你已经是台成熟的vivo手机了,要自己学会打王者( 三 )

就《王者荣耀》而言,关键性的大局观包括:“去哪儿”、“应该何时去支援队友”、“队友应该何时一起参加团战”……

而重要的精细化操作则包括:“何时闪现”、“何时交出大招”、“多人团战中应该如何精细走位”、“团战中应该如何释放技能”。

你已经是台成熟的vivo手机了,要自己学会打王者

图1/7

上述两种操作,对人类玩家稀疏平常,对AI却别有挑战。

而且也需要具体问题具体分析,需要有不同的应对策略。

此次vivo AI Lab,就分别采用了不同的策略。

针对大局观,因为很难量化和计算,需要先参考人类数据,进行模仿学习和专家引导。

而在精细化操作时,vivo AI Lab直接使用了“多智能体”强化学习方法。

通俗来说,可以视为成百上千个机器人在虚拟团战走位、技能释放等操作,其中只有表现最好的能够留下来。通过不断的对垒,让机器自然而然学会最优操作方式。

推荐阅读