玩躲猫猫游戏，人工智能自动发展出类似人类的攻防策略( 二 )

2019-09-19

研究人员在模拟的、物理接地的环境中放置了1—3个“躲藏者”和1—3个“寻找者”，房间的边界是静态墙。环境中还包括不同尺寸的可移动箱子和可移动坡道。

研究人员使用强化学习来训练游戏代理，并遵循简单的躲猫猫规则：隐藏者成功躲过寻找者的追逐，或是寻找者成功找到躲藏者。

AI如何玩躲猫猫？

在经过数亿次的游戏后，AI代理经历了几个阶段的策略发展过程。

在初始阶段，躲藏者（蓝色）和寻找者（红色）通过在空间中移动而不操纵任何物体，制定了非常粗糙的躲避和追逐策略。

在经历2500万个回合后，游戏变得更加复杂。躲藏者学会了移动和锁定在环境中的箱子和路障，以在自己周围建立堡垒，这样寻找者就永远看不到它们了。不仅如此，他们还制定了协调战略，例如相互传递物体，以加快建造堡垒的进程。

然而，在游戏进行了7500万回合之后，寻找者发现了一个反策略。他们学会了在躲藏者的要塞旁边移动一个坡道，并用它来爬过墙壁。

推荐阅读

上一篇：能和三星Note10拼颜值，让iPhone11关注度骤减，只因NEX 3太出色

下一篇：苹果开发者工具确认iPhone 11系列配置：还有惊喜