玩躲猫猫游戏,人工智能自动发展出类似人类的攻防策略( 二 )
研究人员在模拟的、物理接地的环境中放置了1—3个“躲藏者”和1—3个“寻找者”,房间的边界是静态墙。环境中还包括不同尺寸的可移动箱子和可移动坡道。
研究人员使用强化学习来训练游戏代理,并遵循简单的躲猫猫规则:隐藏者成功躲过寻找者的追逐,或是寻找者成功找到躲藏者。
AI如何玩躲猫猫?
在经过数亿次的游戏后,AI代理经历了几个阶段的策略发展过程。
在初始阶段,躲藏者(蓝色)和寻找者(红色)通过在空间中移动而不操纵任何物体,制定了非常粗糙的躲避和追逐策略。
在经历2500万个回合后,游戏变得更加复杂。躲藏者学会了移动和锁定在环境中的箱子和路障,以在自己周围建立堡垒,这样寻找者就永远看不到它们了。不仅如此,他们还制定了协调战略,例如相互传递物体,以加快建造堡垒的进程。
然而,在游戏进行了7500万回合之后,寻找者发现了一个反策略。他们学会了在躲藏者的要塞旁边移动一个坡道,并用它来爬过墙壁。
推荐阅读
- 电子游戏|电子游戏=精神鸦片?
- 使徒|PS5发布一周年,最受玩家喜爱的10款PS5游戏
- 功勋|大话西游2:玩家晒出多只高等级情怀召唤兽,游戏梦想还记得吗?
- 手机游戏|LOL:手游总是排到牛马队友?选这四个英雄,实力上大分
- 精灵宝可梦|《宝可梦传说:阿尔宙斯》可继承前作存档,游戏形式像是怪物猎人
- 手机游戏|中国游戏登顶全球第一,从日本吸金60亿,还从美国赚回64亿
- 手机游戏|梦幻西游:副本等人时可以刷的任务,随时随地领取,失败也没问题
- 权力的游戏|重温权利的游戏
- 网吧|他们本是素不相识的两个人,直到有一天,她覆盖了他的游戏存档
- 手机游戏|3年内不得转会FNC!G2老板被爆与C9达成秘密协议,Perkz转会受阻