从雀圣到股神,微软只差“最后一英里”( 三 )

完美信息游戏的典型代表有双陆棋、国际跳棋、国际象棋和围棋等,其中复杂程度最高的是围棋。2017 年 AlphaGo 两次迭代后的版本 AlphaZero 通过深度强化学习成功解决了包括围棋在内的多个完美信息游戏。在此之后学术界研究的热点开始转向不完美信息游戏和多人对战的电竞游戏。

从雀圣到股神,微软只差“最后一英里”

围棋、德州扑克、桥牌和麻将的信息集数目和信息集平均大小对比 | 亚研院博客

扑克、麻将、桥牌,还有包括星际争霸 2 和 Dota2 等地图不完全公开的电子游戏,都属于不完美信息游戏。2017 年到 2019 年,卡内基梅隆大学(CMU)发布的 Libratus 和与 Facebook AI 合作发布的 Pluribus 分别击败了两人无限注德州扑克和六人不限注扑克的人类顶级玩家,由此正式开启了 AI 学界对不完美信息游戏的征程。

与此同时,包括开发了 AlphaGo 的 DeepMind,埃隆·马斯克参与创办的 OpenAI,Facebook 人工智能实验室 FAIR 以及国内的腾讯 AI Labs 都开始对星际争霸 2、Dota2、王者荣耀等 RTS 和 MOBA 类电子游戏进行游戏 AI 的开发。其中 DeepMind 联合暴雪开发的星际争霸 2 游戏 AI AlphaStar 在 2019 年 1 月战胜了顶尖的人类玩家,OpenAI Five 也在 2019 年 4 月战胜了 Dota2 刚刚蝉联世界冠军的战队 OG 俱乐部。

推荐阅读