从雀圣到股神,微软只差“最后一英里”( 五 )

从雀圣到股神,微软只差“最后一英里”

Suphx 大三元胡牌 | 亚研院博客

而在棋牌类游戏里,麻将也有着一些特殊性。

首先,麻将对战中存在着巨大的状态空间。136 张麻将牌的排列组合可能性远远高于 52 张的德州扑克,且在同一个玩家两次出牌之间,夹杂了其他 3 个玩家的出牌和自己摸的底牌,可能出现的不同局面数目非常巨大。更大的变数是,在麻将中,4 位玩家的出牌顺序是不固定的,任意一位玩家的「吃碰杠」都可能使出牌顺序突然改变,导致游戏树不规则且动态变化。这些特点使麻将很难直接利用 AlphaGo 等棋盘游戏 AI 常用的蒙特卡洛树搜索算法。

其次,在不完美信息的棋牌游戏中,麻将玩家只能看到手上 13 张手牌和之前已经打出来的牌,因此最多会有超过 120 张未知牌。一方面,由于随机性太大,玩家即便在出牌决策中能估测出对方玩家手牌、底牌等不可见的牌,也无法避免不确定性对于游戏走向的影响。这给 AI 模型的训练带来很大挑战:AI 模型很难发现已知牌面信息和最优打法之间的逻辑链路。另一方面,丰富的隐藏信息导致游戏树的宽度非常大,对树搜索算法的可行性提出了进一步的挑战。

推荐阅读