从雀圣到股神,微软只差“最后一英里”( 九 )

在 Suphx 的开发和研究中,最有价值的部分就是以上介绍的,基于麻将特性,研究团队在深度强化学习基础上做出的改进(自适应决策、先知教练和全盘奖励的预测机制)。现阶段,深度强化学习是业界最为有效的一种机器学习方法,但它在具体解决一些复杂问题的时候还需要进一步改进,而 Suphx 就是这样一种探索。半年来,Suphx 在与人类选手的对战中不断改进,背后的数据对团队的算法研究有很大的帮助。刘铁岩表示,不久后,亚研院会以论文的方式分享相关的技术细节。

最后,至于 Suphx 是否会在未来登陆中国麻将平台,刘铁岩表示,「作为一个研究单位,我们对一切都是开放的。因为我们使用的是机器学习的技术,它对游戏的规则(中国麻将规则与日本麻将有差别)没有那么敏感,只要有明确的规则体系在,就会有解决办法。」

责任编辑:克里斯

题图来源:视觉中国

从雀圣到股神,微软只差“最后一英里”

从雀圣到股神,微软只差“最后一英里”

推荐阅读