从雀圣到股神,微软只差“最后一英里”( 八 )

基于上面这三种特别的算法,Suphx 在进入「天凤」平台后快速地在与人类选手的对战中掌握了独特的策略,有不少玩家表示,「天凤」的玩法与人类有很大的不同,甚至有天凤位的选手表示自己看了几百场 Suphx 的比赛,学了很多新技术,对他个人的打法有很大帮助。

不过有趣的是,据刘铁岩介绍,Suphx 背后的研究团队并没有麻将高手,最擅长麻将的研究员在「天凤」平台上「可能都打不到一段」。

还差「最后一英里」

可是如此投入精力做出的游戏 AI 究竟有什么用?麻将仅仅四人的对弈,牌数也是数量明确且有限的,在这样的环境里训练出的模型和系统,是否能在复杂度远远高于游戏的真实世界里应用?

面对这一问题,刘铁岩说道:「在做基础科学研究的时候,首先我们希望能在一个相对可控的环境里淬炼技术,当我们找到最好的技术后,去落地的时候,还有所谓的『最后一英里的创新』(last mile innovation)。」

目前,Suphx 相关研究带来的技术创新还没有全部应用到实际落地场景中,但已经有了部分应用。亚研院与华夏基金、太平资产等金融机构一起做了一些「很大胆」的实盘投资实验,涉及资金上亿人民币,「取得了非常好的效果,在业界遥遥领先」,其中就使用了自适应决策的技术。刘铁岩解释说,通过历史的金融交易数据离线训练出的 AI 模型,在今天的市场上有很多变数,包括经济走势、 国家政策和世界范围内互动模式的差异等等,因此动态适应今天的场景就非常重要。「这与 Suphx 里的自适应决策是一脉相承的」。

推荐阅读