|谷歌AI又获重大突破!新算法无需了解规则也能自学成“棋”
科技日报采访人员 冯卫东
据最新一期《自然》杂志报道 , DeepMind公司开发的一种AI算法MuZero , 可以在不告知其游戏规则的情况下掌握围棋、国际象棋、日本将棋和视频游戏 , 这是谷歌人工智能部门获得的又一重大突破 。
文章图片
文章图片
DeepMind 公司表示 , 研究人员多年来一直在寻找一种方法 , 既可以学习建立用于解释当前环境的模型 , 也能够利用这个模型来进行最好的决策 。到目前为止 , 大多数方法都难以在Atari这种游戏中进行有效规划 。
MuZero最初在2019年推出 , 通过只关注环境中最重要的一个方面 , 来学习建立模型并解决问题 。通过将这种方法与阿尔法狗强大的搜索树技术相结合 , MuZero的能力实现了重大飞跃 。此外 , MuZero 还利用了前瞻搜索、基于模型的规划来解决问题 。
文章图片
文章图片
【|谷歌AI又获重大突破!新算法无需了解规则也能自学成“棋”】MuZero不会使用规则来找到最佳情况(因为事先不被告知) , 而是学习考虑游戏环境的各个方面 , 自己观察它是否重要 。在数百万场比赛中 , 它不仅学习规则 , 而且学习位置的通用价值 , 成功的通用策略以及事后评估自己行为的方式 。后一种功能可帮助其从自身的错误中学习、回忆和重做游戏 , 以尝试各种不同方法来进一步优化位置和策略价值 。
文章图片
文章图片
MuZero不仅在国际象棋、围棋和日本将棋上达到了与提供完善规则的阿尔法狗一样的超人水平 , 在Atari游戏这样的杂乱感知输入环境中也创造了新纪录 。研究人员将MuZero描述为“在追求通用算法方面迈出的重要一步” 。
编辑:刘义阳
推荐阅读
- 变化|1月1日生效的RCEP,将带来这些重大变化!
- 塔琳|剑与远征:1.80重大版本更新,这是22年最重要的版本
- 评级|韩国要求苹果和谷歌应用商店下架边玩边赚游戏
- 达摩|王者荣耀达摩又获勇者皮肤 甄姬西游记联动曝光!韩信星元部件返场
- 红警ol|新英雄 新装扮《红警OL》版本重大更新!
- 英雄联盟|备战春季赛,Rookie抵达LPL赛区,V5粉丝喜迎三重大礼
- 三国杀|三国杀:一将成名翻车!这名武将的设计竟然隐藏着重大历史错误!
- 过程|强制社交链成《幻塔》重大败笔,完美世界始终没懂二次元
- kpl|镜KPL限定曝光:飒到不行,但有项重大缺陷!412点券你会入手吗?
- 突击|三战(天蓬快讯)三势阵重大改革,武将动态加新人