OpenAI:用“捉迷藏”游戏训练AI学会团队合作
猎云网注:“捉迷藏式代理人倾向于强化学习,这种技术利用奖励来推动软件策略实现目标,通过反复试验进行自我学习。”文章来源:AI星球(ID:ai_xingqiu),编译:油人,编辑:奇点。
古老的捉迷藏游戏可以揭示人工智能如何衡量其所面临的决策,更不用说为什么它在其影响范围内与其他AI相互作用的方式了。这是旧金山人工智能研究公司OpenAI的研究人员发表的一篇新论文的要点,该公司得到了LinkedIn联合创始人Reid Hoffman等人的支持。这篇论文描述了大量的AI控制代理如何在虚拟环境中释放,学会了越来越复杂的隐藏和寻找方法。测试结果表明,竞争中的双代理团队以比任何单一代理更快的速度进行自我改进,合著者称,这表明可以利用其他人工智能领域的力量来提高效率。
如今,在开源中所提供的捉迷藏式AI训练环境被OpenAI、DeepMind和谷歌所采纳,为人工智能难题提供众包解决方案。去年12月,OpenAI发布了CoinRun,旨在测试强化学习代理的适应性。最近,它推出了Neural MMO,这是一个强大的强化学习模拟器,可以在类似RPG的世界中扮演代理人。6月,谷歌的Google Brain部门开源了Research Football Environment,这是一个3D强化学习模拟器,用于训练AI掌握足球。DeepMind上个月揭开了OpenSpiel的面纱,OpenSpiel是一系列用于视频游戏的AI训练工具。
推荐阅读
- 电子游戏|电子游戏=精神鸦片?
- 使徒|PS5发布一周年,最受玩家喜爱的10款PS5游戏
- 功勋|大话西游2:玩家晒出多只高等级情怀召唤兽,游戏梦想还记得吗?
- 手机游戏|LOL:手游总是排到牛马队友?选这四个英雄,实力上大分
- 精灵宝可梦|《宝可梦传说:阿尔宙斯》可继承前作存档,游戏形式像是怪物猎人
- 捉迷藏|?LOL世界赛“含金量”数据出炉:EDG仅排第六,IG稳居榜首
- 手机游戏|中国游戏登顶全球第一,从日本吸金60亿,还从美国赚回64亿
- 手机游戏|梦幻西游:副本等人时可以刷的任务,随时随地领取,失败也没问题
- 权力的游戏|重温权利的游戏
- 网吧|他们本是素不相识的两个人,直到有一天,她覆盖了他的游戏存档