OpenAI：用“捉迷藏”游戏训练AI学会团队合作_猎云网注：“捉迷藏式代理人倾向于强化

猎云网注：“捉迷藏式代理人倾向于强化学习，这种技术利用奖励来推动软件策略实现目标，通过反复试验进行自我学习。”文章来源：AI星球（ID：ai_xingqiu），编译：油人，编辑：奇点。

古老的捉迷藏游戏可以揭示人工智能如何衡量其所面临的决策，更不用说为什么它在其影响范围内与其他AI相互作用的方式了。这是旧金山人工智能研究公司OpenAI的研究人员发表的一篇新论文的要点，该公司得到了LinkedIn联合创始人Reid Hoffman等人的支持。这篇论文描述了大量的AI控制代理如何在虚拟环境中释放，学会了越来越复杂的隐藏和寻找方法。测试结果表明，竞争中的双代理团队以比任何单一代理更快的速度进行自我改进，合著者称，这表明可以利用其他人工智能领域的力量来提高效率。

如今，在开源中所提供的捉迷藏式AI训练环境被OpenAI、DeepMind和谷歌所采纳，为人工智能难题提供众包解决方案。去年12月，OpenAI发布了CoinRun，旨在测试强化学习代理的适应性。最近，它推出了Neural MMO，这是一个强大的强化学习模拟器，可以在类似RPG的世界中扮演代理人。6月，谷歌的Google Brain部门开源了Research Football Environment，这是一个3D强化学习模拟器，用于训练AI掌握足球。DeepMind上个月揭开了OpenSpiel的面纱，OpenSpiel是一系列用于视频游戏的AI训练工具。