OpenAI:用“捉迷藏”游戏训练AI学会团队合作

OpenAI:用“捉迷藏”游戏训练AI学会团队合作

猎云网注:“捉迷藏式代理人倾向于强化学习,这种技术利用奖励来推动软件策略实现目标,通过反复试验进行自我学习。”文章来源:AI星球(ID:ai_xingqiu),编译:油人,编辑:奇点。

古老的捉迷藏游戏可以揭示人工智能如何衡量其所面临的决策,更不用说为什么它在其影响范围内与其他AI相互作用的方式了。这是旧金山人工智能研究公司OpenAI的研究人员发表的一篇新论文的要点,该公司得到了LinkedIn联合创始人Reid Hoffman等人的支持。这篇论文描述了大量的AI控制代理如何在虚拟环境中释放,学会了越来越复杂的隐藏和寻找方法。测试结果表明,竞争中的双代理团队以比任何单一代理更快的速度进行自我改进,合著者称,这表明可以利用其他人工智能领域的力量来提高效率。

如今,在开源中所提供的捉迷藏式AI训练环境被OpenAI、DeepMind和谷歌所采纳,为人工智能难题提供众包解决方案。去年12月,OpenAI发布了CoinRun,旨在测试强化学习代理的适应性。最近,它推出了Neural MMO,这是一个强大的强化学习模拟器,可以在类似RPG的世界中扮演代理人。6月,谷歌的Google Brain部门开源了Research Football Environment,这是一个3D强化学习模拟器,用于训练AI掌握足球。DeepMind上个月揭开了OpenSpiel的面纱,OpenSpiel是一系列用于视频游戏的AI训练工具。

推荐阅读