会玩躲猫猫的AI能get到什么新技能?( 五 )

躲猫猫游戏研究也激发了OpenAI,因为随着环境复杂性的增加,游戏中的代理不断地通过新策略自我适应新的挑战。贝克表示,“如果像这样的流程可以扩展并放入更复杂的环境中,那么你可能会得到足够复杂的代理,以便为我们解决实际任务。”

挑战在哪里?

游戏代理有时会表现出令人惊讶的行为。例如,躲藏者试图完全逃离游戏区域,直到研究人员对此施加惩罚。

其他挑战可能归因于模拟环境设计中的物理缺陷。例如,躲藏者了解到,如果他们在拐角处向墙壁推动斜坡,斜坡将由于某种原因穿过墙壁然后消失。这种“作弊”说明了算法的安全性如何在机器学习中发挥关键作用。研究人员称,“在它发生之前,你永远不会知道。这类系统总是存在缺陷。我们所做的基本上是观察,并将政策可视化,以便我们可以看到这种奇怪的事情发生,然后试着修复物理缺陷。”

来源:科技日报 文中图片均由作者提供

编辑:岳靓

审核:朱丽

版权声明:本文仅代表作者观点,不代表手机腾讯网立场。版权归自媒体所有,未经许可不得转载。

推荐阅读