OpenAI Five 亲测报告:技术强悍但有天大弱点!(12)

而在其他从零开始的应用场景中 , AI 可以根据规则在自我对战中进行学习 , 这也正是 OpenAI Five 和 DeepMind 的 AlphaGo Zero 所使用的技术 。 自我对战最大的优势在于可以“从零开始” , 在大量的对战中进行优化 , 用大量的计算力和训练时间来掌握一个技能 。

无论哪种方法 , 我们都能看出类似的趋势:减少数据需求 。 但是 , 从 OpenAI Five 竞技场的表现来看 , 虽然现有的技术手段能够有效地减少对数据的依赖 , 却依然无法有效地提高模型训练的速度 。

所幸 , 提升学习速度也是当下机器学习领域的一个大热门 。 可以预见的是 , 从 AI 到 AGI , 将是一个漫长的发展历程 , 而只借助少量数据就能迅速学习新技能的能力 , 将是发展过程中的最大难题之一 。

推荐阅读