“最终之战”人类完败！DOTA2 AI 2：0吊打世界冠军(16)_图1

在 OpenAI Five 被职业队打败的过程中，AI 充分暴露了依靠这种方法抛弃人类先验经验、获取新的技能，还有一些“盲区”。

来自斯坦福的 Andrey Kurenkov 就撰写了大量有关强化学习局限性的文章，他表示，此前的比赛表明，强化学习可以处理“比大多数人工智能研究人员想象的复杂程度更高的问题”，但一些失败的结局表明，游戏 AI 需要新的方式来培养其“长期思维”。也就是说，AI 在即时即地的反应上做得很好，但宏观层面决策的表现却很糟糕。他在其文章中如此总结 AlphaGo 和 OpenAI Dota2 AI 的成绩局限性所在：从零开始学习导致它们和人类学习相比，更依海量游戏指令和使用更原始的、无人能及的计算能力。

也正因为这些局限，目前我们也还没有看到有任何 AI 被广泛应用在商业级游戏中。但在接下来很长一段时间，AI 打游戏恐怕还需要通过强化学习来实现，强化学习究竟是不是让机器能够像人一样从零学习新技能的最佳方法，还需要更长时间的验证。