OpenAI Five 亲测报告:技术强悍但有天大弱点!( 九 )

人类有什么样的学习能力呢?从竞技场的例子可以看出 , AI 一开始连赢了 500 场 , 但一支人类顶尖队伍在尝试 2 次之后就获得了胜利 , 之后还获得了连胜 。

随着人类不断挖掘 AI 的弱点 , 只用了 1 天就摸清了 AI 的套路 , 做到了可以稳定击败 AI , 最后取得十连胜(这支队伍在竞技场结束之后还在直播打 OpenAI , 继续保持了连胜记录) 。

也就是说 , 人类整体只用了几百场游戏、顶尖个体甚至只用了 2 场游戏 , 就“学会了”如何反复击败训练了 4.5 万年的 AI , 两者的学习效率差距显而易见 。

当然 , 在比赛的过程中 , OpenAI 自身是锁定的 , 不会学习 , 也不会改变 , 给了人类找到套路的机会 。 但这并不能改变它需要的训练数据远超人类的事实 。

图 | 双大哥隐刀 BKB 拆家

从大数据到小数据

现代机器学习领域最热门的莫过于深度学习(AlphaGo)和强化学习(OpenAI Five)等人工神经网络 。 当 AI 系统一次次在围棋、电子游戏、图像识别、自然语言处理等多个应用领域追上、甚至超越人类后 , 很多人都在使用这些技术探索可以应用于多个领域的 AGI 的可能性 。

推荐阅读