OpenAI Five 亲测报告:技术强悍但有天大弱点!( 十 )

但是 , 这些技术都依赖于海量数据和计算资源 , 比如训练 AI 识别医疗影像 , 进行中英翻译或听懂你说的话 , 均需要数十万份训练数据才能训练出表现出色的模型 。 但它们也只能在特定场景下才能使用 。 因此 , 相对于被称之为“强人工智能”的 AGI , 这类 AI 系统普遍被称为“弱”或“窄人工智能”(Narrow AI) 。

如果想再更进一步 , 进军 AGI , 首先要攻克的就是在冷门应用场景下 , 训练数据稀少的问题 。

(来源:Pixabay)

目前已有类似的努力 , 比如“仅需”数千个数据就能生效的生成模型(Generative Models)、数据需求进一步降低至数百的迁移学习(Transfer Learning) , 可以从零开始的单样本学习(one-shot learning)和自我对战 (Self-Play) , 这都是近几年的新兴概念 。

生成模型的基础思想为“训练算法来生成自己的训练数据” , 通过生成一个能够抽取出基类数据的模型 , 根据少量的训练数据 , 凭空“想”出大量的训练数据 。 对于图像来说 , 迄今最成功的生成模型是生成对抗网络(GAN) 。 正如生成对抗网络的发明人 Ian Goodfellow 所说的 , 生成模型给机器带来了“想象力” 。

推荐阅读