央视315曝光的AI骚扰电话:背后的技术与伦理( 四 )

其实,人类历史上第一次与人工智能进行全双工语音电话,并不是发生在美国,而是发生在中国。

我们很荣幸能将这一桂冠奉献给祖国。自2016年8月起,微软(亚洲)互联网工程院通过人类用户主动发起的方式,已让小冰与人类用户累计完成了超过60万通电话。

今天,我们公布其中一通发生在两年前的实际电话录音,将之作为珍贵的资料,奉献给全世界说中文的华人。

Google Duplex背后的技术核心:其实是由TensorFlow Extended(RFX)构建而成的一个RNN网络。为了达到高精度,Google用匿名的电话对话数据训练Duplex的RNN网络。

这个网络会使用Google自动语音识别(ASR)的识别结果文本,同时也会使用音频中的特征、对话历史、对话参数(比如要预订的服务,当前时间)等等。

Google为每一种不同的任务分别训练了不同的理解模型,不过不同任务间也有一些训练语料是共享的。最后,Google还利用TFX的超参数优化进一步改进了模型。

推荐阅读