为什么人们会一直击败语音识别算法( 二 )

想象一下这样一个世界 , 其中的Siri总能理解你的意图 , 而谷歌翻译则完美无缺 , 它们两个相互配合组成了一个Doctor Who(神秘博士)风格的翻译机器 。 想象一下 , 不管走到哪里 , 你都能随心所欲地和人交流(不包括在学校用法语小声嘀咕巴黎服务员哦) 。 这样的前景很有吸引力 , 但目前仍然遥不可及 。 阻碍这一前景继续向前发展的瓶颈来自于语言变异 , 特别是口语的变异 。 目前技术还无法很好的应对这一问题 。

Humans on the other hand are amazingly good at dealing with variations in language. We are so good in fact that we really take note when things occasionally break down. When I visited New Zealand I thought for a while that people were calling me “pet” a Newcastle-like term of endearment. They were in fact just saying my name Pat. My aha moment happened in a coffee shop (“Flat white for pet!” gave me a pause).

另一方面 , 我们人类真得非常擅长处理语言的变异 。 事实上 , 我们是如此的擅长 , 以至于偶尔遇到问题时 , 它会给我们留下深刻的印象 。 在我去新西兰旅游的时候 , 人们总是称呼我为pet(宠物 , 音“拍特”);我想了想 , 这可能是某种纽卡斯尔风格的昵称吧 。 但事实是 , 他们只是在喊我的名字 , Pat(帕特) 。 在某家咖啡店 , 服务员喊道“pet的馥芮白” , 这突然让我意识到了pet其实就是Pat 。

推荐阅读