传说中的新版Google翻译到底有多厉害?

谷歌翻译是目前世界上使用最广泛的翻译产品 , 支持90种语言之间的翻译 , 包括阿拉伯语、英语、法语、德语、汉语和西班牙语等所有流行语言 。据《纽约时报》报道 , 目前web、iOS、Android等各种平台的月活跃用户已经超过5亿 , 仅Android中的GoogleTranslationApplication(非预装应用)下载安装量就达到1亿 。

在机器翻译领域 , 主要有三类翻译技术 , 即“基于规则的”、“基于统计的”和混合的 。其中 , 谷歌属于“统计型” , 可以通过用户直接搜索的翻译结果、网页内容的爬行翻译等多种渠道获取大量语料库资源进行深度学习 , 从而逐渐获得一种理解两种语言之间如何匹配的能力 , 并将这种能力作为服务提供给用户 。

显然 , 谷歌翻译的服务水平已经达到了一个新的水平 。如果把自己安装了谷歌翻译的手机当成一个人 , 其实ta已经成为了一个翻译效率高的电子翻译器 。然而 , 谷歌翻译之前并没有给很多人留下很好的印象 。比如那些出现在交通标志、超市甚至厕所上的可笑翻译 , 往往被吐槽为“谷歌翻身”的结果 。人们不禁感叹:谷歌这么强大的公司 , 连一台电脑都翻不过来?

一位前谷歌翻译团队科学家告诉采访人员 , 即将发布的新翻译产品谷歌背后的研发远比预期复杂 。

过去 , 谷歌翻译功能背后的主要技术是机器翻译 。后来随着安卓和iOS操作系统的发展 , 移动终端支持语音输入 , 引入了语音识别 。“机器翻译和语音识别在技术上是分开的产品 , 背后使用了许多自然语言处理(NLP)和‘深度学习’的基础技术 。”专家说 。

专家认为 , 从目前媒体报道和业内了解到的信息来看 , 全新的GoogleTranslation是一款集机器翻译和语音识别于一体的产品 。“从技术角度来说 , 谷歌早就应该可以推出这个功能了(编者按:指语音识别和实时翻译) , 但是到现在还没有出来 , 可能还有一些其他的考虑 。总的来说 , 这两种技术的集成需要大量的优化 , 而不是简单的拼凑 。”

也即意味着 , 新版Google翻译是Google的机器翻译技术和语音识别技术进行了系统性的整合之后投产的结果 , 将能够代表Google在自然语言处理方面的深度学习所取得的进展 , 以及其商业化能力 。提到的前谷歌科学家指出 , 在他任职期间(两年前) , 谷歌的翻译技术已经处于行业领先水平 。近两年来 , 谷歌在深度学习方面取得了突出的进步 , 因此有理由(相对安全)相信谷歌基于深度学习的翻译服务背后的技术仍能代表行业最高水平 。

【传说中的新版Google翻译到底有多厉害?】 当然 , 人们可能对谷歌翻译技术有多强大没有太多的认知 。他们能感知到的是 , 他们不应该把干货变成混账货 。

    推荐阅读