金磊 发自 凹非寺
量子位 报道 | 公众号 QbitAI
十年,能让一个机器翻译系统发生怎样的变化?
2011年,TA还只会“中-英”翻译这一项技能。但TA却用十年时间,在翻译这条路上不断打磨自己。
文章插图
现如今,TA的“打开方式”的是这样:
全球首个发布互联网神经翻译系统,10年内让翻译质量提升30个百分点(国际常用的评价指标BLEU),而通常提升1个百分点就是非常显著的了。
全球首次突破200种语言的互译,10年内让翻译语种数量增长100倍。
不再是只会文本翻译这一项技能,而是掌握了图片、视频、文档,甚至是同传这样的跨模态翻译。
也不再限于在输入框中输入文本来翻译,而是翻译APP、AI同传会议版、同传助手、小程序以及翻译开放平台等多种产品。
而且现在的它还变得格外忙碌,全世界每天找TA翻译的字符量超过千亿,相当于2000部大英百科全书,是10年前的10万倍。
甚至Gartner对它还做出了这样的评价:
是神经网络机器翻译标杆机构,也是国内唯一入围单位。
是全球AI翻译服务中的重要力量。
……
TA,就是百度翻译。
文章插图
但如果现在你还认为它只是个搞翻译的,那可能就有点片面了。
因为现在的百度翻译,有点“变味”了。
10岁的百度翻译,长什么样?如果说百度翻译的起点,是十年前那个只会中英翻译的网站。
那么现在的它,可谓是把翻译这事玩出了一种新高度。
首先在翻译语种这件事,也正如刚才提到的,百度翻译全世界范围内首个突破200种语言互译的系统。
而且不只是翻译语种数量多的问题,更是在翻译难度上有所体现。
例如它甚至在涉猎一些“冷门”的语言,以国粹文言文为例,输入一段《学弈》的文字:
弈秋,通国之善弈者也。使弈秋诲二人弈,其一人专心致志,惟弈秋之为听;一人虽听之,一心以为有鸿鹄将至,思援弓缴而射之。虽与之俱学,弗若之矣。为是其智弗若与?曰:非然也。
啪的一下,百度翻译瞬间就能把晦涩难懂的古文,用大白话的形式展现出来:
文章插图
然而机器能做到这一点,也相当不容易,因为除去大语种,大部分语言的互译资源是稀缺的,无法供AI学习足够多的知识。
但百度翻译所满足的可不止于对文本翻译的“多”和“精”,它还花了十年时间在便捷性这块下足了功夫。
这不就在最近,百度翻译App更新迭代到了10.0版本,“花式翻译”也在这里得到了很好的体现。
不再是把文字输进去、翻出来这样单一的套路,而是把语音、图片、视频、文档等形式也融入了进来。
文章插图
换言之,现在想要做翻译,不再是输入文本这种单一的形式了。
说一句话、拍一张照,甚至直接把完整的文档导进来,就可以完成翻译了。
不仅如此,甚至像同传这样高段位的翻译,百度翻译也是能够轻松hold住。
文章插图
百度翻译更是在全球顶级机器翻译比赛WMT (Workshop on Machine Translation)中,拿下过中英翻译第一名的成绩。
不难看出,百度翻译花了十年时间,不只是在做横向的扩展,也是对各个产品在纵向上“自修功法”。Big Family目前已经枝繁叶茂。
推荐阅读
- 知识店铺|百度文库:知识店铺开店量突破50万家,发布亿元优质内容激励计划
- 搜索引擎|百度起诉人工刷量平台我爱网干扰搜索引擎算法,获赔200万元
- 向海龙|百度前搜索总裁加入传音,担任移动互联总裁
- 向海龙|百度前搜索总裁向海龙加入传音
- 百度竟然出了一款良心产品?
- 百度知道|如何利用百度赚钱?分享十个普通人可以利用百度赚钱的方法
- 购物|逛超市也有“窍门”?逛了几十年,你知道如何在购物时省钱吗?
- 微信|视频号,拉开微信新十年序幕
- 电商|时隔十年,淘宝天猫"分久必合"?
- 百度|“跳转APP查看完整内容”谁在给用户使绊子?