原创<br> 阿里的 B 面,AI 如何成为下一个二十年辉煌的基石?( 四 )

过去几年 AI 领域的突破,更多还是体现在基于机器学习带来的语音、NLP(自然语言处理)以及计算机视觉的技术突破,这三大技术分别从听、说、看的角度延伸了机器智能的边界。

阿里 AI 在上述三大领域取得了一系列算法突破。比如在语音智能领域,2018 年 6 月,阿里自主开发的语音识别模型(DFSMN)在世界最大的语音识别数据库 LibriSpeech 上取得 96.04% 的识别准确率,创行业新高;而面向语音合成的自研技术 Knowledge-Aware Neural TTS (KAN-TTS),能将特定发音人数据的自然度能提高到 97% 以上,有望通过图灵测试。

机器视觉领域,阿里 AI 的算法也已经步入行业前列,阿里AI目前可以识别超过100万种物理实体。以今年 6 月的两项机器视觉竞赛为例,阿里 AI 的机器视觉团队击败了全世界 150 多支参赛队伍,获得 WebVision 竞赛冠军;同时在第二届视觉对话竞赛 Visual Dialogue Challenge 中,阿里AI 的机器视觉团队还击败了微软、首尔大学等十支参赛队伍,获得冠军,并将该项赛事准确率的世界记录提升至 74.57%。

阿里 AI 的算法突破还体现在自然语言处理领域。比尔·盖茨曾感叹「自然语言处理是 AI 皇冠上的一颗明珠」,这充分说明语言技术之于 AI 的意义,同时语言技术也是最能考验一家公司 AI 能力的技术领域。

推荐阅读