原创<br> 阿里的 B 面，AI 如何成为下一个二十年辉煌的基石？( 四 )_：阿里的B面

过去几年 AI 领域的突破，更多还是体现在基于机器学习带来的语音、NLP（自然语言处理）以及计算机视觉的技术突破，这三大技术分别从听、说、看的角度延伸了机器智能的边界。

阿里 AI 在上述三大领域取得了一系列算法突破。比如在语音智能领域，2018 年 6 月，阿里自主开发的语音识别模型（DFSMN）在世界最大的语音识别数据库 LibriSpeech 上取得 96.04% 的识别准确率，创行业新高；而面向语音合成的自研技术 Knowledge-Aware Neural TTS (KAN-TTS)，能将特定发音人数据的自然度能提高到 97% 以上，有望通过图灵测试。

机器视觉领域，阿里 AI 的算法也已经步入行业前列，阿里AI目前可以识别超过100万种物理实体。以今年 6 月的两项机器视觉竞赛为例，阿里 AI 的机器视觉团队击败了全世界 150 多支参赛队伍，获得 WebVision 竞赛冠军；同时在第二届视觉对话竞赛 Visual Dialogue Challenge 中，阿里AI 的机器视觉团队还击败了微软、首尔大学等十支参赛队伍，获得冠军，并将该项赛事准确率的世界记录提升至 74.57%。

阿里 AI 的算法突破还体现在自然语言处理领域。比尔·盖茨曾感叹「自然语言处理是 AI 皇冠上的一颗明珠」，这充分说明语言技术之于 AI 的意义，同时语言技术也是最能考验一家公司 AI 能力的技术领域。