百度，技术求道二十年(14)_一家公司

为了让AI技术的应用者，不必从头建造轮子，百度大脑从开放开始，每年都完成着幅度巨大的进化。 2017年7月的百度AI开发者大会上，百度大脑2.0正式发布，这一版本开放了包含基础层、感知层、认知层和平台层在内的完整AI技术体系；开放了语音、图像、视频、增强现实、自然语音处理等60多项AI核心能力，让AI赋能开发者和行业应用有了足够多的技术支撑。

到2018年的百度AI开发者大会，百度大脑宣布升级至3.0 ，所开放的核心AI技术达到110多项，形成了从芯片到深度学习框架、平台、生态的AI全栈技术布局。尤其“多模态深度语义理解”的技术突破，让百度大脑走向了世界AI产业的技术最前沿。

2019年，百度大脑又进一步得到了跨越式的升级。在百度大脑5.0版本中，语音、视觉、语言和知识等核心算法都得到了再次突破。例如语音方面，流式多级的截断注意力模型（SMLTA）使语音识别速度和识确度大幅提升，并可解决中英文混合语音的识别难题；风格迁移的语音合成技术，仅需20句话就可以制作一个人的专属声音，不仅保留语音中的音色、风格、情感等要素，使用时还可任意组合、灵活控制。