百度,技术求道二十年(14)

为了让AI技术的应用者 , 不必从头建造轮子 , 百度大脑从开放开始 , 每年都完成着幅度巨大的进化 。 2017年7月的百度AI开发者大会上 , 百度大脑2.0正式发布 , 这一版本开放了包含基础层、感知层、认知层和平台层在内的完整AI技术体系;开放了语音、图像、视频、增强现实、自然语音处理等60多项AI核心能力 , 让AI赋能开发者和行业应用有了足够多的技术支撑 。

到2018年的百度AI开发者大会 , 百度大脑宣布升级至3.0 , 所开放的核心AI技术达到110多项 , 形成了从芯片到深度学习框架、平台、生态的AI全栈技术布局 。 尤其“多模态深度语义理解”的技术突破 , 让百度大脑走向了世界AI产业的技术最前沿 。

2019年 , 百度大脑又进一步得到了跨越式的升级 。 在百度大脑5.0版本中 , 语音、视觉、语言和知识等核心算法都得到了再次突破 。 例如语音方面 , 流式多级的截断注意力模型(SMLTA)使语音识别速度和识确度大幅提升 , 并可解决中英文混合语音的识别难题;风格迁移的语音合成技术 , 仅需20句话就可以制作一个人的专属声音 , 不仅保留语音中的音色、风格、情感等要素 , 使用时还可任意组合、灵活控制 。

推荐阅读