最强版“百度大脑”来了,躯干和四肢在哪里?( 二 )

算法与算力才是重点

AI 的三大要素,算法、算力和数据,百度大脑 5.0 在前两个领域都进行了升级。

算法突破方面,首先是语音识别的流式多级截断注意力模型(SMLTA),使识别准确率和响应速度都有大幅提升,为用户带来更好的体验;风格迁移的语音合成技术,能够将音色、风格和情感等多要素解耦分析,20 句话就可以制作一个人的专属声音。

语音识别技术的进步,无疑将增加百度在智能音箱等领域的优势。在上午,百度发布了大金刚等三款智能音箱产品,李彦宏和小度智能音箱的交流,更是放在了大会之初作为热场,「全双工免唤醒」的功能,让音箱可以自动分辨哪些话是对自己说的,哪些不需应答,语音助手变得更智能。而 AI 语音合成技术,结合视觉技术,自动生成的虚拟形象,应用于浦发银行的「金融数字人」,不仅听得懂,还能对答如流。

最强版“百度大脑”来了,躯干和四肢在哪里?

搭载小度助手的智能设备激活数量 | 百度

推荐阅读