python|兼容PyTorch!语音识别大牛Daniel Povey正式发布新一代框架Kaldi!( 三 )

3

全面赋能小米语音产品
在万物互联的时代,智能语音交互扮演者越来越重要的角色。嗅觉敏锐的小米早在2017年已经注意到到这片蓝海市场。在Daniel加盟之前,小米已经逐步搭建了自己的语音技术团队,并推出了智能语音产品-小爱音箱。2019 年年初,小米创始人雷军提出“手机 +AIoT"双引擎发展战略,为小米在语音识别领域的发展指明了一条可行路径。
“新一代Kaldi或将在明年之前将全部应用到小米所有的智能语音产品中”,Daniel向媒体表示。他说,新一代Kaldi能够适用各种场景的不同语音模型,如远近场语音唤醒、离在线语音识别、说话人识别等通用模型,以及口语评测、语种识别、语音情绪识别等。
以小米小爱为例,“通过它,用户可以连接到各种各样的 AIoT 设备并与它们产生互动:智能音箱、手机、电视、智能手表、儿童故事机、车载后视镜等。”

python|兼容PyTorch!语音识别大牛Daniel Povey正式发布新一代框架Kaldi!
文章插图
不仅是小米,所有企业、开发者和普通用户都可以继续享受新一代Kaldi的核心技术。Daniel表示,当初之选择加盟小米,也是因为小米承诺Kaldi可以继续作为开源项目。“小米是一家稳定的公司,重视开源开放,而且允诺我一直做开源项目,这对于我来说是最好的选择”
Kaldi从诞生之日起,就是一款开源语音识别工具包。Daniel一直坚持开源工作,鼓励更广泛的用户自由使用、复制以及修改源代码,并推动智能语音技术的发展。
新一代Kaldi依旧采用了高效的C++代码实现。由于将 k2 的C++代码都包装到了Python, 模型的训练迭代都可以使用纯Python代码完成。
Daniel表示,基于Icefall中的示例脚本,开发者们可以很容易地基于自己公司产品的数据集进行修改,进而快速地搭建线上数据反馈和模型自动迭代更新的流程,这将大大缩短模型更新的周期。

python|兼容PyTorch!语音识别大牛Daniel Povey正式发布新一代框架Kaldi!
文章插图
随着新一代Kaldi 的发布和其在小米产品线的逐步落地,相信在不久的将来,小米将和其他公司一起,为普通用户带来更加完善的AIoT产品体验。
正如崔宝秋博士在去年举行的Kaldi线下交流会中所讲,这将是围绕Kaldi的“四赢”局面:Kaldi项目赢,小米语音赢,全球的Kaldi社区赢,所有跟Kaldi相关的中小型公司赢!
4

关于Daniel
Daniel可以说是语音识别领域的殿堂级人物。除了开发kaldi外,他还对语音识别做出了许多科学贡献,包括助力判别训练(现在称为序列训练)的早期发展等。从1999年发布语音识别研究成果以来,其论文被引用次数超过了 30000 次。也因如此,Daniel从约翰斯·霍普金斯大学离职后,引发了全球科技巨头的一场人才争夺战。

python|兼容PyTorch!语音识别大牛Daniel Povey正式发布新一代框架Kaldi!
文章插图
Daniel在2012年加入约翰斯·霍普金斯大学,担任语言和语音处理中心任副教授。在此之前,他在IBM研究院、微软研究院从事计算机语音识别研究。
2019年10月,Daniel正式加入小米公司,担任小米集团首席语音科学家。
雷锋网雷锋网雷锋网

推荐阅读