声学|这波钉钉搞音频实验室,真没蹭热点( 三 )


声学|这波钉钉搞音频实验室,真没蹭热点
文章插图
还有语音3A算法。冯津伟团队会将达摩院Fullband 3A快速在钉钉落地,这项算法对会议拾音的3个核心能力做了深度优化:优化主讲增益(AGC)。实测3米以外10dBFS的声音可增益至22dBFS,距离主机5米的地方讲话,对方依然可以听得很清楚。优化回声消除(AEC)。能有效消除99%由扬声器外放声音经空间传播后产生的回声,人声失真控制在3%以内;实现房间自适应,可以智能检测房间混响,实现双讲透明。优化噪声抑制(ANS)。能够抑制特定的噪声,比如压制主讲人旁边的人声和会议室常见的空调、鼠标、键盘、翻书等噪音,确保传递出的声音更纯净。这一算法目前已经应用在钉钉F1视频会议一体机,以及合作伙伴罗技的产品上。借助这一算法,相关产品在音频质量主观盲测MOS等得分,远超同段位视频会议设备。可以说是同类产品中的性价比之选。……
声学|这波钉钉搞音频实验室,真没蹭热点
文章插图
技术储备显然已经就位,思路亦清晰明朗。从这个角度来说,钉钉加码音视频技术这一举动,似乎也值得被重新评估。返璞方能归真无疑,元宇宙是当下最火科技热词,而钉钉的会议场景,又恰恰是巨头们纷纷看好的元宇宙应用阵地。技术、场景对口,又背靠阿里这样的大集团,乘概念之势提前抢占生态位,听上去倒也是业内的常规操作。但或许,恰恰是在概念满天飞之时,才更应该冷静思考,什么才是现有技术能直观改变用户体验之处,什么才是行业最急需的技术进步。钉钉单纯加码音视频,又着重选择了音频这个更不容易被“看”到的赛道,看似逆潮流,但反过来说,焉不是一种对自身定位的明确,一种技术底气的体现。
声学|这波钉钉搞音频实验室,真没蹭热点
文章插图
说到这里,吃瓜已毕:钉钉确实加码了音视频,但进军元宇宙——还不到这份上。话说回来,虽然不是直指元宇宙,但正如前文所说,音频等技术同样是保障元宇宙交互体验的基础。钉钉音视频将开放建生态作为重点,或许反而能在元宇宙的未来风向里站稳自己的生态位。而且,冯津伟也强调,有了音频实验室的中间环节,钉钉接下来与达摩院语音、视频、视觉、XR等相关实验室的合作将会更深入,毕竟同为研究人员,更有共同话题嘛(手动狗头)。不过,钉钉的选择,却也引发了新一层思考:跟风热度,而缺少对行业本质的洞察,恐怕会在愈发拥挤的赛道之中,偏离自身的航向。stop doing list,未为不可。你觉得呢?One More Thing最后的最后,冯津伟博士还向我们透露了一个讯息:钉钉蜂鸣鸟音频实验室启动阶段,人才需求旺盛。感兴趣的小伙伴可以投起来了。

推荐阅读