36氪首发 | 「庄生晓梦」完成数百万元Pre-A轮融资,投资方为浩方创投( 三 )

先是智能会议终端,这款终端以USB驱动,即插即用,可以适配目前市面上主流的云视频会议系统,主要可以应用与企业中小型会议室(10-30平方米),其具备的特色功能包括:

听声辨位,实时切换聚焦说话人画面。硬件搭载全向360度摄像头和全向麦克风阵列,同时具备语音视觉双重认证功能。人脸签到;语音识别自动转会议文字纪要,未来还计划实现文字字幕实时显示的功能。音频降噪,支持双向通话的回声消除;360度交互与广角双模式,并可以实现一键切换。其背后核心技术在于全向声源定位、全向视觉算法以及视觉语音融合验证算法等算法,通过精确计算声音方位角定位说话人位置,再调用视觉算法确认声音对象的确是发言人,之后系统会自动截取该对象的画面,更新到会议画面中。庄生晓梦的另一个优势是能将这些算法集成到相对便宜的芯片上,在产品研发上实现闭环产出,并不依赖芯片公司,同时也能切换到全国产芯片。

如何提高视频会议交互性一直是视频会议解决方案提供商们关注的重点。庄生晓梦产品可以实现说话人画面的实时切换,这样的功能设计可以让相对“陌生”参会者明确发言人位置和身份,增强在场感。

推荐阅读