声音定制三天交付,深声科技如何在语音AI赛道弯道超车?( 三 )

\n

智能客服营销业务是深声科技正在尝试的场景 , 深声科技主要帮助运营商和金融客户定制声音并合成声音 , 使其在营销过程中提高通话时长和营销转化率 。 谈及看好语音交互和智能客服营销这两类客户群体的原因时 , 周俊明告诉创业邦 , 这两类客户对于语音音质的要求更高 , 通过深声科技自身语音合成技术的优势能很快产生规模化效应 , 且这两类客户群体的长期付费能力更强 。

\n

从时间的维度上看 , 深声科技相比科大讯飞、商汤科技等AI企业入局较晚 , 但团队正在加紧业务布局 , 构建自身技术壁垒 。 首先 , 基于端到端的语音合成技术逻辑 , 深声科技会对采集到的原始语音进行自动标注 , 再由声学模型算法对语言和语音进行音素级特征对齐 , 可以实现完全拟人发声 , 将语气、语调、语速、抑扬顿挫等语音特点完美呈现 。 在Blizzard Challenge 2019 国际语音合成大赛中 , 该技术在PER(拼音-不包含声调-错误率)和PTER(拼音-包含声调-错误率)两个指标上优于科大讯飞 。 此外 , 团队在声音定制合成方面的交付能力突出 , 三天内便可完成 , 而行业一般需要3~6个月 。

\n

成立不到两年 , 团队已有50多人规模 , 其中80%为技术研发人员 。 团队主要成员拥有中科院、中山大学、华南理工、日本早稻田大学等名校硕博教育背景和腾讯、网易、YY等名企工作经历 。 联合创始人黄博贤拥有12年的互联网语音和音频技术积累 , 先后在酷狗和YY主导语音和音频技术的开发 。

推荐阅读