在对话中理解苏大强们:语音交互的未来会是老龄化+个性化吗?( 五 )

不难看出,如今NLP领域中关于语料的累积和处理,已经呈现出了横向和纵向两种态势。横向来看,是汉、英、日、俄以及各种少数民族语言、小语种等等语言类型。纵向来看,则是一个人从童年到老年整体语言能力的发展变化。

相较之下,更多时候我们仍然还停留在对NLP语料进行横向耕耘的阶段,不断地深挖语义,尽可能去实现足够自然的语音交互。但纵向的语言能力变化,同样对语音交互效果有着巨大的影响。

就拿儿童语音识别来说,儿童音域与成年人不同,语言能力以及对智能产品的认知理解也与成年人有巨大的差异。在谷歌助手、亚马逊Echo这类产品身上,都曾出现过儿童语音识别不准确的问题。目前已经有不少创业公司,例如来自爱尔兰的SoapBox Labs已经开始着手去建立专属于儿童的语音识别算法。

其实个体语言能力的差异何止儿童、老年人、成年人这三个维度?不同性别、不同受教育能力、不同细化年龄阶段,都可能决定其语言能力的细节差异。

在未来,当语音交互真正进入细节化竞争时,很可能出现的是语料数据处理平台化+语音交互方式个性化。

推荐阅读