声智科技CTO冯大航:AI章鱼系统架构在智慧城市的进展与应用( 七 )

右边的图是谷歌的做法,当信号进来之后,同样进行去混响的操作,用后面的两层网络对波束形成的部分做了一个拟合的过程,然后放入声学模型当中处理。

从这几个图可以看到,最简单的是接下来进一步的融合,这个过程可能信号处理发挥的作用更少一些。但如果两个人声重叠在一起,就很难识别出来应该识别哪一个人声。

一个好的系统,最本质的原因主要在于我们是在自然界这样一个复杂的系统当中,一定是存在线性效应也存在非线性效应。关于信号处理,声学擅长解决的是线性部分,深度学习擅长解决的是非线性部分,最好的方式一定是两者的完美融合。比如说鸣笛检测需要定位到车辆的位置,这一过程信号处理就可以发挥作用,通过深度学习把噪声去掉,智能安防和智慧交通系统也是如此。

声智科技CTO冯大航:AI章鱼系统架构在智慧城市的进展与应用

以上是技术方面的阐释,接下来我们剖析下系统层面。首先,我们认为现在新的系统正在形成,以简单的比喻说明,可以认为是从水母的计算模式向章鱼的计算模式进行转变。那么章鱼和水母有什么区别呢?章鱼的头脑更加聪明,触手更加灵活,从前可以联网的设备无外乎就是手机、平板或电脑,这些设备计算能力比较强,系统比较统一,用水母的计算模式完全可以满足需求。但现在,可以连通网络的设备越来越多,也存在各种各样的系统。如何屏蔽这些不同设备和系统间的差异,尽可能地实现统一,就必然催生出一套新的系统。在这一方面,亚马逊走在了最前列, 2014年亚马逊推出智能音箱的时候就考虑到这个问题,对整套系统进行彻底的优化,将80%的计算放在云端,把20%不能放在云端的计算放在端上,这样做的好处就是不论是再计算能力还是系统方面,都可以最大化地屏蔽端上的差异。

推荐阅读