声智科技CTO冯大航:AI章鱼系统架构在智慧城市的进展与应用( 六 )
在这个过程当中,信号处理完全可以出一个逆流波器,这不能完全和原声一模一样。换言之,就是存在一些偏差,实际当中也有一些非线性效应,但这种信号确实和原来的信号更接近了一些,之后我们再重新训练网络,就可以达到很好的语音识别的效果。
其实,整个信号处理可以做的是什么样的工作?简单一点来说,我们要做的是信号多样性的问题。
左边的图是我们当前的语音识别的系统框图,一般来说,信号回来之后要做一个回声的工作,把设备自己的声音去掉。接下来我们会做一个去混响的操作,然后找到说话人的位置,做一些波形的工作,把处理后的信号送到云端,再后面是声学模型的结构,这就是一个复杂的网络,最终转化成文字。这个过程当中,从波形形成以后,这个信号实际上也是存在一定的失真,需要对后来的网络进行重新的迭代,让它对非线性的部分有一个学习的过程。大家可以看到,总而言之,整个过程还是信号处理跟语音识别的集联关系,不是深度的融合。但我们在不断探索,比如我们现在希望用深度学习的网络把回声消除的非线性部分进一步去除掉,这个公式比较简单,一个设备自己发出声音之后,首先利用线性的部分消除掉,就得到下面的公式,这是参考信号的非线性表达,S(n)是期望的信号,在这里面非线性回声残留会用参考信号的非线性的关系来表达。我们可以利用神经元网络进行一个模拟,这样处理之后,可以得到更好的结果。
推荐阅读
- 永劫无间|国产游戏优化都不行?永劫无间更新“黑科技”,玩家:丝滑般体验
- 吕蒙|三国志战略版:吕蒙、关银屏黑科技联动,技穷、缴械全都有
- 黄忠|三国志战略版黄忠蜀盾黑科技,蜀盾内战和打弟弟一样!
- 傲世堂|原傲世堂CTO叶志飞再创业,新公司获灵犀互娱1亿元投资
- ai|EDG夺冠,虎牙斗鱼B站直播间AI字幕黑科技比拼亮眼,虎牙的最准确
- 一加科技|钱小佳签约后平台未定,神豪“A皇”爆料,他复播不会选择斗鱼
- 地下城与勇士|DNF:堆满暴击率的4种方法!土豪靠“科技”,平民靠“变异”
- 主机掌机类游戏|我的世界:mc“穿越事件”,第一天还在砍树,数月后科技拉满!
- t1|LOL:T1黑科技时光辅助锁定赛点,六神跑酷烬DK毫无办法!
- 动视|巾帼不让须眉,新赛季女将黑科技十分惊艳,硬刚T0吴枪麒麟弓