“听声避险”?这个AI可精确辩声 帮助防盗和规避交通事故( 二 )

为了训练AuditoryNET的算法,Audio Analytic公司使用了世界上最大音频数据收集平台Alexandria提供的数据。米切尔说:“我们最近做的事情是绘制出我们整个声音世界的地图。”

“听声避险”?这个AI可精确辩声 帮助防盗和规避交通事故

图2:Audio Analytic公司的声音地图包含600万份音频文件,包括六种类型的餐厅窗户玻璃碎裂的声音。

Audio Analytic公司已经创建了一个包含600多万个音频文件的声音地图。它看起来就像是个彩虹蜂巢:在视觉上代表着相似的声音聚集在一起的彩色块,或称为“色调岛屿”。

米切尔表示,通过调整音量,他们的技术可以识别出有细微差别的声音。比如来自餐厅玻璃的破碎声就有6种,其中由玻璃制成的层压板的碎裂声与其他声音截然不同。

Alexandria的音频样本数据池必须从头开始构建。电影中常见的声音是没有用的,因为它们并不真实。米切尔说:“如果你去看最新的《复仇者联盟》电影,我敢肯定绿巨人会把什么东西掉在车上。”

推荐阅读