腾讯优图贾佳亚:人工智能的多模态发展丨CCF-GAIR 2019(11)

因为我们现在还没有一套完整系统 , 甚至没有一个好的算法 , 把最为简单的两种模式叠加起来 。

如果十年、二十年后回过头来看我们现在的发展历程 , 比如人脸识别超过了人、特征识别超过了人 , 这些都是微不足道的 , 因为我们有更为广阔的天地要去探索 。

通过以上介绍就会发现 , 其实人工智能距离成熟还太远太远 , 现在的人工智能是单模态的人工智能 , 甚至是单点的一个触发 , 在以后的多模态世界中 , 会发生很多更为有趣的事情 。

同时 , 做好这件事 , 也有诸多难点 。

第一个是数据模态的多样性 。

我们有这么多图像、模型、文本、声音、结构化信息 , 怎么去融合?怎么能找到一个场景把这么多信息融合进来?

当你把这些信息全部融合在一起的时候 , 与我们最为贴合的是哪一个产业?那就是汽车产业 。

推荐阅读