腾讯优图贾佳亚:人工智能的多模态发展丨CCF-GAIR 2019(16)
但是很少人问 , 这张图像里是不是个羚羊 , 没有问这些问题的时候 , 系统就学不到否定性的答案 , 在你的数据集上就会出现很大的偏差 。
第二是这个问题缺乏多模态的监管 , 也就是说有这样一个图像 , 我们只有一个简单的问题 , 比如 “这里面的桌子是什么颜色的” , 实际上图片中并没有桌子 , 但它还是要给你一个答案 , 这就是缺乏监督的原因 。
还比如说 , 这张图像里有多个人员 , 我要把它区分出来是非常难的 , 人眼可以精确分割碗里的每一粒米 , 但是现在的算法想分割出每一粒米 , 并不是很容易 。
基于腾讯的一个巨大的内容平台 , 我们每天要处理百亿计的视频 , 包括长视频、短视频、小视频 。
我们基于多模态的处理方式 , 从视频本身得到很多视频特征 , 然后进行多模态融合 , 目前做得效果不错 。
最后讲讲多模态的未来发展 。
推荐阅读
- 腾讯|腾讯49亿日元投资目标明确:3款新游明后年全球发行,强化主力IP
- 腾讯|LPL年度最佳选手,同队最多三人,选谁?
- 腾讯|LPL官方发新歌,JKL被吐槽累死调音师,网友:Lvmao努力在C了!
- 挂机|腾讯网易都不敢做的事,它却做到了!挂机烤火掉神装,能卖上千元
- 腾讯|腾讯Q3财报公布,青少年游戏时长仅占比0.7%,目标却远不止此
- 王者荣耀|《英雄联盟》大热 腾讯成大赢家
- 金铲铲之战|为了防腾讯米哈游抢人,游戏厂商也开始内卷,育碧竟被偷家?
- 腾讯|本来能更火的LOL动画,居然被腾讯耽误了?
- 腾讯|10月网吧热力排行榜公布,LOL第一原神第8,前20腾讯占据10款
- 阴阳师|为何崩坏3在Steam上差评如潮,在腾讯WeGame却有超8成好评?