澎思科技申省梅：后深度学习时代的智能视觉技术落地 | CCF-GAIR 2019(22)

2019-07-19

还有3D重建，在这个当中，我们的关键技术就是视觉SLAM 。我们有做这个的基因，一旦有客户对我们提出这方面的要求，就能很快把它做出来。

现在谈到视频结构化，刚才也有人谈到这一点，视频也好，语音也好，要在上面进行数据处理是不可能的，所以一定要视频结构化。但对我们来讲，视频结构化的优先顺序是不一样的，因为我们有人的卡口、车的卡口，所以对人和车是优先做的。

关于行人，可以看到人有基本的特征（性别、年龄、头部是怎么样的，有没有戴眼镜，他的上装、下装是什么样的，他的携带物，以及行为），我们看到一个视频，就会把它描述下来，生成这个视频的Metadata ，回头搜寻的时候就可以做逻辑推理，应用到不同的场景。

推荐阅读

上一篇：旷视首席科学家孙剑：深度学习变革视觉计算丨CCF-GAIR 2019

下一篇：华为首当其冲！中国首款5G手机7月26日首发，除了贵还有一个缺点