澎思科技申省梅:后深度学习时代的智能视觉技术落地 | CCF-GAIR 2019(22)

还有3D重建 , 在这个当中 , 我们的关键技术就是视觉SLAM 。 我们有做这个的基因 , 一旦有客户对我们提出这方面的要求 , 就能很快把它做出来 。

现在谈到视频结构化 , 刚才也有人谈到这一点 , 视频也好 , 语音也好 , 要在上面进行数据处理是不可能的 , 所以一定要视频结构化 。 但对我们来讲 , 视频结构化的优先顺序是不一样的 , 因为我们有人的卡口、车的卡口 , 所以对人和车是优先做的 。

关于行人 , 可以看到人有基本的特征(性别、年龄、头部是怎么样的 , 有没有戴眼镜 , 他的上装、下装是什么样的 , 他的携带物 , 以及行为) , 我们看到一个视频 , 就会把它描述下来 , 生成这个视频的Metadata , 回头搜寻的时候就可以做逻辑推理 , 应用到不同的场景 。

推荐阅读