计算机视觉9大常见应用,深度学习的这些名词你听过几个( 四 )

该任务可能涉及在图像中同一对象的多个示例周围添加边界框 。 这样 , 有时将该任务称为“对象检测” 。 用于本地化图像分类的ILSVRC2016数据集是一个受欢迎的数据集 , 包含150000张照片和1000个对象类别 。

3、物体检测尽管图像可能包含需要定位和分类的多个对象 , 但是对象检测是通过定位对图像进行分类的任务 。 与简单的图像分类或具有定位的图像分类相比 , 这是一个更具挑战性的任务 , 因为通常在不同类型的图像中存在多个对象 。 通常 , 针对本地化图像分类而开发的技术已被使用并证明用于物体检测 。

对象检测的一些示例包括:绘制边界框并标记街道场景中的每个对象 。 绘制边界框并标记室内照片中的每个对象 。 绘制边界框并标记景观中的每个对象 。 PASCAL视觉对象类数据集或简称PASCAL VOC(例如VOC 2012)是用于对象检测的常见数据集 。 另一个用于执行多个计算机视觉任务的数据集是Microsoft的“上下文数据集中的通用对象” , 通常称为MS COCO 。 4、对象分割对象分割或语义分割是对象检测的任务 , 其中在图像中检测到的每个对象周围画一条线 。 图像分割是将图像分割成多个部分的更普遍的问题 。 对象检测有时也称为对象分割 。 与涉及使用边界框识别对象的对象检测不同 , 对象分割可识别图像中属于该对象的特定像素 。 这就像一个细粒度的本地化 。 一般而言 , “图像分割”可能是指将图像中的所有像素分割为不同类别的对象 。 同样 , VOC 2012和MS COCO数据集可用于对象分割 。 KITTI Vision Benchmark Suite是另一个受欢迎的对象细分数据集 , 它提供用于自动驾驶汽车训练模型的街道图像 。 5、样式转移样式转移或神经样式转移是从一个或多个图像中学习样式并将该样式应用于新图像的任务 。 可以将此任务视为可能没有客观评估的一种照片滤镜或变换 。

推荐阅读