计算机视觉9大常见应用,深度学习的这些名词你听过几个( 三 )
在本文中 , 你将发现九个有趣的计算机视觉任务 , 其中深度学习方法正在取得进展 。 注意 , 在图像分类(识别)任务时 , 采用了ILSVRC的命名约定 。 尽管这些任务集中在图像上 , 但是它们可以推广到视频帧 。 我试图将重点放在你可能感兴趣的最终用户问题的类型上 , 而不是在深度学习方面做得很好的更多学术子问题上 。 每个示例都提供了对该问题的描述以及一个示例 。 是否有未列出的最喜欢的用于深度学习的计算机视觉应用程序?1、图像分类图像分类涉及为整个图像或照片分配标签 。 这个问题也被称为“对象分类” , 并且可能更普遍地被称为“图像识别” , 尽管后者的任务可能适用于与图像内容分类有关的更广泛的任务集 。
图像分类的一些示例包括:是否将X射线标记为癌症(二进制分类) 。 对手写数字进行分类(多类分类) 。 为面部照片分配名称(多类分类) 。 用作基准问题的图像分类的一个流行示例是MNIST数据集 。
街景房门号码(SVHN)数据集是对数字照片进行分类的一种流行的现实版本 。 该图像的类别是什么?有许多涉及对象照片的图像分类任务 。 两个受欢迎的示例包括CIFAR-10和CIFAR-100数据集 , 这些数据集的照片分别分为10类和100类 。 大规模视觉识别挑战赛(ILSVRC)是一项年度竞赛 , 在该竞赛中 , 团队将根据ImageNet数据库中提取的数据 , 在一系列计算机视觉任务中争夺最佳性能 。 图像分类的许多重要进步来自有关此挑战的任务或有关此任务的论文 , 其中最著名的是有关图像分类任务的早期论文 。 2、具有本地化的图像分类具有本地化的图像分类涉及为图像分配类别标签 , 并通过边界框(在对象周围绘制一个框)显示对象在图像中的位置 。 这是图像分类的更具挑战性的版本 。 具有本地化的图像分类的一些示例包括:标记X射线是否为癌症 , 并在癌变区域周围画一个方框 。 在每个场景中对动物的照片进行分类并在动物周围画一个方框 。 用于本地化图像分类的经典数据集是PASCAL视觉对象类数据集 , 或简称为PASCAL VOC(例如VOC 2012) 。 这些是多年来在计算机视觉挑战中使用的数据集 。
推荐阅读
- 孙尚香|孙尚香异界灵契皮肤上线,而玩好他需要解决5大常见操作问题
- 明日之后|热血传奇:最常见的三大PK原因,快来看看有没有你当年PK的原因
- kpl|【KPL常见组合】职业选手都在用的组合,你确定不拿去上分?
- 王者荣耀|原神:萌新会用班尼特吗?火神的十个常见的误区 下篇
- 地下城与勇士|DNF:属性最夸张的“玉玺”!12%技攻最常见,20负重给肥宗无敌
- 挂机|游戏搬砖常见问题,如何一台电脑挂机日产300左右
- 精灵宝可梦|《宝可梦》每个世代都常见的雨天,反过来也很被环境影响?
- 原神|原神:刷大世界最常见的阵容,钟离上场率低,万叶被策划“针对”
- 地下城与勇士|DNF一些常见的流传很广的谣言
- 阴阳师|阴阳师:勾玉严重不足?常见几个误区赶紧避开,百连抽不在话下