文章图片
文章图片
目标检测
目标检测的方法我们选用了百度自研的 PicoDet , 该方法主打轻量级目标检测场景 。 下表展示了在 COCO 数据集上、backbone 选用 PP-LCNet 与 MobileNetV3 的结果的比较 。 无论在精度还是速度上 , PP-LCNet 的优势都非常明显 。
文章图片
语义分割
语义分割的方法我们选用了 DeeplabV3+ 。 下表展示了在 Cityscapes 数据集上、backbone 选用 PP-LCNet 与 MobileNetV3 的比较 。 在精度和速度方面 , PP-LCNet 的优势同样明显 。
文章图片
实际拓展应用结果说明
PP-LCNet 在计算机视觉下游任务上表现很出色 , 那在真实的使用场景如何呢?本节简述其在 PP-OCR v2、PP-ShiTu 上的表现 。
在 PP-OCR v2 上 , 只将识别模型的 backbone 由 MobileNetV3 替换为 PP-LCNet 后 , 在速度更快的同时 , 精度可以进一步提升 。
文章图片
在 PP-ShiTu 中 , 将 Backbone 的 ResNet50_vd 替换为 PP-LCNet-2.5x 后 , 在 Intel-CPU 端 , 速度快 3 倍 , recall@1 基本和 ResNet50_vd 持平 。
文章图片
PP-LCNet 并不是追求极致的 FLOPs 与 Params , 而是着眼于深入技术细节 , 耐心分析如何添加对 Intel CPU 友好的模块来提升模型的性能来更好地进行准确率和推理时间的平衡 , 其中的实验结论也很适合其他网络结构设计的研究者 , 同时也为 NAS 搜索研究者提供了更小的搜索空间和一般结论 。
自论文发出以来 , PP-LCNet 引起了国内外学术界和产业界的广泛关注 , 无论是各类版本的复现 , 还是极具探索意义和实用价值的各类视觉任务应用和技术分析文章层出不穷 , 将简单模型的实用性优化方案重新带入大家的视野 , 真正践行技术让 “生活” 更美好的初心 , 期待 PP-LCNet 在实际落地和应用中的更多表现 。
前面提到的论文 , 链接如下:https://arxiv.org/pdf/2109.15099.pdf
本论文工作的总体研究思路由百度飞桨 PaddleClas 团队提出并实施 。 PaddleClas 提供全球首个开源通用图像识别系统 , 并力求为工业界和学术界提供更高效便捷的开发工具 , 为开发者带来更流畅优质的使用体验 , 训练出更好的飞桨视觉模型 , 实现行业场景实现落地应用 。
想要获取更多 PaddleClas 相关介绍及教程文档可前往:GitHub: https://github.com/PaddlePaddle/PaddleClas
推荐阅读
- 精度|将建模速率提升10倍,消费级3D扫描仪Magic Swift在2021高交会大显“身手”
- 识别|天津滨海机场RFID行李全流程跟踪系统完成建设 行李标签识别成功率可提升至99%
- 制造业|稳健前行开新局 制造业未来五年转型升级迎来“加速度”
- 设计|宇瞻发布 NOX 系列 DDR5 电竞内存,速度最高 7200MHz
- 周鸿祎|网络安全行业应提升数字安全认知
- 曾学忠|小米手机部总裁曾学忠:希望明年与光弘科技完成智能手机4000万台目标 将引入高端和旗舰项目提升合作规模
- 安全风险|网络安全行业应提升数字安全认知
- 数据|全球5G下载速度普遍下降,韩国、中国等除外
- 东西|手机越用越卡?是这5个东西在拖慢你的手机速度!
- 速度|长江存储发布PCle4.0 固态硬盘致态TiPro7000,顺序读取速度高达7400MB/s
