速度|速度提升2倍,超强悍CPU级骨干网络PP-LCNet出世( 三 )


文章图片


速度|速度提升2倍,超强悍CPU级骨干网络PP-LCNet出世
文章图片

目标检测
目标检测的方法我们选用了百度自研的 PicoDet , 该方法主打轻量级目标检测场景 。 下表展示了在 COCO 数据集上、backbone 选用 PP-LCNet 与 MobileNetV3 的结果的比较 。 无论在精度还是速度上 , PP-LCNet 的优势都非常明显 。

速度|速度提升2倍,超强悍CPU级骨干网络PP-LCNet出世
文章图片

语义分割
语义分割的方法我们选用了 DeeplabV3+ 。 下表展示了在 Cityscapes 数据集上、backbone 选用 PP-LCNet 与 MobileNetV3 的比较 。 在精度和速度方面 , PP-LCNet 的优势同样明显 。

速度|速度提升2倍,超强悍CPU级骨干网络PP-LCNet出世
文章图片

实际拓展应用结果说明
PP-LCNet 在计算机视觉下游任务上表现很出色 , 那在真实的使用场景如何呢?本节简述其在 PP-OCR v2、PP-ShiTu 上的表现 。
在 PP-OCR v2 上 , 只将识别模型的 backbone 由 MobileNetV3 替换为 PP-LCNet 后 , 在速度更快的同时 , 精度可以进一步提升 。

速度|速度提升2倍,超强悍CPU级骨干网络PP-LCNet出世
文章图片

在 PP-ShiTu 中 , 将 Backbone 的 ResNet50_vd 替换为 PP-LCNet-2.5x 后 , 在 Intel-CPU 端 , 速度快 3 倍 , recall@1 基本和 ResNet50_vd 持平 。

速度|速度提升2倍,超强悍CPU级骨干网络PP-LCNet出世
文章图片

PP-LCNet 并不是追求极致的 FLOPs 与 Params , 而是着眼于深入技术细节 , 耐心分析如何添加对 Intel CPU 友好的模块来提升模型的性能来更好地进行准确率和推理时间的平衡 , 其中的实验结论也很适合其他网络结构设计的研究者 , 同时也为 NAS 搜索研究者提供了更小的搜索空间和一般结论 。
自论文发出以来 , PP-LCNet 引起了国内外学术界和产业界的广泛关注 , 无论是各类版本的复现 , 还是极具探索意义和实用价值的各类视觉任务应用和技术分析文章层出不穷 , 将简单模型的实用性优化方案重新带入大家的视野 , 真正践行技术让 “生活” 更美好的初心 , 期待 PP-LCNet 在实际落地和应用中的更多表现 。
前面提到的论文 , 链接如下:https://arxiv.org/pdf/2109.15099.pdf
本论文工作的总体研究思路由百度飞桨 PaddleClas 团队提出并实施 。 PaddleClas 提供全球首个开源通用图像识别系统 , 并力求为工业界和学术界提供更高效便捷的开发工具 , 为开发者带来更流畅优质的使用体验 , 训练出更好的飞桨视觉模型 , 实现行业场景实现落地应用 。
想要获取更多 PaddleClas 相关介绍及教程文档可前往:GitHub: https://github.com/PaddlePaddle/PaddleClas

推荐阅读