文章图片
第二步 , 上传并标注数据 。 检测功能的模型:上传数据后 , 需要在数据中标注出需要检测的具体目标 。
要知道 , 数据的获取是一个比较长的过程 , 这个过程中需要开发者去采集数据 , 标注数据 , 清洗数据 , 每个流程都可能会占用我们较多的人力 。
别担心 , 百度推出的一站式数据处理和服务平台EasyData , 主要围绕AI开发过程中所需要数据采集、数据清洗、数据标注等业务需求提供完整的数据服务 , 帮助你提升模型训练的效果 。
文章图片
在竹签数据集中 , 采集的图片竹签占比小 , 背景干扰多 , 可以通过数据清洗模块批量裁剪掉非目标的背景区域 , 保留核心竹签区域 。
文章图片
第三步 , 训练模型并校验效果 。 选择部署方式与算法 , 用上传的数据一键训练模型;模型训练完成后 , 可在线校验模型效果 。
EasyDL平台的用户可根据模型部署环境以及对预测时延的要求来选择模型 , 一般情况下 , 时延越大 , 精度越高 。
文章图片
得到模型的初步效果后 , 用户还可以根据其特点进一步优化 。
文章图片
首先是数据增强 , 竹签图片量不大 , 为了扩产数据集并提高模型的泛化性 , 可以采用数据增强策略 。
文章图片
其次是优化超参数 , 如锚框大小、输入分辨率、学习率、优化器等 。 百度飞桨EasyDL平台提供自动超参搜索服务 , 能大幅提升模型的效果 。 同时 , EasyDL支持早停、失败重试、表现差的试验复用优秀试验的预训练权重等功能 , 使训练更加高效 。 在EasyDL线上多场景模型精度可以平均提升10%以上 。
文章图片
最后是智能评估 。 通过查看指标、归因分析、有针对性地收集和修正数据并进行模型迭代 , 模型调优的效率普遍可以提升50% , 在有些数据集上精度甚至可以提升20%以上 。
第四步 , 发布模型 。 根据训练时选择的部署方式 , 将模型以云端API、设备端SDK等多种方式发布使用 。
文章图片
EasyDL提供灵活丰富的服务部署形态 , 包括公有云部署、本地服务器部署、设备端SDK、软硬一体产品等 。 它还支持4大操作系统 , 15+芯片类型 。
推荐阅读
- 快报|“他,是能成就导师的学生”
- 技术|“2”类医械有重大进展:神经介入产品井喷、基因测序弯道超车
- bug|这款小工具让你的Win10用上“Win11亚克力半透明菜单”
- 重大进展|“2”类医械有重大进展:神经介入产品井喷、基因测序弯道超车
- 历史|科普:詹姆斯·韦布空间望远镜——探索宇宙历史的“深空巨镜”
- 空间|(科技)科普:詹姆斯·韦布空间望远镜——探索宇宙历史的“深空巨镜”
- 精度|将建模速率提升10倍,消费级3D扫描仪Magic Swift在2021高交会大显“身手”
- 四平|智慧城市“奥斯卡”揭晓!祝贺柯桥客户荣获2021世界智慧城市治理大奖
- |南安市司法局“加减乘除” 打造最优法治营商环境
- ASUS|华硕预热ROG Flow Z13:称其是“全球最强悍的游戏平板”