面向边缘智能的模型推理优化技术简介
在深度学习模型的部署(即模型推理)阶段 , 为了在算力和能耗均受限的边缘或终端设备实现低延迟和高效能的模型推理 , 现有的优化技术主要可以分为模型压缩、模型分割、模型提前退出、模型选择、边缘缓存、输入过滤、面向应用优化等7种 。
模型压缩:通过压缩深度学习模型 , 可以使模型从“大”变“小” , 从而降低模型复杂度和资源需求 , 更好地在资源受限的边缘设备上实现低延迟和低能耗的模型推理 。 模型压缩的常用方法包括权重剪枝(weight pruning)和数据量化(quantization) 。 其中 , 权重剪枝的基本思想为:深度学习模型中含有大量的权重参数 , 然而不同的权重参数对模型表示能力(即模型精确度)的贡献具有差异 。 因此 , 通过删除重要程度低(即对模型表示能力贡献少)的权重参数 , 可以达到以牺牲少量模型精度为前提 , 显著降低模型资源消耗的目的 。 数据量化是另一项用于模型压缩的主流技术 , 其基本思想为通过低精度的数值来表示权重参数 , 例如8比特、4比特甚至1比特 , 从而降低模型的复杂度和资源消耗 。 值得注意的是 , 数据量化同样会降低模型精度 。
推荐阅读
- 重生边缘|【荒野大镖客2】每日任务更新攻略2021年10月23日
- canyon|梦幻西游:论梦幻精灵的智能程度,被和谐了也能找到正确内容
- 阴阳师|阴阳师:一次活动等于半年收益?魂土逐渐边缘化,囤体力才是王道
- 阴阳师|阴阳师:抵抗是否成为时代的眼泪?必中控制横行,它逐渐被边缘化
- ai|R星已成功研发“高智能AI”系统,未来“开放世界”将更加智能!
- RNG|WE遭RNG让一追二,官博出面向观众致歉,TES面临考验
- 永恒边缘|IG被BLG干碎,官博沦陷了!Rookie被狂喷:你现在只叫送义进
- 三国杀|【三国杀国战】吴国四害已消三害,唯剩一人还在边缘徘徊
- csgo|CSGO最强反作弊出现了?完美平台使用人工智能封禁
- ag战队|王者荣耀KPL解说爆料, 每赢一局都有一万五奖金, AG战绩1-1掉级边缘!