字节跳动|字节跳动开源最新 GAN 压缩算法 算力消耗只需原来的 1/46
字节跳动近期开源了一项代号为 OMGD 的压缩技术 。这是字节自研的 GAN( 生成对抗网络)压缩算法 , 在保证生成效果不变的前提下 , 算力消耗最低可以减少到原来的 1/46 , 相比之前业界的最佳压缩效果提升一倍多 。据悉 , 这项技术的论文已入选国际计算机视觉会议 ICCV 2021 。
文章图片
图:字节跳动技术团队发表的自研 GAN 压缩算法论文
GAN 是人工智能领域重要的深度学习模型 , 在图像生成、音乐生成和视频生成等方面应用广泛 , 还可以提高图像质量 , 实现图像风格化、图像着色等任务 。漫画特效等人们常用的短视频道具 , 就是通过 GAN 实现的 。
由于 GAN 对计算资源和存储空间的需求巨大 , 模型难以直接部署到手机 、Pad 等移动设备上 , 业界一直在努力改进 GAN 的压缩方法。2020 年 , 麻省理工学院 、Adobe 和上海交通大学的研究者们提出一种 GAN 压缩算法 , 将算力消耗成功减少到 1/21 。此次字节跳动提出的 OMGD 方法则进一步提升了压缩能力 。
OMGD(Online Multi-Granularity Distillation) 意为“在线多粒度蒸馏” 。据字节跳动技术团队的论文显示 , 该算法能灵活地在训练过程中优化并压缩 GAN 模型 , 从而实现更好的图像效果和更少的计算成本 。
测试数据表明 , OMGD 压缩算法对 Pix2Pix 和 CycleGAN 这两种常用的 GAN 解决方案效果显著。Pix2Pix 和 CycleGAN 主要应用于图像到图像的“翻译” , 比如将照片转换为绘画 , 对黑白图片着色等。OMGD 压缩算法可使其算力消耗分别减少到原来的 1/40 和 1/46 。
目前 , OMGD 压缩算法已在抖音等产品中落地 , 为用户提供更丰富的视频创作能力 。相关技术代码也已发布在开源社区 , 以帮助从业者提升 GAN 的创新和应用效率 。迄今 , 字节跳动已开源了机器学习平台 Klever、 联邦学习平台 Fedlearner、 高性能分布式训练框架 BytePS 、LightSeq 推理和训练引擎等重磅项目 。
【字节跳动|字节跳动开源最新 GAN 压缩算法 算力消耗只需原来的 1/46】节能环保是字节跳动一个重要的技术研究方向 。在不久前的自然语言处理领域国际顶会 ACL 2021 上 , 字节跳动的词表学习方案获得年度唯一的“最佳论文”大奖 , 该论文同样极具节能价值 , 相比主流词表可以节约 92% 的算力 。
推荐阅读
- bleu|字节跳动火山翻译上新 38 个稀有语种,翻译能力再升级
- 技术|使用云原生应用和开源技术的创新攻略
- Baidu|百度抢跑元宇宙 却默认“输给”字节?
- 设计|腾讯宣布企业级设计体系 TDesign 对外开源
- 项目|开源鸿蒙OpenHarmony 3.0实现全设备能力初步覆盖
- 协议|再发正式版本,经典开源压缩软件 7-Zip 21.07 发布:仅 1.5MB
- 字节跳动|抖音上线学习频道,为知识内容增加一级入口
- Open|意大利法院认定开源软件许可证的可执行性
- 字节跳动|抖音正测试“通讯录”功能:神似朋友圈
- Vue|TDesign 重磅开源,腾讯设计云产品集体亮相