如何将深度学习训练速度提升一百倍?PAISoar 来了(13)
经过 num_devices - 1 轮后 , 每个 device 上都有一个 tensor 分片进得到了这个分片各个 device 上的和 。
AllGather 阶段:
经过 num_devices - 1 轮后 , 每个 device 上都每个 tensor 分片都得到了这个分片各个 device 上的和;由上例可以看出 , 一次 Ring Allreduce 中单个节点总的通信数据量是
每个节点上通信数据量的上限不会随分布式规模变大而变大 。
在 PaiSoar 中 , 我们基于 Tensorflow 原生的通信原语 Rendezvous 实现 Ring AllReduce 算法 , 并提供简化用户构建分布式 TF 模型训练的
ReplicatedVarsOptimizer 接口(用户文档) , 核心功能如下:
-
简单的用户接口:只需开启 PAISoar 之后将原有的 Optimizer 包装为 ReplicatedVarsOptimizer , 即可将单机模型改成分布式模型 , 不需要修改太多的代码;
推荐阅读
- 小鱼人|如何在新赛季稳定上分?善于抓失误的小鱼人,值得认真练上一波
- 阴阳师|阴阳师SR川猿强度如何 是否值得抽卡 改变斗技环境 大佬的新玩具
- 手机游戏|梦幻西游手游:活力如何换金币 一切都已给出 就看你的选择
- 华佗|三国杀:两位\奶爸\,朱治与华佗比,强度如何呢?
- 亲朋上分|《亲朋上分》266391亲朋下分亲朋上下分永劫无间崔三娘技能介绍 崔三娘如何获得更多技能
- s6|金铲铲之战:S6双城传说如何才能快速上手?基础知识很关键
- |冰雪传奇:平民玩家四转后如何打金
- 穿越火线|CF:传说武器再度上新,那王者、炫金该如何发展?
- 无尽梦魇|魔兽世界TBC:深度解析“翠绿的宝珠”对哪些职业保值
- 打野|打野已经被削到几乎不能再削了,到底如何平衡打野位置?