如何将深度学习训练速度提升一百倍?PAISoar 来了( 九 )
图中参数说明:
-
上面4个图分别是 Inception v3、ResNet-50、ResNet-152、VGG16 这四个模型的性能测试数据;
-
横坐标是 GPU 卡数 , 纵坐标是模型训练总的 Images/sec;
-
ps、allreduce 分别表示模型参数同步的模式是 worker+ps 模式或 Ring AllReduce 模式;
-
grpc、rdma 分别表示通信底层使用的是 grpc 协议还是 rdma 协议 。
Tensorflow 默认的分布式方法是 worker+ps 模式 , variable 定义在 ps 上 , worker 会训练并更新 ps 上的参数 。 我们将底层通信协议替换成 RDMA 后 , 各模型性能都有提升 , 在 64GPU 卡下 , Inception v3、ResNet-50、ResNet-152、VGG16 四个模型性能分别提升:24.94%、44.83%、38.80%、23.38% 。
相较于 worker+ps 模式 , PAISoar 中提供的 Ring AllReduce 通信模式对网络带宽利用率更高 , 延迟更小 。 与 worker+ps (使用 grpc 通信)相比 , 各模型性能提升非常明显 , 在64 GPU 卡下 , Inception v3、ResNet-50、ResNet-152、VGG16四个模型性能分别提升:84.77%、125.43%、56.40%、40.04% 。
推荐阅读
- 小鱼人|如何在新赛季稳定上分?善于抓失误的小鱼人,值得认真练上一波
- 阴阳师|阴阳师SR川猿强度如何 是否值得抽卡 改变斗技环境 大佬的新玩具
- 手机游戏|梦幻西游手游:活力如何换金币 一切都已给出 就看你的选择
- 华佗|三国杀:两位\奶爸\,朱治与华佗比,强度如何呢?
- 亲朋上分|《亲朋上分》266391亲朋下分亲朋上下分永劫无间崔三娘技能介绍 崔三娘如何获得更多技能
- s6|金铲铲之战:S6双城传说如何才能快速上手?基础知识很关键
- |冰雪传奇:平民玩家四转后如何打金
- 穿越火线|CF:传说武器再度上新,那王者、炫金该如何发展?
- 无尽梦魇|魔兽世界TBC:深度解析“翠绿的宝珠”对哪些职业保值
- 打野|打野已经被削到几乎不能再削了,到底如何平衡打野位置?