如何将深度学习训练速度提升一百倍?PAISoar 来了( 七 )
2.1.1 网络层
我们和 AIS 网络团队、RDMA 项目团队一起搭建了集团内部第一套基于 RoCE 的大规模 RDMA 集群 , 并针对于深度学习场景进行了相应的参数调优 , 包括:
-
机器上搭载 Mellanox 25G 网卡支持基于 RoCE v2的 RDMA , 打造低延迟高吞吐通信网络;
-
ASW(接入层交换机 , 32口)和 PSW(聚合层交换机)间采用 8*100Gb 高速传输光纤 , 支持交换机 1:1 收敛比 , 搭建无损传输网络;
-
构建 TCP 和 RDMA 多级混合流控策略 , 解决各种混跑场景的流量干扰;
2.1.2 软件层
-
在 PAI Tensorflow 中接入 RDMA 驱动 , 使用 verbs 库进行 RDMA 通信 , 并和思科交换机进行适配调参;
-
对 RDMA 通信的关键路径进行梳理 , 加速内存拷贝 , 异步化数据发送 , 优化通信状态机 , 提高 RDMA 通信的效率和稳定性;
推荐阅读
- 小鱼人|如何在新赛季稳定上分?善于抓失误的小鱼人,值得认真练上一波
- 阴阳师|阴阳师SR川猿强度如何 是否值得抽卡 改变斗技环境 大佬的新玩具
- 手机游戏|梦幻西游手游:活力如何换金币 一切都已给出 就看你的选择
- 华佗|三国杀:两位\奶爸\,朱治与华佗比,强度如何呢?
- 亲朋上分|《亲朋上分》266391亲朋下分亲朋上下分永劫无间崔三娘技能介绍 崔三娘如何获得更多技能
- s6|金铲铲之战:S6双城传说如何才能快速上手?基础知识很关键
- |冰雪传奇:平民玩家四转后如何打金
- 穿越火线|CF:传说武器再度上新,那王者、炫金该如何发展?
- 无尽梦魇|魔兽世界TBC:深度解析“翠绿的宝珠”对哪些职业保值
- 打野|打野已经被削到几乎不能再削了,到底如何平衡打野位置?