助力深度学习!阿里开源可插拔 GPU 共享调度工具(11)

Allocate方法中 , 会根据 GPU Share Scheduler Extender 的调度决策运行对应的 Pod

  • 会列出该节点中所有状态为 Pending 并且ALIYUN_COM_GPU_MEM_ASSIGNEDfalse的 GPU Share Pod

  • 选择出其中 Pod Annotation 的ALIYUN_COM_GPU_MEM_POD的数量与 Allocate 申请数量一致的 Pod 。 如果有多个符合这种条件的 Pod , 就会选择其中ALIYUN_COM_GPU_MEM_ASSUME_TIME最早的 Pod 。

  • 将该 Pod 的 annotation ALIYUN_COM_GPU_MEM_ASSIGNED设置为true , 并且将 Pod annotation 中的 GPU 信息转化为环境变量返回给 Kubelet 用以真正的创建 Pod 。

[
(https://www.atatech.org/articles/132268#9)相关项目

目前项目已经开源到 github.com 上gpushare-scheduler-extendergpushare-device-plugin

部署

推荐阅读