使用 K8S 几年后,这些技术专家有话要说( 七 )

第一是物理层面,英伟达是在 CUDA 的驱动层面来做的,虽然性能很好,但由于是在虚拟机层面做的,因而不适合容器。

第二是它不开源,而且收费。既然不开源,出现各种问题你就很难去查。

另外,英伟达基于 MPS 做了一个软件的 GPU 虚拟化,要求必须平均分配,这会造成资源的浪费。比如,它是把一张卡虚拟成 0.01 之类的。使用一张卡其实很浪费,以一张 P40 的卡为例,很有可能你的算法根本用不到。基于这个痛点:腾讯做了一个选型,也是在 CUDA 层面上做了一层,所有的调用都是转到这个后面,再去调 CUDA 的底层,但是我们这个不会对 CUDA 底层的东西做任何改动,只是中间加了一层。

使用 K8S 几年后,这些技术专家有话要说

图5/15

使用 K8S 几年后,这些技术专家有话要说

图6/15

超参数科技高级研发工程师 朱恒满

推荐阅读