公司|重新认识特斯拉:一家计算公司( 二 )


一颗颗D1芯片的无缝连接 , 构成了一个25颗D1芯片组成的机器学习模块 , 再把多个模块集成在一起 , 就构成了一台特斯拉自研的超级计算机——Dojo 。 Dojo的日语译文是“道场” , 也就是修炼的地方 。 “修炼”的意象正符合一台超级计算机最核心的功能:对数据模型无休无止的机器学习和神经网络训练 , 炼成一颗超级大脑 。
Dojo有超过50万个训练节点 , 每个节点的算力为9千兆浮点计算(fetaflops) 。 基于Dojo的架构 , 特斯拉又发布了ExaPOD——集成了120个训练模块 , 包含3000颗D1芯片 , 超过100万个训练节点 , 算力超过1100千兆浮点计算 。 特斯拉说:这就是全球最快的AI训练计算机 。 作为一家非常喜欢用“概念替换”的方式无限放大自身优势的公司 , 特斯拉甚至想宣称:这已经是全球性能最强的超级计算机 。
然而作为一款神经网络训练为主要功能的计算器 , 特斯拉的“千兆浮点计算”指向的其实是低精度算力 , 而非超级计算机性能的通常参考值双精度浮点算力 。 按照后者性能计算 , 特斯拉Dojo的排名大约在世界第七 , 落后于日本的富岳(Fugaku)、美国的IBM Summit、美国的Sierra、中国的神威太湖之光、美国的Selene和中国的天河2-A 。 特斯拉说 , Dojo的性能下一代还会有10倍的提升——依据这家公司的历史 , 很难排除其中的“吹牛”成分 , 但特斯拉的一个“优势”在于 , 比起人工智能领域遍地存在的“吹牛不上税”的玩家 , 它总能把事情做得更到位 。
Dojo这个号称世界上最强的神经网络训练计算机 , 将被专注用来做一件事——训练特斯拉完全基于纯视觉而非激光雷达的自动驾驶 。 鉴于特斯拉在全球有几百万辆行驶在高速公路上的轿车 , 这是一项有着海量数据支撑的实验 。 特斯拉AI技术负责人Andrej Karpathy在AI Day上解释了Dojo这台超级计算机对纯视觉自动驾驶的意义:一辆特斯拉轿车上的8个摄像头能够检测足够多的图像数据和预期目标 , 但背后的神经网络矢量空间不够 。 于是 , 特斯拉基于Dojo计算平台重新设计了神经网络系统 , 作为自动驾驶系统的决策依据 。
也就是说 , 过去特斯拉的自动驾驶眼睛好使 , 但脑子还是不够用(不知道这是不是自动驾驶刹车系统经常出bug的原因) 。 现在 , 特斯拉重新给了每一辆车一个新的大脑 。
这是“算力”的力量 , 只有一家“计算公司”才能真正地做到这一点 。 它让特斯拉基于纯视觉方案的、将自动驾驶系统看作一个眼睛、神经和大脑的结合体的解决方案 , 得以在蔚来、小鹏和理想们“摄像头+激光雷达”的包围中 , 孤注一掷地走下去 。 Dojo这台超级计算机能不能真正地修炼出一颗比激光雷达厉害的“超级大脑” , 虽有待时间的检验 。 但其背后关于从芯片到模块再到超级计算机 , 从硬件到软件的一整套围绕着“计算”而投入的巨大成本 , 让特斯拉的本质从一家“电动车和太阳能公司”跳了出来 。

推荐阅读