AI芯片混战,谁能挑战英伟达?(14)

给一万名工程师一个大沙盒

现在,快到三年到2019年。再一次,竞争对手声称他们的芯片有10倍甚至100倍的性能优势,而这一切都还在开发中。英伟达仍拥有一万名工程师队伍,并与全球顶尖的研究人员和终端用户保持着技术合作关系。现在,他们都在为英伟达的下一代7nm芯片献技,在我看来,这基本上将使该公司的产品从“带AI的GPU芯片”转变为“带GPU的AI芯片”。

AI芯片混战,谁能挑战英伟达?

图1:英伟达的DGX-2超级计算机用连接在NVSwitch上的16 V100 GPU提供了2 peta-ops的AI性能。

英伟达工程师需要为公司的下一代产品添加多少额外的逻辑区域?虽然下面的分析很简单,但它可以有效地构建对这个关键问题的答案。

让我们从第一款貌似具有出色性能的ASIC开始,即谷歌TPU。我看到分析说每个谷歌TPU芯片大约是2-2.5B个晶体管。Volta V100在12nm制造工艺中拥有大约21B晶体管。它是台积电可以制造的最大芯片。随着英伟达从12nm迁移到7nm,芯片可以包含大约1.96(1.4x1.4)倍的晶体管。因此,从理论上讲,如果英伟达不添加任何图形逻辑(当然不太可能),它将会有另外200亿个晶体管可以使用,大约是整个Google TPU逻辑量的十倍。假设我的逻辑部分占去2倍。在这种情况下,英伟达工程师仍然有5倍的逻辑可用于新AI功能。现在,所有这一切都假设英伟达将全力追求性能,而不去降低成本或电力。不过,在训练市场上,这正是用户所需要的:缩短训练时间。关于英伟达可能提供什么,有很多想法,包括处理器内存和更多版本的tensorcore。

推荐阅读