Systolic阵列成为云端深度学习芯片的主流架构( 二 )

谷歌的TPU就是基于Systolic的架构 , 它的计算效率比英伟达(NVIDIA)的GPU高出了一个数量级 。 英伟达最新的Volta架构 , 也加入了专门的Tensor Core来提升张量计算的效率 , 其本质也是stolid阵列 。 云端深度学习的加速芯片的体系结构都在向Systolic阵列靠拢 , 本质上是各种改善型的Systolic阵列 。

推荐阅读