从GTX到RTX,NVIDIA GPU架构的变迁史(19)

2016年7月份NVIDIA推出了Titan X Pascal显卡 , 它使用的也是16nm Pascal架构 , 但核心是GP102 , 全规格的GP102核心确实可以称为目前最强大的微架构:120亿晶体管、3584个流处理器、12GB GDDR5X 显存、384-Bit位宽 , 相比Tesla P10的HBM 2显存和NVLink有所妥协 , 所以显存带宽为480GB/s , 8+6Pin供电 , 显示接口提供Display Port 1.4、HDMI 2.0b以及双链DVI , 最大支持7680*4320@60Hz输出 , 性能上达到11TFLOPS 。

在Titan X Pascal之外 , 桌面的GTX 1080 Ti显卡也是GP102核心 , 除了显存容量、位宽的变化之外 , GP102核心的SM单元架构也跟GP100核心不同 , 后者为了追求更高的计算性能 , 每组SM单元的CUDA核心数减少到了64个 , 但集成了更多组SM单元 , 高达56组 , 而GP102核心虽然也是3584个CUDA核心总数 , 但只有28组 , 每组SM单元的数量回归到了Maxwell的128个 , 所以这一代游戏及计算再次分离 , 本质上来说GP100是真正的Pascal核心 , 而GP102核心是16nm加强版的Maxwell架构 。

Maxwell(左)架构与GP104核心的SM单元架构

推荐阅读