超能课堂(170): 从桌面到移动, NVIDIA的追光大计( 七 )

·Tensor Core:张量核心 , 这是之前的Volta架构就有的设计 , Turing架构对其进行了增强 。 还增加了新的INT8和INT4精度模式 , FP16半精度也能够被完整支持 。 简单来说 , Tensor Core就是给GPU带来了AI人工智能加速能力 , NVIDIA的DLSS抗锯齿技术就需要Tensor Core来加速运算 。

·RT Core:RT Core可以说事图灵GPU最为核心的功能了 , 没有之一 , 因为RT Core才是实现实时光线追踪的关键 , 一个SM单元中只需要配备一个RT Core即可 , 因为SM单元只是个引子 , 用于启动 , 剩下的工作全都交由RT Core处理 , 会自动计算执行BVH遍历以及光线和三角求交 , 并且向SM单元返回结果 , 从而节省SM单元执行的数以千计的指令 。

在NVIDIA发布的几款RTX 20系显卡中 , 目前有TU102、TU104、TU106三个图灵GPU核心 , 分别用于RTX 2080 Ti、RTX 2080及RTX 2070显卡 , 分别集成了68组、46组、36组RT Core , 其中RTX 2080 Ti每秒钟可以追踪10G条光线 , 78T的RTX-OPS;RTX 2080每秒追踪光线降低至8G条 , RTX-OPS也降低至60T;RTX 2070每秒能追踪的光线只有6G条 , 45T RTX-OPS;而Pascal的游戏王者GTX 1080 Ti只能追踪1.1G条光线 , RTX-OPS只有11.3T , 所以RT Core性能是非常强劲的 。

推荐阅读