原创<br> 台积电官博力挺摩尔定律,5nm制程工艺将有重大突破( 五 )

从CPU和GPU的经典计算任务中可以看出,现代芯片的晶体管时钟速度极快,接近5千兆赫甚至更高。实际上,这些计算任务所面临的核心挑战是保持CPU和GPU内核数据的供应。

虽然这是典型的软件问题,但现代线程架构和方法已经直接将性能瓶颈置于硬件层面。我们终于看到了大数据分析和人工智能时代内存缓存的局限性。

为了满足现代快速CPU、GPU和专用AI处理器的需求,我们除了要为内核处理器提供更高宽带的数据之外,还必须提供在物理上更靠近请求数据(requesting the data)的内存,以改善内核延迟,这些都是设备级密度所提供的。当内存靠近逻辑内核配置时,系统可以实现更低的延迟、更低的功耗和更高的整体性能。

有些人可能认为这是系统级的问题,而不是设备技术的内在属性。这在过去可能是正确的,但现在芯片和系统之间定义的界限已经变得模糊,并且还会更模糊,最终将完全被消除。因为目前我们已经从设计技术协同优化(DTCO)时代,过渡到了系统技术协同优化(STCO)的时代。

四、封装技术影响AI的训练和推理

推荐阅读