IBM|IBM 下一代 Z 系列处理器 ''Telum'' 或展示了 CPU 缓存的未来( 二 )


IBM 为每个核心配置了 32MB 的 L2 缓存,这比一般的处理器大得多,而且取消了核心之间共享的 L3 和 L4 缓存 。一般来说,这样的设计会使得缓存有很高的访问延迟。IBM 采取的方法是,通过私有物理缓存里打造共享虚拟缓存的方法解决,意思是将平时需要放置在 L3 缓存里的部分标记为 L3 缓存线存在不同核心空余的 L2 缓存里 。
L2 和 L3 缓存在物理上是一致的,可以根据工作负载的需要,包含来自不同核心的 L2 和 L3 缓存线的混合数据 。这意味着一个芯片 8 个核心里 ,8 x 32MB 共 256MB 的 L2 缓存也可以视为“虚拟 ”L3 缓存,采用双向环形互连拓扑结构 。
相似的方法 IBM 也用在了原来的 L4 缓存上 ,L2 缓存里也可以容纳 L4 缓存线 。从单个核心的角度来看,在一个基于 Telum 打造标准的系统,可以访问 32MB 的 L2 缓存 ,256MB 的共享虚拟 L3 缓存,以及 8GB 的共享 L4 缓存。IBM 表示,使用这种虚拟缓存的系统,每个核心的缓存相当于 Z15 的 1.5 倍,而且还改善了数据访问的平均延迟,性能提高了 40% 以上 。

IBM|IBM 下一代 Z 系列处理器 ''Telum'' 或展示了 CPU 缓存的未来
文章图片

【IBM|IBM 下一代 Z 系列处理器 ''Telum'' 或展示了 CPU 缓存的未来】在具体运行中如何降低延迟和保证命中率是一个非常复杂的操作,加上功耗、缓存在断电和空闲等状态下如何保证单核心工作负载的一致性,这都是 IBM 需要考虑的问题 。可以思考一下,如果 AMD 使用 3D V-Cache 技术堆叠的不是 L3 缓存,而是 L2 缓存,同样采取虚拟 L3 缓存线的方式,这样的微架构对性能会有怎样的影响?

推荐阅读