Intel|英特尔Ponte Vecchio早期芯片或以1.37GHz频率达成45 TFLOPs性能
2021 架构日活动期间,英特尔披露了 Xe HPC“Ponte Vecchio”加速卡的诸多技术细节,并且分享了基于 A0 原型的一些初步性能数据 。通过简单的数学计算,TechPowerUp 推测原型卡的运行频率在 1.37GHz 左右 。但在 Sapphire Rapids 至强处理器平台上,单个 Ponte Vecchio OAM(双堆栈 MCM)还是实现了至少 45 TFLOPs 的 FP32 吞吐量 。
文章图片
(图 via TechPowerUp)
如此耀眼的成绩,已经超越了英伟达 Ampere A100 Tensor Core 40GB 竞品所宣传的 19.5 TFLOPs,此外 AMD Instinct MI100 计算卡也仅提供了 23.1 TFLOPs 的 FP32 性能 。
文章图片
“A0”版本应该是首批从代工厂流片回来的 Ponte Vecchio 原型,且英特尔内部应该正在通过严格的 NDA 协议,来下发给 ISV 与行业合作伙伴 。
【Intel|英特尔Ponte Vecchio早期芯片或以1.37GHz频率达成45 TFLOPs性能】
文章图片
通常情况下,芯片制造商只会将时钟速率明显低于最终性能的原型交付给 ISV,以便其充分测试相关功能和开发特定的软件 。
文章图片
参考英特尔在演示文稿中提到的数据,OAM 封装的每时钟周期 FP32 吞吐量为 32768 ops,且单个封装中的两个堆栈相当于 128 个 Xe 核心 。
文章图片
每个 Xe HPC 的核心矢量引擎,可在单个时钟周期内提供 256 次 FP32 操作,那样单封装(双堆栈)的总和为 32468 FP32 ops/clock,约等于 1373MHz。
文章图片
不过随着后续的生产迭代,我们有望看到更高的始终速率、以及吞吐量的线性扩展 。不过考虑到芯片的庞大尺寸和功率消耗(传闻为 600W),最终运行频率卡在 1.37GHz 也不是不可能 。
文章图片
在用功耗换性能的情况下,英特尔甚至会要求厂商为 OAM 搭配高性能的水冷散热方案 。至于其能否在 HPC 市场获得充分的认可,仍有待时间去检验 。
文章图片
访问购买页面:
英特尔旗舰店
推荐阅读
- Intel|英特尔放出i9-12900K平台PCIe 5.0 SSD演示 突破13GB/s传输速率
- Intel|Intel在Alder Lake平台演示PM1743 PCIe Gen 5 SSD,带宽达14GB/s
- Intel|Intel谈DDR5内存价格贵、缺货问题:新技术升级在所难免
- Intel|Intel 12代酷睿20款新品百分百实锤:赛扬升级、i5混乱
- 硬件|Intel 11代酷睿4核15瓦超迷你平台 仅有信用卡大小
- VIA|x86研发团队卖给Intel后 VIA出售厂房和设备:北美分部就此终结
- Intel|特尔锐炫Alchemist桌面显卡或将延期至明年3月
- Intel|英特尔全新第12代原装散热器实测 i5-12400最高温度73℃
- Intel|英特尔正为Linux 5.17准备PFRUT:升级系统固件无需重启
- 业绩|用Mac业绩说话!苹果摆脱英特尔,被市场证明是成功的一步