FPGA保持灵活性同时拥有ASIC级AI性能是可实现的吗?( 七 )

Robert表示 , MLP的效率比传统FPGA的性能提升了5倍 , 使这款FPGA能以每秒万亿次运算数量为单位(TOPS) 。 算法在不断的改变 , 但底层的需求都是一样的 , 他们希望建立一个很好的硬件底层 , 让算法无论怎么改变 , 需求都可以被满足 。

用片上网络解决数据挑战

计算能力的提高可以通过增加MAC , 但算力提升之后 , 能否解决数据传输的挑战决定着AI处理器最终的性能 。 据介绍 , Speedster7t器件是唯一支持GDDR6存储器的FPGA , 并且最多可以支持8个GDDR6控制器 , 可以支持4 Tbps的GDDR6累加带宽 , 能够以HBM一半的成本提供与HBM等效的存储带宽 。

另外 , Speedster7t还有72个高性能的SerDes , 可以达到1到112 Gbps的速度 , Robert强调已经经过硅片验证过 。 还带有前向纠错(FEC)的硬件400G以太网MAC , 支持4x 100G和8x 50G的配置 , 每个控制器有8个或16个通道的硬件PCI Express Gen5控制器 。 为了应对400G以太网数据的处理需求 , Achronix采用的是将数据进行分割并行处理的方法 。

推荐阅读