大型游戏部署“云端对决”:华为云C6s实例与阿里云C6实例谁更强( 五 )

处理器性能

处理器理论性能表现上 , 我们使用Geekbench 4.3.3对华为云C6s服务器和阿里云C6服务器处理器性能进行跑分 。 经过连续的五次跑分 , 我们取单核整型、单核浮点型、多核整型、多核浮点型四个参数的平均值来对华为云C6s服务器和阿里云C6服务器的处理器性能进行跑分对比 。 跑分结果如下(均为五次跑分平均值):

表格 4 Geekbench 4.3.3连续五次跑分平均值

从数据上看 , 华为云C6s整型计算能力相比于阿里云C6更好一些 , 而阿里云C6单核浮点型计算能力与华为云C6s基本持平 。 整体来看 , 二者在计算能力上基本上持平 。

接下来 , 我们通过英特尔Memory Latency Checker工具对华为云C6s服务器和阿里云C6服务器同NUMA节点内存时延进行测试 。

NUMA技术全称是非统一内存访问 , 可以使众多服务器像单一系统那样运转 , 同时保留小系统便于编程和管理的优点 。 现在的机器上都是有多个CPU和多个内存块的 。 以前我们都是将内存块看成是一大块内存 , 所有CPU到这个共享内存的访问消息是一样的 。 这就是之前普遍使用的SMP模型 。 但是随着处理器的增加 , 共享内存可能会导致内存访问冲突越来越厉害 , 且如果内存访问达到瓶颈的时候 , 性能就不能随之增加 。 NUMA(Non-Uniform Memory Access)就是这样的环境下引入的一个模型 。 比如一台机器是有2个处理器 , 有4个内存块 。 我们将1个处理器和两个内存块合起来 , 称为一个NUMA node , 这样这个机器就会有两个NUMA node 。 在物理分布上 , NUMA node的处理器和内存块的物理距离更小 , 因此访问也更快 。 NUMA node内数据访问时延越短 , 说明处理器和内存块之间数据交互也就更加迅速 , 处理器单位时间内所处理的数据也就更多 , 避免出现内存吃满 , 处理器吃不饱的局面 。

推荐阅读