从OCP China Day 看云数据中心的2.0进化( 四 )

OCP、ODCC社区成员在技术和方案层面的快速创新,弥补了标准升级缓慢带来的问题。OCP成员的创新IP或者技术规范只要经过被社区接受,就可以在社区平台上发布。本次活动上,腾讯联合浪潮将T-flex2.0规范贡献给了OCP社区,该规范此前已经被ODCC社区所接受,基于I/O池化技术,通过服务器不同模块的解耦重组,实现服务器的模块化迭代和灵活组合,可以实现异构加速、冷存储、HPC集群等各类不同的应用方案,也就是超大规模数据中心可以基于该规范对统一服务器架构,降低采购运维的复杂度,降低整体成本。

数据中心的效率不仅要依靠硬件层面的创新,也要依靠管理技术的提高。Intel在大会上介绍了两项数据中心管理技术。大部分云平台一旦进入管理的广播模式(也就是管理节点向资源节点发送各种调度指令),所有资源节点都会将管理命令优先处理,从而导致当前排队的的业务进程停止,业务会出现短暂的中断,Intel将管理中断功能放到了PRM层面,这样可以有效的缩短业务中断时间。另外,数据中心的冷却系统会根据负载水平进行调节,但是大规模数据中心的反馈复杂、延时非常高,导致冷却调节明显慢于负载的变化,Intel在管理系统中加入了AI支持的预测窗口,冷却系统调节不必依赖反馈,冷却策略更为精准。

推荐阅读