零和博弈|散热与可靠性兼得的极限挑战:我知道风 是在哪一个方向吹
“风扇转速刚过每分钟2万转 , 硬盘就掉链子 , 而且多次测试结果都是这样 。 ”即使看惯了实验室里不同工况条件下的大场面 , 浪潮信息服务器研发工程师张海龙对眼前的情况还是有些惊讶 , “毕竟各种因素赶到一块儿的场景太罕见了” 。
其实 , 任何事物在带来好处的同时 , 都要付出一定的代价 。 所谓鱼和熊掌兼得 , 不过是成千上万次再平衡之后的偶然 。
比如:芯片的性能越高 , 产生的功耗也会随之增大 , 提高散热能力就成为谋求平衡的筹码;而追求极限散热 , 难免对硬盘等部件造成冲击 , 兼顾可靠性又变成新一轮平衡游戏的主题 。
当然 , 散热和可靠性并非零和博弈 , 只要管控好变量 , 就有机会走出囚徒困境 。
悬在头上的达摩克利斯剑
在千行百业数字化转型的大时代 , 数据中心既是驱动增长的重要引擎 , 也是不容忽视的“耗电怪兽” 。 2020年 , 我国数据中心用电量突破2000亿千瓦时 , 占用电总量比重约2.7%;预计到2030年 , 这一数字将突破4000亿千瓦时 , 占比升至3.7% 。
工信部近期印发《新型数据中心发展三年行动计划(2021-2023年)》 , 对PUE(数据中心总能耗/IT设备能耗)明确规定:到2021年底 , 新建大型及以上数据中心PUE降低到1.35以下 , 到2023年更要低于1.3 。
文章图片
工信部《新型数据中心发展三年行动计划(2021-2023年)》
显而易见 , 1.3将成为各地新建数据中心的PUE红线 。 但目前全国大型数据中心平均PUE为1.55 , 超大型数据中心平均PUE也仅为1.46 。 也就是说 , 在保有量万台服务器的数据中心 , 每耗费一度电 , 只有64.5%用于IT领域 , 其余35.5%则用在空调等非IT设备 。
数据中心为了降低PUE , 必须让能源更多向IT设备倾斜 , 这对服务器的供电和散热研发设计提出了更高要求 。 供电效率提升可降低CPU等关键部件散热量 , 从而减少空调等设备的使用 。 浪潮信息掌握了从12V到48V直流供电技术 , 48V直流供电预计可减少30%的能耗 。
液冷是散热技术的翘楚 , 可以用液体取代空气作为冷媒 , 带走部件热量 , 目前常见的方式有冷板、浸没、风液混合等 , 已在云数据中心和边缘数据中心规模化部署 , 对降低PUE效果显著 。 但液冷技术对数据中心的机房环境要求苛刻 , 重新改造的成本也较高 , 浸没式液冷的冷却液价格更是堪比茅台 。
对大多数数据中心来说 , 风冷才是低成本改善散热的主流方案 , 最“简单粗暴”的做法是提高服务器风扇转速 。 风扇高速转动将热量快速带出 , 可避免部件发热量过高影响系统稳定性 。 但不断加码风扇转速直至满转时 , 风扇与硬盘之间会形成大的漩涡 , 而不规则的湍流影响非常严重——服务器内的硬盘碟片磁道密度低于50nm、Ocylim低于10nm , 磁头轻微振动就会造成读写性能大幅下降 , 甚至导致整个硬盘报废 。
推荐阅读
- 手机|强力磁吸 支持无线和有线充电 iWALK咔嗒宝解决手机续航焦虑
- 一财网|28页文件“上书”英国监管机构 英伟达收购Arm进入最后博弈
- 数字货币|金-卡戴珊和小弗洛伊德·梅威瑟因涉嫌加密代币拉高出货骗局被起诉
- 数字货币|金-卡戴珊和小弗洛伊德·梅威瑟因涉嫌拉高出货骗局被起诉
- 澎湃新闻|国新办发布会:外企对我国知识产权保护和营商环境信心增强
- Apple|黑苹果OpenCore项目持续更新 支持12代酷睿和Z690主板
- IT|KDDI合作开发海空系统:用空中无人机运输和部署水下无人机
- 软件和应用|Locket跃居App Store榜首:将情侣/闺蜜/好友照片放到iOS主屏上
- the|加州新预算提案旨在解决港口的拥堵和污染问题
- 新浪科技|硅谷和华尔街联手杀入币圈:三个华人促成的交易