云计算的春节战场:从“人肉”到智能( 五 )

早在2015年微信和春晚的合作中 , 就出现了多次宕机的情况:当晚九点左右微信出现了短暂的宕机 , 春晚过程中有1.2亿个红包送出 , 但也有不少网友在社交网络上反映卡顿、消息无法接收、红包发不出去等等 。

2016年支付宝拿下春晚合作机会 , 除夕夜红包活动的总参与人数达到3245亿次 , 达到2015年春晚互动次数的29.5倍 , 同样也出现了宕机时刻 。

到了2018年 , 春晚宕机事件已经多次告警 , 合作方淘宝也提前推导了各自极端情况 , 并且在2017年双11的基础上扩容三倍 。 结果却是 , 不少网友吐槽无法登录注册、绑定亲情号失败、不能组团抢红包等 , 经历过数次双11挑战的阿里云 , 也倒在了春晚的流量高峰面前 。 后来公布的数据显示 , 春晚当晚的流量峰值是2017年双11的15倍 。

宕机的频繁发生 , 并非是腾讯、阿里没有“一级警备” , 相反往往要投入几百人的技术保障团队 。 春晚红包是互联网巨头们争夺的对象 , 也是云计算的春节战场 , 所谓的宕机史 , 也是云计算的进化史 。

坊间流传最广的无疑是阿里双11的故事 , 早几年的后台保障也普遍被戏称为“人肉”计算 。 比如2010年以前 , 互联网公司普遍采用的是IOE系统 , IBM的小型机配合Oracle数据库和EMC的存储设备 。 为了一场双11大考 , 从年初准备到年尾 , 可怜最后可能连及格的分数都没有 。

推荐阅读