whFacebook宕机事故,暴露了上云不是唯一的答案
文章插图
图片来源@视觉中国
文丨脑极体
当国内人民欢度假期的时候,互联网巨头Facebook却收获了“负面新闻大礼包”。
负面之一,就是长达6小时的全球大宕机。
据说,这是Facebook创办以来最严重的一次网络访问事故,除了Instagram、Whatsapp、Messenger这几大海外冲浪必备平台,虚拟现实平台Oculus的游戏,部分企业端服务以及很多需要Facebook账号登录的平台都上不去了,就连Facebook公司的内网也受到影响。要知道,这里可汇聚了全球最厉害、薪酬最高的一大批程序员啊!
【 whFacebook宕机事故,暴露了上云不是唯一的答案】互联网公司宕机,并不是一件很稀奇的事。
今年早些时候,国内某视频平台就因为服务器突然故障,一度崩溃,大量用户“流浪”到其他网站,巨大的流量洪峰又让其他平台也连锁式瘫痪了,各厂程序员们都感受到了被宕机统治的恐惧,一度登上微博热搜,被网友戏称为——互联网内卷之《谁也别想睡觉》。
文章插图
同样是宕机,为什么Facebook就面临着“非死不可”的吐槽声,而不是一笑了之呢?
这可能是因为,Facebook庞大的产品生态,已经不再是娱乐冲浪的一部分,而成为了数字生活的基础设施。
尤其是在疫情之后,许多企业服务、办公教育等都依赖互联网来完成,服务中断会直接导致严重的经济损失。
在WhatsApp(Facebook旗下一款类似微信的软件)的官网就显示,巴黎的医疗人员会在WhatsApp 群组内更新医院病床、资源等信息;印度企业依靠WhatsApp售卖产品;巴西政府、医疗和教育系统都通过WhatsApp提供C端服务,比如接收考试成绩、远程预约挂号等等。
可想而知,作为数字化底座的互联网服务,一旦中断,将连带产生不少次生灾害。
而面对宕机,我们第一时间总会想到云服务商,云中断导致的问题,互联网企业自然也是受害者。
不过,像Facebook这样的巨头,往往核心业务和数据都放在自家数据中心的服务器上。这次宕机之后,就有不少工程师“打飞的”到位于加州的主数据中心参与维修,科技媒体The Verge还曾爆料,因为门禁卡失效,工程师们使用切割机,锯开了数据中心的服务器铁笼。
Facebook面临的挑战,也是许多互联网巨头的缩影:一方面,作为数字化底座,最大程度地保证基础设施的稳定性、可靠性,是巨头们应尽的社会责任;同时,又不能将希望全部都放在云服务上,增加了IT系统的复杂度和运维难度。
这次大型宕机事件也掀开了全面上云的另一面,为什么互联网巨头们都没有把鸡蛋放在一朵云上?
不是唯一的答案:云服务的另一面互联网公司,可谓是云服务的先遣部队。在传统行业还不知道什么是互联网浪潮、什么是云的时候,互联网公司就成了云厂商的高价值客户。
常规情况下,互联网企业会将移动应用、电商之类前端流量业务放到云上,以节省自建机房的高昂成本。
不过,别看互联网企业上云这么积极,它们可是“狡兔三窟”,一边迁移上云,一边也有本地数字基础设施。2018年,Facebook斥资10亿美元在新加坡打造了亚洲首个数据中心,这也是它在全世界的第15个数据中心。相当于一边从发电厂买商业用电,但也在造自己的发电机。
这两年来,上云浪潮如火如荼,出现了一些观点,认为云服务会彻底消除数据中心,但事实上,越来越多的企业在尝试让部署数据中心上的旧应用升级,而不是将一切业务都云化。
甚至有企业IT人员告诉我,他们可能会让自家的数据中心永远运转下去。
推荐阅读
- 亚马逊|美国亚马逊服务平台一个月三次宕机 视频企业网站受波及瘫痪
- 中断|亚马逊 AWS 宕机原因公布:自动化服务出现 Bug,导致网络过载
- 亚马逊|受云服务宕机影响 亚马逊多项服务出问题
- netflix|亚马逊云服务宕机影响多个应用,造成交付混乱、包裹堆积
- 亚马逊|美国亚马逊网络服务现大规模断线 波士顿停车缴费系统宕机
- 服务器|亚马逊云服务大面积宕机7小时 波及上万用户
- 微软GitHub|微软 GitHub 宕机数小时,正在全力修复
- .net|暴雪战网短暂宕机 目前已从DDoS攻击中恢复
- 动视暴雪|海外版战网 Battle.net 部分宕机,动视暴雪称遭到 DDoS 攻击
- 人性化|强哥图文生活 篇五十七:一场事故引起的思考,迫切寻找一款更为人性化的头盔!