又一云厂商因光缆被切出故障 AWS中国近12小时瘫痪( 二 )

接下来,张丰的工作重点不得不变成安抚各路学员。直到下午1点多,张丰终于开始群发消息,通知学员们APP“服务”已经逐步恢复中。

类似的尴尬在VIPKID的各个家长群同时上演。

有客户在微信上评论道:“这是我从业以来经历最长的一次故障修复时间,AWS这次事故处理的时间效率太低了,我表示很失望。”

为了保障服务不中断、数据不丢失,一般业务系统、数据都有多个备份。而在云计算中,为了保障数据中心内业务系统的可用性,数据中心基础设施也会采取类似的冗余备份,提高系统可用性。

有业内人士认为,此次AWS光缆被切断导致近12小时大面积服务瘫痪是因为没有做好网络冗余设计。

网络冗余设计主要通过重复设置网络链路和网络设备冗余措施。网络链路冗余是指为确保业务正常运转,除配置主线路外,同时做好第二种、第三种线路的部署。

主备线路隔的位置比较远,因此,一旦主线路出现故障,还有其他线路保证网络的可用性。例如,接入互联网时,同时采用不同电信运营商线路,相互备份且互不影响,但这样一来,成本也会增大。

推荐阅读