做一个天猫双十一这样级别的活动,技术难度有多大?( 八 )

除了昂贵 , 这种对策也很浪费 , 为了双十一当天峰值状态采购的机器 , 在日常业务中根本用不上 , 「没有它们 , 熬不过去双十一;双十一一过 , 它们都白瞎了」 。

更可怕的是 , 这也是一种高度集中的架构 。 所有核心账目都存在一处 , 一旦发生故障 , 只能眼睁睁看着消费者一个个抱怨着离开 。

在双十一峰值的刺激下 , 阿里巴巴开始放弃这种中央集中式的强大单点 , 开始「去IOE」 。 2013年 , 整个系统完全转换成云计算方式 , 并逐步优化 。 他们试着尝试一种新的对策——分布式「异地多活」的弹性架构 。

这种分布式的架构有一个最核心的设计前提:用最常见的PC服务器 , 满足存储数据的最低硬件要求;用最缜密的逻辑关系 , 满足金融交易的最高可靠性要求 。 这就好像是拆掉了高端的中央收银台 , 换成了分散在商场各个角落的无数小型计算器 , 每台计算器虽然不如单一的中央收银台高端厉害 , 但个个都能记点帐 , 更重要的是 , 有一种统筹全局的力量为分散在各处的计算器设计了相互关联的逻辑关系 , 它们互为补充 , 互相备份 , 从全局上保证了运算可靠 , 因而任何单个计算器的故障 , 都不会影响整盘生意 。 这就是这种架构中最核心的云计算能力 。

推荐阅读