做一个天猫双十一这样级别的活动,技术难度有多大?( 九 )

「2016年是弹性架构 , 50%(的业务)放在阿里云上 , 50%用自己的机器 。 今年又不太一样 , 我们55%还是在阿里云上 , 25%是自由的 , 但是剩余的20% , 我们放到离线机群 。 」胡喜说 , 这就是今年的技术革新——离在线混布 。

具体地说 , 在线机群性能强大 , 每秒钟能读写数万次甚至数十万次 , 但是离线机群日常处理分析任务 , 读写能力差得远 , 每秒最多读写数百次 。 这就像是在一个临时搭建的部队里 , 既有黄埔毕业的战斗精英 , 也有小士兵 。 好处是 , 小士兵虽然没法像精英那样以一敌百 , 但还能处理力所能及的任务 , 且人数众多 。 所以 , 这种「离在线混布」的设计最核心的优势是 , 能够在瞬时并发交易量激增的时候 , 最大化使用可调动的所有资源 。 而这一切都依靠于准确的上层容量调度算法 , 实时评估 , 快速部署 , 在瞬息万变的交易中完成海量计算 。

胡喜说 , 这就是他们对于双十一难题提出的对策 , 很可能是世界最前沿的技术设计 。 「分布式(架构)本身就是一个挑战 , 分布式还能兼容 , 必须接受更高的挑战 , 而兼容过程中还要使用离线资源 , 把从来没有想过的资源合并一起 , 提供一个最高级别在线能力 。 」他说 , 「我感觉 , 我们就是在不断刷新科技应对挑战的能力 。 」

推荐阅读