庆功宴|全球特大云计算项目,扛得住是庆功宴,扛不住是散伙饭…

春节期间 , 一个超级大项目诞生了
史上所有的云计算项目
可能都不如这个项目“惊心动魄”
除夕之夜 , 开端即结局
你说压力大不大?

庆功宴|全球特大云计算项目,扛得住是庆功宴,扛不住是散伙饭…
文章图片

这项目有点特别 , 如果干砸了
会在14亿全国人民面前丢人现眼
项目组人心里都清楚
扛住了是庆功宴!扛不住是散伙饭!
庆功宴|全球特大云计算项目,扛得住是庆功宴,扛不住是散伙饭…
文章图片

这个项目之所以“惊心动魄”
是因为难度系数超级高

难点之①
同一套云资源 , 要同步扛住
超级并发流量+超复杂应用场景
先看“ 超级并发流量”
来自于春晚红包互动流量峰值

庆功宴|全球特大云计算项目,扛得住是庆功宴,扛不住是散伙饭…
文章图片

15亿红包 , 691亿次互动量
每秒亿万级访问请求
今年春晚流量达到历史巅峰
庆功宴|全球特大云计算项目,扛得住是庆功宴,扛不住是散伙饭…
文章图片

这是当之无愧的
全球“ 蓝波万”的高并发场景
它称老二 , 没人敢称老大
庆功宴|全球特大云计算项目,扛得住是庆功宴,扛不住是散伙饭…
文章图片

再看“ 超复杂应用场景”
来自于京东商城“春节不打烊”活动
由于京东“春节也送货”
导致京东商城电商流量激增

庆功宴|全球特大云计算项目,扛得住是庆功宴,扛不住是散伙饭…
文章图片

“ 春节不打烊”的背后
是对云计算最极限的压力测试
京东需要这套云计算资源
支撑数百万自营商品SKU、数十万商家、亿消费者;支撑超1000座仓库物流、超200座城市快递配送

庆功宴|全球特大云计算项目,扛得住是庆功宴,扛不住是散伙饭…
文章图片

也就是说 , 在除夕夜 , 在同一时间段
京东要同时应付两大超级场景
一边是春晚红包 , 绝不能卡壳
一边是京东商城 , 绝不能拉胯
嘿嘿 , 好比在刀尖上行走
险得很
庆功宴|全球特大云计算项目,扛得住是庆功宴,扛不住是散伙饭…
文章图片

这种“双重”压力
在云计算行业 , 从未经历过
换句话说 , 谁都没玩过这么特别的场景
京东云没有可复制的经验
难点之②
任务重、时间紧
京东云从接活到交付
只有短短的 19天

1月5日 , 才拿到中标通知
京东成为虎年春晚独家互动合作伙伴
1月24日 , 春晚红包互动预约活动开启
时间实在太紧迫
庆功宴|全球特大云计算项目,扛得住是庆功宴,扛不住是散伙饭…
文章图片

而且这项目“很磨人”
并非一口气冲完了事
1月24日预约开启→除夕夜峰值
→接下来活动一直持续到元宵节
这是个长周期、脉冲式、高并发的项目
对系统架构稳定性、伸缩调配能力
都是一种极大的考验
庆功宴|全球特大云计算项目,扛得住是庆功宴,扛不住是散伙饭…
文章图片

难点之③
不花钱 , 办大事
扛住洪峰最简单粗暴的方式
就是加加加加设备 , 增加算力
庆功宴|全球特大云计算项目,扛得住是庆功宴,扛不住是散伙饭…
文章图片

但是 , 嘿嘿 , 逼近年关的19天
到处都是缺货
去哪儿整那么多服务器、存储..
所以 , 京东云想出了一个妙招

盘点自家家当底
腾挪现有资源
庆功宴|全球特大云计算项目,扛得住是庆功宴,扛不住是散伙饭…
文章图片

乾坤大挪移
就是通过云计算技术
把“千万核”云计算资源
在抢红包和商城之间来回切换
实现超大规模快速调度
庆功宴|全球特大云计算项目,扛得住是庆功宴,扛不住是散伙饭…
文章图片

不得不说 , 京东云心真大
在不增加预算的情况下
还能这么整这么大活
庆功宴|全球特大云计算项目,扛得住是庆功宴,扛不住是散伙饭…
文章图片

京东云这种牛掰的底气
源自他们有超强的技术储备
即 , 云计算大规模调度能力
把这种能力产品化后
就有个一个霸气的名字

云舰 , 京东云混合云操作系统
堪称“容器调度之王”
庆功宴|全球特大云计算项目,扛得住是庆功宴,扛不住是散伙饭…
文章图片

京东被称为“容器上的王国”
因为京东所有业务都运营在“容器”之上
运营着全球最大规模的容器集群
也是全球容器化最彻底的企业之一
京东业务应用100%容器化丨离线分析应用100%容器化丨数据库在内的所有PaaS组件100%容器化

庆功宴|全球特大云计算项目,扛得住是庆功宴,扛不住是散伙饭…
文章图片

云舰好比一个总司令
对京东所有容器集群调兵遣将
也是京东618、双11战役中的定海神针
此次 , 云舰再次扛起大旗
在春晚那一夜 , 调动千万核
庆功宴|全球特大云计算项目,扛得住是庆功宴,扛不住是散伙饭…
文章图片

不过 , 相比618、双11的单一峰值
现在想要应付两大流量场景
精准地实现超大规模资源“腾挪”
保证两边都不受影响
从技术上来讲 , 难度非常高

闪电调度 , 要求资源秒级到位
留给调度系统的时间只有 仅仅1秒
庆功宴|全球特大云计算项目,扛得住是庆功宴,扛不住是散伙饭…
文章图片


精准调度 , 要求资源指哪打哪
必须严丝合缝“怼”到每个业务需求
庆功宴|全球特大云计算项目,扛得住是庆功宴,扛不住是散伙饭…
文章图片

所以
为实现高速、精准调度
云舰采取了两步

第一步 , 规划业务优先级
比如 , 春晚互动设为最重要的S级
而一些相关度较低的业务系统 , 就降级
通过自动化系统分级、占用资源预测
调度就有了主次之分
庆功宴|全球特大云计算项目,扛得住是庆功宴,扛不住是散伙饭…
文章图片

第二步 , 区分在线服务和离线任务
进行分时复用、混合部署
在线服务 , 比如支付、抢红包
离线任务 , 比如后台大数据计算
混合部署后
最大限度利用算力资源 , 不空转
庆功宴|全球特大云计算项目,扛得住是庆功宴,扛不住是散伙饭…
文章图片

由此 , 云舰通过这两步策略
调动了足够多弹药(资源)
弹药调出后
还需要将资源快速扩容到系统中
这时候就需要一个强大的“吊装”平台
这个吊装平台就是云舰内嵌的
阿基米德智能调度系统
实现全局最优资源编排和极速切换
庆功宴|全球特大云计算项目,扛得住是庆功宴,扛不住是散伙饭…
文章图片

OK , 方案是有了
但是能不能抗住实战
得进行压力测试

庆功宴|全球特大云计算项目,扛得住是庆功宴,扛不住是散伙饭…
文章图片

7轮压测 , 有成也有败
最终京东云找到了自由切换的“驾驭感”

到了春晚 , 主持人一说:抢红包啦
咔 , 资源切换到抢红包模式
非抢红包时间段
资源切入“京东商城”模式
庆功宴|全球特大云计算项目,扛得住是庆功宴,扛不住是散伙饭…
文章图片

结局如何呢?
开端即结局
春晚4小时内
累计16次超大规模资源调度
秒级调度近300万个容器
超1000万核算力资源
庆功宴|全球特大云计算项目,扛得住是庆功宴,扛不住是散伙饭…
文章图片

除夕当夜 , 从客户体验上讲
无论是抢红包还是在线购物
没有一次卡顿、没有一丝迟疑
所有业务如丝滑般顺畅
京东云以超高弹性成功
登顶云计算领域的“珠穆朗玛峰”
庆功宴|全球特大云计算项目,扛得住是庆功宴,扛不住是散伙饭…
文章图片

这个项目 , 有人说意义重大
京东云打赢了云计算的完美一仗
如其说是京东云的成功
不如说是中国云计算的成功
成功意义之①
以前说 , 云计算能省钱 , 没人信
这次甲方“0预算、不出钱”
京东云硬是像挤海绵一样
“挤”出了资源完美地把项目扛下来
云计算经济价值吊打了传统IT架构
让所有人体会到
云原生数字基础设施 , 真香!
庆功宴|全球特大云计算项目,扛得住是庆功宴,扛不住是散伙饭…
文章图片

成功意义之②
以前说 , 云计算技术很牛 , 没人懂
春晚一战 , 京东云创造了云原生新纪录
正式将云原生推向2.0时代

除了上面已经体会到的
云舰对容器化资源的极致调度外
我们还看到一个事实 , 短短19天里
京东云用 云原生低代码平台
像搭积木一样 , 快速构建了600个应用
这在传统IT时代 , 完全不可想象
庆功宴|全球特大云计算项目,扛得住是庆功宴,扛不住是散伙饭…
文章图片

成功意义之③
以前说 , 云计算服务产业 , 没人听
如今以京东云为代表的互联网大厂
正在把自家最牛的技术、实战过的产品
输出给客户和产业伙伴
让大家一起成为先进技术的受益者
庆功宴|全球特大云计算项目,扛得住是庆功宴,扛不住是散伙饭…
文章图片

成功意义之④
中国工程师团队作战能力
永远值得信赖

为了攻克此次春晚技术难关
京东云投入了3000多名工程师
组建了100多个敏捷的虚拟团队
这是一场超大规模的研发协同作战
确保了双线战场的全面胜利
庆功宴|全球特大云计算项目,扛得住是庆功宴,扛不住是散伙饭…
文章图片

与其说这是京东云团队的成功
不如说是云时代中国工程师的成功
扛下顶级大项目
再攀中国云之巅
【庆功宴|全球特大云计算项目,扛得住是庆功宴,扛不住是散伙饭…】庆功宴|全球特大云计算项目,扛得住是庆功宴,扛不住是散伙饭…
文章图片

    推荐阅读