支付宝技术风险负责人陈亮:把事情做到极致,技术的差异性才会体现出来( 五 )

2017 年 , SRE 团队成立了专门的、独立职能的技术蓝军 , 其主要的工作就是发掘防御系统的弱点并发起真实的攻击 。 技术蓝军并不对各业务方负责 , 只对这套防御系统的稳定性和可靠性负责 。

在技术蓝军看来 , 发生故障是必然的 , 只是时间早晚而已 , 技术蓝军会想尽办法触发这些故障 , 以保障在故障真实发生时 , 团队有足够的应付能力 。 目前 , 全栈级的技术攻防演练每周都在进行 , 而故障防御系统及不断优化的高可用架构则是由 SRE 团队的红军与各业务深度合作 , 沉淀、构建出来的 。

发展至今 , 陈亮表示 , 支付宝技术风险团队的主要工作其实就两件事情:一是保障支付宝生产环境的稳定性;二是保障互联网金融系统的资金零差错 。 目标非常明确 , 但如何解决问题并为之规划可行途径是不简单的 。

技术演进

四年前 , 我们最初只敢做故障定位 , 现在真的是在做演练 。


回顾整个过程技术实力的变化 , 陈亮表示支付宝的攻防演练是技术演进的缩影 。 至今 , 攻防演练已经进行了四届 , 时间也从一天拉长至四天 。

推荐阅读