支付宝技术风险负责人陈亮:把事情做到极致,技术的差异性才会体现出来( 三 )

组织架构演进

2014 年 , 质量技术部成立希望从全域视角解决技术风险问题 。 但是 , 质量技术部并没有运维团队 , 主要就是通用质量检测和高可用保障相关的技术解决方案 , 并驱动各业务部门的技术团队落地 。 当时 , 质量技术部人员并不多 , 是一个小而精悍的中台部门 。

经过一年多的发展 , 质量技术部发现仅仅依靠质量技术并不能解决生产上的各种故障风险 。 虽然 , 质量技术部会关注生产研发过程 , 但主要精力在于对各业务技术团队输出技术风险 , 比如高可用及通用质量检测的解决方案 , 高可用及资金保障方面尚未出现成型的平台体系 。 虽然当时的全链路压测和持续集成平台已有所成型 , 但关于高可用等并没有成型的平台 。

当时 , 技术团队判断 , 不能只从质量角度看风险 , 而需要从更高的维度和更全面的视角看待风险 。 2015 年 , 质量技术部升级为技术风险部 , 专注研发及架构技术风险问题 , 做相应的解决方案和落地平台 。

2016 年 , 陈亮一手打造了支付宝的 SRE(Site Risk Engineer , 参考谷歌的 Site Reliability Engineer)体系 。 技术风险部增加 PE 和 DBA 团队 , PE 团队直接对生产环节中的运营、操作等做技术风险防控 , 整个大团队的职能属于 SRE 。 据了解 , 这也是国内第一个 SRE 团队 。

推荐阅读