Uber大型分布式系统可靠性运维实践(15)

对于运行可靠分布式系统的团队 , 组织需要持续投资保障这些系统和体系的运行 。

总结

优步团队运维着世界上最大的大型的分布式支付系统之一 , 其运维实践非常有参考和学习的价 。 本文总结了优步内部维护大型系统的实践的总结 , 包含监控、异常告警、故障审查、故障迁移演练、SLA/SLA , SRE建设等等 。

推荐阅读