支付宝技术风险负责人陈亮:把事情做到极致,技术的差异性才会体现出来( 八 )

其次 , 作为 TRaaS 平台负责人 , 陈亮回忆道 , 在整个资金防控体系的演进过程中 , 支付宝最初与众多银行一样 , 靠人力进行对账 。 之后通过自动化的方式将全量数据库表导出后做计算来进行核对 。 后来 , 业务量更大 , 就引入了 T+H , 核对时间也从天变到小时级 , 并在此过程中增加了异常管理 。 最后演进到实时业务核对 , 增加了熔断决策、资金免疫以及智能监控等方面的功能 , 从而形成了 TRaaS 强大的千亿级资金秒级核对能力 。

最后 , TRaaS 集成了支付宝在 AIOps 层面的探索 。

AIOps

如前文所言 , 自愈是支付宝 AIOps 方向的重要探索 。 目前 , 自愈的恢复能力控制在 5 分钟左右 。 随着 AI 算法的不断优化 , 陈亮认为 , 这一时间未来有望继续缩短 。 陈亮表示 , 在系统建设的过程中 , AI 算法肯定发挥了较好作用 , 但通过 AI 实现自愈可能会局限于某些场景 , 这就需要借助 SRE 的能力用软件工程的方法建模 。 支付宝也会通过 AI 的方式实现根因定位、告警处理等功能 。

采访中 , 陈亮提及 , AI 在 DevOps 领域最大的价值可以概括为提升效率和扩展边界 。 一方面 , 通过历史监控数据对模型进行训练 , AI 可以辅助工程师进行业务监控 , 进而提高监控效率;另一方面 , AI 有效提高了监控点的配置数量 , 覆盖的业务范围更广 , 这是依靠现有人力很难实现的 。

推荐阅读