监控产品中“告警服务”的设计及演化( 八 )

梳理完告警配置模块的元素,就可以根据“配置告警策略”的设计原则,开展设计:“配置规则简单、指标契合、阈值有默认值、自定义接收渠道、自定义接收者”

当用户进入告警配置模块,未配置任何告警策略,提示、引导用户开始创建。

监控产品中“告警服务”的设计及演化

针对“添加告警策略”,经历了3版设计方案的演变。

第一版方案,基本符合上述的设计原则。

监控产品中“告警服务”的设计及演化

该方案上线之后用户配置了大量的告警策略,但发生了意想不到的事情:不告警。经过排查定位,最终确认是计算平台产生了非常严重的阻塞,即“用户体验地图”的第二阶段“筛选产品数据”出了问题。复盘之后,认定有两方面的原因:

一是所选择的告警指标“影响用户占比的环比增长率”涉及大量的“去重”计算,严重消耗计算平台的性能;二是监控对象没有做限制,多个筛选条件排列组合之后产生了大量监控对象,远远超过了计算平台的极限。因此,决定从两个方面优化设计方案:

推荐阅读