视点·观察|从核酸检测到健康码,为什么系统总是“崩了”?( 二 )
不过,采访人员了解到,通常这样的系统会采用分布式大数据技术,结合所在地的人口情况、上下班出现的访问高峰设计出相应的系统容量和冗余量 。“健康码的赋码业务逻辑需要根据运营商手机相关数据、公安人口相关数据、卫健委人员健康状态等数据进行离线加工融合,并通过实时对接健康云等用户注册信息融合加工达到秒级别的生产数据以快速控制风险 。所以团队确定使用大数据分析和实时流处理引擎对这一业务场景进行技术支撑 。”一位参与过某地健康码系统搭建的相关人士介绍称 。
此外,还要对系统各环节下的全链路全方位测压,以保证系统上线足够高的可靠性和稳定性 。
应急层面上看,系统要有足够的弹性伸缩能力 。在访问出现激增的特殊情况时,能够快速扩容,满足相应的访问需求,比如进行容器化的设计保证底层基础设施具备良好的弹性伸缩能力 。
除去访问容量冗余角度上的考虑,还要考虑对于整体系统层面的全流程监控设计,如网络访问情况,健康码接口访问统计,日峰值出现时段等指标 。这不仅为实时大屏提供了相应的数据指标支撑,同时也为团队验证系统容量设计,监控保障系统稳定运行,以及后续实现资源动态扩缩容提供了决策依据 。
即便考虑再周全,这世上当然没有完美无缺的系统,特别是在计算资源本身就是有限的情况下 。业内人士提到需要配套合理的开发流程和运营管理流程来有效的支撑软件系统的持续升级和健康运行 。比如在总体系统设计上,针对关键软件服务和数据配备应急资源和环境进行分级 。平时这部分资源可用于一些创新业务或非关键性业务,一旦有临时性的业务需求如全员核酸时,可以及时将这部分应急资源用于业务扩容来支撑 。
这有些类似于12306系统将订票和查询余票业务分开,在各个子系统按需进行扩缩容的设计,同样,也不建议在关键高并发的健康码查询路径上关联过多的非关键业务,不同业务采用微服务等新型软件开发方式来开发,结合容器云等技术来实现动态的按需扩缩容,同时保证各个业务之间不互相影响,如上传核酸报告、查询核算报告、查询健康码等业务要分开 。
“在某些关键业务失灵后能够快速地从备份系统恢复数据并支持业务重新上线,这样即使某个业务短暂出现问题,我们可以通过灾备系统来快速恢复业务和数据,这样老百姓的等待时间可以从一天缩减到几分钟 。”这位业内人士说 。
推荐阅读
- 视点·观察|新华社:数字虚拟人频频出圈,能在多大程度上替代真人?
- 视点·观察|收购黑鲨入局VR设备,曾说不做硬件的腾讯,搞得定硬件制造吗?
- 财产|折叠屏手机冲击高端,荣耀从华为继承的最后财产
- 视点·观察|每天9.9元起就能租手机?租赁平台被指向未成年人放高利贷……
- 爆发|从1G到5G 技术成熟与应用爆发相辅相成
- 视点·观察|虎年只有355天 少的10天你知道去哪了吗?
- 创事记|从主播开始谈一个购物需求
- 视点·观察|肯德基盲盒二手价暴涨8倍 是否在搞“饥饿营销”?
- 视点·观察|涉嫌传销再陷逃税风波,“微商教母”张庭夫妇最少补税118亿?
- Apple|大量Wordle“克隆”应用已从苹果App Store中消失