视点·观察|西安一码通“崩溃”调查:一场系统性失灵的再思考( 四 )


文章图片


【视点·观察|西安一码通“崩溃”调查:一场系统性失灵的再思考】西安市电子政务统一平台网络安全服务外包项目合同
问题到这里并没有结束 。钛媒体App了解到,网络防火墙阈值是可以人为调整和设置的,即便一开始在压测时阈值设置较低,收到报警后可由工程师在后台修改调整,并不需要耗费太长时间 。“但是从西安一码通的故障修复时间看(第一次故障次日修复,第二次故障约两小时修复),网络防火墙出现问题只是表象 。”李冬分析,深层次原因的排查应该在架构设计是否合理,计算存储带宽资源是否充足两个大的层面,而从以往经验来看,责任更多在前者 。
对此,截至发稿前,钛媒体App再次联系启明星辰,启明星辰回复称,一切以官方信息为准,目前官方信息暂未公布,同时启明星辰也否认防火墙本身出现问题 。钛媒体App获悉,启明星辰团队目前在现场积极参与故障的修复 。防火墙只是恰好成为故障爆发的弱环,超出设计本身限制 。
此外,数字政府项目层层分包(运营商以及大型企业都可以作为总包方,也会互相成为彼此的分包商)也是被外界诟病的一点,这在项目层面属于正常现象 。而在西安“一码通”项目中,西安电信作为项目总包,负有验收和把控项目的最终责任 。仅西安“一码通”项目就涉及不下十个分包商,更不要说项目规模更大的城市类项目 。如何做好分包商产品与服务质量管理,是总包以及项目主体不可推卸的责任,特别是涉及民生的关键基础设施项目 。
当汹涌的疫情成为西安“一码通”的新预设条件,这场“违背”预设的系统崩溃似乎也不那么让人意外了 。
现有架构应对高并发,力有未逮
西安“一码通”的故障与多年前12306春运高峰宕机、双十一狂欢节淘宝与京东的宕机并无二致 。不同在于,12306与淘宝、京东的高并发是商业性的,而西安“一码通”故障涉及的是民生问题,出现在疫情防控的紧要关头 。
随着数字化、信息化的推进,各种“码”被应用在生活中的各个方面 。西安“一码通”这类健康码和微信、支付宝的支付码有相似之处,但支付码却甚少发生大规模宕机事件,两者的对比也有一定参考意义 。
与健康码不同,支付码的投入建设周期长,并且从规划之初就采用了支持大规模、高并发的分布式架构,健康码则更多是在疫情期间紧急上马,事急从权,例如西安一码通是在2020年3月到12月数次招标,而在此期间西安一码通已经投入使用,类似情况在全国范围内并不少见 。
其次,对疫情态势发展的预估也影响到系统建设 。2020年初,社会普遍认为新冠疫情是一次突发事件,并没有意识到事态会长期持续,自然也不会在一个“临时系统”上花费重金 。相比之下,微信、支付宝的健康码则是多年来持续迭代、不断优化,才有了良好的体验 。

推荐阅读