对本研究而言 , 简单的理解就是 , 先用一套机器学习模型 , 基于所有国家在所有未实施管控政策时的数据构建病毒有效传播数 R_t 的拟合模型 , 用 “反事实推理模型框架” 来预测某地如果不采取防控措施下(反事实)病毒有效传播数 R_t’值 , 以及该地实施防控措施后的病毒有效传播数 R_t 真实数据 , 通过计算两个数据的差值的期望值 , 得到该防控措施的平均效应值 。
但在实际操作中 , 腾讯天衍实验室的科学家们对原模型进行了更符合 “新冠疫情防控政策” 评估的优化改进(模型公式如图) , 通过融合多种传统面板数据的因果推断模型 , 包含双效固定效应模型、矩阵补全模型等 , 并隐式地引入潜在因子交互项 , 使其在复杂场景下能满足统计学的先验假设 , 对于像新冠疫情这样随时间变化的动态数据 , 能够进行更有效的量化研究 , 这也是研究者在新冠疫情防控研究开发并引入该模型框架的主要原因 。
文章图片
“新模型”的新用法:能获得更接近真实世界的运算结果
新冠疫情爆发后 , 全球几乎所有国家和地区都先后实施了不同程度的防控措施 。 虽然 , 已有很多研究对各种管控措施遏制疫情的效果进行了分析 , 但许多传统研究存在国家样本数量小、统计方法过于简单 , 或只采用传统的因果推断模型(如双效固定效应模型)进行研究 , 难以应对新冠疫情传播中诸多不可测量的混杂因素影响 , 比如 , 不同国家间和地区的经济、文化、交通、人口密度 , 不同时间点人们自发的防护措施 , 当地的检测能力不同等 , 因此导致了统计效能不足 , 结果偏差较大等问题 。
而新的反事实推理模型框架最大的特点是 , 通过引入时间效应、国家 / 地区效应 , 以及隐含的交互混杂效应项 , 以一种隐含因子的方式排除了各种未知的“混杂因子” , 最大程度消除了各种动态因素对统计结果的影响 。
为了进一步核验该模型的量化结果 , 科学家们还引入了 Pre-Trend 检验(图) 。 结果表明 , 在政策实施前 , 估计值与真实值残差趋于 0 波动 , 证明了模型的有效性 , 这说明在该反事实推理模型框架下量化的管控政策效果是无偏估计量 , 这也使得在新的 “反事实推理模型” 框架下 , 研究人员获得的研究结果将更准确、更符合真实世界的疫情发展情况 。
文章图片
研究印证:防控要快且准 , 三种措施效果最显著
研究人员利用新的 “反事实推理模型” 框架 , 对全球 145 个国家和地区 , 包括欧洲 36 个 , 亚洲 36 个 , 非洲 47 个 , 北美 13 个 , 南美 11 个 , 大洋洲 2 个进行了研究 , 跟踪了这些国家 / 地区在 2019 年 12 月 31 日到 2020 年 7 月 1 日新冠病毒在全球掀起第一波大流行期间 , 普遍采取的 8 种防控措施数据 , 具体包括:关闭学校、关闭工作场所、取消公共活动、限制人群聚集、公共交通管制、居家生活建议、限制国内流动、限制国际旅行 。
推荐阅读
- 区块|面向2030:影响数据存储产业的十大应用(下):新兴应用
- 最新消息|CES线下回归受阻:受奥密克戎肆虐影响
- IT|Omicron影响持续蔓延 捷蓝航空拟取消约1280架次航班
- 风湿|钟南山邀张桂梅赴广州治疗
- 细节|小米发布会上 15 分钟就讲完的 MIUI 13,好用么?
- 向张桂|钟南山邀张桂梅赴广州治疗
- 最新消息|美光西安DRAM工厂遭受影响:预计将出现供货延误
- 影响|我国东北虎种群增长迅速 但近交风险不容忽视
- 钟南山|钟南山邀张桂梅赴广州治疗
- 华为|华为正研究电动车充电设施,充7分钟电量可由20%到80%
