AI和大数据分析为疫情防控提供了有力支持。
智东西12月21日消息,日前,钟南山院士团队与腾讯公司披露了一项新研究,利用大数据与人工智能技术,定量评估不同公共防控政策对新冠疫情控制效果。
该研究团队开发了一种新的反事实推理模型框架,通过引入隐含交互因子项,最大程度排除了随时间变化的混杂因素的影响,对包含145个国家和地区、8种公共防控政策的动态数据进行更加准确且符合真实世界运转的量化分析。
研究结果表明,更快、更精准地实施疫情防控,才能有效遏制新冠肺炎疫情的发展,取消公共活动、关闭学校、关闭工作场所3项措施对疫情控制效果更为显著。这也是新冠防控领域首次引入该技术进行研究。
其研究成果已在国际著名医学期刊Value in Health(《健康价值》)刊出,论文题目为《Quantifying the Effect of Public Activity Intervention Policies on COVID-19 Pandemic Containment Using Epidemiologic Data From 145 Countries》。
来自广州呼吸健康研究院院长何建行和腾讯健康副总裁吴文达为共同通讯作者,钟南山院士为指导作者,广州呼吸健康研究院的梁文华教授、杨子峰教授、曾志奇博士,以及腾讯天衍实验室的孙继超博士、郑冶枫博士,为这项新研究的共同第一作者。
01.
防控越快起效越快,三种措施效果最显著
研究人员利用新的“反事实推理模型”框架,对全球145个国家和地区,包括欧洲36个、亚洲36个、非洲47个、北美13个、南美11个、大洋洲2个进行了研究,跟踪了这些国家/地区在2019年12月31日到2020年7月1日新冠病毒在全球掀起第一波大流行期间,普遍采取的8种防控措施数据。
8种数据具体包括:关闭学校、关闭工作场所、取消公共活动、限制人群聚集、公共交通管制、居家生活建议、限制国内流动、限制国际旅行。
研究结果显示:防控越快,起效越快。大多数疫情防控措施在实施后约7~14天,反映病毒有效传播的“再生数”Rt会迅速降低,防控效果随着时间的推移而增强,在25~32天后达到最大抑制效果,Rt平均降低约30% 。
▲反事实推理模型计算出8项防控措施实施后不同时间段对Rt(有效传播数)的抑制效应
研究还指出,在疫情暴发早期(感染缓慢增长期)实施的防控措施,措施越严格、持续时间越长,最终感染人数会越少。
处于疫情中后期(感染快速增长期)实施防控措施,结果则正好相反防疫措施越严格,持续时间越久,最终感染人数反而增加。
论文第一作者孙继超博士指出,造成这一结果的原因并非疫情防控措施失效,而是反向因果关系导致:到了感染人数快速增长暴发的时候,才开始制定严格的管控措施,此时已经收效甚微。这意味“亡羊补牢”为时已晚,在疫情出现苗头的时候尽快行动,才能实现最大效果。
研究结果同时显示:刚性防控,效果更好。取消公共活动、关闭学校、关闭工作场所3项措施对疫情控制效果更为显著。
研究者推测,这3项措施均属强制性措施,执行的可行性更高,因此,更有可能对遏制疫情生效。
▲反事实推理模型对8项管控措施效果的定量评估结果
02.
反事实推理模型:获得更接近
真实世界的运算结果
本项研究采用了一种新的反事实推理模型框架,以尽可能消除各种动态因素对测量结果的影响。
此前很多研究已经对各种管控措施遏制疫情的效果进行分析,但许多传统研究存在国家样本数量孝统计方法过简,或只采用传统的因果推断模型(如双效固定效应模型)进行研究等限制,难以应对新冠疫情传播中诸多不可测量的混杂因素影响。
比如,不同国家间和地区的经济、文化、交通、人口密度,不同时间点人们自发的防护措施,当地的检测能力不同等,这会导致统计效能不足、结果偏差较大等问题。
而本项研究采用的新反事实推理模型框架,可通过引入时间效应、国家/地区效应,以及隐含的交互混杂效应项,以一种隐含因子的方式排除了各种未知的“混杂因子”,来最大程度消除各种动态因素对统计结果的影响。
为了进一步核验反事实推理模型的量化结果,科学家们引入了Pre-Trend检验,结果表明,在政策实施前,估计值与真实值残差趋于0波动,证明了该模型的有效性。
这说明在该反事实推理模型框架下量化的管控政策效果是无偏估计量,使得研究结果将更准确、更符合真实世界的疫情发展情况。
03.
基于反事实逻辑设计的算法模型
研究人员在本项研究中使用的“反事实推理模型框架”,是2021年7月由MIT和斯坦福大学提出的一种基于机器学习的因果分析模型架构,最初应用于经济促进政策如减税对GDP增长的影响分析。
该模型使用了反事实逻辑进行算法设计,表现为假设“如果没有……就会(不会)……”,通常在公共管理领域用来评估政策影响。
以房价控制政策为例,原本A、B、C三地房价因为受到温和通胀影响,会按照规律上涨,但突然A地限购了,要计算限购的影响,就要将“如果不限购其未来房价数据”与“实际限购房价的数据”进行比较,得到的差值就是对限购政策影响的评估值。
类似的,这项研究先用一套机器学习模型,基于所有国家在所有未实施管控政策时的数据,构建病毒有效传播数Rt的拟合模型,用“反事实推理模型框架”来预测某地如果不采取防控措施下(反事实)病毒有效传播数Rt’值,以及该地实施防控措施后的病毒有效传播数Rt真实数据,通过计算两个数据的差值的期望值,得到该防控措施的平均效应值。
在实际操作中,腾讯天衍实验室的科学家们对原模型进行了更符合“新冠疫情防控政策”评估的优化改进,模型公式如下图:
通过融合多种传统面板数据的因果推断模型,包含双效固定效应模型、矩阵补全模型等,并隐式地引入潜在因子交互项,使其在复杂场景下能满足统计学的先验假设,对于像新冠疫情这样随时间变化的动态数据,能进行更有效地量化研究,这也是研究者在新冠疫情防控研究开发并引入该模型框架的主要原因。
04.
结语:AI和大数据分析为疫情
防控提供了有力支持
这次发表于Value in Health的新研究,是继去年2月钟南山院士团队与腾讯公司共同成立大数据及人工智能联合实验室后,双方在抗击新冠肺炎疫情上的最新研究成果。此前,双方还联合研发了新冠重症AI预测,有助合理地为新冠患者进行早期分诊。
研究通过大数据分析找到了更可靠的证据,印证了疫情防控措施对抑制新冠肺炎疫情的定量影响,并建议应在疾病流行的早期,实施更严格的疫情防控措施,以更好地遏制疫情。
目前,钟南山院士团队和腾讯健康正在持续利用大数据与人工智能等互联网科技手段,围绕新冠预警预测、传染病防控等领域展开深入的科研合作,进一步为疫情防控提供有力的证据支持。
文章来源: 智东西
——————-END——————-
看累了吗?戳一下“在看”支持我们吧!