基于大数据与人工智能的疫情分析与决策平台
2022年12月27日

一、面临的重大管理问题

2022年3月,上海市爆发了新冠肺炎Omicron变种,截至6月30日,总感染数已超过62万,严重影响了公众社会福祉与经济活动,并为社会治理带来了重大挑战。为了应对Omicron,政府采取了不同程度的管控措施,开展了大规模核酸检测,并最终有效的控制了疫情的发展,取得了阶段性成果。

回顾整个历程,从民众的角度来讲,相较于获悉杂乱的碎片化信息,为其提供直观且全面的疫情发展情况能够在相当程度上减轻情绪焦虑,进而避免疫情中社会恐慌传播效应的产生。从政府管理者的角度来看,如何科学地预测疫情变化,准确评估疫情风险并采用最佳的防控手段,平衡好疫情防控与经济社会发展,从而实现高质量的动态清零政策,仍是工作的重点与要点。

针对上述两个方面的关切,上海交通大学管理决策模型与算法研究中心的金耀辉教授、许岩岩副教授作为项目负责人,在上海交通大学人工智能研究院、上海白玉兰开源开放研究院的联合支持下发起了“Shanghai COVID-19 ReOpen”开源项目。本项目在对此轮上海疫情进行信息开源可视化,提供直观且全面的疫情信息的同时,构建了大规模传染病仿真决策平台以助力科学决策,应对未来的公共卫生挑战。

二、解决问题的思路与方法

1.疫情可视化平台助力信息治理

项目首先借助自然语言理解模型,自动化完成对上海市卫健委发布的官方数据进行信息提取,并于2022年4月24日发布了上海市新冠疫情可视化平台(http://reopen.baiyulan.org.cn/)。疫情可视化平台对上海全市及各行政区县的每日新增感染数、医疗资源占用情况(每日现存方舱隔离人数、医院治疗人数)、社会面新增人数等关键信息进行可视化展示。平台后续增加了小区检索功能、最新医疗及核酸检测资源信息等,用户可通过地址检索,快速查看周边小区通报情况以及附近医疗资源开诊、核酸检测点运营信息。

图1: 上海疫情信息可视化平台主界面

为推动开源数据在科学决策中发挥作用,团队将数据分析代码及处理后数据开源(https://github.com/Bai-Yu-Lan/SH-COVID19),并授权在《木兰-白玉兰开放数据许可协议(MB-ODL-BY 署名 v1.0)》下,欢迎第三方下载并进一步利用数据。此外,团队基于开源并估计了上海市及各区的Omicron有效传染数Rt;融合安居客等第三方数据,评估小区级别的脆弱性,便于公众与决策部门更清晰、直观地了解疫情发展趋势。

图2:上海疫情信息可视化平台信息处理流程

2.仿真决策平台支撑科学决策

与此同时,为进一步助力科学决策,团队针对上海市疫情防控的特殊情形,如无症状、方舱隔离、密接隔离等策略,设计了新的传染病动力学(SH-SEIR)模型,并基于移动大数据推演居民的日常活动行为,构建了大规模智能体模拟系统。当设定模型推演的时空颗粒度为“百米网格·小时”时,能够实现基于2800万人口在个体层面移动行为之上的病毒传播仿真,以及不同防控策略效果的模拟分析。

图3: 大规模智能体模拟系统构建流程

基于智能体的模拟系统是分布式人工智能的一种,其运作方式是建立一系列有自主分析和决策能力的智能体(Agent),并通过这些智能体的行为和互动来模拟真实世界的运行。基于智能体的城市流行病传播模型不仅对流行病传播的持续时间、感染节点数量及其空间分布的预测具有良好的准确性,还能够较为有效地模拟多种公共卫生干预措施对疫情发展的影响,从而为城市疫情期间的危机防控和健康安全空间体系的打造提供帮助。欧美国家在新冠爆发初期,诸多以物理、人工智能学者为主的科研团队,开发了大规模ABM系统,辅助政府在初期社交距离管控、后期经济重启等环节作出科学决策。从目前全球范围内的形势来看,疫情防控将是长期持久的过程,即使在达到动态清零之后,也需要依据当下形势作出风险预警及制定合理的应急管理措施。

通过对上海市居民的日常活动行为进行ABM建模,并结合新的SH-SEIR传染病动力学模型,团队研发了《大规模传染病仿真决策平台》。平台可在不同地域背景下,针对宏观封控政策的进行设置,并在此政策背景下,从“健康–民生–经济”三个层次对疫情进行模拟,预警未来疫情时空传播趋势,对疫情走势的影响与风险做出预判。同时,采用强化学习的方式,在平衡疫情防控与经济社会发展的目标下,求解最佳的防控细节组合,包括但不限于核酸检测频率、区域封控的条件与时机、感染密接者隔离举措等,从而为传染病防控的科学决策提供全面支撑。

1672816097196048595.png

图4: 大规模传染病仿真决策平台基于闵行区数据的封控政策风险模拟

三、推广和应用效果

项目整体工作得到了社会各界的高度认可。项目可视化平台发布之后,受到国家信息中心、上海市公安局、上海市大数据中心、澎湃新闻、亚马逊中国、阿里云等机构专家的高度关注和好评,高峰访问量达到每小时逾千人,截至目前,访问次数已近4万人次,访问用户来自50多个国家和地区。项目开源数据在开源社区吸引逾百名开发者收藏关注,项目负责人金耀辉教授受上海市大数据应用研究会等邀请做学术报告。目前项目团队正积极推进决策平台在具体复工复产复商场景中的落地应用。