高娓娓疫情日记:专访约霍普金斯实验室,传说中的美国权威疫情数据,居然是两个中国学生搞的?!!!
0 2020-06-01

高娓娓疫情日记:专访约霍普金斯实验室,传说中的美国权威疫情数据,居然是两个中国学生搞的?!!!

【高娓娓疫情日记】

Picture2

Picture1

全世界都在关注疫情的数据,那么这些数据是从哪儿来,怎么来的呢?人们通常会说到约翰•霍普金斯大学实验室。今天我们请到了实验室的一员,约翰•霍普金斯大学土木与系统工程学院在读博士杜鸿儒。他跟我们分享美国权威实验室是怎样追踪、统计疫情数字的。

娓娓:我个人很好奇,我的观众朋友也很好奇,为什么美国的主流媒体选择你们实验室的数据作为权威,我想竞争应该很激烈吧?

杜:我想主要原因应该是我们是最早开始做疫情追踪地图的机构之一。在人们都开始对疫情慢慢有关注的时候,我们在1月22日就上线了第一版地图。在那个时候就积累了一定的用户量。其次我们也借助于约翰•霍普金斯大学这个平台来扩大我们疫情地图的知名度。因为约翰•霍普金斯大学在公共卫生方面在全美,乃至于全世界都是数一数二的。所以相比于其它机构,大家可能更容易接受我们的数据。我们也在尽我们所能维护系统的运行,每天都要审核我们的数据。确保我们的数据准确,并且实时。

娓娓:《纽约时报》说约翰•霍普金斯大学实验室搜集的数据是非常谨慎、周密的,很多媒体都做不到。我想问问你们的数据是怎么搜集的,分享一下秘密?

杜:我们的数据是来自于很多不同的数据源,这些数据源主要有各个州、各个地区的CDC、一些权威媒体的报导、一些推特账户,还有一些直接联系我们的邮件。从这些数据源中,我们会把我们觉得有效的、正确的信息整理出来,再变化成统一的格式,公布到我们的疫情地图当中。

娓娓:现在的数据都是基于拿到的数据做出来的,而专家们认为,真实的感染人数比实际统计出来的数字要高得多。基于这种偏差,你们怎么对待呢?

杜:很多人都问过我跟您一样的问题,针对于确诊案例和实际公布案例偏差的情况,我个人观点是这个偏差是不可避免的。因为只有将这个国家所有的人都探得之后,我们才能知道这个国家真实的确诊案例到底是多少。但是这个显然是不可能实现的。在我们的一些建模当中,我们预测之后疫情的走势,我们一般都不会参考实时的确诊案例。我们更倾向于参考当时的死亡案例会有多少。因为死亡案例要比确诊案例来得更准确一些。

娓娓:疫情数据的实时更新非常重要,而CDC的数据通常都有一天的延迟。我们大家都很好奇你们的疫情追踪系统是怎么样的?

杜:我们现在这个疫情追踪系统已经包括了188个国家和地区,对于不同的国家,我们会有不同的播报标准。比如说对于中国,我们是以省为单位进行播报。对于美国,我们是以3000多个郡、县为单位进行播报。除了播报确诊病例、死亡病例之外,我们还会播报其它流行病学的相关数据,比如说检测数据,比如说对于美国,我们还有住院数据。比如说对于世界上各个国家,我们还会播报死亡率,或者确诊病例占总人口的病例这些数据。所以,我们整个疫情追踪系统相比于其它机构会提供更加完善,更加完整的一些数据。

娓娓:疫情从爆发到逐渐地稳定,确诊人数从零到上百万,死亡人数从零到上十万,这些都是一个一个鲜活的生命,一个一个的家庭。我很想知道你们的心路历程,看到这些数据的跳动,这些数字的变化,你有什么感想?

杜:疫情的发展速度之快出乎了所有人的意料,尤其是对于我们来说,有更直观的感受,因为我们每天都在面对这些数据。从最开始疫情的初期发展阶段,主要集中在亚洲的部分国家和地区会出现一个一个的红点。随着疫情在全世界范围内的蔓延,这些红点蔓延到了世界的各个角落,这对于我们来说是很大的冲击。

娓娓:疫情期间全美甚至全世界都在看你们的数据,你觉得工作压力大吗?

杜:参加这项工作确实会感受到一些压力,特别是在疫情蔓延到全世界以后,大家都在实时关注我们的地图。所以,我们就一定要谨慎再谨慎,小心再小心地公布数据,以免我们公布了错误的数据对一些地区的居民造成不必要的恐慌。

娓娓:现在疫情逐渐稳定,那你们的工作重心有什么变化吗?

杜:如今我们的实时疫情追踪地图已经越来越成熟稳定了,所以我们就把我们的工作重心放到了科学研究上来。我们收集了各个郡县的确诊案例和人们的一些出行数据进行数学建模,以此来研究社交距离和居家令对于疫情发展的影响。我们发现保持社交距离对于控制疫情的进一步发展确实有很大效果的,但是这个效果并不是能实时见效的。不是说当人们今天待在家,明天就能看见疫情有所放缓的,这个需要一段缓冲的时间。通过我们的研究,我们发现缓冲的时间大概是10天左右,也就是说当人们都保持社交距离或者待在家10天或者10天以上之后,居家令和保持社交距离的效果就能逐渐显现出来。

娓娓:这次疫情让我们看到了数据的重要性,而你作为这方面的博士、高材生,给我们学习数据的同学来点建议好吗?

杜:对于数据专业的同学们,你们可以去关注一些相关账号,看看他们在实际项目中是如何处理数据的。所以从实际出发不仅仅局限于课上所学内容,从实际项目中找到自己需要的技能和技巧。

娓娓:杜鸿儒博士作为一名中国留学生,能够成为世界著名约翰•霍普金斯大学实验室的一员,我们为你骄傲。感谢你的分享。

杜:谢谢您今天的采访