衡量大流行的真正收费

《经济学人》如何衡量covid-19导致的过度死亡

One of the grim ironies of the covid-19 pandemic is that the world has shown an unprecedented interest in data — and yet there has never been so much uncertainty around official statistics. Facebook and Twitter have become catalogues of terrifying charts, as people around the globe have tried to work out how quickly the SARS-CoV-2 virus is spreading. Meanwhile, academics and journalists have come up with lots of inventive ways to quantify the impact of the pandemic.经济学家例如,已发布的分析旅游流量全球主要城市的落脚点and互联网使用

Yet we still don’t know the numbers that matter most. Because countries have different testing capabilities, and many carriers show no symptoms, we don’t know how many people the virus has infected. More worryingly, we don’t even know exactly how many people it has killed. As I4月初报道在许多国家,官方covid-19收费前clude victims who were not tested before passing away. It often takes several days to establish and report the cause of death, creating a lag in the data. And if hospitals are overwhelmed, people with other conditions might not get the intensive care they need to survive. As a result, the numbers of deceased that get read out each night on the news are smaller than the true number of fatalities that the virus has already caused.

在像这次这样的医疗危机期间,衡量死亡率的一个更好的方法是看一个地区的“超额死亡”:与往年同期的平均数相比,死于各种原因的人数。我一直在用两种方法来做这件事。第一种方法是收集一些统计局定期提供的有关死亡率的公开数据,并估计在一些地方死亡人数比平时多多少。第二种方法是使用EuroMOMO那a network of epidemiologists in 24 European countries, which covers 350m people in its weekly reports. As the pandemic continues, I will update all of these datasets on我们的超额死亡率追踪器,这是免费提供给所有读者

对于每个国家或地区,我们都将超额死亡人数与官方covid-19数字进行了比较

One of the biggest challenges when it comes to measuring the spread of the virus is that every country collects its data differently. This is particularly true for the official covid-19 figures. For example, France has conducted a considerable amount of testing in care-homes, and includes fatalities from such institutions in its daily tolls, whereas almost all of the Netherlands’ reported deaths have occurred in hospitals.

然而,关于所有原因的死亡数据可能似乎更加直接收集,在各国的质量和频率也有所不同。西班牙Carlos III研究所,其国家流行病学中心是出版的各地区每日数据-但这些都有很大的滞后性,而且随着新数据的出现,这些滞后性会增加(见下表)。相比之下,英国国家统计局每周总计在其系统中注册的死亡证明数,以后不再修改。因此,国家之间的比较并不完全是苹果对苹果的比较。我们还必须使用一种简单的方法来确定“预期死亡”的基线:前几年同一周的平均数(理想情况下是过去五年,但有时是两到三年,视可用性而定)。

西班牙每日总死亡人数的数据经常被回顾性地修正

此外,有些国家只报告了部分死亡率数据,这些数据涵盖了非随机选择的地区或受害者。在伊斯坦布尔and雅加达这两个非西方地区目前在我们的跟踪者中,我依靠当地部门报道的被埋葬的人数的概率。这些数字不会拿起已经死亡的每个人,但它们仍然远远高于官方Covid-19收费。土耳其甚至没有通过地区进行Covid-19死亡的定期崩溃,因此我们必须估计伊斯坦布尔以4月1日的一份报告为基础的国家份额的一半。鉴于许多发展中国家发表的速度慢,我可能必须使用类似的方法来查找南美洲,非洲,亚洲和中东的数字。

Even some rich nations do not have complete data. Italy’s National Institute of Statistics (ISTAT) has releasedfigures on all deaths只有1,700个国家的7,900个市镇(或comuni) - 只有这两者的增加,今年至少增加了20%并声称有准确的记录。这使得不可能在欧洲国家遭受最严重的欧洲国家的过度死亡。但是,因为这些comuni在伦巴第7.2亿人中,最严重影响的意大利地区,我能够生产对该地区的估计。我发现快照映射官方Covid-19那些人的死亡comuni在3月底,用来预测伦巴第死亡人数每周遭受的死亡人数的份额。

我们基于可用的Comuni估计伦巴第总量和Covid-19死亡人员

All of this data-cleaning is fiddly and time-consuming, especially because the underlying spreadsheets are in different formats and languages. Whenever new data are published, I check them carefully, in case the definitions have changed.纽约官方公布的死亡人数例如,已经开始包括“可能”死于Covid-19的人,根据其死亡证明的症状。为了使这个过程更加组织,我在R中写了一个脚本,编程语言最常由数据记者使用经济学家那to do the cleaning for me. It is about 1,000 lines long, and spits out CSV files in the same format for each country. Those go into a Github repository, whichMartínGonzález.是我们卓越的互动记者之一,用于为我们的跟踪器制作动态图表。我们希望在某些时候,一旦我们制作代码即可,将公开可用的资源 - 继续检查我们的github

I’ve used an R script to clean the raw data files from each country, often in a foreign language!

虽然我能够为许多欧洲国家找到死亡率,但并非所有人都以及时的方式公开提供这些数据。例如,德国只发布了全国达到3月13日的数字(在撰写本文时),因为意大利,它努力协调大量区域办事处。

为了解决这个问题,我和EuroMOMO的流行病学家合作过。他们每周收集欧洲各地的死亡率数据,我们将把这些数据包括在我们的跟踪系统中。虽然他们没有按国家划分死亡人数的绝对数字,但他们确实为每个成员国提供了一个趋势图on their website

Euroomomo的数据表明,Covid-19即使是最糟糕的流感季节也远远超过最严重的流感季节

In this respect, EuroMOMO is a unique resource. No other continent has such a coordinated system. The United States has a“肺炎和流感死亡率监测”工具,为每个州发布每周总死亡人数。但各国需要几个月的时间来更新他们的数字,这就是为什么我们迄今为止我们只包括纽约市的纽约市。

While working with EuroMOMO, I spoke to Lasse Skafte Vestergaard, to find out more about how the data are collected and what the limitations might be. Lasse coordinates the network, and helps put together the bulletin that the group publishes each Thursday. He is also an epidemiologist at Denmark’s national institute for infectious disease, and has specialised in influenza, malaria and parasitology.

JT:Lasse,您的组织是唯一一个追踪整个大陆的过多死亡的人。这是怎么来的?

LSV: EuroMOMO’s network was set up in response to the global influenza pandemic in 2009, to ensure early detection of future public health events. Currently we have 28 partner institutions across 24 countries and regions. We also have representatives from the European Centre for Disease Prevention and Control (ECDC) and the World Health Organization (WHO) Regional Office for Europe, who both support the network activities and our hub financially, participate in technical discussions, and help our active strategy to expand geographical coverage, especially in Eastern Europe. For example, Ukraine has recently started to provide monthly data to the hub. One of the great strengths of our approach has been its consistency and close collaboration between participating countries, running week after week, year after year. Putting together the national data from all of them adds power to detect smaller changes than what individual countries may immediately see.

15岁至64岁的人以及65岁以上的人的死亡率显著上升

JT: How comprehensive are your numbers?

路易斯安那州:我们的数据来自国家或地区统计局,通常基于民事登记簿中记录的死亡信息。总体而言,我们的样本覆盖了相当大比例的欧洲人口,超过3.5亿人。然而,所涵盖的比例在不同国家之间差异很大,从许多国家的95-100%到其他国家的15-20%。这一切都取决于地方行政制度和政治决定。

JT:解读数字的人应该注意哪些限制?

首先,我们提供的是基于某些统计模型和假设的死亡率估计,而不是确切的死亡人数。他们周围总会有一定程度的不确定性。其次,有些国家的覆盖范围仅限于一些选定的地区或城市,例如德国和意大利。由于我们正在研究国家一级的估计数,观察到的数字可能无法充分发现一个国家较小地区的死亡率水平要高得多。最后,即使是质量最好的报告也没有完全完成,而且总是有几天或几周的延迟。我们在统计算法中应用了一个调整函数,但是,最近几周的估计数必须谨慎阅读。

JT:一些读者可能会看看Euromomo的图表,并认为来自Covid-19的死亡人数不如来自最近的一些流感季节。你会如何回应?

LSV:鉴于我们已经看到的戏剧性死亡率,特别是在欧洲的某些地区,我们可以得出结论,这种大流行不仅仅是另一种流感 - 根本没有。它醒来看大变异,从一个国家的极高过度到邻近的水平。我们以后必须评估各种综合预防措施的效果,以不同的速度和覆盖率的水平。然后我们可以得出结论应该在未来的淫乱的准备方面建议。

我们还不知道我们会保持更新需要多长时间经济学家的追踪器。如果随着各国进入和退出封锁期,这种流行病在几个月内激增,然后减弱,那么超额死亡率数字将是衡量社会疏远政策的效果以及何时需要执行的一个重要指标。我将继续挖掘各种语言的官方报告和电子表格,扩展我们越来越复杂的R脚本。如果有读者发现了我们可以使用的数据,或者我们需要对现有数据进行修正,那将是非常有帮助的——我很乐意在网站上听到他们的消息jamestozer@economist.com.

James Tozer是一个数据记者经济学家。You can follow The Economist Data Team’s work on推特

经济学家

对国际新闻、政治的洞察和见解…

中等是一个开放的平台,1.7亿读者可以在这个平台上发现有见地的动态思维。在这里,专家和未被发现的声音一样潜入任何主题的核心,并带来新的想法表面。了解更多

遵循对您有关的作家,出版物和主题,您将在您的主页和收件箱中看到它们。探索

If you have a story to tell, knowledge to share, or a perspective to offer — welcome home. It’s easy and free to post your thinking on any topic.写在中等

Get the Medium app

一个按钮,上面写着'下载到应用商店',如果点击它会引导你到iOS应用商店
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store