COVID-19数据如此令人困惑的简单原因

为什么准确的报道还不够好

考虑以下两个关于COVID-19数据的说明性标题:

1 |年轻人占COVID-19住院人数的很大一部分

在美国第一批报告的病例中,超过40%需要住院的患者年龄在65岁以下

COVID-19对年轻人的影响不那么严重

在确诊COVID-19病例的65岁以下成年人中,约有10%最终住进了医院,住院的可能性比年龄较大的人群低70%。

这两个说明性标题都是准确的,但存在清晰度危机:它们向更年轻、更健康的人传递了关于COVID-19风险的相互冲突的信息。

40%的年轻人的隐含风险和10%的(对他们来说)更相关的风险之间有很大的区别。由相互冲突的信息引起的认知失调有不良的影响,从人们不理睬,或更糟的是——得出错误的结论,或最糟糕的是——做出错误的行为。

穿越困惑

读者必须调和两个标题,其中任何一个都是有意义的新闻。不幸的是,在没有更多信息的情况下,不可能调和这两个标题,所以我们用(假设的)数据建立了一个表,与两者一致:

两种观点:政客和专业人士跨行查看数据,但媒体和普通民众希望按列查看数据。

像这样的二维表格可以用两种方式阅读:水平(其中行百分比之和为100%);垂直方向上(各列的百分比之和为100%)。

水平的观点对应第一个标题。这是政治家和专业人士的观点,他们放眼整个社会。关键是,在这种视图下收集数据要容易得多——只需数一下医院里的人数。以这种方式组织的数据对于资源和容量规划非常有用。

垂直的观点对应第二个标题。这是大众的观点,包括大多数媒体。它回答了“这对我意味着什么?”不幸的是,垂直视图的数据很难收集,而且很少以这种方式呈现。

你就知道了——同样的信息,两种准确但不同的观点和解释。为什么年轻的成年人在住院人数中占很大比例,而住院率却很低?年轻人比老年人多很多。

我们需要关于总体人口的这一关键的“先验信息”来调和两种观点,但它经常被忽略——这是丹尼尔·卡尼曼(和其他人)所说的“基准率忽视”的一种形式。”[3]

混乱的观点,混乱的人

既然我们知道这两种观点都是正确的,而且每一种观点都回答了不同但重要的问题,那就意味着没有问题了吗?

不,这里有一个大问题:大多数时候,数据是以水平视图的形式呈现给我们的,而我们大多数人感兴趣的是垂直视图的问题:“它对我来说意味着什么?””[4]

不同的观点导致不同的人。许多人干脆不理睬。另一些人则得出了错误的结论——在本例中,有超过40%的COVID-19年轻人正在住院,这一结论令人担忧,但却是错误的。混杂的信息让人们追随自己的偏见,相信自己想相信的任何东西。”[5]

更糟糕的是:当“专家”(横向)观点和“大众”(纵向)观点无法调和时,就会滋生对专家及其动机的不信任。准确而不清晰可能会导致回旋镖效应,“试图说服的结果是采用相反的立场,而不是意想不到的结果。”[6]。

在COVID-19大流行的早期阶段,美国卫生局局长杰罗姆·亚当斯(Jerome Adams)博士要求美国人停止购买口罩,因为“它们在防止公众感染冠状病毒方面并不有效,但如果医疗服务提供者不能让口罩照顾病人,就会将他们和我们的社区置于危险之中。”他对医疗保健体系的担忧是合理的(横向观点),但模糊了对公众的风险(纵向观点)。[7]

然而,许多人都知道,亚洲国家是如何把口罩视为个人安全的重要保障的,这引发了困惑,并对美国专家及其动机产生了怀疑。不幸的是,有些人的反应与专家的意图相反——起初囤积口罩,后来(在专家改变了主意后)拒绝戴口罩。

数据科学家的准确性和清晰度

认识到存在两种观点为数据科学家提供了一个机会,使他们能够带头追求准确性和清晰度。我们前面提到,通常很难编译垂直视图的人口数据。当我们将人口划分为子群体时尤其如此。

假设COVID-19住院数据缺少垂直视图中的大部分数据:

想象一下,您正在从三个来源修补信息:

  1. 一项研究告诉我们,在COVID-19病例中,年轻人和老年人的比例为70% - 30%;
  2. 一项医院调查显示,40%多的住院病人是年轻人;而且
  3. 检测数据显示,17%的COVID-19确诊病例正在住院。

请注意,1。和2。为水平视图数据,3。是垂直视图数据。你想要回答垂直视角的问题:“这对我来说意味着什么?”

贝叶斯规则提供了一种结合水平视图和垂直视图来推断缺失信息的优雅方法。即使大部分垂直视图是不可用的(通常情况下),你可能有足够的信息来创建它:

贝叶斯来拯救我们!
解决“我们想知道的”问题
水平和垂直视图的贝叶斯可视化:在小方框中表示的住院是准确的,但不清楚。关于大框中的人口的上下文信息提供了非常需要的清晰度。

为了清楚起见,我们能做什么?

任何展示表格数据的人都可以通过澄清水平或垂直视图(如果可能的话,两者都可以),为公共话语提供巨大的服务。明确哪个方向是100%!清晰是一种天赋……你的建议、教导和说服他人的能力——以及最终被理解的能力——都依赖于它。

现在庆祝!

参考文献

这些标题是根据2020年5月中下旬的报告和调查合成的。

[2]希雷。(2020年4月29日)。如何利用贝叶斯定理更智能地消费新闻对数据科学

[3]基准利率谬论.(2020)。维基百科。(2020年6月7日检索)

[4]最近一个来自瑞士的例子:达西的席尔德。(2020年5月31日)。根据一份新的报告,瑞士约40%的COVID-19重症监护患者年龄在60岁以下内幕。

约翰逊[5]。如何构建公共卫生信息以便人们听到《经济学人》.(2020年4月4日)。

[6]飞去来器效应(心理学).(2020)。维基百科。(2020年6月7日检索)

[7] Asmelash,利亚。(2020年3月2日)。卫生局局长希望美国人停止购买口罩(视频文件)。CNN。

有关认知偏见和2019冠状病毒病的进一步阅读,如指数增长谬误和习得性无助:

为什么我们低估了COVID-19

为什么有些人仍然不呆在家里

关于作者

马修Raphaelson
马修是一名管理顾问,他帮助公司通过数据科学增加收入。此前,他是一名高级财务主管,拥有25年应用量化建模和数据科学启动和管理数十亿美元业务的经验。他是金融应用的主席ProbabilityManagement.org他拥有斯坦福大学商学院的工商管理硕士学位。

Raj Dev
Raj是使用数据科学和分析来进行人才和人员决策的传播者。Raj是EleveneX的执行合伙人。此前,拉杰是Impossible Foods的人力运营副总裁。在此之前,他在Credit Sesame和Tesla担任高级管理职务。拉杰拥有耶鲁大学管理学院的工商管理硕士学位。

使用Medium应用程序

一个写着“在App Store下载”的按钮,点击它就会引导你进入iOS App Store
一个写着“开始吧,谷歌播放”的按钮,如果点击它,就会引导你进入谷歌播放商店
Raj Dev

Raj Dev

同理心+数据=好的决策。天赋,分析,策略。

Baidu
map