当直觉失败时 如何用概率和统计找到真正的答案
例如,假设公交车有一半的时间以 20 分钟的间隔到达,一半的时间以 40 分钟的间隔到达。总体平均现在是 30 分钟。但是,从您的角度来看,您在 40 分钟间隔内出现的可能性是在 20 分钟间隔内出现的可能性的两倍。
这在任何情况下都是正确的,除非公共汽车以精确的 30 分钟间隔到达。随着围绕平均值的离差增加,预期等待时间超过平均等待时间的量也会增加。这就是“检查悖论”它指出,每当您“检查”一个过程时,您很可能会发现事情花费(或持续)的时间比“未经检查”的平均值要长。看起来厄运的持续存在只是概率和统计规律的自然过程。
一旦意识到这个悖论,它似乎无处不在。
例如,假设您想对一所大学的平均班级人数进行调查。假设学院的班级人数为 10 人或 50 人,每个班级人数相等。因此,班级平均总人数为 30。但在随机选择学生时,他或她来自 50 名学生的班级的可能性是 10 名学生的 5 倍。因此,对于您对班级人数的询问,每有一个回答“10”的学生,就会有五个回答“50”您的调查得出的平均班级人数接近 50,因此,比 30。因此,与未经检查的真实平均值相比,检查班级人数的行为显着增加了获得的平均值。经检查和未经检查的平均值一致的唯一情况是每个班级人数相等。
我们可以在所谓的基于长度的采样的上下文中检查相同的悖论。比如挖土豆的时候,为什么叉子要穿过很大的那个?为什么在下载最大文件时网络连接中断?这不是因为你生来不走运,而是因为这些结果发生在比空间或时间的平均扩展更大的空间或时间扩展中。
一旦你了解了检查悖论,这个世界和我们对我们在其中的位置的看法就再也不会完全相同了。
另一天,你在医疗诊所排队接受病毒检测。该测试的准确率为 99%,您的测试结果呈阳性。现在,您感染病毒的可能性有多大?直观的答案是 99%。但这是对的吗?鉴于您感染了病毒,我们获得的信息与检测呈阳性的可能性有关。然而,我们想知道的是,如果您检测呈阳性,感染病毒的可能性。常见的直觉将这两种概率混为一谈,但它们非常不同。这是逆或检察官谬误的一个实例。
检测结果的重要性取决于您在接受检测前感染病毒的可能性。这被称为先验概率。从本质上讲,我们在病毒的罕见程度(基本比率)和测试出错的几率之间存在竞争。假设根据当地的流行率,您在接受测试之前有 100 分之一的机会感染了病毒。现在,回想一下测试是 100 分之一是错误的。这两个概率是相等的,所以测试呈阳性时您感染病毒的几率是二分之一,尽管测试的准确率为 99%。但是,如果您在接受检测之前就出现了病毒症状怎么办?在这种情况下,我们应该将先验概率更新为高于测试人群中的流行率。测试时感染病毒的几率正值相应上升。我们可以使用贝叶斯定理来进行计算。
总之,直觉常常让我们失望。尽管如此,通过应用概率和统计方法,我们可以无视直觉。我们甚至可以解决许多人认为最大的谜团——为什么我们似乎经常发现自己被困在较慢的车道或队列中。直觉上,我们生来就倒霉。慢车道拼图的合乎逻辑的答案是,它正是我们应该期待的地方!
当直觉失败时,我们总是可以使用概率和统计来寻找真正的答案。