“生日双胞胎”需要多大的群体才能存在?
这是一个有趣的脑筋急转弯:随机一群人必须有多大才能有 50% 的机会至少有两个人会共享一个生日?答案是23,这让很多人感到惊讶。这怎么可能?
在思考这个在统计学上被称为“生日问题”或“生日悖论”的问题时,很多人直觉地猜测 183,因为这是所有可能生日的一半,因为一年通常有 365 天。不幸的是,直觉在这类统计问题上往往表现不佳。
“我喜欢这些类型的问题,因为它们说明人类通常不擅长概率,导致他们做出错误的决定或得出错误的结论,”Jim Frost,一位统计学家,他写了三本关于统计和是美国质量协会统计文摘的定期专栏作家,他在一封电子邮件中说。 “此外,它们展示了数学对改善我们的生活有多么有益。因此,这些问题的违反直觉的结果很有趣,但它们也有目的。”
为了计算生日问题的答案,弗罗斯特从几个假设开始。 首先,他忽略了闰年,因为这简化了数学运算并且不会对结果产生太大影响。 他还假设所有的生日都有平等的机会发生。
如果您从一组两人开始,第一个人与第二个人不共享生日的机会是 364/365。因此,他们共享生日的可能性是 1 减 (364/365),或大约 0.27% 的概率。
如果您假设一组三人,则前两个人涵盖两个日期。这意味着第三个人不与其他两个人共享生日的机会是 363/365。因此,他们共享同一生日的可能性是 1 减去 (364/365) 乘以 (363/365) 的乘积,即概率约为 0.82%。
一个群体中的人越多,至少有一对人共享一个生日的机会就越大。 Frost 指出,如果有 23 个人,则有 50.73% 的机会。 57个人,有99%的概率。
“我收到了来自大学统计学教授的消息,他们会在一个特定的统计学课上赌两个人在同一天生日,赌注 20 美元,”弗罗斯特说。 “考虑到与生日问题相关的概率,他知道他几乎肯定会赢。但每个学期,学生们总是赌输!幸运的是,他说他会退还钱,然后教他们如何解决生日问题问题。”
生日问题的答案感觉违反直觉可能有几个原因。一个是人们可能会无意识地计算小组中其他人生日的可能性,而不是实际的问题,即小组中的任何人是否共享生日,弗罗斯特说。
“第二,我认为他们也从类似的东西开始,嗯,一年有 365 天,所以你可能需要大约 182 人才能有 50% 的机会,”弗罗斯特说。 “但最重要的是,他们大大低估了概率随群体规模增加的速度。可能配对的数量随着群体规模呈指数增长。在理解指数增长方面,人类是可怕的。”
Frost 指出,生日问题在概念上与另一个指数增长问题有关。 “为了换取一些服务,假设您在第一天获得 1 美分,第二天 2 美分,第三天 4 美分,8 美分,16 美分等等,持续 30 天,”弗罗斯特说。 “这是一笔划算的交易吗?大多数人认为这是一笔糟糕的交易,但由于指数级的增长,在第 30 天你将总共获得 1070 万美元。”