揭密钟形曲线为何无处不在的数学原理

揭密钟形曲线为何无处不在的数学原理

Hacker News 摘要

原标题:The math that explains why bell curves are everywhere

无论你看向何处,正态分布曲线(又称钟形曲线)几乎无处不在。如果你在每次下雨时都在后院放一个量杯并记录水的高度,或者让100个人猜测罐子里糖果的数量,所得的数据都会呈现出这种曲线。测量足够多女性的身高、男性的体重、SAT考试分数或马拉松成绩,你总会得到一个中间高、两端逐渐变细的光滑弧形。

为什么钟形曲线如此普遍

这种现象的核心原因在于中心极限定理。这是一个非常强大的数学真理,对于初学者来说,它往往显得不可思议,甚至像是大自然的某种魔术。华盛顿大学的生物统计学家丹妮拉·威滕(Daniela Witten)指出,中心极限定理之所以神奇,是因为它极其违反直觉。通过它,最随机、最不可想象的混乱都可以演变成惊人的可预测性。

如今,它是现代经验科学赖以生存的重要支柱。几乎每当科学家利用测量数据来推断世界时,中心极限定理都隐藏在研究方法中。如果没有它,科学很难对任何事物做出有把握的推断。卡内基梅隆大学的统计学家拉里·瓦瑟曼(Larry Wasserman)直言,如果没有中心极限定理,统计学这个领域可能根本就不会存在。

从赌博中诞生的规律

人类试图在随机性中寻找规律的最初动力源于对赌博的研究。18世纪初,法国数学家亚伯拉罕·德·莫伊弗(Abraham de Moivre)因为宗教迫害逃往伦敦。由于无法获得正式的学术职位,他成为了一名博彩顾问,向那些寻求数学优势的赌徒提供建议。

德·莫伊弗意识到,虽然抛硬币、掷骰子或抽牌是随机行为,但当你合并许多随机行为时,结果会遵循一个稳定的模式:

• 如果你抛100次硬币,正面朝上的次数通常在50次左右。

• 如果你玩100万次这样的游戏,绝大多数结果都会非常接近50%。

• 如果你把看到每个数字的次数画成图表,就会出现经典的钟形,50位于中心。

德·莫伊弗计算出了这个钟形的精确数学形状,也就是后来的正态分布。他以此编写了《概率论》(The Doctrine of Chances),这成为了当时赌徒们的圣经。

拉普拉斯的理论升华

直到1810年,也就是德·莫伊弗去世几十年后,皮埃尔-西蒙·拉普拉斯才揭示了这一发现的宏大范围。拉普拉斯用掷骰子的例子进行了更复杂的推演。单次掷骰子的结果是均匀分布的(1到6的概率相等),但如果你掷10次骰子并计算平均值,然后重复这个实验多次,你就会得到一个以3.5为中心的钟形曲线。

这就是中心极限定理的魅力所在:

1. 你从一组没有任何特定结构的原始数据开始(比如掷骰子的平坦分布)。

2. 通过对多次测量取平均值,并重复该过程。

3. 最终会得到一个精确、可预测的数学结构,即钟形曲线。

拉普拉斯将这一结构浓缩成了一个简洁的公式。无论一个随机过程多么不规则,只要是对大量结果取平均值,它们就会符合正态分布。

遍布世界的工具

虽然取平均值听起来像是人类才会做的操作,但中心极限定理在自然界中潜移默化地发挥着作用。以人类身高为例:

• 一个人的身高取决于父亲的身高、母亲的身高、遗传基因、营养状况以及其他许多微小效应的叠加。

• 这些效应之间通常互不相关,这种多重微小效应的累加,本质上就像是对许多随机变量取平均值。

正因如此,各种数据集才会自发地符合这种美丽的形状。只要某个现象背后存在大量独立因素的综合作用,结果就会呈现正态分布。

此外,该定理还赋予了统计学家检测异常的能力。如果你抛100次硬币只得到20次正面,通过中心极限定理,你可以计算出公平硬币出现这种结果的概率仅为0.15%。这说明这个硬币很可能被动了手脚。

使用时的局限性

尽管中心极限定理是现代科学的支柱,但它也有自己的限制条件:

样本量:它只有在合并大量样本时才有效。

独立性:样本必须相互独立。例如,如果你只在缅因州的一个小镇进行全国总统民调,那么重复实验也无法让你得到准确的预测。

极端事件:在科学研究中,离群值有时比平均值更重要。例如,所谓的百年一遇的洪水在现代发生的频率正在增加。对于模拟此类极端事件,单纯依靠建模平均值的中心极限定理可能并不足够。

如今,统计学家经常针对具体的复杂问题制定中心极限定理的变体。当我们将大量独立测量结合起来时,就会产生聚集效应。只要我们足够聪明,就可以利用这些聚集模式来发现产生它们的深层逻辑。


原文:https://www.quantamagazine.org/the-math-that-explains-why-bell-curves-are-everywhere-20260316/

评论:https://news.ycombinator.com/item?id=47401489

Report Page