中心极限定理:从1733到1937,一场跨越两百年的传奇

中心极限定理是概率论和统计学中的核心定理之一,其发展历程贯穿了数学史的几个重要阶段。无数伟大的数学家和统计学家做出了巨大的贡献,共同谱写了一场跨越两百年的传奇。

撰文 | 郭旭

中心极限定理(Central limit theorems, CLT)是概率论和统计学中的一个核心定理。在统计学的实践中,中心极限定理无处不在。中心极限定理表明,在一定条件下,若干随机变量的算术平均值的分布可以用正态分布近似。中心极限定理简洁优美且有普遍适用性。它并不需要明确知道参与求和的随机变量的精确分布,而只要满足一些较弱的条件即可。然而和大数定律(Law of large numbers)不同,中心极限定理并不是那么自然。我们很容易理解硬币正面朝上的频率应该逐渐接近于朝上的概率,而不太容易理解为什么即使每个变量是从偏态分布比如指数分布、卡方分布中抽取的,它们的样本均值都会近似服从正态分布。从1733年棣莫弗首次得出了一个特殊版本的中心极限定理到1935年费勒和莱维给出中心极限定理的充要条件,无数伟大的数学家和统计学家做出了巨大的贡献,共同谱写了一场跨越两百年的传奇。

1

法国数学家的贡献

亚伯拉罕·棣莫弗(Abraham De Moivre,1667—1754)在1733年给出了中心极限定理的雏形。这也是正态分布的第一次出现。他利用由他和詹姆斯·斯特林(James Stirling, 1692-1770)共同发展的现今被称为斯特林公式给出了二项分布的正态近似。他的工作是雅各布·伯努利 (Jacob Bernoulli, 1655-1705)大数定律的进一步发展。尽管大数定律表明频率和概率很接近,但却无法给出均匀硬币在次抛掷中次正面朝上的概率的更加精细的刻画。然而棣莫弗仅仅将这一超越时代的成果看作是二项分布的近似,而并没有意识到中心极限定理的普遍存在。

下一个重大的突破是由皮埃尔-西蒙·拉普拉斯(Pierre-Simon Laplace, 1749-1827)给出的。1812年他发表了重要的《概率分析论》(Théorie Analytique des Probabilités, TAP)一书。他使用由他在1785年引入的特征函数进行了论证。这一证明思路甚至影响到了100年之后的亚历山大·李亚普诺夫(Aleksandr Mikhailovich Lyapunov, 1857-1918)。尽管在1785年拉普拉斯已得出了一些初步的结果,但非常奇怪的是直到近40年后他才得到一个较一般化的中心极限定理。拉普拉斯所得出的中心极限定理是第一个一般化的结果。他的结果可应用于有界的随机变量。

西莫恩·德尼·泊松(Simeon-Denis Poisson, 1781-1840)在1824年和1829年发表了两篇文章来讨论中心极限定理。他希望能够对拉普拉斯的结果给出更加严格的论证。他的贡献主要是两个方面:1. 他创造了”choses”这一概念,可以看作是现代观点下的“随机变量”的开端;2. 他给出了一些反例比如柯西分布来说明中心极限定理有时并不总是成立。

这一时期的研究主要将中心极限定理看作是个工具而不是数学对象本身。在早期,概率论并不被看作是严格的数学理论而更多的是一种常识。到了19世纪后期,很多数学家希望给出中心极限定理更加严格的证明。这其中包括德国数学家约翰·彼得·古斯塔夫·勒热纳·狄利克雷(Johann Peter Gustav Lejeune Dirichlet, 1805-1859), 弗里德里希·威廉·贝塞尔(Friedrich Wilhelm Bessel, 1784-1846)和法国数学家奥古斯丁·路易斯·柯西(Augustin Louis Cauchy, 1789-1857)等。

狄利克雷和贝塞尔在他们的证明中引入了”不连续因子”,进一步发展和完善了泊松的证明。狄利克雷还尝试给出正态近似的误差。尽管这一尝试并不是很成功,但这是第一次对近似误差的较深入的研究。柯西是第一批认真地将概率论看作是纯粹数学的大数学家之一。在与伊雷内-朱尔·比内梅 (Irénée-Jules Bienaymé, 1796-1878)关于最小二乘的讨论中,柯西建立了正态近似误差的一个上界。

关于中心极限定理的早期证明往往不够严谨,定理所需的条件并没有清晰地给出,同时一般限定所讨论的变量有界。从1870年到1910年,俄国数学家开始在历史舞台上展露他们的才华。以帕夫努蒂·切比雪夫(Pafnuty Lvovich Chebyshev, 1821-1894), 安德雷·安德耶维齐·马尔可夫(Andrey Andreyevich Markov,1856-1922)和亚历山大·李亚普诺夫(Aleksandr Mikhailovich Lyapunov, 1857-1918)为代表的“圣彼得学派”在中心极限定理的发展史上写下了重重的笔墨。

2

俄国数学家的贡献

切比雪夫和马尔可夫采用矩方法进行论证,而李亚普诺夫则采用拉普拉斯的路径基于特征函数进行论证。切比雪夫和马尔可夫更多地是将中心极限定理用来说明他们所提的矩方法。而李亚普诺夫则将中心极限定理本身看作是一个数学对象。第一个现代意义下的严格证明是由李亚普诺夫在1901年给出的。

在1887年,切比雪夫发表了一篇关于中心极限定理的文章。尽管这篇文章的证明并不够完善,但他不仅清晰地陈述了定理所需的条件同时首次将中心极限定理看作是极限定理,而之前的数学家更多地将中心极限定理看作是误差分布的近似。在1898年,马尔可夫指出他的老师切比雪夫的结论实际上还需要一个额外的条件,即参与求和的变量的方差不会趋于0。切比雪夫和马尔可夫论证规范化后的和式的各阶原点矩收敛到标准正态分布对应的原点矩。

作为切比雪夫的另一个学生,李亚普诺夫并没有延续切比雪夫和马尔可夫的矩方法,而是回到1810年拉普拉斯所引入的特征函数方法。尽管拉普拉斯给出的证明不够完善,但对于他所考虑的情形,给出完整的证明并不非常困难。因而直到接近100年之后才由李亚普诺夫给出严格的论证显得非常地奇特。而法国的大数学家柯西,约瑟夫·伯特兰德(Joseph Bertrand,1822-1900)和儒勒·昂利·庞加莱(Jules Henri Poincaré,1854—1912)却没能完成这一壮举。在李亚普诺夫条件下,李亚普诺夫论证规范化后的和式的特征函数收敛到标准正态分布的特征函数。和拉普拉斯不同的是,他意识到特征函数和分布函数之间的关联。实际上莱维连续性定理已暗含在他的证明中。由于李亚普诺夫所得中心极限定理结果非常重要,现将其陈述如下:

3

中心极限定理历史的第三个篇章

第三个篇章发生在1920-1937。第一次世界大战结束后,概率论变得愈发重要,而中心极限定理也已变成数学领域的一个重要研究对象。匈牙利数学家乔治·波利亚(George Pólya, 1887-1985)意识到中心极限定理的重要性和普遍存在性,给出了“中心”这一名字。

在1922年,芬兰数学家贾尔·瓦尔德马·林德伯格(Jarl Waldemar Lindeberg, 1876-1932)给出了中心极限定理的一个新的证明。由于该结果的重要性,现将其陈述如下:

林德伯格条件一般来讲更弱,但有时不太容易验证。可以证明李亚普诺夫条件可推出林德伯格条件。从而一般倾向使用李亚普诺夫-中心极限定理。

林德伯格给出了中心极限定理的充分条件,而泊松已经表明中心极限定理有时并不成立。美国数学家威廉·费勒(William Feller, 1906-1970)在转入概率论的研究不久就对中心极限定理的充要条件进行了回答。他的结果现已被称为林德伯格-费勒-中心极限定理。因为他使用林德伯格条件。结论如下:

在同一年,法国数学家保罗·皮埃尔·莱维(Paul Pierre Lévy, 1886-1971)也对中心极限定理的充要条件独立地进行了研究并得出了类似的结果。莱维对于他的工作未被给予足够的肯定表示失望“I shall never have had any luck with the Gaussian distribution”。费勒的工作受到了莱维在1925年的专著的影响,使用特征函数作为分析工具。而莱维反而放弃了他所擅长的特征函数手段而转而采用他所新提出的“集中”和“分散”作为分析手段。尽管莱维的工作发表时间晚于费勒,但他的投稿时间要早于费勒。

费勒和莱维的结果需要假定“若两个独立的随机变量的和服从正态分布则它们分别服从正态分布”。在1936年,瑞典数学家哈拉尔德·克拉梅尔(Harald Cramér, 1893-1985)对这一假定进行了证明。而在1937年,费勒和莱维利用克拉梅尔的结果更新了他们的证明。

4

总结

我们看到尽管法国数学家尤其是拉普拉斯对正态分布做出了巨大贡献,但这一分布却被冠上了德国大数学家卡尔·弗里德里希·高斯(Carolus Fridericus Gauss, 1777-1855)的大名。而高斯对中心极限定理并没有做过相关的论证。一方面高斯关于最小二乘的工作使得正态分布更加为人所知,另一方面则可能是法国数学界对中心极限定理的不够重视。比如法国数学界埃米尔·博雷尔(Émile Borel, 1871-1956)认为关于中心极限定理所得结果的重要性和为此付出的努力并不相匹配,同时还认为在实际中所需的条件难以验证。

而更多数学家的工作由于通讯的不便使得优先权产生了一定争议。不论如何通过众多伟大数学家的不懈努力,对于独立随机变量序列而言,中心极限定理的大厦终于基本建立了起来!

参考文献

[1] Hans Fischer. A History of the Central Limit Theorem From Classical to Modern Probability Theory, Springer New York, NY, 2011.

[2] A History of the Central Limit Theorem, Fanni Plenar, 2019.

本文转载自微信公众号“郭老师统计小课堂”。

特 别 提 示

1. 进入『返朴』微信公众号底部菜单“精品专栏“,可查阅不同主题系列科普文章。

2. 『返朴』提供按月检索文章功能。关注公众号,回复四位数组成的年份+月份,如“1903”,可获取2019年3月的文章索引,以此类推。

主题测试文章,只做测试使用。发布者:sengcheng,转转请注明出处:https://www.sengcheng.com/14428.html

(0)
sengcheng的头像sengcheng
上一篇 2024年12月3日 下午4:01
下一篇 2024年12月3日 下午4:02

相关推荐

  • 脱口秀“接棒”双11晚会,仪式化的流量争夺战

    从晚会到脱口秀大军,电商平台的内容营销方式正发生转变。这种转变不仅出于成本和流量的考量,更是为了呈现全新双11形象而做出的自我解构。 原创@新熵作者丨茯神  编辑丨蕨影 曾经一年一度的天猫双11晚会,经历了暂停、重启之后,今年再次没了消息。取而代之的是,一个个或耳熟能详、或鲜有人知的脱口秀演员,拉开了此次“史上最长双11”的序幕。 10月14日的晚上8点整,…

    行业 2024年10月31日
    7100
  • G20宣言背后的中美较量

      作者:陆岑   二十国集团(G20)领导人峰会本周在巴西里约热内卢举行。峰会第一天便公布了各国代表团周末达成的联合宣言。虽然宣言所提到“共识”大多只具象征意义,但其议题设定和不同关切表达,都能反应大国地缘政治博弈势头的变化。   宣言提到了俄乌冲突、加沙冲突造成的“苦难”和“经济冲击”,同时呼吁各国在气候变化、减贫和税收政策方面开展合作。由于特朗普再次当…

    行业 2024年11月20日
    4700
  • 5人违规探险被困承担2万救援费 违规探险代价高昂

    昨日,“驴友违规探险承担2万元救援费”成为热门话题。江西5名“驴友”不顾劝阻,徒步进入百丈山未开发山区探险,救援人员经过18个小时的搜救将他们救出,并依法要求他们承担2万元的救援费用。 10月25日,10名南昌“驴友”来到奉新县百丈山进行徒步登山探险运动,当晚在百丈山下的民宿住宿。次日下午,其中5人不听民宿负责人劝阻,徒步进入未经开发的天狗岭探险,并约定当天…

    行业 2024年11月13日
    2300
  • 中方谴责侵犯伊朗主权行为 反对威胁地区和平安全

    联合国根据伊朗和阿尔及利亚、中国、俄罗斯的要求,于10月28日下午就中东局势召开紧急公开会。会上,中国常驻联合国代表傅聪发言表示,10月26日以色列对伊朗多地发动多轮空袭,导致伊朗设施损毁和人员伤亡。中方谴责侵犯伊朗主权和领土完整的行为,反对威胁地区和平与安全的破坏行为。伊以关系和整个中东地区的局势目前处于危险边缘。中方对以色列行动造成的局势升级表示严重关切…

    行业 2024年10月29日
    5100
  • 以安全内阁批准对伊朗袭击 以总理和防长指挥行动

    总台记者当地时间26日获悉,以色列安全内阁25日晚间通过电话会议批准了对伊朗的袭击。以色列总理内塔尼亚胡和国防部长加兰特在一处地下设施指挥此次袭击。 以色列国防军发言人阿维凯·阿德拉伊26日凌晨发表声明称,以军正在对伊朗军事目标实施精确打击,以回应伊朗近期对以色列的袭击。 据悉,当地时间26日凌晨,伊朗首都德黑兰附近连续传出多次爆炸声。(总台记者 黄元鹏)

    行业 2024年10月26日
    4100

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信