大数定律(统计学定律) - 简单百科92e.net

大数定律（英文：Law of large numbers）又称大数法则，是一种统计学中的极限定律，指的是在大量重复试验中一个随机事件出现的频率在某个固定数的附近摆动，即所谓的“频率稳定性”。数学语言表示为：若是随机变量序列，令。如果存在这样的一个常数序列，对任意的，恒有即，则称序列服从大数定律。

大数定律从长期实践中发展而来，人们很早就意识到“频率稳定性”的现象但一直没有理论上的说明。意大利数学家吉罗拉莫·卡丹诺（英文：Gerolamo Cardano）在他的《机遇博弈》（英文：The Book of Games of Chance）中最早写下了这个现象，瑞士数学家雅各布·伯努利（德语：Jakob Bernoulli）在他的著作《推测术》（德语：Ars Conjectandi）中首次证明了次伯努利试验下的大数定律。法国数学家西莫恩·泊松(法语：Simeon-Denis Poisson）首次提出了“大数定律”这一名称，并证明了泊松大数定律。而后有众多数学家都对大数定律的建设做出了贡献。包括俄罗斯数学家切比雪夫（英文：Pafnuty Lvovich Chebyshev），法国数学家埃米尔·博雷尔（法语：Émile Borel），苏联数学家亚历山大·辛钦（英文：Aleksandr Yakovlevich Khinchin），俄国数学家安德烈·马尔科夫（英文：Andrey Markov），俄国数学家安德雷·科尔莫戈罗夫（英文：Andrey Kolmogorov）等。

大数定律根据随机变量的收敛性分为弱大数定律和强大数定律。前者是依概率收敛意义下的大数定律，后者是以概率1收敛意义下的大数定律。弱大数定律包括伯努利大数定律、泊松大数定律、切比雪夫大数定律、马尔科夫大数定律、辛钦大数定律等，强大数定律包括博雷尔大数定律、科尔莫戈罗夫大数定律等。如不加说明，大数定律通常指的是弱大数定律。

大数定律应用广泛。生活中常用“频率稳定性”的思想用概率估计频率。数学上的蒙特卡罗方法成为了求积分的经典方法。经济学上保险业，银行管理、贷款等服务均有大数定律的应用。统计物理中在多粒子组成的宏观体系内的计算也有大数定律作理论基础。

定义

弱大数定律

弱大数定律是依概率收敛意义下的大数定律。一般提到大数定律的时候默认提到的是弱大数定律。先介绍依概率收敛：

如果对任意的成立，则称依概率收敛于，并记为。

弱大数定律（英文：Weak law of large numbers）：若是随机变量序列，令

如果存在这样的一个常数序列，对任意的，恒有，则称序列服从弱大数定律。

强大数定律

强大数定律是以概率1收敛意义下的大数定律。先介绍以概率1收敛：

若是随机变量，若，则称以概率1收敛于，又称几乎处处收敛于，记为。

强大数定律（英文：Strong law of large numbers）：设是独立随机变量序列，若，则称它满足强大数定律。

历史

人们在长期实践中发现，虽然个别随机事件在某次试验中既可以出现也可以不出现，但是在大量重复试验中却呈现出明显的规律性，即一个随机事件出现的频率在某个固定数的附近摆动，这就是所谓“频率稳定性”。对于这点，很久以来都没有理论上的说明。大约1564年，意大利数学家吉罗拉莫·卡丹诺（英文：Gerolamo Cardano）在他的《机遇博弈》（英文：The Book of Games of Chance）中不加证明地指出经验统计的准确性往往会随着试验次数的增加而提高。瑞士数学家雅各布·伯努利（德语：Jakob Bernoulli）在他的著作《推测术》（德语：Ars Conjectandi）中首次证明了次伯努利试验下的大数定律——当时还未曾有大数定律的说法，伯努利试图证明的是在次伯努利试验中用频率估计概率可以达到事实上的准确性。伯努利的侄子尼古拉一世·伯努利（德语：Nikolaus I. Bernoulli）和法国数学家亚伯拉罕·棣莫弗（法语：Abraham de Moivre）对证明进行了优化。

1837年，法国数学家西莫恩·泊松(法语：Simeon-Denis Poisson）在他的《刑事和民事判决可能性研究》（法语：Recherches sur la probabilité des jugements en matière criminelle et en matière civile）中首次提出了大数定律的名称，并推广了伯努利大数定律，即泊松大数定律。而后有众多数学家都对大数定律的建设做出了贡献。包括俄罗斯数学家切比雪夫（英文：Pafnuty Lvovich Chebyshev），法国数学家埃米尔·博雷尔（法语：Émile Borel），苏联数学家亚历山大·辛钦（英文：Aleksandr Yakovlevich Khinchin），俄国数学家安德烈·马尔科夫（英文：Andrey Markov），俄国数学家安德雷·科尔莫戈罗夫（英文：Andrey Kolmogorov）等。博雷尔于1909年证明博雷尔强大数定律。1928年辛钦提出了强大数定律的名称并证明了辛钦大数定律。

举例

例1

一个公平的掷硬币是一个伯努利试验。当一个公平的硬币被投掷一次时，结果是正面的理论概率等于。因此，根据大数定律，在大量的硬币翻转中，正面的比例应该大致为。当n接近无穷大时，在n次翻转后正面的比例几乎肯定会收敛到。这就是频率稳定到概率的含义。

例2

要估计某种产品的不合格率则可以才能从该种产品中随机抽取件。当很大时，这件产品中的不合格品的比例可作为不合格率的估计值。这便是大数定律在其中的作用。

例3

本福特定律（英文：Benford's law）：它描述的是在一堆从实际生活得出的纯随机数据中，为首数字出现的频率稳定等于某个概率。比如十进制下，以1为首位数字的数的出现频率约为30%，以9为首位数字的数的出现频率约为4%。这个定律可以用来揭露数据造假，比如华盛顿邮报曾引用该定律声称2009年伊朗总统大选中有造假情况，因为数字5和7出现的频率太少。这个定律也用到了频率稳定到概率的含义。

局限性

下面分四个方面举例说明大数定律不成立的情况。

仅满足独立性

设是相互独立的随机变量序列，且满足，则不满足大数定律。

独立同分布

1.设独立同分布，若其分布函数为，则不满足大数定律。这个分布也叫作标准柯西分布（英文：Standard Cauchy distribution）。柯西分布都不服从大数定律。因为尾端数据过大，柯西分布本身没有均值和方差。

2.若有有限的方差：，且令，那么不服从大数定律。

不独立但同分布

设子A有四个红面和两个白面，而骰子B有两个红面和四个白面。掷一个硬币，若出现正面，接着就连续掷骰子A；若出现反面，就掷骰子B。令，则不服从大数定律。

其他

设是随机变量序列，令，且，（均为大于0的常数），那么不服从大数定律。

大数定律成立的充要条件

这里再给出一个大数定律成立的充要条件：

设是任何随机变量序列，，并且记，则随机变量序列满足大数定律的一个充要条件是

应用

基础数学

蒙特卡罗方法

蒙特卡洛方法（英文：Monte Carlo method）是一种随机模拟的计算方案，以积分计算为代表。

比如计算定积分可以任取一列相互独立的、都具有中均匀分布的随机变量，则也是一列相互独立相同分布的随机变量，而且。既然，因此只要能求得，便能得到的数值。应用大数定律，因为，从而只需要能生成随机变量序列就能对积分进行数值计算。而这正是计算机的应用。

矩估计的相合性

假设总体的均值未知，通常的做法是对进行次独立重复观察，得到样本，并以它们的平均值作为的估计量，这样做法的依据之一是依辛钦大数定律应有。这个性质在数理统计学中称为相合性。对阶矩也成立。

经济学

大数定律在经济学中有着很高的重要性。大数定律是保险财政稳定性重要的理论基础。关于保险金的赔偿具实是符合大数定律的，因为现实中每个人的保费足不同的，但是因为投保的基数很大，所以根据大数定律，每个投保户的平均赔偿金额将会稳定在某一数值附近。大数定律在保险学上的应用包括保费的厘定，以及保险金的赔偿等等。大数定律也可以计算保险单位数，求出被保险单位的数量增加到多少才能符合保险公司财政稳定性的要求。大数定律也对小微企业贷款问题有所帮助。大数定律可以让银行等金融服务提供者研究小微企业及其所处行特点并进行系统性的规划，减少系统风险性。

统计物理

统计物理常见的模型是由多粒子组成的宏观体系，在原则上，非统计的预测是不可能的。因为在经典描述中，对于一个体系的唯一预测将要求直到同一时刻每个粒子的位置和速度，这种信息是不可能得到的。因此概率统计在其中扮演着重要角色，这其中，大数定律对均值和概率的计算起着理论上的支持。比如计算自旋体系平均值和理想气体中分子的分布。

生产生活

生活中用到最多的是用概率估计频率。因为大数定律将频率稳定到概率，所以当生活中的样本数足够大时可以通过计算该问题在数学上的概率去估计它发生的概率。比如扔1000次硬币估计正面向上的次数，并不一定非要扔1000次，而是可以直接得出500的结论。

参考资料

Earliest Known Uses of Some of the Words of Mathematics (L).Mactutor.2023-09-05

The Devil Is in the Digits: Evidence That Iran's Election Was Rigged.Washingtonpost.2023-09-04

大数定律

定义

弱大数定律

强大数定律

历史

举例

分类

弱大数定律

伯努利大数定律

泊松大数定律

切比雪夫大数定律

马尔科夫大数定律

辛钦大数定律

强大数定律

博雷尔强大数定律

科尔莫戈罗夫强大数定律

随机变量独立情况

随机变量独立同分布情况

局限性

仅满足独立性

独立同分布

不独立但同分布

其他

大数定律成立的充要条件

相关概念

四种收敛的关系

依分布收敛

依概率收敛

r阶收敛

以概率1收敛

关系

依概率收敛推出依分布收敛

依概率收敛和依分布收敛等价情况

r阶收敛推出依概率收敛

以概率1收敛推出依概率收敛

大数定律和中心极限定理的关系

应用

基础数学

蒙特卡罗方法

矩估计的相合性

经济学

统计物理

生产生活

参考资料