均匀分布
均匀分布(英文:Uniform 广义函数),亦称一致分布,又称等概率分布。均匀分布的随机变量在确定的区间中,所取得每个值具有等可能性,它是一种常见的连续型随机变量的分布。
均匀分布的历史与等可能性思想的形成密不可分。概率论概念的形成最早可见于16世纪,概率是一个事件发生,一种情况出现的可能性大小的数量指标,介于与之间。1657年,数学家克里斯蒂安·惠更斯(英文:Huygens)出版的概率论著作《机遇的规律》中,从关于公平赌博的值的一条公理出发,推出了关于“期望”的3条定理,并可在书中前几个命题见到等可能性的思想。后来,1713年著名数学家雅各布·伯努利(英文:Jacob Bernoulli)所著《推测术》一书出版,书中把古典概率中“等可能性”的思想推广到主观概率的场合,当没有任何理由可以认为众多可能性中的某一个或某一些比其他可能性更具优势时,应给予这些可能性以同等的主观概率。如某个未知量取值区间在之内,取区间内任一值有同等的可能性,即取内的均匀分布为的主观概率分布,被称为“同等无知原则”,在数理统计学史上有着重要的意义。
均匀分布有几个基本性质,包括数学期望,方差等数字特征。它与其他常见的连续型分布有着重要的联系,如正态分布、韦布尔分布、指数分布、贝塔分布等。若增加随机变量的个数,均匀分布还可推广至多维。同时,它作为一种重要的统计工具不仅能处理一些现实生活的问题,如候车问题等,还可以广泛地应用于遗传学、计算机等其他科学领域,如在现代计算机技术中,均匀分布是蒙特卡洛方法的理论依据,并且在数值计算中,定点计算的舍入误差可作为均匀分布的随机变量。
历史
1657年,数学家克里斯蒂安·惠更斯出版了概率论著作《机遇的规律》,书中从关于公平赌博的值的一条公理出发,推出关于“期望”(这是惠更斯首先引进的术语)的3条定理。惠更斯基于这些定理并利用递推法等工具解决了当时一些机遇博弈的问题。《机遇的规律》中的3条定理加上11个问题,被称为惠更斯的14个命题,其中的前两个命题描述如下:
从上述命题中,已可见到等可能性的思想。
后来,1713年数学家雅各布·伯努利所著《推测术》出版,书中伯努利把古典概率中“等可能性”的思想推广到主观概率的场合,当没有任何理由可以认为众多可能性中的某一个或某一些比其他可能性更具优势时,应给予这些可能性以同等的主观概率。如某个未知量取值区间在之内,取区间内任一值有同等的可能性,即取内的均匀分布为的主观概率分布原则,被称为“同等无知原则”,在数理统计学史上有着重要的意义。
定义
均匀分布是一种常见的连续型随机变量分布,即随机变量在确定的区间中,所取得每个值具有等可能性的分布。
若是两个有限数,且随机变量的密度函数为: 则称服从上的均匀分布,记为
特别地,当时,称为标准均匀分布。
均匀分布的分布函数为:
均匀分布反映的一切可能值充满整个有限区间,并且在该区间内的任一点有相同的分布密度,即分布密度在区间上为常量。在数值计算中,拟在小数点后第位上进行四舍五入,若用表示舍入误差,则服从区间上的均匀分布。
举例
设随机变量服从上的均匀分布,现对进行次独立观测,试求至少有次观测值大于的概率。
解:设随机变量是次独立观测中观测值大于的次数,则其中
由知的密度函数为
所以
于是可得
答:至少有次观测值大于的概率为
性质
性质1
数学期望定义:设连续随机变量的密度函数为,若,则称为的数学期望,或称为该分布的数学期望,简称期望或均值。若不收敛,则称的数学期望不存在。
均匀分布的数学期望:
性质2
方差定义:若随机变量的数学期望存在,称偏差平方的数学期望为随机变量(或相应分布)的方差,记为
性质2 均匀分布的方差:
性质3
随机变量的分布函数连续,且严格单调增加,则
性质4
即若则反之,若则
相关概念
正态分布
正态分布(normal 广义函数)亦称常态分布、误差分布、高斯分布。
式中为实参数,且,则的分布称为(一维)正态分布,简记为
密度函数:
实参数分别是正态分布的数学期望和方差,所以正态分布是由其数学期望和方差唯一确定的。
当时,正态分布,即,称为标准正态分布。
与均匀分布的关系:
其中独立同服从均匀分布
韦布尔分布
定义:若随机变量的分布密度为,则称服从韦布尔分布(Weibull 广义函数)。
其中称为形状参数,称为位置参数,称为尺度参数,其分布函数为:
与均匀分布的关系:随机变量服从韦布尔分布的充分必要条件为:,其中服从均匀分布
指数分布
指数分布(exponentialdistribution)是韦布尔分布的特殊情况,即分布密度中的韦布尔分布。
定义:若随机变量的密度函数为,其中参数为正的常数,则称服从指数分布,相应的分布函数为:
与均匀分布的关系:随机变量服从指数分布的充分必要条件为:,其中服从均匀分布
贝塔分布
定义:若随机变量的分布密度为
其中,是伽马函数,为分布参数。由于的形式与贝塔函数的积分表示有密切联系,故称服从贝塔分布。它的数学期望为,方差为
与均匀分布的关系:随机变量服从贝塔分布的充分必要条件为:,其中
独立同服从均匀分布
相关定理
均匀分布的相关定理
伯努利分布的定义:设随机变量只可能取和两个值,且分布律为和,则称随机变量服从伯努利分布(或两点分布,分布)。
均匀分布的相关定理:任一概率空间上的随机变量服从上的均匀分布的充要条件为:
存在上的随机变量序列独立同伯努利分布,且可以表示成无穷级数的形式。
相关定理的应用
均匀分布可应用于产生上服从均匀分布的随机数。
例如,要产生一个服从均匀分布上的随机数,可以先产生个服从雅各布·伯努利分布的随机数,各,随后代入公式,即,计算即可得。
对任一概率空间上的随机变量总存在上的独立随机变量序列使得同分布。
(证明过程略,见参考资料)
相关推广
联合密度函数的定义:给定二维连续型随机变量,如果存在一个定义域为整个平面的二元非负实值函数,使得的分布函数可以表达成:
,那么称为连续型随机变量的(概率)密度函数(或分布),或者称为随机变量与的联合(概率)密度函数(或联合分布)。
二维均匀分布
设为平面上的有界区域,其面积为,二维连续型随机变量的概率密度为
,则称服从区域上的均匀分布。
若在区域上服从均匀分布,则对于任一平面区域,有
其中为平面区域与的公共部分的面积。
特别地,对于内任何子区域,有
n维均匀分布
设为中的一个有界区域,其度量(平面的为面积,空间的为体积等)为,如果维随机变量的联合密度函数为:
,则称服从区域上的维均匀分布。
统计推断
参数估计是统计学的重要概念之一,运用从总体抽取的随机样本对总体分布中的未知参数值做出估计,可以将均匀分布等统计模型应用于实践,是一种重要的统计推断方法。
矩估计
矩估计的定义:设总体具有概率分布函数其中是未知参数。若取自总体的一个样本的阶矩存在,则称为的函数。
而阶样本矩为
再令
即可得到包含个未知参数的个方程,此方程组的解就可作为总体参数的估计量,这种估计称为矩估计。
均匀分布的矩估计:设总体服从区间上的均匀分布,是总体的样本,可得未知参数的矩估计量为:
最大似然估计
最大似然估计的定义:设总体的概率函数为其中是一个未知参数或几个未知参数组成的参数向量,是参数空间,是来自该总体的样本,将样本的联合概率函数看成的函数,记为称为似然函数。如果某统计量满足则称为参数的最大似然估计量,这种估计称为最大似然估计。
均匀分布的最大似然估计:设总体服从区间上的均匀分布,是总体的样本,可得未知参数的最大似然估计量为:
区间估计
区间估计的定义:设是总体的分布函数,是变元,是参数。给定了一个概率数值,再由样本确定两个参数值及,使得对于给定值,满足,则随机区间称为参数的置信区间或区间估计。
均匀分布的区间估计:设总体服从区间上的均匀分布,为来自总体的容量为的一个简单随机样本,次序统计量为通过计算可得参数的置信水平为的置信区间为其中,
应用
现实生活
均匀分布因其各种结果发生的可能性相同,因此可以用来模拟现实生活中很多未知分布的问题,如候车问题。
若某班公交车的发车间隔为分钟,不考虑中途路况的影响,则该公交到达车站的间隔为分钟。在等车问题下,要考虑某个乘客甲到达车站后,等候公交车的平均等候时间,就需要用到均匀分布对其等候时间的分布进行建模。
解:由于并不知道公交车究竟是上一辆刚刚离开(需要等候分钟)还是下一辆即将到来(需要等待0分钟),可得下一趟公交车的到来时间服从上的均匀分布,即该乘客需要等候时间的概率为进一步计算可得到等候时间的期望为
遗传学
在遗传学上,人们经常研究数量性状,即在世代遗传中呈连续性变异的性状的规律性。数量遗传学包括统计遗传学和群体遗传学两部分,统计遗传学主要研究数量性状的遗传和变异,研究各遗传参数之间的关系及其估算方法,所应用的方法是概率和统计学的基本方法。
利用计算机可进行群体遗传的计算和遗传过程的模拟,原理是利用计算机所提供的随机函数模拟自然界中的各种随机现象,结合生物规律,产生模拟数据,模拟生命科学中的随机现象。所谓的随机函数的数值介于之间,每次产生的随机数均匀分布,且各不相同。
在群体很小时,等位基因频率会发生随机波动的现象,即产生遗传漂变,会导致某基因座的基因固定(即基因频率为)或丢失(即基因频率为)。遗传漂变来源于两个随机过程的发生,即亲代个体基因型的确定和子代基因型的确定。
计算机科学
均匀分布在现代计算技术中有着重要的应用,比较常见的应用方法有如下几种。
在舍入误差中的应用
由于数字计算机的字长有限,舍入误差的分析在用于计算机解题时是必要的,在计算机的数值计算中,定点计算的舍入误差,可以作为均匀分布的随机变量。
蒙特卡罗方法
蒙特卡罗(Monte Carlo)方法是计算机计算中的一个重要方法,其理论依据是均匀分布的性质之一,是基于随机数序列抽样的一种模拟计算方法,它不仅可以模拟自然界真实存在的随机过程的统计规律,还可以通过构建概率模型来模拟确定性问题。