高斯函数(英文:Gauss 函数)是一类特殊函数。一般地,形式如f(x)=Ae-ax^2的函数,称为高斯函数,其中a为实参数且A大于0。

在19世纪以前,在天文学领域有一个经典的问题,即数据结合问题。1809年,德国数学家、物理学家和天文学家约翰·卡尔·弗里德里希·高斯(英语:Carl Friedrich Gauss,1777~1855)发表了数理天文学著作《绕日天体运动理论》(Theory of the Motion of the Heavenly Bodies Moving about the Sun in Conic Sections),书中的谈到了对该问题的看法,并介绍了高斯推导出误差正态分布的过程,给出了最早的高斯函数的简单形式,即正态分布N(0,σ)的概率密度函数。后来,在得到拉普拉斯中心极限定理的支持后,经由朗伯·阿道夫·雅克·凯特勒和高尔登等人的努力,高斯函数成为数理统计学之中重要的统计模型之一。

除了正态分布的密度函数之外,高斯脉冲信号也是一种高斯函数。高斯函数具有几个基本性质:如它是光滑函数,且其各阶导函数都是连续的;高斯函数的傅里叶变换仍然是高斯函数。基于高斯函数的特殊性质,可构建统计模型与小波分析模型,应用于生物学、图像处理、气象学和工程学等各种领域。

简史

在19世纪以前,在天文学领域有一个经典的著名问题,即数据结合问题:“当对同一目标的若干次观测结果不同时,如何处理这些数据?或如何利用观测数据对观测目标的真值进行估计?”最早提出“数据结合问题"的时间可以追溯到公元前的巴比伦和古希腊时期,虽然很久以前就以取算术平均数的方法来处理这一问题,但并无理论根据。

1809年,约翰·卡尔·弗里德里希·高斯发表了数理天文学著作《绕日天体运动理论》,书中谈到了有关数据结合问题的内容。高斯介绍了预测行星轨道的方法,同时证明了“观测误差服从正态分布”,得出观测参数的估计为算术平均值,并给出了简单正态分布的概率密度函数,即正态分布的概率密度函数。

1812年,法国数学家皮埃尔-西蒙·拉普拉斯在著作《概率的分析理论》中,把早期中心极限定理的理论进行了扩展,并首次引入特征函数对中心极限定理进行证明,指出二项分布可用正态分布逼近。在得到拉普拉斯中心极限定理的支持后,经由朗伯·阿道夫·雅克·凯特勒和高尔登等人的努力,高斯函数成为数理统计学之中重要的统计模型之一。

定义

高斯函数适用于描述数学、自然科学和工程学中的许多过程,在信号和图像处理领域有重要作用。例如,在信号传输或处理过程中由于各种随机因素所引起的噪声,即高斯噪声,其分布概率密度函数是高斯函数型;在图像处理中,点光源通过衍射受限透镜成像,由于衍射在焦点处形成的光斑,其中以第一暗环为界限的中央亮斑,即艾里斑可近似地用二维高斯函数来表示。

一维高斯函数

定义:一维高斯函数为式中

二维高斯函数

类似地,可得二维高斯函数的定义:

该函数图形如下图所示,函数曲线下的体积等于若则二维高斯函数可表示成:

若用极坐标表示,令则有

常见形式

正态分布的概率密度

正态分布

正态分布(normal distribution)亦称常态分布、误差分布、高斯分布。在概率论和统计学中,正态分布的概率分布密度函数是高斯函数。

定义:若随机变量取不超过实数的值的事件概率为

式中为实参数,且,则的分布称为(一维)正态分布,简记为

正态分布的密度函数:

高斯推导过程

设被测量的真值为误差密度为则观测得到的概率与成比例,可得个独立测量值为的概率与成比例。

上式中被称为独立测量值的似然函数。

最大似然估计法可得:

上式的最大值问题可等价于的最大值问题。

故对求导,并令得:

根据观测值的算术平均值是真值最合理的估计,即是已经应取的估计,从而式应是由式解得的值。

引入辅助函数则

故求解只求解由为偶函数,可知为奇函数,即

令且则有

则可将化简得

显然左式对一切自然数实数均成立。

引理:已知连续函数是定义在上的奇函数,对任意自然数及实数

均有则(其中为常数)。

可得出即

又从而

可知常数且函数随增大而减小,故常数须小于

则可令即

那么确定常数即可得出概率密度函数的解析式。

已知密度函数在整个实数域上的积分值为即

令可得

又因为即可得

密度函数的解析式是由数学家约翰·高斯在研究天文观察误差过程中推导出来的,称为正态分布的的概率分布密度函数。

类似地,正态分布的密度函数,即高斯函数为

其中,实参数分别是正态分布的数学期望和方差

高斯脉冲信号

对于高斯脉冲信号它在时域中的持续时间是无限的并且其频谱密度函数

是高斯函数,其在频域中的频谱分布也是无限的。这时其有效脉冲宽度和有效频带宽度可以根据能量求得。

例如,有效脉冲宽度可定义为在时域中绝大部分能量集中的那一段时间,即

式中,表示在时间宽度内的能量占总能量的百分数,通常取

同理,有效频带宽度可定义为在频域中绝大部分能量集中的那一段频带,即

性质

导函数

导函数的定义:设函数在点的某邻域内有定义,当自变量在点有一增量时,函数相应地有增量若当时,增量比的极限,即

存在,就称该极限值为函数在点处的导数,记为

即也称函数在点可导或导数存在。

高斯函数的各阶导函数

令则上式可化简为

一阶导数:

二阶导数

三阶导数:

导数

高斯函数是光滑函数,且其各阶导数都是连续的。

积分

反常积分的定义:设函数在区间上连续,任取一有限数

积分存在,称极限为函数在区间上的广义积分,

记作即

高斯积分是无穷区间上的反常积分

高斯积分的定义:一般地,形如包含高斯函数的定积分称为高斯积分。作的变量变换,则可将高斯积分写成另一种形式:

高斯函数的积分

令可得高斯积分

因为高斯函数从到的积分为即则可得到的高斯积分为

类似地,可以得到高斯函数从 到的高斯积分

傅里叶变换

定义:通过积分运算把属于某函数类的函数通过含参变量的积分变为另一函数类中的函数是一个确定的二元函数,通常称为该积分变换的核,称为像原函数,称为的像函数。特别地,当核函数时,即

称为函数的傅里叶(Fourier)变换。

高斯函数的傅里叶变换

高斯函数的傅氏变换式为:

令则上式积分变为一复变函数的积分,即

根据复变函数的积分性质和柯西积分定理,可得高斯函数的傅里叶变换为:

高斯函数的傅里叶变换仍然是高斯函数。

相关概念

高斯误差函数

高斯误差函数以符号表示,其中表示自变量,表达式称为高斯误差函数。

特别地,由高斯积分可得出

高斯误差补函数以表示,其定义为

性质

则有

推论:

对于函数若则有

应用

生物学

水稻的叶曲线是空间中一条近似光滑的曲线,基于不同年份与施氮水平的水稻桶栽试验,定期利用三维激光扫描仪来获取水稻主茎不同叶位叶曲线空间坐标数据,并利用动态建模技术以高斯函数为基础构造构建水稻主茎不同叶位叶曲线动态模拟模型,模拟研究水稻叶曲线空间变化特征,能较好地预测不同施氮水平水稻主茎不同叶位叶曲线在生长进程中的变化动态,从而为进一步提高水稻叶片及植株的可视化效果提供了技术支持。

图像处理

红外光图像在采集过程中受到距离和采集设备等因素的影响,导致红外光图像受到的干扰较大,信息特征的反应能力不足。针对传统算法抗干扰能力弱和图像增强后信噪比低的难题,使用基于高斯函数的红外光图像增强算法,能对红外光图像进行增强处理,把降噪输出红外光图像分解为小波尺度,提取图像的高阶谱特征,突出图像中的重要部分,减弱或去除不需要的信息,从而提高图像的识别和特征提取能力。

地理学

基于GPS信号的计算机层析成像技术较早应用于三维和四维电离层成像领域,并取得了较好的效果。相对于电离层层析成像,对流层层析需要一个更完善的算法。在对流层层析中,由于GPS卫星和测站数量有限,站星的几何结构不好等因素,层析观测方程往往是不适定的,需要增加一些约束条件来获取唯一解。

水汽在垂直方向变化很快,合理的垂直约束在获取准确的水汽场上起着重要作用。利用高斯函数建立垂直约束进行层析实验,相对于指数约束所得结果,层析湿折射率标准差在整个对流层和低对流层中都有所减小。因此,高斯函数建立特定时期特定地点的垂直约束条件能够很好地反映水汽的垂直分布情况,并且有利于得到更加准确可靠的层析解,相对于指数函数具有明显的优越性。

工程学

概率潮流计算是定量分析电力系统随机性的重要方法,合理地描述风速随机性是概率潮流计算的基础。基于高斯函数-最大原理的改进半不变量概率潮流计算方法,可适用于风电并网系统中对概率潮流的计算,并分析风电出力的随机性对系统造成的影响,具有通用性强,计算精度高、速度快等优点。

最大熵原理:指在一定的约束条件下,熵达到最大值时,计算得到的随机变量概率分布最接近真实分布。

基于高斯函数改进最大熵展开的半不变量概率计算方法的研究创新:采用高斯函数结合改进反射核密度估计建立计及有界性的风速模型;引入高斯函数改进经典最大熵模型的通解形式和求解方法;无需对变量分布进行先验假设。

参考资料

Python中二维高斯函数的绘制.CSDN博客.2024-01-26