normaldistribution
正态分布的基本描述:
在概率论里面,正态分布(或者叫高斯分布)是非常常见的连续概率分布。由于存在中心极限定理,这使得正态分布十分有用。中心极限定理表明,在观测数据非常大的时候,具有独立分布的独立随机变量的观测样本的平均值是收敛于正态分布的。正态分布的概率密度函数为:
这里μ是分布的均值,或者叫期望值;σ是标准差;σ的平方是方差。
另外,一个具有高斯分布的随机变量也被称为是具有正态分布的,这个变量被称为正态偏差。
标准正态分布:
当μ=0和σ=1的时候,正态分布就是标准正态分布了。标准正态分布的概率密度函数如下:
标准正态分布是关于x=0对称的,并且在x=0的时候获得最大值,而且标准正态分布的有两个拐点,分别是x=+1和x=-1。
通用正态分布:
每一个正态分布都可以看成是由标准正态分布转化而成的,通过将标准正态分布的定义域先使用标准差σ进行拉伸,然后再平移μ个单位得到。公式如下。
假定Z是一个标准的正态偏差,X=σZ+μ也是具有正态分布的正态偏差,X的期望值为μ,标准差为σ。相反的,如果X是一个期望值为μ、标准差为σ的正态偏差的话,那么通过转换Z=( X - μ ) / σ会得到一个标准正态分布,得到的变量Z也可以叫做X的标准形式。
另外,每一个正态分布都可以写成以二次函数为自然常数的指数的形式。
这里且。在这种形式下,正态分布的均值为,方差为。当正态分布为标准正态分布的时候,,和。
正态分布的表示符号:
正态分布经常可以用和表示。因此,当一个随机变量X是一个均值为μ和标准差为σ的正态偏差时,我们可以用这个形式表达:。
正态分布的属性:
①正态分布是关于x = μ对称的。
②正态分布曲线有两个拐点,分别在离均值一个标准差的位置,为x=μ-σ和x=μ+σ。
③对于任意的正态偏差X,Z = ( X - μ ) / σ是一个标准正态偏差。
④对于特定的期望值和方差,正态分布是具有最大熵的连续分布。
⑤由于对于离期望值好几个标准差范围之外的取值,它们的概率趋近于0。
⑥正态分布概率的覆盖范围遵循68-95-99.7的规定,这个规定又称为3-sigma规定。也就是说在距离均值一个标准差的范围内的取值的概率大概是68%,在两个标准差范围大概是95,在三个标准差范围大概是99.7%。
正态偏差上的操作:
①对正态偏差进行线性变换得到的也是正态偏差,如Y = aX + b,当X具有正态分布时,Y也具有正态分布。当X的期望值为μ,标准差为σ的时候,Y的期望值为aμ+b,标准差为|a|*σ。
②当X1和X2为两个独立的具有正态分布的随机变量时,如果它们的期望值分别是μ1和μ2,标准差为σ1和σ2,那么X1+X2也是具有正态分布的,对应的期望值为μ1+μ2,方差为σ1的平方加σ2的平方。
③独立正态偏差的线性组合也是一个正态偏差。
④无限可分性:对于任意正整数n,任意均值为μ和标准差为σ的正态分布都是n个独立正态偏差的和,每一个正态偏差均值为μ/n和方差为σ的平方除以n。
⑤Cramer分解定理:如果X1和X2都是独立随机变量且他们的和满足满足正态分布的话,那么,X1和X2一定是正态偏差。换句话说就是,当且仅当两个分布是正态分布时它们的卷积才是正态分布。
⑥Bernstein‘s定理:如果X和Y是独立的并且X+Y和X-Y也是独立的,那么X和Y都必须是满足正态分布的。
正太分布的属性图:
参考资料:
正态分布-维基百科 https://en.wikipedia.org/wiki/Normal_distribution
相关阅读
归一化(Normalization)与标准化(Standardization)
在机器学习和数据挖掘中,经常会听到两个名词:归一化(Normalization)与标准化(Standardization)。它们具体是什么?带来什么益处?具体怎么用
1.右侧的按钮可以导入高模以及低模,这款软件可以将高模中的信息烘焙到低模的各种贴图中,右键可以加载和移除模型 2.在低模的选项
卡方分布(Chi-squared Distribution)
卡方分布的基本描述: 具有k个自由度的卡方分布是一个由k个独立标准正态随机变量的和所构成的分布。卡方分布经常用于我们常见的
【概率论】5-7:Gama分布(The Gamma Distributions Par
title: 【概率论】5-7:Gama分布(The Gamma Distributions Part I)categories:- Mathematic- Probabilitykeywords:- The Gamma D
机器学习领域有个很重要的假设:IID独立同分布假设,就是假设训练数据和测试数据是满足相同分布的,这是通过训练数据获得的模型能够在