大数定律
一. 中心极限定理
下图形象的说明了中心极限定理
当样本量N逐渐趋于无穷大时,N个抽样样本的均值的频数逐渐趋于正态分布,其对原总体的分布不做任何要求,意味着无论总体是什么分布,其抽样样本的均值的频数的分布都随着抽样数的增多而趋于正态分布。
如上图,这个正态分布的u会越来越逼近总体均值,并且其方差满足a^2/n,a为总体的标准差,注意抽样样本要多次抽取,一个容量为N的抽样样本是无法构成分布的。
该定理说明,当n很大时,随机变量 近似地服从标准正态分布N(0,1)。
应用举例
二. 大数定律
大数定律(law of large numbers),是一种描述当试验次数很大时所呈现的概率性质的定律。
概率论中讨论随机变量序列的算术平均值向随机变量各数学期望的算术平均值收敛的定律。
应用举例
(1)在重复投掷一枚硬币的随机试验中,观测投掷了n次硬币中出现正面的次数。
不同的n次试验,出现正面的频率(出现正面次数与n之比)可能不同,但当试验的次数n越来越大时,出现正面的频率将大体上逐渐接近于1/2。
(2)称量某一物体的重量,假如衡器不存在系统偏差。
由于衡器的精度等各种因素的影响,对同一物体重复称量多次,可能得到多个不同的重量数值,但它们的算术平均值一般来说将随称量次数的增加而逐渐接近于物体的真实重量。
三. 中心极限定理和大数定律的区别
(1)大数定律是说,n只要越来越大,把这n个独立同分布的数加起来去除以n得到的这个样本均值(也是一个随机变量)会依概率收敛到真值u,但是样本均值的分布是怎样的我们不知道。
(2)中心极限定理是说,n只要越来越大,这n个数的样本均值会趋近于正态分布,并且这个正态分布以u为均值,sigma^2/n为方差。
(3)综上所述,这两个定律都是在说样本均值性质。随着n增大,大数定律说样本均值几乎必然等于均值。中心极限定律说,它越来越趋近于正态分布,并且这个正态分布的方差越来越小。
直观上来讲,想到大数定律的时候,脑海里浮现的应该是一个样本;
想到中心极限定理的时候脑海里应该浮现出很多个样本。
参考文章
https://blog.csdn.net/u014755493/article/details/72118559
https://baike.baidu.com/item/%E5%A4%A7%E6%95%B0%E5%AE%9A%E5%BE%8B/410082?fromtitle=%E5%A4%A7%E6%95%B0%E5%AE%9A%E7%90%86&fromid=9679413&fr=aladdin
相关阅读
进入移动互联网时代之后,金融业务地域限制被打破。金融企业没有固定业务区域,金融服务面对所有用户是平的。金融消费者逐渐年轻化,80
对于当下共享单车在互联网界的火热状况,笔者想从大数据文本挖掘的角度来做一番分析,主要是从海量的文本数据中找到有价值的讯息和观
案例背景网易旗下有众多公共部门与创新产品。近年来大数据团队尝试从公共技术部门转型,对外输网易大数据的处理能力,帮助传统企业解
作为消费升级风向标的90后,他们的行为习惯和心理诉求背后是怎样一个瞬息万变的市场?在节假日一浪高过一浪的买买买浪潮中,你总能看
当下一代无线网络5G来临,我们的生活将会迎来什么样的改变?华为余承东说,5G将强化AI赋能的速度。随着运营商、通信服务提供商、设备制