大数定理
之前介绍了统计概率的第2大护法—中心极限定理,详见这里。
本篇博客是基于猴子在知乎上的回答,进行的整理。非常感谢猴子的讲解。
目录
1 小数定律
2 什么是大数定律
3 小数定律和大数定律的动态演示
要理解大数定律,就必然先要理解小数定律。我会从下面3个方面聊聊:
1)什么是小数定律?
2)什么是大数定律?
3)小数定律和大数定律的动态演示案例
1 小数定律
喜欢总结规律是人类的天性。例如,人们抱着娱乐或者认真的态度总结了世界杯足球赛的各种“定律”,其中比较著名的有“巴西队的礼物”。
“巴西队的礼物”是指:只要巴西夺冠,下一届的冠军就将是主办大赛的东道主,除非是巴西队自己夺冠。
我们来看下历史下真实的数据:1962年巴西夺冠后,4年后英格兰在本土称雄。1970年巴西三夺金杯,1974年轮到东道主西德捧杯。1994年巴西在美国夺冠,下一届东道主法国队在本土夺冠。1958年,巴西队在瑞典夺冠,4年后他们未免成功,收回了“礼物”。
看起来这个定律很有意思,但是这一定律在2006年被打破。
2006年在德国的世界杯,德国和巴西队都没有夺冠,而是由我们中国人耳熟能详的主队里皮率领的意大利队夺冠。
还有一些未被打破的定律,这些看似没有规律的神奇定律,之所有神奇,完全纯属巧合。
世界杯每4年举办一次,总共才举办了20多届。只要数据足够少,我们总能发现一些神奇的定律。
如果数据少,随机现象可以看起来很不随机。甚至非常整齐,好像真的有规律一样。
那么,什么是小数定律呢?
小数定律是说,如果统计数据很少,那么事件就表现为各种极端情况,而这些情况都是偶然事件,跟它的期望值一点关系也没有。
比如人们知道投硬币出现正反面的概率都是50%,于是在连续出现了5个正面以后,却倾向于下一次出现的反面概率较大。
这就好比盲人摸象,你看到的只是偶然事件。
所以,理解“小数定律”最大的一个好处就是你不会再轻易地大惊小怪了,也不会有个人偏见了。
如果统计数据不够大,那就什么也说明不了。
正因为如此,我们才不能只凭自己的经验,哪怕加上朋友和家人的经验,去对事物进行判断。我们的经验特别有限。别看个例,看大规模统计。
小数定律里的“跟它的期望值一点关系也没有”,这里的期望值就是我们后面所聊到的“大数定律”。
2 什么是大数定律
大数定律就是我们从统计学中推测真相的理论基础。
大数定律说如果统计数据足够大,那么事物出现的频率就能无限接近它的期望值。
那么,什么是事物的期望呢?
某个事件的期望,也就是收益,实际上各种不同结果出现的概率乘结果的收益的和。
拿我们最熟悉的投色子举例,游戏规则是投中1点获得1元,投中2点获得2元,以此类推。
那么,这个事件的期望是多少呢?
显然是:
这个期望3.5代表什么意思呢?
也就是说,只要你一直玩下去,你每次游戏的预期收益是3.5元。可能你某次赢了1元,某一次赢了6元,只要你长期投下去, 你平均下来每次就赢3.5元。
3 小数定律和大数定律的动态演示
下面是前面投色子的动态演示过程,横轴代表投色子的次数,纵轴表示期望值。
你会发现,当抛色子次数少时,期望波动很大,这就是小数定律,如果统计数据很少,那么事件就表现为各种极端情况,而这些情况都是偶然事件,跟它的期望值一点关系也没有。
但是当你抛色子次数大于60时,就会越来越接近期望值3.5。这就说明了,如果统计数据足够大,那么事物出现的频率就会越来越接近它的期望值。
粗略看一下,抛出色子点数是3.5似乎是一个无效数据,因为色子的每一面都是整数,不会出现小数。
但是,期望是一个非常有用的参考数据。就像我们刚刚说的抛色子游戏,你可以通过比较成本投入和期望收益,你就能知道这件事情值得不值得。
如果每玩1次需要缴纳5元,那么你玩1万次,你投入是5万元,那么你的收益将是3.5万元。显然,你已经知道你要是玩1万次的结局了。你必然会输掉1个带有1080ti显卡的主机。
相关阅读
简单的说,反射机制就是在程序的运行过程中被允许对程序本身进行操作,比如自我检查,进行装载,还可以获取类本身,类的所有成员变量和方法
用户的价值可分为现有价值和未来价值,本文主要讨论现有价值。目前中国有超过400万APP,有的已经远去,有的还活在当下,做为一名移动产品
关于Java中接口作用的深入理解。这是个很容易遇到的问题吧。 / 2019/3/1 补充 : 接口的存在也是为了弥补类无法多继承的缺点,假设
目前外卖代运营市场的主要痛点就是人力成本高,线上运营专业性太强,需要依赖大量的数据分析进行优化等等,这让很在多线下经营有声有
转载于:https://www.cnblogs.com/xuanlvshu/p/10349192.html