必威体育Betway必威体育官网
当前位置:首页 > IT技术

一文快速搞懂对95%置信区间的理解

时间:2019-07-19 16:41:07来源:IT技术作者:seo实验室小编阅读:62次「手机版」
 

置信区间

一文快速搞懂对95%置信区间的理解

综合知乎上各大神的解答和网络资料得到本文对95%置信区间的理解


先给出结论

  • 最常出现的对置信区间的错误理解:

在95%置信区间内,有95%的概率包括真实参数  (错误!!)

在95%置信区下构建的模型,意味着模型参数对于试图近似的函数有95%的概率是真实值的估计值(错误!!)

  • 正确解释应为:

95%置信区间,意味着如果你用同样的步骤,去选样本,计算置信区间,那么100次这样的独立过程,有95%的概率你计算出来的区间会包含真实参数值,即大概会有95个置信区间会包含真值。

而对于某一次计算得到的某一个置信区间,其包含真值的概率,我们无法讨论。

我们平常使用的频率学派(frequentist)95% 置信区间的意思并不是真值在这个区间内的概率是 95%。真值要么在,要么不在。由于在频率学派当中,真值是一个常数,而非随机变量(后者是贝叶斯学派) ,所以我们不对真值做概率描述。对于这个问题来说,理解的关键是我们是对这个构造置信区间的方法做概率描述,而非真值,也非我们算得的这个区间本身。

换言之,我们可以说,如果我们重复取样,每次取样后都用这个方法构造置信区间,有 95% 的置信区间会包含真值 。然而(在频率学派当中)我们无法讨论其中某一个置信区间包含真值的概率。

参考自:如何理解 95% 置信区间? - 管致远的回答 - 知乎  https://www.zhihu.com/question/26419030/answer/70589735


详细一点的分析

截图参考来源:知乎-如何理解 95% 置信区间?

- 马同学的回答 - 知乎 https://www.zhihu.com/question/26419030/answer/274472266

著作权归作者所有

估计又分为“点估计”和“区间估计

而区间估计又称为置信区间估计,要得到一个置信区间需要样本统计量(比如均值)和从数据中计算出方差,中心极限定理告诉我们均值会接近一个高斯分布,我们可以用标准差计算出真实期望落在选定区间的概率,例如,以均值μ^为中心的概率为0.95的区域为(基于高斯分布):

题外话:在机器学习实验中,我们通常用测试集样本的误差均值来估计泛化误差,一般我们说算法A比算法B好,是指算法A的误差的95%置信区间的上界小于算法A的误差的95%置信区间的下界。


 

总结来说

转自邸月宝科学网博客

链接地址:http://blog.sciencenet.cn/blog-925634-870778.html 

假设现在是95%的置信水平( 95%也被称为置信水平,是统计中的一个习惯,可以根据应用进行调整),每个从总体中抽出的样本都可以求出一个95%的置信区间,且不同样本求出的置信区间是不同的,但随着抽出的样本次数的增加,例如抽100次,得到100个样本,每个样本都对应一个置信区间,那么100次抽样求出的100个置信区间有95个包含真实的总体均值。

置信区间会因样本的不同而不同(置信区间是怎么算的?是通过样本(sample)算的),而且不是所有的区间都包含真值,一个区间就像是一个为了捕获总体未知参数而撒出的网,不是所有撒网的地点都能捕获我们想要的总体的参数。

相关阅读

格式化后U盘存储量变小金士顿8G变了950多mb

我们会对自己的U盘进行格式化,有时候便会遇到格式化后的U盘存储量居然变小了,根据网上的步骤借用了量产工具也都没有恢复。现在通过

950黑色时尚女装淘宝店铺欢迎光临图片素材

今天装修宅小编为大家推荐的是950黑色时尚女装淘宝店铺欢迎光临图片素材,希望各位会喜欢这款淘宝店铺装修素材。适用店铺:所有行业

950宽淘宝宝贝搭配套餐代码装修模板

今日搭配套餐 2011新款 时尚加法 金粉碎花 韩版显瘦气质 ¥108元 单件热销:35件 11新

干货 | HR必看的95后新生代职场期望调研报告

这是一份关于95后新生代职场期望调研报告,如果身为HR的你还不知道95后对于工作的要求到底是什么的话,我想你需要进来看一看。2017年

产品经理日报第955期|支付宝的咻一咻加好友功能将在5月

哈喽,你我相约七点半,你来了么^_^产品经理日报继续为您带来今日最新的资讯:根据支付宝官方公告,咻一咻加好友功能将在5月8日停止服务;

分享到:

栏目导航

推荐阅读

热门阅读