置信区间
1. 点估计和区间估计
例如:刮刮卡
2. 置信区间
置信区间又称估计区间,是用来估计参数的取值范围的。在统计学中,一个概率样本的置信区间(Confidence Interval)是对这个样本的某个总体参数的区间估计。
2.1 计算步骤
第一步:求一个样本的均值
第二步:计算出抽样误差。
人们经过实践,通常认为调查:
100个样本的抽样误差为±10%;
500个样本的抽样误差为±5%;
1200个样本时的抽样误差为±3%;
第三步:用第一步求出的“样本均值”加、减第二步计算的“抽样误差”,得出置信区间的两个端点。
置信区间=点估计±(关键值× 点估计的标准差)
2.2 性质
窄的置信区间比宽的置信区间能提供更多的有关总体参数的信息。
假设全班考试的平均分数为65分,则
置信区间 | 间隔 | 宽窄度 | 表达的意思 |
---|---|---|---|
0-100分 | 100 | 宽 | 等于什么也没告诉你 |
30-80分 | 50 | 较窄 | 你能估出大概的平均分了(55分) |
60-70分 | 10 | 窄 | 你几乎能判定全班的平均分了(65分) |
2.3 置信水平
置信水平是指总体参数值落在样本统计值某一区内的概率。
假如设定的置信水平为95%,即做100次抽样,会有95个置信区间包含了总体平均值。
2.4 置信区间与置信水平、样本量的关系
(1)样本量对置信区间的影响:在置信水平固定的情况下,样本量越多,置信区间越窄。
实例分析:
由上表得出:
1、在置信水平相同的情况下,样本量越多,置信区间越窄。
2、置信区间变窄的速度不像样本量增加的速度那么快,也就是说并不是样本量增加一倍,置信区间也变窄一半(实践证明,样本量要增加4倍,置信区间才能变窄一半),所以当样本量达到一个量时(通常是1,200,如上例三个国家各抽了1,200个消费者),就不再增加样本了。
(2)置信水平对置信区间的影响:在样本量相同的情况下,置信水平越高,置信区间越宽。
2.5 实例分析
美国做了一项对总统工作满意度的调查。在调查抽取的1,200人中,有60%的人赞扬了总统的工作,抽样误差为±3%,置信水平为95%;如果将抽样误差减少为±2.3%,置信水平降到为90%。则两组数字的情况比较如下:
由上表得出:
在样本量相同的情况下(都是1,200人),置信水平越高(95%),置信区间越宽。
参考文章
https://www.zhihu.com/question/26419030
https://baike.baidu.com/item/%E7%BD%AE%E4%BF%A1%E5%8C%BA%E9%97%B4/7442583?fr=aladdin
http://www.360doc.com/content/18/0317/16/15033922_737796626.shtml
相关阅读
一文快速搞懂对95%置信区间的理解 综合知乎上各大神的解答和网络资料得到本文对95%置信区间的理解 先给出结论 最常出现的对
当你的试验已经跑了一段时间之后,需要通过分析数据来看不同版本的行为数据表现,从而决策出最优版本。那么如何才能在已有数据基础上