参数估计
点估计
设总体X的分布函数的形式已知,但它的一个或多个参数未知,借助于总体X的一个样本来估计总体未知参数的值得问题称为参数的点估计问题。
举例:
某炸药厂,一天中发生着火现象的次数X是一个随机变量,假设X服从λ>0泊松分布,即X∼π(λ)。根据现有的样本量估计参数λ
着火次数k |
0 1 2 3 4 5 6 >=7 |
发生k次着火的天数 |
75 90 54 22 6 2 1 0 |
根据λ=E(X),以上的数据表示X=0出现了75次,X=1出现了90次…,一共有250个样本
E(X)=2500×75+1×90+2×54+3×22+4×6+5×2+6×1=1.22
所以估计参数λ=1.22
点估计:设总体X的分布函数F(x;θ)的形式为已知,θ是待估参数,X1,X2,...,Xn是X的一个样本,x1,x2,...,xn是对应的样本值。点估计问题是构造出一个适当的统计量θ^(X1,X2,...,Xn),用它的观察值θ^(x1,x2,...,xn)作为未知参数θ的近似值,称θ^(X1,X2,...,Xn)为θ的估计量,θ^(x1,x2,...,xn)为θ的估计值。
下面介绍两种常用的构造估计量的方法:矩估计和最大似然估计
##矩估计法
设X为连续型随机变量,其概率密度为f(x:θ1,θ2,...,θk);或X为离散型随机变量,其概率密度为P{X=x}=p(x;θ1,θ2,...,θk),其其中θ1,θ2,...,θk为待估参数。假设总体X前k阶矩为:
μl=E(Xl)=∫−∞∞xlf(x:θ1,θ2,...,θk)dx,(X是连续型)
μl=E(Xl)=x∈Rx∑xlp(x;θ1,θ2,...,θk),(X是离散型)
l=1,2,⋯,k
其中,Rx是x可能取值的范围。
X1,X2,...,Xn是来自X的样本,样本矩为Al=n1i=1∑nXil
样本矩依概率收敛于相应的总体矩ul,样本矩的连续函数依概率收敛于相应的总体矩的连续函数。因此,可以使用样本矩作为相应的总体矩的估计量,样本矩的连续函数作为相应的总体矩的连续函数的估计量,此估计法被称为矩估计法。具体做法如下:
⎩⎪⎪⎨⎪⎪⎧μ1=μ1(θ1,θ2,⋯,θk)μ2=μ2(θ1,θ2,⋯,θk)⋯μk=μk(θ1,θ2,⋯,θk)
这是包含k个未知数θ1,θ2,⋯,θk的联立方程组。一般来说,可以得到:
⎩⎪⎪⎨⎪⎪⎧θ1=θ1(μ1,μ2,⋯,μk)θ2=θ2(μ1,μ2,⋯,μk)⋯θk=θk(μ1,μ2,⋯,μk)
以ai代替上述中的μi,i=1,2,⋯,k,可得:
θi^=θi(A1,A2,⋯,Ak),i=1,2,⋯,k
分别作为θi,i=1,2,⋯,k的估计量,称为矩估计量,观察值称为矩估计值。
最大似然估计
离散型
设总体X属于离散型,分布律P{X=x}=p(x;θ),θ∈Θ的形式为已知,θ为待估参数,Θ为θ可能取值的范围。设X1,X2,⋯,Xn为来自X的样本,x1,x2,⋯,xn为对应的样本值,它们都是已知的常数。易知样本X1,X2,⋯,Xn取到x1,x2,⋯,xn的概率,即事件{X1=x1,X2=x2,⋯,Xn=xn}发生的概率为:
L(θ)=L(x1,x2,⋯,xn;θ)=i=1∏np(xi;θ),θ∈Θ
概率值随θ的取值而变化,是θ的函数,L(θ)称为样本的似然函数。
现在我们已经取到了样本值x1,x2,⋯,xn,表明取到这一样本值的概率L(θ)比较大。当θ=θ0∈Θ时L(θ)取得最大值,而Θ中的其他值使得L(θ)取得较小的值,所以认为取θ0为未知参数θ的估计值最为合理,这就是最大似然估计,即:
L(x1,x2,⋯,xn;θ^)=θ∈ΘmaxL(x1,x2,⋯,xn;θ)
这样的得到的θ^与样本值x1,x2,⋯,xn有关,常被记为θ^(x1,x2,⋯,xn),称为参数θ的最大似然估计值,统计量θ^(X1,X2,⋯,Xn)称为参数θ的最大似然估计量。
连续型
设总体X属于连续型,概率密度f(x;θ),θ∈Θ的形式为已知,θ为待估参数,Θ为θ可能取值的范围。设X1,X2,⋯,Xn为来自X的样本,x1,x2,⋯,xn为对应的样本值,它们都是已知的常数。易知样本X1,X2,⋯,Xn取到x1,x2,⋯,xn的概率,即为随机点(X1,X2,⋯,Xn)落在点(x1,x2,⋯,xn)的邻域(边长分别为dx1,dx2,⋯,dxn的n维立方体)内的概率近似为:
i=1∏nf(xi;θ)dxi
其值随θ的变化而变化,取θ的估计值θ^使得概率取得最大值,但因子∏i=1ndxi与θ无关,故只需要考虑函数:
L(θ)=L(x1,x2,⋯,xn;θ)=i=1∏nf(xi;θ)
的最大值,L(θ)称为样本的似然函数,若L(x1,x2,⋯,xn;θ^)=θ∈ΘmaxL(x1,x2,⋯,xn;θ)
则θ^(x1,x2,⋯,xn),称为参数θ的最大似然估计值,统计量θ^(X1,X2,⋯,Xn)称为参数θ的最大似然估计量。
对数似然方程
似然函数中的连乘操作容易造成下溢,取对数之后可以变为相加的形式:logL(θ)=i=1∑nf(xi;θ)
确定最大似然估计量的问题归结为求L(θ)的最大值问题。很多情况下,p(x;θ)和f(x;θ)关于θ可微,这时θ^可从方程:dθdL(θ)=0解得。又因为L(θ)和lnL(θ)在同一θ处取得极值,因此θ的最大似然估计θ也可以从方程dθdlnL(θ)=0求的,而使用对数方程求解比较方便,称为对数似然方程。
#无偏估计量
对于待估参数,不同的样本值就会得到不同的估计值。要确定一个估计量的好坏,就不能仅仅依据某次抽样的结果来衡量,而必须由大量抽样的结果来衡量。对此,一个自然而基本的衡量标准是要求估计量无系统偏差。也就是说,尽管在一次抽样中得到的估计值不一定恰好等于待估参数的真值,但在大量重复抽样时,所得到的估计值平均起来应与待估参数的真值相同,换句话说,估计量的均值(数学期望)应等于未知参数的真值。若估计量θ^=θ^(X1,X2,⋯,Xn)的数学期望E(θ^)存在,则有E(θ^)=θ
无偏估计的实际意义为无系统偏差。
文章最后发布于: 2018-05-12 19:37:52
相关阅读
斯特林公式 ——Stirling公式(取N阶乘近似值)
原文:https://blog.csdn.net/liangzhaoyang1/article/details/51145807#commentBox
斯特灵公式是一条用来取n阶乘近似值的数学公式
苹果股价暴跌6.6%,创出4年多以来的单日最大跌幅
A5创业网(公众号:iadmin5)11月5日消息,上周五苹果股价大跌6.63%,创出4年多以来的单日最大跌幅,公司市值一度回落至万亿美元以下。据悉
使用心得:文章相似度检测工具靠谱吗?
现如今做SEO最难的不是技术,而是网站内容。拥有高质量的文章对SEO排名帮助很大。很多人以为原创文章就是高质量文章,所以出现了很多
iPhone 11首发,浴霸三摄真香警告,没想到最大的赢家居然
相信不少人早上醒来就被朋友圈的iPhone新品发布会刷屏了,早前已有谍照流出,被大家戏称为“浴霸三摄”,被不少网友嫌弃。新
求两个数的最大公约数(C语言)
辗转相减法:
#include <stdio.h>
#include <stdlib.h>
int main()
{
int a, b;
printf("请输入要求公约数的两个数:");
scanf(