泊松分布
1.甜在心馒头店
公司楼下有家馒头店:
每天早上六点到十点营业,生意挺好,就是发愁一个事情,应该准备多少个馒头才能既不浪费又能充分供应?
老板统计了一周每日卖出的馒头(为了方便计算和讲解,缩小了数据):
均值为:
Xˉ=53+7+4+6+5=5
按道理讲均值是不错的选择,但是如果每天准备5个馒头的话,从统计表来看,至少有两天不够卖,40% 的时间不够卖:
你“甜在心馒头店”又不是小米,搞什么饥饿营销啊?老板当然也知道这一点,就拿起纸笔来开始思考。
2. 老板的思考
老板尝试把营业时间抽象为一根线段,把这段时间用T来表示:
然后把周一的三个馒头(“甜在心馒头”,有褶子的馒头)按照销售时间放在线段上:
把 T 均分为四个时间段:
此时,在每一个时间段上,要不卖出了(一个)馒头,要不没有卖出:
在每个时间段,就有点像抛硬币,要不是正面(卖出),要不是反面(没有卖出):
T内卖出3个馒头的概率,就和抛了4次硬币(4个时间段),其中3次正面(卖出3个)的概率一样了。
这样的概率通过二项分布来计算就是:
C43p3(1−p)1
但是,如果把周二的七个馒头放在线段上,分成四段就不够了:
从图中看,每个时间段,有卖出3个的,有卖出2个的,有卖出1个的,就不再是单纯的“卖出、没卖出”了。不能套用二项分布了。
解决这个问题也很简单,把 T 分为20个时间段,那么每个时间段就又变为了抛硬币:
这样,T内卖出7个馒头的概率就是(相当于抛了20次硬币,出现7次正面)
C207p7(1−p)13
为了保证在一个时间段内只会发生“卖出、没卖出”,干脆把时间切成 n 份:
Cn7p7(1−p)n−7
越细越好,用极限来表示:
n→+∞limCn7p7(1−p)n−7
更抽象一点,T 时刻内卖出 k 个馒头的概率为:
n→+∞limCnkpk(1−p)n−k
3.p的计算
“那么”,老板用笔敲了敲桌子,“只剩下一个问题,概率 p 怎么求?”
在上面的假设下,问题已经被转为了二项分布。二项分布的期望为:
E(X)=np=μ
那么:
p=nμ
4.泊松分布
有了p=nμ了之后,就有:
n→∞lim(kn)pk(1−p)n−k=n→∞lim(kn)(nμ)k(1−nμ)n−k
我们来算一下这个极限:
n→∞lim(kn)(nμ)k(1−nμ)n−k=n→∞limk!n(n−1)(n−2)⋯(n−k+1)nkμk(1−nμ)n−k=n→∞limk!μknn⋅nn−1⋯nn−k+1(1−nμ)−k(1−nμ)n
其中
n→∞limnn⋅nn−1⋯nn−k+1(1−nμ)−k=1
n→∞lim(1−nμ)n=e−μ
所以:
n→∞lim(kn)(nμ)k(1−nμ)n−k=k!μke−μ
上面就是泊松分布的概率密度函数,也就是说,在 T 时间内卖出 k 个馒头的概率为:
P(X=k)=k!μke−μ
一般来说,我们会换一个符号,让 μ=λ ,所以:
P(X=k)=k!λke−λ
这就是教科书中的泊松分布的概率密度函数.
5.馒头店的问题的解决
老板依然蹙眉,不知道μ啊?
没关系,刚才不是计算了样本均值:
X=5
可以用它来近似:
X≈μ
于是:
P(X=k)=k!5ke−5
画出概率密度函数的曲线就是:
可以看到,如果每天准备8个馒头的话,那么足够卖的概率就是把前8个的概率加起来:
这样 93% 的情况够用,偶尔卖缺货也有助于品牌形象。
老板算出一脑门的汗,“那就这么定了!”
6.二项分布与泊松分布
鉴于二项分布与泊松分布的关系,可以很自然的得到一个推论,当二项分布的p很小的时候,两者比较接近:
相关阅读
随着电子商务和网络营销的蓬勃发展,越来越多的中小企业开始布局网络营销和电子商务,但是要做好电子商务并非那么简单,必须进行系统化
回收站清空了能恢复吗?回收站是Windows版本电脑上一种文件保护机制,当用户在对一些文件进行普通删除后,文件首先就会出现在回收站当
大家好,我是那个人见人爱,花见花开的燕丰收,今天给大家带来的教程是卢松松(松哥)的博客,并不是给大家看着玩的哈,最主要的就是通过松哥
什么人做兼职文员工作更轻松简单: 其实我们知道,不同的兼职工作因为从业内容、从业难度、从业的工作强度存在着一定不同,所以有一些
随着电商时代来临,电动物流车也有着广阔的发展前景。继菜鸟、京东之后,顺丰也宣布将在今年投入8000辆新能源物流车,京东、阿里巴巴更