必威体育Betway必威体育官网
当前位置:首页 > 运营推广

清明节,用数据思维案例聊聊平均死亡年龄和期望寿命

时间:2019-10-01 15:41:04来源:运营推广作者:seo实验室小编阅读:73次「手机版」
 

期望寿命

前些天,我所在的一个产品经理群里面,无意中有人聊到了社保,继而聊到了关于中国人平均寿命的问题。问题如下:

中国现在对外公布的平均寿命,如:2018年平均寿命75岁,是一个名叫“期望寿命”的指标

而中国人2018年的平均死亡年龄实际上只有66岁左右,所以群里有人认为,期望寿命是国家忽悠人一个指标,应该用平均死亡年龄来作为平均寿命的指标。

对此,你有什么看法呢?

中国人到底寿命多长,如果让你去收集数据然后得出结论,你会怎么做

要知道平均寿命66岁和75岁,差别可是非常巨大的,会导致完全不同的舆论和国家政策。

群里面不少人随声附和,什么毒奶粉地沟油又被提起了,然而一个专业的产品群居然很少有人对上面的说法提出质疑。

看到大家的反应,我担心的倒不是中国人的平均寿命,而是担心产品经理的整体职业素质。

作为职业产品经理,平时都说自己根据数据分析来改进结果,这么多人对于这么明显的数据坑不能识别,那么得有多少决策是错误的?

在很多人看来,产品经理可能是一个门槛很低的职业,然而数据思维真的是很多人的硬伤。

数据思维不就是统计统计平均值,比比大小吗?

还真没有这么简单,有的看似很简单的问题,却藏着巨大的坑。

忽略掉基数,是很多时候数据分析的一个大坑,对认真学过统计的人,识别这个坑并不难,但是多数产品人员并不能,只会做简单点加减乘除求平均。

就像上面那个问题一样,如果想要计算一个国家人口的平均寿命,就把死亡年龄算个平均数不就OK了。

你要是不这么计算,他还说你把简单的事情复杂化。被“简单化思维”洗脑的人群其实也蛮可怕的,会变得有点反智。

这个世界上有的东西本质上就是不能简化的,过度简化就是错误。

一、平均死亡年龄

平均死亡年龄是一个很容易理解的指标,就是把当年所以死亡人口的年龄算平均。但这个具有误导性的统计指标,代表不了人群的平均寿命。

为了说明问题,我们来简化一下问题。假设有两个群体:

第一个群体:由十个10岁的人和五个70岁的人组成;

第二个群体:由五个10岁的人和十个70岁的人组成。

2018年,第一个群体中,10岁的人死亡2个,70岁的人死亡4个;第二个群体中,10岁的人死亡1个,70岁的人死亡8个。如下图所示:

算平均死亡年龄,第一个群体:50岁,第二个群体:63.3岁。

于是,有的人可能就想得出结论:第二个群体的人口比第一个群体人口人均寿命更长。

但是我们仔细看看:

这两个群体,10岁的死亡率都是20%,70岁死亡率都是80% 。刨除掉不同年龄阶段人口基数的误导,这两个群体的两个年龄阶段的死亡率是完全相同的,也就是说,这两个群体的人寿命应该是相同的。

然而,平均死亡年龄这个指标却相差很大,平均死亡年龄将不同基数混淆在里面了,没有任何的意义。

一个年轻人非常多的国家,只要年轻人意外死亡很小一部分比例,就能把平均死亡年龄拉的很低,造成大家寿命短的假象。而一个年轻人很少的老龄化的国家,平均死亡年龄就会被拉得很高。

中国当前就是中年、青年人口更多,所有平均死亡年龄会比较低。如果你用平均死亡年龄当寿命指标,就会被误导。

想要真正反映一个国家当前人口的健康及寿命的状况,需要刨除掉不同年龄人口基数的影响,要用到一个叫做期望寿命的指标。

期望寿命虽然叫“期望”,但并不是指的“期待”的意思,这个期望是“数学期望”,反应的是当下人真实寿命的,是刨除掉了基数影响的平均寿命。

二、期望寿命

为了刨除掉基数的影响,期望寿命的计算使用死亡率而不是死亡人数。

假设一个群体中年龄最大的是n岁,年龄最小的1岁。

假如在2018年,1岁人群的死亡率是A1(死亡率是一个百分数),2岁人群的死亡率是A2 , 3岁人群死亡率A3,以此类推,n岁人群死亡率 An。

那么人均预期寿命为:

1*A1 + 2*(1-A1)*A2 + 3*(1-A1)*(1-A2)*A3 + 4*(1-A1)*(1-A2)*(1-A3)*A4+….(直到n岁)

这个计算方法,是根据当年各个年龄阶段的死亡率来计算平均寿命的,直观感觉有点类似于有一个虚拟的人在同一年从出生到死去,平均会在多少岁死亡。

还有一种错误的理解,在一些网页新闻中能够见到。他们认为:2018年的期望寿命是2018出生的人预计能活到多少岁,这也是完全错误的。

期望寿命是当前人口刨除掉基数影响后寿命的数学期望值,不是对新生人口未来的预计。

三、总结

在做产品数据分析的时候,也有不少这样的问题。比如:有的人就直接把不同渠道的转化用户直接相加,或者把不同地区的转化用户相加等。

要知道这些数据的基数都是不一样的,很有可能会得出误导性的结论。

有的人说数据是不会骗人的,其实,数据是最会骗人的,数据思维不过关的更容易被数据欺骗。

数据思维也不是想某些文章讲的那样,有意识地去看看数据就是有数据思维了,那顶多称得上数据意识。

后续有机会还会继续分享数据思维相关的问题。

题图来自Unsplash,基于CC0协议

相关阅读

人人圆桌总结 | 聊聊跳槽的那些事儿

春节的脚步越来越近,新一年大家都希望有个新的开始,所以对现状不满的产品经理们心里蠢蠢欲动,准备开始勾搭各家职位,期望年后抓紧“金

To B:聊聊供应商管理系统

供应链管理系统是最早期面向企业的软件解决方案之一,供应商管理又是供应链链条中的上游部分。正值To B话题的热点,本文跟大家分享一

0基础学python,聊聊这半年我是如何自学编程

很多人在遇到事业瓶颈,或者从事一份自己不喜欢工作,又或者对未来迷茫的时候,总能看到很多人说,转码农,当程序员。诚然,转行当程序员不仅

一起聊聊:SCRM的前景未来以及市面上的产品

连接和数据是SCRM的核心,在未来我们有理由相信SCRM能发挥越来越巨大的作用。一、SCRM是什么?常见的CRM系统大家都不陌生,全译:Custome

社交or社区产品,聊聊到底有什么不同

从1995年第一个互联网BBS“水木清华”上线以来,社交场上的产品一直不断涌现出来。即使到了移动互联网时代,微信成为了社交产品中的

分享到:

栏目导航

推荐阅读

热门阅读