人口增长模型
摘要
本文旨在建立数学模型描述并预测中国人口变化情况, 并努力全面合 理地分析人口老龄化、城乡人口分布、男女比例等现实因素对人口发展的 影响, 从而优化基本人口模型.
首先我们提出两个基本人口增长模型: 人口指数增长模型和人口阻滞增 长模型, 他们在生物种群分析、社会研究等领域都有广泛应用. 经过在原始 模型中引入修正参数并运用非线性最小二乘法求解, 它们对于中国人口增长 的描述是一定程度上可以适用的.
为了进一步优化人口增长模型, 我们依次考虑了年龄结构、人口城乡分 布、生育模式对于人口增长的影响. 分别使用到的关键方法如下:
1. 模仿概率论中概率分布函数和概率密度函数的定义, 引入了若干能够 同时反映人口与时间、人口与年龄分布情况关系的二元函数, 和表征 了育龄女性生育模式的关于年龄的女性生育加权因子;
2. 将影响人口变化的因素细分为城、镇、乡的自然增长率、净迁移率从 而实现各区域人口分别估计.
关键词: 非线性最小二乘法, 人口指数增长模型, 人口阻滞增长模型, 连 续人口发展方程, 生育模式
1 问题重述
中国是世界上人口最多的国家, 人口众多、人均资源相对不足是我国的 基本国情. 所以, 人口过多一直制约着中国的发展.
但自从中国在20世纪70年代全面推行计划生育以来, 我国的人口增速稳 步放缓, 形式趋于乐观. 但与此同时也出现了新的人口变化, 例如: 老龄化进 程加速、出生人口性别比持续升高以及乡村人口城镇化等, 这些都影响着中 国人口的数量增长与结构严谨. 因此, 利用已有数据和已掌握的现有国情, 通过数学建模对中国人口做出分析和预测是一个重要且必要的任务. 这将直 接为中国经济和社会发展决策提供科学依据, 同时对于加速推进我国现代化 建设有现实指导意义.
2.模型假设
1. 由于中国人口基数庞大, 我们忽略国际人口迁移对中国人口发展的影 响.
2. 将中国或中国部分地区的人口看做关于各个变量均连续可微的正值函 数
3 符号说明
符号 符号说明
t 年份
P(t) 年份 t 的人口
P0 初始人口数量
B(t) 年份 t 的出生率
D(t) 年份 t 的死亡率
r 人口增长率
r(t) 年份 t 的人口增长率
r0 固有增长率
M 人口容量
c 待定的修正参数
a 年龄
F(a, t) 年份 t 时年龄小于 a 的人口
ρ(a, t) 人口分布函数
µ(a, t) 死亡率函数
ρ0(a) 初始人口密度函数
f(t) 婴儿出生率函数
4 基本模型准备
一个地区的人口增长率基本可由该地区的出生率、死亡率、迁入率、 迁出率共同决定, 由于本文研究中国人口增长, 人口基数足够庞大, 因此可 忽略人口迁入迁出对于总人口的影响, 即成立
r(t) = B(t) − D(t). (1)
设年份 t 时中国人口为 P(t). 尽管我们只关心 P(t) 在 t 为整数时的取 值, 但为了更方便地利用微积分学工具, 不妨认为 P(t) 为关于 t 的连续可微 函数. 本文所有涉及到的数学模型均是在此假设下构建的. 本部分给出用于描述人口增长的两个基本模型.
4.1 人口指数增长模型
记初始年份的人口数量为 P0, 人口增长率为常数 r, 即 P(0) = P0, P(t + ∆t) − P(t) = rP(t)∆t. (2)
令 ∆t → 0, 可得函数 P(t) 所满足的微分方程,进而可解得 P(t) = P0e rt , (2) (2) 式称为人口指数增长模型, 因为若其中增长率 r > 0, 则人口将关于时间 呈指数式增长. 该模型也被称为 Malthus 人口模型.
4.2 人口阻滞增长模型
由于实际情况下人口不可能关于时间无限增长下去, 一个地区有限的资 源必将对人口的增长产生阻滞作用, 故指数增长模型只能适用于人口相对较 少、资源相对充足时的人口增长描述. 理论上当人口极少时, 资源可认为是 绝对充足, 人口增长最快; 当人口极多时, 资源变得有限, 人口增长不断减缓 直至死亡率与出生率相等时不再增长, 因此模型应体现出人口越多, 资源对 于人口增长的阻滞作用越显著的特点.
增长率函数 r(t) 关于人口 P(t) 递减. 出于计算简便的考虑, 我们可取 r(t) 为关于 P(t) 的线性函数 r(t) = r0 − sP(t), r0 > 0, s > 0.(3)
其中 r0 表示人口增长的初始阶段(理论上是人口为零时)的人口增长率, 称 为固有增长率.
在介绍 上式中系数 s 的含义之前, 引入指标 M 以表示该 地区资源、环境等条件所能容纳的最大人口, 称为人口容量. 则可知当人口 增长至地区人口容量时将达到饱和不再增长, 故有增长率 r(t)|P (t)=M = 0, (4)依此可改写上式为下述形式:
r(t) = r0 1 − P(t) M , (5)
我们可观察出这样的结论: 人口增长率 r(t) 正比于人口容量中尚未实现部 分的占比 M−P (t) M , 比例系数恰为固有增长率 r0.
现将 (5) 式代入方程 (3), 得到人口阻滞增长模型的基本公式, 也称为Logistic模型. 利用分离变量法解 方程得
P(t) = M 1 + M P0 − 1 e−r0t . (6)
(6) 式是可用于直接计算结果来进行人口预测的显式表达式, 但相应地 也有缺点, 那就是(6) 难以化为线性关系式, 不利于我们借助线性回归分析 理论来进行参数估计. 好在我们可以将方程 (6) 另作处理,从而可结合实际情况下的具体数据给出模型 (7) 中的待定参数 r0, s 的估值, 进而取 P0 = P(0), 完成模型的具象化.
5 模型求解
在实际情况下我们要对基本模型作出参数的最优求解或调整. 我们将使 用搜集得到的表1中的数据对上文提出的人口指数增长模型和人口阻滞增长 模型进行相应的模型参数求解. 为了使模型能最好的拟合现有数据, 我们应设法确定模型中的参数, 使 得各个数据点处误差平方和最小, 从而将模型求解转化为最小二乘问题, 然 后使用MATLAB软件进行求解.
在操作过程中, 我们都将使用1994年 2003年的人口数据来进行模型求 解, 再使用解得的模型来预测2004年和2005年的中国人口, 并将预测结果与 实际结果进行比对来判断模型对于中国人口增长预测得准确与否.
5.1 人口指数增长模型的修正与求解
经过尝试我们可以发现, 直接利用中国人口统计数据进行人口指数增长模型 (2) 进行求解, 所得模型的预测效果并不好. 我们在模型 (2) 的 基础上引入待定修正参数 c, 得到改进模型: P(t) = P0exp rt + c, (9) 使用 MATLAB 软件结合表1数据作最小二乘运算得到最优参数。
由拟合效果可见, 经过一定改进, 人口指数增长模型可大致给出 短期内人口增长的预估. 然而观察图1我们也能预感到, 由于构建该模型的 理论框架相对简单, 它似乎对于未来两年之后的人口预估无能为力.
5.2 人口阻滞增长模型的修正与求解
我们对人口阻滞增长模型 也引进修正参数, 得到改进模型。其中参数 P0 代入第一年的人口数据即可. 需要给出最优的参数 M, r0, c, 使 用 MATLAB 软件结合表1数据作最小二乘运算得到最优参数。
6 对基本模型的优化
我们在前文提到的人口指数增长模型和阻滞增长模型事实上在无形中 粗糙地假设了任何一个人在其生命的任何时刻死亡的概率是相等的, 因此根 本不需要“年龄”这一概念. 像这样以十分“整体而均衡”的视角研究人口 变化, 在带来简便的同时必将有失其准确性. 为了更科学的描述和预测整个 群体的变化, 我们还应详细分析人群年龄结构、城乡分布、男女比例等对于 人口变化的影响, 这实际上相当于在我们的基本模型上增加了变量、提升了 考察对象的维度来提高对结果的估计精确程度.
6.1 引入年龄结构对人口发展的影响
人口老龄化是中国当今社会正在面临的一大人口难题, 在建立数学模型 描述人口变化时必须考虑我国人口年龄重心向老龄化偏移的事实. 注意到一个人的年龄 a 是随年份 t 等量增长的,
即 ∆a = ∆t,
对一个人来说给定了某个年份就能相应地确定这一年时他的年龄, 故我们需 考虑的变量事实上是年份 t 和不同年龄段的人口比例. 我们模仿概率论中的 分布函数和概率密度函数的定义, 引入人口分布函数 F(a, t), 它表示年份 t 时年龄小于 a 的人口. 类似于之前, 我们在此仍假设 F(a, t) 关于变量 a, t 都是连续可导的. 为了符合实际情况, 人口分布函数 F(a, t) 是非负的、关于 a 单调递增的, 且满足对任意的年份 t, F(0, t) = 0, F(∞, t) = P(t)
人口密度函数为如下述定义的连续函数: ρ(a, t) = ∂F/∂a , 则 ρ(a, t)∆r 表示年份 t 时年龄在区间 [a, a + ∆a) 内的人口. 用 µ(a, t) 表示年份 t 时年龄为 a 的这部分人口的死亡率, 其具体含义 是使得 µ(a, t)ρ(a, t)∆a 表示年份 t 时年龄在区间 [a, a + ∆a)内的人口在一 年中的死亡人数.
为了能够描述人口密度 ρ(a, t) 的变化, 我们考虑年份 t 时年龄在区间 [a, a + ∆a)内的这部分人口从年份 t 到年份 t + ∆t 这段时间里发生的变化. 这部分人口中存活的人口年龄将相应地变为 [a + ∆a1, a + ∆a + ∆t), 其中 ∆a1 = ∆t. 其余为死亡人口, 数量为 µ(a, t)ρ(a, t)∆a∆t. 故可得 ρ(a, t)∆a − ρ(a + ∆a1, t + ∆t)∆a = µ(a, t)ρ(a, t)∆a∆t. 在上式中取 ∆a1 = ∆t → 0, ∆a → 0, 得到人口密度函数 ρ(a, t) 所满足的一阶偏微分方程, 其中死亡率函数 µ(a, t) 可根据数据拟合生成, 故为已知函数. 为了求得实际问题中方程 (11) 的特解, 我们还需要定解条件: 初始密度 函数 ρ(a, 0) = ρ0(a) 和婴儿出生率函数 ρ(0, t) = f(t), 分别用于表示初始年 份时的人口年龄分布和年份 t 的出生人数, 它们都可通过实际数据拟合或对 未来预测得到, 故为已知函数。
我们得到连续人口发展方程,方程在时间与年龄分布这两个变量维度上实现了对人口发展的描述, 在由方程 (12) 解出人口密度函数 ρ(a, t) 之后便可方便地得到人口分布函数。在研究中国近几年人口变化时, 我们可以认为死亡率与时间 t 基本无 关, 即设 µ(a, t) = µ(a). 此时可解方程。
根据附录2中死亡率、各年龄段人数的数据, 我们使用MATLAB 软件拟合 得到
µ(a) = 3.16 × 10−5 · e 0.0976a ≈ 3.16 × 10−5 (1 + 0.0976a),
ρ0(a) = 0.0003733a 4 − 0.05164a 3 + 0.8931a 2 + 58.93a + 886.4,
即可得到最终模型。
6.2 引入生育模式对人口发展的影响
事实上在上一节中我们引入的婴儿出生率函数 f(t) 会受到许多因素的 影响, 我们将对其展开讨论. 引入女性性别比函数 k(a, t), 则年份 t 时年龄在区间 [a, a + ∆a) 的女性 人数为 k(a, t)ρ(a, t)∆a, 记这些女性平均每位在一年内生育孩次数为 b(a, t),β(t) 表示平均每位女性一生的总生育孩次数, 称为总和生育率; h(a, t) 是年龄为 a 的女性的生育加权因子, 称为生育模式。
在稳定的社会环境下可假设生育模式 h(a, t) 与时间 t 无关, 即 h(a, t) = h(a), 可用于直接表示不同育龄的女性的生育率高低.
6.3 引入城镇化对人口发展的影响
我们使用 P1(t), P2(t), P3(t) 来分别表示中国城、镇、乡地区的人口. 设 某一个地区年份 t 时人口净迁移率为 A(t), 人口自然增长率为 B(t), 则有 d dt Pi(t) = [A(t) + B(t)]Pi(t), i = 1, 2, 3
在社会安定和不太长的时间里, 净迁移率和自然增长率大致与时间无关. 通 过对附件二的数据进行处理,经过Excel拟合可以分别得到城镇乡的净迁移率和自然增长率 解析式,据此预测城镇乡人口未来50年内的变化。
可以得到结论:乡村人口比重将持续减小, 下降速度较快; 城市和城 镇的人口比重上升。
7 模型评价与推广
人口指数增长模型可对未来人口进行相对理想化的推测, 默认人口增长 会呈J型趋势. 此模型中, 未考虑由于自然资源有限, 且在实际情况中当人 口增长到一定程度时往往会出现外力干预的情况, 所以只能用于理想情况 下,或地区人口发展初期阶段的预测. 同时由于数据较少, 构建该模型的理论 框架相对简单, 基本对于未来两年之后的人口预估无能为力, 有较大局限性.
Logistic 人口阻滞增长模型可对人口增长率做出了相对合理、简化的假 设, 它实际上将人口增长率看作是受控于人口数量的函数. 同时它的中期预 测结果比较准确, 可以对人口数量进行粗略的预测. 但是在此模型中并没有 考虑人口结构、男女比例、城镇化进程等客观影响因素, 故只能对人口数量 作出中短期预测, 实用性欠佳.
因此我们对模型进行了优化, 通过引入年龄结构、生育模式和城镇化对 于人口发展的影响, 把市镇乡人口比例、各年龄死亡率、生育率等各种因素 都考虑在内, 通过数据拟合进行了预测. 在预测前, 我们对现有的数据进行了 预先处理: 一, 对数据取平均值, 排除了意外因素对人口发展造成的异常波 动; 二, 根据抽样人口中市、镇、乡地区, 男、女人口所占的比例对抽样结果 作出了修正, 从而得到了比较准确的数据, 使我们的模型更加贴合实际情况.
然而在具体分析过程中, 依然存在一些问题, 举例罗列如下:
1. 假设了死亡率与生育率不随时间的变化而变化而忽略了国家政策等因 素, 偏于理想化;
2. 求总人口的算法过于复杂, 只能预测短期人口数据, 有一定的局限性;
3. 引入城镇化对于人口发展的影响时, 由于数据样本过小, 无法考虑出生 和死亡人口对净迁入率的影响, 使得建模结果与实际情况不可避免地 存在小范围误差.
故此, 我们也提出一些继续优化模型的方法, 列举如下:
1. 继续搜集19世纪初至今中国总人口的可靠数据, 从而使数据拟合结果 更具有准确性;
2. 使用最小二乘法求出 r(t) 与 P(t)的具体关系;
3. 考虑依赖性指数即平均每个劳动者要供养的人数对于人口发展的影响.
本文的数学模型虽然均用于描述及预测中国人口的变化情况, 但对于其 他许多国家与地区也可适用, 因为我国综合有城、镇、乡人口分布, 故相应 的人口模型也具有较强综合性. 然而本文的模型毕竟都没有考虑地区与外界 的人口迁移, 这很大程度上限制了模型的普适性.
参考文献
[1] 姜启源, 谢金星, 叶俊. 数学模型. 3版. 北京: 高等教育出版社, 2003.
[2] 王泽文, 乐励华, 颜七笙, 张文. 数学实验与数学建模案例. 1版. 北京: 高 等教育出版社, 2012.
相关阅读
分享一下我老师大神的人工智能教程!零基础,通俗易懂!http://blog.csdn.net/jiangjunshow也欢迎大家转载本篇文章。分享知识,造福人民,
1月22日下午,中国互联网络信息中心(CNNIC)在京发布第39次《中国互联网络发展状况统计报告》(以下简称为《报告》)。《报告》显示,截至20
五一劳动节当天,一篇《这届年轻人已经开始消费降级了》,不得不服这个标题和话题都非常抓眼球,并且现在我们年轻人被现在的各种网文搞
互联网的流量战争就像是一场雾里看花的游戏,看似找不到门道,杂乱无章间却存在着某种必然。互联网进入中国的第25个年头,作为“数字地
前言 更多内容,请访问我的 个人博客。 大家应该知道,个人开发者要想上线自己的软件到第三方APP平台,多半是需要软件著作权的。因此,