人口预测_第1页
人口预测_第2页
人口预测_第3页
人口预测_第4页
人口预测_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 人口预测 摘要 人口预测对国民经济的发展有着非常重要的作用,如何用操作性强、可信度高 的方法来预测人口的变化是一个值得探讨的问题。为方便理解和建模,我们将本题 的3个问题整合后重新编排如下: 对我国人口数量、年龄结构以及生育率进行预测,推测我国生育政策发展方向; 分析计划生育政策对我国人口数量、年龄结构和生育率的影响,以及社会经济 发展对我国人口生育率的影响,综合分析生育率下降的原因。 为使结果尽可能地真实可靠,我们决定采用国家统计局中国统计年鉴上的数据。 针对第一个问题,为排除计划生育政策对趋势预测的影响,我们选用 2001- 2014 年的数据。考虑到样本数据较少,我们决定采用 GM(1,1)模型,但 GM(1,1)模 型对长期预测精度会下降,故同时采用 NAR 神经网络模型。经分析后我们发现,两 个模型各有所长,这时我们想到能否将两个模型结合:先用 GM(1,1)模型进行短期 预测,然后结合预测得到的数据对 NAR 神经网络模型进行训练,从而得到更精确的 结果,称这个模型为“GM(1:1)与 NAR 神经网络组合模型” ,简称“组合模型” 。我 们用三个模型同时进行预测,经分析选取最恰当的一组数据,用 MATLAB 拟合工具 箱中的多项式曲线对数据进行拟合,生成图像,便于分析。预测结果及分析如下: 短期内,我国人口数量增长率平稳下降,总量继续增长,将于 2020 年、2030 年分别达 14.11 亿人和 14.84 亿人; 65 岁及以上的人口比例持续上升,14 岁及以 下的持续降低,预计 2030 年,65 岁以上老年人口比例将高达 13.19%,14 岁及以 下的将低至 10.61%。对于中长期我国人口总量将于 2045 年前后达到峰值 15.20 亿 人,之后缓慢下降;65 岁以上和 14 岁以下人口比例上升下降的速度逐渐减小, 2050 年前后 65 岁以上老年人口比例将至 14.63%,而 14 岁及以下人口比例将降至 6.34%。而生育率则始终稳定在较低水平,趋近于 3.63%,波动相当小。显然,我 国将面临严重的人口老龄化问题,预测我国会在不久后全面开放生育,但至少在未 来 30 年内不会出台鼓励生育的政策 针对第二个问题,分析计划生育的影响时,选取 1954-2014 年的数据,囊括计 划生育从试点实施到全面施行的时间。分析社会经济发展对生育率的影响时,选取 20012014 年的相关数据。分别用 MATLAB 的多项式曲线对上述数据进行拟合。 先来看看计划生育的影响,计划生育政策实施之前,我国人口数量几乎呈线性 增长;65 岁及以上人口比例一直维持在 5%左右,14 岁及以下的也保持在 37%左右; 生育率一直维持在一个相当高的水平,接近 10%。计划生育实施之后,人口增长速 率立即得到有效控制,人口数量在实施 30 年之后基本稳定,但仍在缓慢上升;我 国 65 岁及以上的人口比例开始上升,并在 2001 达到 7%以上,我国进入老龄化社 会,与此同时 14 岁及以下的人口比例不断下降;在二三十年内直接从接近 10%降 至 4%以下,但 2010 年之后始终稳定在 3.63%左右。 再结合社会经济发展对生育率的影响,我们有下列结论:在我国经济实力较弱 的年代,计划生育政策使我国生育率骤降,为主要影响因素。我国经济实力提升后, 社会经济发展的影响开始占据主要地位,成为导致生育率下降的主要因素。 最后,我们对评价了模型的优缺点,提出了改进方向,并对组合模型进行了检 验。 关键词:NAR 神经网络 GM(1,1)灰色预测模型 组合模型 人口预测 2 一.问题重述 人口数量和结构是影响经济社会发展的重要因素,中国作为世界上人口总量最 大的国家,人口问题始终制约着我国的发展。人口问题有着悠久的研究历史,也有 不少经典的理论和模型,这些理论和模型都依赖生育模式、生育率、死亡率、性别 比等多个因素,这些因素与政策及人的观念、社会文化习俗有着紧密的联系,还受 到社会经济发展水平的影响。大家普遍认可的能降低生育率的因素主要有以下几个: 妇女的受教育程度,社会保障体系的完善程度,生活成本,妇女生育年龄。妇 女受教育程度越高,职业成就就可能越大,对于妇女来说生孩子的机会成本就较大, 就会减少生育;古代人们多生孩子的原因之一就是“养儿防老” ,社会保障体系的 完善就使得不需要“养儿”来“防老” ;生活成本上升,养儿的成本自然也会上升; 妇女初婚年龄的提高会拉大了两代之间的年龄差,客观上降低了生育率。 为了理解和建模的方便,我们将本题中的问题整合后重新编排如下: 对我国人口数量、年龄结构以及生育率进行短期和中长期预测,并推测我国是 否会在将来全面放开生育甚至出台鼓励生育的政策; 分析计划生育政策对我国人口数量、年龄结构和生育率的影响,以及社会经济 发展对我国人口生育率的影响,估计我国生育率的下降有多少是社会经济发展导致 的,又有多少是计划生育政策导致的。 (注:下文所说第1小问、第2小问均按重新编排后的问题序号理解) 二.问题分析 人口的增长与生育模式、生育率、死亡率、性别比等多个因素都有关系,而政 策、人的观念、社会文化习俗以及社会经济发展水平又通过影响上述因素,来间接 影响人口的增长。而对于诸如战争爆发、疾病流行等突发因素,由于其不可预测性, 我们不考虑。 为使结果尽可能地真实可靠,我们决定采用中华人民共和国国家统计局中国统 计年鉴上的数据。 针对第一个问题,为排除计划生育政策对趋势预测的影响,我们选用 2001- 2014 年的数据。考虑到样本数据较少,我们决定采用 GM(1,1)模型,但 GM(1,1)模 型对长期预测精度会下降,故同时采用 NAR 神经网络模型。经分析后我们发现, GM(1,1)模型所需要的样本数据少、原理简单、运算方便、短期预测精度高,而 NAR 神经网络的并行计算和容错能力以及自适应能力强,这时我们想到能否将两个 模型结合:先用 GM(1,1)模型进行短期预测,然后结合预测得到的数据对 NAR 神经 网络模型进行训练,从而得到更精确的结果,称这个模型为“GM(1:1)与 NAR 神经 网络组合模型” ,简称“组合模型” 。我们用三个模型同时进行预测,经分析选取最 恰当的一组数据,再用 MATLAB 拟合工具箱中的多项式曲线对数据进行拟合,生成 图像。利用数据和图像对我国人口数量、年龄结构以及生育率进行短期和中长期预 测。 针对第二个问题,分析计划生育的影响时,选取 1954-2014 年的数据,囊括计 划生育从试点实施到全面施行的时间。分析社会经济发展对生育率的影响时,选取 20012014 年妇女受教育程度、社会保障体系完善程度、生活成本、妇女生育年 3 龄(即两代间的年龄差)的相关数据。分别用 MATLAB 的多项式曲线对上述数据进 行拟合,分析计划生育政策对我国人口数量、年龄结构和生育率的影响,以及社会 经济发展对我国人口生育率的影响,估计我国生育率的下降有多少是社会经济发展 导致的,又有多少是计划生育政策导致的。 三.问题假设 假设下面我们所使用的所有数据均真实可靠; 忽略我国人口的迁入和迁出; 不考虑战争、瘟疫等对人口数量或人口生育率产生急剧影响的特殊情况; 在对人口按年龄进行分段处理时,同一年龄段的人死亡率相同,同一年龄段的 育龄妇女生育率相同; 在分析老年人口问题时,以65岁作为老年人口的起点年龄; 预测时期小于10年为短期,10-25年为中期,大于25年为长期。 4主要统计指标解释 人口数:指一定时点,一定地区范围内有生命的个人总和 出生率:指在一定时期内(通常为一年)一定地区的出生人数与同期内平均人 数(或期中人数)之比,用千分率表示。其计算公式为: 年 平 均 人 数年 出 生 人 数出 生 率 10 死亡率:指在一定时期内(通常为一年)一定地区的死亡人数与同期内平均人 数(或期中人数)之比,用千分率表示。其计算公式为: 年 平 均 人 数年 死 亡 人 数死 亡 率 10 人口自然增长率:是指在一定时期内(通常为一年)人口自然增加数(出生人 数减死亡人数)与该时期内平均人数(或期中人数)之比,用千分率表示。计算公 式为: 人 口 死 亡 率人 口 出 生 率年 平 均 人 数本 年 死 亡 人 数年 出 生 人 数人 口 自 然 增 长 率 -10- 出生人口性别比:是活产男婴数与活产女婴数的比值,通常用女婴数量为100 时所对应的男婴数来表示(正常情况下, 出生性别比是由生物学规律决定的, 保持 在103107之间) 。 生育率:一定时期(如某一年)各年龄组妇女生育率的合计数,说明每名妇女 按照某一年的各年龄组生育率度过育龄期,平均可能生育的子女数,是衡量生育水 平最常用的指标之一。 (注:由于本题中我们用到的符号较少,故我们在建模中直接阐述,不再在这里单 独列出) 5模型的建立和求解 1.GM(1,1)预测模型的基本原理 GM(1,1)灰色系统 灰色系统(grey system)是有华中科技大学控制科学与工程系教授、博士生 4 导师邓聚龙于 1982 年提出的,是用来解决信息不完备系统的数学方法。灰色系统 理论研究的是贫信息建模,它提供了贫信息情况下解决系统问题的新途径。它把一 切随机过程看做是在一定范围内变化的、与时间有关的灰色过程,对灰色量不是从 寻找统计规律的角度,通过大样本进行研究,而是用数据生成的方法,将杂乱无章 的原始数据整理成规律性较强的生成数列后再作研究。 4 灰色预测方法是根据过去及现在已知的或非确知的信息,建立一个从过去引申 到将来的 GM 模型,从而确定系统在未来发展变化的趋势,为规划决策提供依据。 在灰色预测模型中,对时间序列进行数量大小的预测,随机性被弱化了,确定性增 强了。此时在生成层次上求解得到生成函数,据此建立被求序列的数列预测,其预 测模型为一阶微分方程,即只有一个变量的灰色模型,记为 GM(1,1)模型。 灰色 GM(1,1)预测模型在计算过程中主要是以矩阵为主,而 MATLAB 可以有效 解决灰色系统理论在矩阵计算中的问题,这为灰色系统理论的应用提供了一种新的 方法。 GM(1,1)预测模型的基本原理 3 GM(1,1)模型是灰色预测的核心,它是一个单个变量预测的一阶微分方程模型, 其离散时间响应函数近似呈指数规律。建立 GM(1,1)模型的方法是: 设 X (0)=X(0)(1), X(0)(2),X(0)(n)为原始非负时间序列, X(l)(t)为累加生成序 列即 )21t()t( i10( nml , GM(1,1)模型的白化微分方程为: uaXdtll)()( (其中,a 为待辨识参数,亦称发展系数;u 为待辨识内生变量,亦称灰作用量) 设待辨识向量 ,按最小二乘法求得 式中 ua yBaT1)(1)()1(232)1(2)()(nXBllllll)n(3)( 00Xy 于是可得到灰色预测的离散时间响应函数为: auet tl )1()()0) 为所得的累加的预测值,将预测值还原即为:)1()tXl( ),32,()()1()0 ntXttXll 5 GM(1,1)预测模型的MATLAB程序 根据上述 GM(1,1)模型的数学思想,结合 MATLAB 语言的特点编制一套可读性 强、容易理解的预测程序。力求使该程序操作简单灵活,稳定性好,直接面向用户。 2.NAR神经网络模型的基本原理 神经网络 神经网络是由多个神经元组成的广泛互连的神经网络,能够模拟生物神经系统 真实世界及物体之间所做出的交互反应。人工神经网络处理信息是通过信息样本对 神经网络的训练,使其具有人的大脑的记忆、辨识能力以及完成名种信息处理功能。 它不需要任何先验公式,就能从已有数据中自动地归纳规则,获得这些数据的内在 规律,具有良好的自学习、自适应、联想记忆和并行处理和非线性形转换的能力, 特别适合于因果关系复杂的非确定性推理、判断、识别和分类等问题。对于任意一 组随机的、正态的数据,都可以利用人工神经网络算法进行统计分析,做出拟合和 预测。 2 NAR模型的基本原理 学习过程由信号的正向传播与误差的逆向传播两个过程组成。正向传播时, 模 式作用于输入层,经隐层处理后,传入误差的逆向传播阶段,将输出误差按某种子 形式,通过隐层向输入层逐层返回,并“分摊”给各层的所有单元,从而获得各层 单元的参考误差或称误差信号,以作为修改各单元权值的依据。权值不断修改的过 程,也就是网络学习过程。此过程一直进行到网络输出的误差准逐渐减少到可接受 的程度或达到设定的学习次数为止。NAR网络模型包括其输入输出模型、作用函数 模型、误差计算模型和自学习模型。 NAR网络由输入层,输出层以及一个或多个隐层节点互连而成的一种多层网, 这种结构使多层前馈网络可在输入和输出间建立合适的线性或非线性关系,又不致 使网络输出限制在-1和1之间。如图2所示: P1 P2 P3 Pn 输出层 隐含层 输入层 (大于等于一层) W(1)W(L) 图 1 NAR网络模型 NAR神经网络的训练 NAR 算法通过“训练”这一事件来得到这种输入,输出间合适的线性或非线性 关系。 “训练”的过程可以分为向前传输和向后传输两个阶段: A.向前传输阶段: a.从样本集中取一个样本 Pi,Q j, 将 Pi输入网络; b.计算出误差测度 E1和实际输出 Oi=FL(F2(F1(PiW(1)W (2)W(L); c.对权重值 W(1),W (2),W (L)各做一次调整,重复这个循环,直到 6 。iE B.向后传播阶段误差传播阶段: a.计算实际输出 OP与理想输出 Qi的差; b.用输出层的误差调整输出层权矩阵; c. ;21)(2mjijijiQE d.用此误差估计输出层的直接前导层的误差,再用输出层前导层误差估计更 前一层的误差,如此获得所有其他各层的误差估计; e.用这些估计实现对权矩阵的修改,形成将输出端表现出的误差沿着与输出 信号相反的方向逐级向输出端传递的过程。 网络关于整个样本集的误差测度为: iE 3.应用步骤 输入原始数据资料; 应用GM(1,1)模型进行预测,得到预测序列和发展系数a; 应用NAR神经网络模型进行预测; 结合GM(1,1)模型短期预测所得数据对NAR神经网络模型进行训练,用NAR神 经网络模型计算后续数据; 最后将所得数据用MATLAB拟合工具箱中的多项式曲线对数据进行拟合。 4.第 1小问 我国未来人口数量预测及分析 通过查询中华人民共和国国家统计局所公布的中国统计年鉴的数据,我们可以 得到中国 20012014 年的人口数量数据(见附录 1 表 1) 。利用这些数据,分别使 用 GM(1,1)模型、NAR 神经网络模型和 GM(1:1)与 NAR 神经网络的组合模型对中国 未来 36 年人口总数进行预测。 我们用 MATLAB 实现了 NAR 神经网络模型,实现过程图如下: 7 图 2 NAR神经网络模型人口数量预测 MATLAB实现过程图 GM(1,1)模型的发展系数为-0.3572,记为 a1。部分预测数据见下表(每年 详细数据见附录 3 表 1): 表 1 2001-2050年我国人口数量预测部分数据 年份 GM(1:1)模型 NAR神经网络模型 GM(1:1)与 NAR神经网络组合模型 2010 134066.57 134066.57 134066.57 2011 134758.50 134758.50 134758.50 2012 135454.01 135454.01 135454.01 2013 136153.10 136153.10 136153.10 2014 136855.80 138226.73 136855.80 2015 137562.13 139251.58 137562.13 2020 141148.84 142647.98 141148.84 2025 144829.06 143848.12 144829.06 2030 148605.24 143601.64 148423.61 2035 152479.88 143414.69 150857.26 2040 156455.54 143373.73 151774.33 2045 160534.86 143409.07 152017.04 2050 164720.54 143414.50 152076.23 注:以上人口数量单位为万人 将所得数据制成图像: 8 图 3 我国未来人口数量的预测 经过分析与比较,组合模型的结论更加符合实际情况,故我们采用组合模型所 得数据。由图 3 可知我国人口增长的中短期和长期趋势为: 中国人口自然增长率继续保持平稳下降,人口总量在中短期内继续增长。人口 总量在未来 30 年还将净增 2 亿人左右,总人口将于 2020 年、2030 年分别达到 14.11 亿人和 14.84 亿人左右,2045 年前后达到峰值 15.20 亿人左右,之后人口总 量缓慢下降。 我国未来年龄结构预测 随着人口年龄结构的不断老化,人口年龄结构的类型就会从年轻型进入成年型, 最后进入老年型。从2001年开始我国65岁以上人口占总人口的比重达到7%,这就 意味着我国已经进入了老龄化社会。 (老龄化社会是指老年人口占总人口达到或超过一定的比例的人口结构模型。 按照联合国的传统标准是一个地区60岁以上老人达到总人口的10%,新标准是65岁 老人占总人口的7%,即该地区视为进入老龄化社会。) 5 通过查询中华人民共和国国家统计局所公布的中国统计年鉴的数据,我们可以 得到中国 20012014 年的年龄结构数据(见附录 1 表 3) 。利用这些数据,分别使 用 GM(1,1)模型、NAR 神经网络模型和 GM(1:1)与 NAR 神经网络的组合模型对中国 未来 36 年人口总数进行预测。 我们用 MATLAB 实现了 NAR 神经网络模型,实现过程图如下: GM(1:1)模型 NAR神经网络模型 GM(1:1)与 NAR神经网络组合模型 9 图 4 NAR神经网络模型年龄结构预测 MATLAB实现过程图 (从左至右分别为 14岁及以下、15-64 岁、65 岁及以上) 预测 14 岁及以下、15-64 岁、65 岁及以上的人口比例时,GM(1,1)模型的发 展系数分别为-0.4367,记为 a2;-0.3782,记为 a3;-0.4137,记为 a4。部分预测 数据见下表(每年详细数据见附录 3 表 3): 表 2 2001-2050年我国年龄结构预测部分数据 GM(1:1)模型 NAR神经网络模型 GM(1:1)与 NAR 神经网络组合模型年份 65 65 65 2010 18.08 73.08 8.84 16.60 74.50 8.90 16.60 74.50 8.90 2011 17.62 73.35 9.04 16.50 74.40 9.10 16.50 74.40 9.10 2012 17.17 73.61 9.23 16.50 74.10 9.40 16.50 74.10 9.40 2013 16.73 73.86 9.43 16.40 73.90 9.70 16.40 73.90 9.70 2014 16.29 74.10 9.63 16.50 73.40 10.10 16.50 73.40 10.10 2015 15.87 74.33 9.83 15.51 74.28 10.22 15.87 74.33 9.83 2020 13.87 75.29 10.88 16.01 73.28 10.83 13.87 75.29 10.88 2025 12.09 75.98 12.00 15.76 73.41 11.03 12.09 75.98 12.00 2030 10.49 76.42 13.18 15.27 73.92 11.08 10.62 75.98 13.19 2035 9.08 76.61 14.43 15.79 73.45 11.16 9.48 75.53 14.22 2040 7.28 76.21 15.62 15.32 73.73 11.01 8.28 76.21 14.62 2045 6.20 77.28 15.65 15.76 72.46 12.21 7.20 77.28 14.65 2050 5.34 78.13 15.63 15.41 74.09 10.61 6.34 78.13 14.63 经过分析比较,组合模型的结论更加符合实际情况,故我们决定采用组合模型 所得数据,由于 9 条曲线在一张图上显得过于凌乱,这里我们不再将三种模型的对 比图列出。将所得 NAR 神经网络模型数据制成图像(纵坐标为各年龄段人口比例, 单位为%): 10 图5 NAR神经网络模型对未来年龄结构预测 由图 5 可以看出,我国 65 岁及以上的人口比例不断上升,而 14 岁及以下的人 口比例不断降低。到 2030 年,65 岁以上老年人口比例将 2010 年的 8.90%增长到 13.19%,而 14 岁及以下人口比例将从 2010 年的 16.60%下降到 10.61%。之后上升 和下降的速度逐渐降低,预计到 2050 年,65 岁以上老年人口比例将达 14.63%,而 14 岁及以下人口比例将降至 6.34%。结论十分明显,我国老龄化进程加速、老年人 口数量多、老龄化速度快、高龄趋势明显。 我国未来生育率预测及分析 通过查询中华人民共和国国家统计局所公布的中国统计年鉴的数据,我们可以 得到中国 20012014 年的生育率数据(见附录 1 表 2) 。利用这些数据,分别使用 GM(1,1)模型、NAR 神经网络模型和 GM(1:1)与 NAR 神经网络的组合模型对中国未来 36 年人口总数进行预测。 我们用 MATLAB 实现了 NAR 神经网络模型,实现过程图如下: 图 6 NAR神经网络模型生育率预测 MATLAB实现过程图 14岁及以下 15-64岁 65岁及以上 11 GM(1,1)模型的发展系数为-1.1378,记为 a5。部分预测数据见下表(每年 详细数据见附录 3 表 2): 表 3 2001-2050年我国生育率预测部分数据 年份 GM(1:1)模型 NAR神经网络模型 GM(1:1)与 NAR神经网络组合模型 2010 3.631484 3.570000 3.631484 2011 3.553907 3.579000 3.553907 2012 3.477986 3.630000 3.477986 2013 3.403688 3.624000 3.403688 2014 3.330977 3.711000 3.330977 2015 3.259819 3.646115 3.260258 2020 2.926191 3.635843 2.951722 2025 2.626709 3.636665 2.746825 2030 2.357878 3.636170 2.652107 2035 2.116560 3.636343 2.627312 2040 1.899940 3.636310 2.626315 2045 1.705490 3.636312 2.627660 2050 1.530941 3.636313 2.627958 将所得数据制成图像(纵坐标为生育率,单位为%): 图 7 我国未来生育率的预测 经分析与比较,GM(1,1)模型误差相当大,即使对短期预测也是如此,导致组 合模型误差也十分大,故这里我们只采用 NAR 神经网络模型的数据。结合数据和图 像分析可知,我国生育率在 2010 年之后始终稳定在一个较低的水平,波动相当小 (2010 年之前的分析我们在下面讨论中给出) ,趋近于 3.63%。 如此看来,我国将面临严重的人口老龄化问题,所以我们推测中国会在不久的 将来全面开放生育, “单独二孩”和“全面二孩”政策的连续颁布就是一个趋势, 但是我们不认为中国在未来 30 年内会出台鼓励生育的政策,由于我国人口基数过 于庞大,且人民生活水平不断提高,鼓励生育对于我国财政来说将会是一笔巨大的 支出,同样是因为人口基数庞大,我国还能承受的人口数量十分有限,鼓励生育一 旦控制不好,后果难以想象。 GM(1:1)模型 NAR神经网络模型 GM(1:1)与 NAR神经网络组合模型 12 上述分析及结论整合如下表: 预测项目 短期 中长期 结论 人口数量 增长率平稳下降,总量继续 增长,将于 2020 年、2030 年分别达 14.11 亿人和 14.84 亿人 总量将于 2045 年前后 达到峰值 15.20 亿人, 之后缓慢下降 年龄结构 65 岁及以上的人口比例持续 上升,14 岁及以下的持续降 低。到 2030 年,65 岁以上 老年人口比例将高达 13.19%,14 岁及以下的将低 至 10.61% 上升下降的速度逐渐减 小,2050 年前后 65 岁 以上老年人口比例将至 14.63%,而 14 岁及以 下人口比例将降至 6.34% 生育率 始终稳定在较低水平,趋近于 3.63%,波动相当小 我国将面临严 重的人口老龄 化问题,预测 我国会在不久 后全面开放生 育,但至少在 未来 30 年内 不会出台鼓励 生育的政策 5.第 2小问 先给出计划生育政策发展的历程 6 7 : 表 4 计划生育政策发展的历程 时间 所处阶段 1953-1961年 节制生育的提出阶段 1962-1969年 提倡计划生育的试点阶段 1970-1982年 提倡“晚、稀、少”的生育政策阶段 1983-2000年 计划生育政策的提出与完善阶段 2001-2012年 第九届人大会议通过中华人民共和国人口与计划生育法继续完善和调整生育政策阶段 2013-2014年 实施“单独二孩”政策 人口数量随时间的变化及计划生育政策对其影响的分析 为了分析评价计划生育政策对我国人口数量的影响,我们决定查询1954-2014 年的数据(见附录1表1),将计划生育从试点实施到全面施行的时间包含在内。拟 合后的结果如图5所示: 图 8 人口数量随时间的变化 (注:横坐标为年份,纵坐标为人口数量,单位为亿) 从图 8 可以看出我国人口数量一直处于上升阶段,结合表 4 可知,计划生育实 施之前几乎是呈线性增长的,实施之后人口增长速率立即得到了有效的控制,人口 数量也在实施 30 年之后基本稳定了下来,但仍在缓慢上升,由于我国人口基数庞 大,每年增加的人口数量仍然不容忽视。 年龄结构随时间的变化及计划生育政策对其影响的分析 为了分析评价计划生育政策对我国年龄结构的影响,我们决定查询1954-2014 年的数据(见附录1表3),将计划生育从试点实施到全面施行的时间包含在内。拟 合后的结果如图6所示: 13 图 9 年龄结构随时间的变化 结合表 4,从图 9 可以看出在计划生育政策实施之前,我国 65 岁及以上的人 口比例一直维持在 5%左右的水平,14 岁及以下的人口比例也保持在 37%左右。然 而自计划生育开始实施,我国 65 岁及以上的人口比例就开始上升,并在 2001 达到 7%以上,我国进入老龄化社会,与此同时 14 岁及以下的人口比例不断下降。 生育率随时间的变化及计划生育政策对其影响的分析 为了分析评价计划生育政策对生育率的影响,我们决定查询1954-2014年的数 据(见附录1表2),将计划生育从试点实施到全面施行的时间包含在内。拟合后的 结果如图7(年份为横坐标)所示: 图 10 生育率随时间的变化 结合表 4 可以看出,在二十世纪五六十年代,计划生育实施之前我国生育率一 直维持在一个相当高的水平,接近 10%。而到了七八十年代,部分地区展开试点工 作,计划生育政策即将全面施行,生育率大幅下降,直至二十一世纪,开始稳定在 4%以下,处于较低水平。之后国家颁布了“单独二孩”政策,但效果甚微,到了 2015 年(我们的数据中未体现),又颁布了“全面二孩”政策,效果有待进一步 考察。 上述分析及结论整合如下表: 分析项目 计划生育实施之前 计划生育实施之后 人口数量 几乎呈线性增长 人口增长速率立即得到有效控制,人口数量 在实施 30 年之后基本稳定,但仍在缓慢上 升 年龄结构 65 岁及以上人口比例一 直维持在 5%左右,14 岁 及以下的也保持在 37%左 右 我国 65 岁及以上的人口比例开始上升,并 在 2001 达到 7%以上,我国进入老龄化社会, 与此同时 14 岁及以下的人口比例不断下降 生育率 一直维持在一个相当高的 水平,接近 10% 在二三十年内直接从接近 10%降至 4%以下, 但 2010 年之后始终稳定在 3.63%左右 14岁及以下 15-64岁 65岁及以上 14 社会经济发展对生育率影响的分析 通过查询中华人民共和国国家统计局所公布的中国统计年鉴的数据,我们可以 得到中国 20012014 年妇女受教育程度、社会保障体系完善程度、生活成本、妇 女生育年龄的相关数据数据(见附录 2)。我们 MATLAB 中的拟合工具箱中的多项 式曲线对这些数据进行拟合,得到拟合后的图像,并进行分析。 (注:对生育率下降原因进行分析时所用到图像的纵坐标均为生育率100,横坐 标为相应的影响因素的衡量数据) A.妇女受教育程度与生育率的关系 我们先将妇女受教育程度分档次数据化,如下表 学历档次 未上过学 小学 初中 高中 大专及以上 评判数值 1 2 3 4 5 将评判数值按每一年不同学历档次的妇女人数占该年妇女总人数比率(见附录 2 表 1)加权所得的数值,作为我们对妇女受教育程度的衡量指标,记为 E。E 越大, 表明该年妇女的整体受教育程度越高。拟合后的结果如图 11(E 为横坐标)所示: 图 11 妇女受教育程度与生育率的关系 从图 11 中可以看出妇女受教育程度越高,生育率反而越低,最后趋近于一个 常量。当 E2.7 时,生育率趋近于 3.626%。这样,我们用数据验证了“妇女的教 育程度越高,其职业成就就可能越大,对于妇女来说生孩子的机会成本就较大,因 此,就会减少生育”这一观点。 B.社会保障水平与生育率的关系 我们查询中华人民共和国国家统计局所公布的中国统计年鉴之后,经过分析, 决定用国家财政每年对社会保障与就业、住房保障和城乡社区的支出总和占国家总 财政支出的百分比(见附录 2 表 2),来衡量我国的社会保障水平。我们把这个百 分比记做 S,S 越大,表明该年我国社会保障水平越高。拟合后的结果如图 12(S 为横坐标,单位为%)所示: 图 12 社会保障水平与生育率的关系 15 从图 12 中可以看出,生育率随着社会保障水平的提高,先降低,后升高。社 会保障水平偏高(S22)和偏低(S17)时,生育率都处在一个较高的水平,当 社会保障水平维持在较高程度(S 约为 19.67)时,生育率将达到最低,约为 3.54%。 这个结论与“社会保障体系的完善就使得不需要养儿来防老 ”这一观 念略有不同,当社会保障水平达到高水平时,我国的生育率反而会开始上升。这个 结论同样也说明了我国与西方发达国家的差异,在高社会保障水平的情况下,西方 发达国家的生育率会下降,但我国反而会上升。 C.生活水平与生育率的关系 经过分析,我们决定直接采用恩格尔系数(见附录 2 表 3)来衡量生活水平的 高低,拟合后的结果如图 13(恩格尔系数为横坐标,单位为%)所示: 图 13 生活水平与生育率的关系 恩格尔系数达 59%以上为贫困,50-59%为温饱,40-50%为小康,30-40%为富裕, 低于 30%为最富裕。结合图 13,我们可以得到与社会保障水平相互印证的结论,那 就是生活水平不断提高的过程中,生育率先下降再升高。当生活水平较低(恩格尔 系数40%)时,生育率较高,当生活水平达到富裕或最富裕时,生育率较低,但 当恩格尔系数37%时,生育率又会开始上升,进一步说明了,在我国,高生活水 平会使得生育率上升。 D.妇女生育年龄(即两代间的年龄差)与生育率的关系 妇女生育年龄这一数据(见附录 2 表 4)可直接作为我们图像中的横坐标,对 数据进行拟合后我们得到图 14: 图 14 妇女生育年龄与生育率的关系 从图 14 中可以看出妇女生育年龄越大,生育率反而越低,最后趋近于一个常 量,类似于指数函数。当妇女生育年龄32.3 岁时,生育率随着妇女生育年龄的 增大急剧减少,当妇女生育年龄在 33 岁以上时,生育率趋近于 3.6%。 生育率影响因素的综合分析 16 上述前四个因素,即:妇女受教育程度、社会保障水平、生活成本、妇女生育 年龄,均是受社会经济发展所影响的因素,社会经济发展导致这些因素发生变化, 进而对生育率产生影响,具体如何产生影响,我们在前面的分析中已经说明。最后 我们所探究的生育率随时间的变化,反映了计划生育政策对生育率的影响。 从图 11 到 14 中可以看出,社会经济发展对生育率的影响基本只有在我国经济 发展到较高水平,生育率已经处在低水平的时候才比较明显。在我国经济实力较弱 的二十世纪七八十年代,影响生育率的主要因素是计划生育政策,计划生育政策的 实施在二三十年内将我国的生育率从接近 10%降到了 4%以下,这时社会经济发展对 生育率的影响处在一个相当次要的地位。到了二十一世纪,我国经济实力已经得到 了很大的提高,这时计划生育政策对生育率的影响退居次要地位,从 2013 年“单 独二孩”政策收效甚微就可以看出这一点,而社会经济发展的影响占主要地位。 六.模型和算法的分析与评价 1.GM(1,1)模型评价推广 GM(1,1)模型优点 灰色 GM(1,1)预测模型在计算过程中主要以矩阵为主,它与 MATLAB 的结合解 决了它在计算中的问题。由 MATLAB 编制的灰色预测程序简单实用、容易操作且预 测精度较高。 GM(1,1)模型的缺点 该模型是指运用曲线拟合和灰色系统理论对我国人口发展进行预测的方法,因 此它对历史数据有很强的依赖性,而且 GM (1,1)的模型没有考虑各个因素之间的 联系,因此误差偏大,尤其是对中长期预测,比如对中国人口总数变化情况做长期 预测时,误差会偏大,使得预测结果脱离实际。 GM(1,1)模型的推广 在对生育率的预测中我们发现 GM(1,1)模型的预测误差相当大,即使对短期预 测也是如此。于是我们对 GM(1,1)模型的适用范围产生了疑问,继续深入分析后我 们发现,GM(1,1)模型并不是对所有的情况都适用。下面我们来讨论 GM(1,1)模型 的适用范围: 在前面我们已经给出 GM(1,1)模型发展系数 a 的定义: 在 GM(1,1)模型的白化微分方程 中, a 为发展系数。uXdtll)()( 有命题:当 GM(1,1)发展系数|a|2 时,GM(1,1)模型无意义。 通过分析,有下述结论: a的范围 GM(1,1)模型的适用范围 -a0.3 可用于中长期预测 0.3-a0.5 可用于短期预测,中长期预测慎用 0.5-a0.8 用于短期预测应十分谨慎 0.8-a1 应采用残差修正 GM(1,1)模型 -a1 不宜采用 GM(1,1)模型 我们在使用 GM(1,1)模型的时候,所得的-a 值均大于 0.3,故在上述情况中 均不适合采用 GM(1,1)模型进行中长期的预测。在对我国未来生育率进行预测时, a5=-1.1378,不宜采用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论