数学建模论文-人口预测模型_第1页
数学建模论文-人口预测模型_第2页
数学建模论文-人口预测模型_第3页
数学建模论文-人口预测模型_第4页
数学建模论文-人口预测模型_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、中国人口预测模型摘要本文对人口预测的数学模型进行了研究。首先,建立一次线性回归模型,灰色序列预测模型和逻辑斯蒂模型。考虑到三种模型均具有各自的局限性,又用加权法建立了嫡权组合模型,并给出了使预测误差最小的三个预测模型的加权系数,用该模型对人口数量进行预测,得到的结果如下:单位:(万人)年份20062007200820092010预测值134840.9137027.351377785.7139360.4140857.4其中加权系数为:0.24282,0.34055,0.41663其次,建立Leslie人口模型,充分反映了生育率、死亡率、年龄结构、男女比例等影响人口增长的因素,并利用以1年为分组长

2、度方式和以5年为分组长度方式预测短期和长期人口增长,得如下数据:年份2006200720082009201020112012人数(万)130990131230131430131620131800132000132220年份2016-20202021-20252026-20302031-20352036-20402041-20452046-2050人数(万)144000148000150000150000151000150000149000然后对Leslie人口模型进行了改进,构建了反映生育率和死亡率变化率负指数函数,并给出了反映城乡人口迁移的人口转移向量最后我们BP神经网络模型检验以上模型的正

3、确性关键字:一次线性回归灰色序列预测逻辑斯蒂模型Leslie人口模型BP神经网络一、问题重述1 .背景人口增长预测是随着社会经济发展而提出来的。在过去的几千年里,由于人类社会生产力水平低,生产发展缓慢,人口变动和增长也不明显,生产自给自足或进行简单的以货易货,因而对未来人口发展变化的研究并不重要,根本不用进行人口增长预测。而当今社会,经济发展迅速,生产力达到空前水平,这时的生产不仅为了满足个人需求,还要面向社会的需求,所以必须了解供求关系的未来趋势。而人口增长预测是对未来进行预测的各环节中的一个重要方面。准确地预测未来人口的发展趋势,制定合理的人口规划和人口布局方案具有重大的理论意义和实用意义

4、。2 .问题人口增长预测有短期、中期、长期预测之分,而各个国家和地区要根据实际情况进行短期、中期、长期的人口预测。例如,中国人口预期寿命约为70岁左右,因此,长期人口预测最好预测到70年以后,中期4050年,短期可以是5年、10年或20年。根据2007年初发布的国家人口发展战略研究报告(附录一)及中国人口年鉴收集的数据(附录二),再结合中国的国情特点,如老龄化进程加速,人口性别比升高,乡村人口城镇化等因素,建立合理的关于中国人口增长的数学模型,并利用此模型对中国人口增长的中短期和长期趋势做出预测,同时指出此模型的合理性和局限性。二、问题的基本假设及符号说明问题假设1 .假设本问题所使用的数据均

5、真实有效,具有统计分析价值。2 .假设本问题所研究的是一个封闭系统,也就是说不考虑我国与其它国家的人口迁移问题。3 .不考虑战争瘟疫等突发事件的影响4 .在对人口进行分段处理时,假设同一年龄段的人死亡率相同,同一年龄段的育龄妇女生育率相同。5 .假设各年龄段的育龄妇女生育率呈正态分布6 .人类的生育观念不发生太大改变,如没有集体不愿生小孩的想法。7 .中国各地各民族的人口政策相同。符号说明ai(t)第t时间区间内第i个年龄段人口总数Ci(t)第t时间区间内第i个年龄段人口总数占总人口的比例Cik(t)第t时间区间内第i个年龄段中第k年龄值人口总数占总人口的比例A(t)第t时间区间内各年龄段人口

6、总数的向量P(t)第t时间区间各年龄段人口总数向量转移矩阵bi(t)第t时间区间内第i个年龄段人的生育率di(t)第t时间区间内第i个年龄段人的死亡率dik(t)第t时间区间内第i个年龄段中第k年龄值的死亡率s(t)第t时间区间内第i个年龄段人的存活率h(t)第t时间区间男性人数与女性人数的比值ei(t)第t时间区间内第i个年龄段育龄妇女的生育率m每个年龄段上年龄值的数目三问题分析本问题是一个关于人口预测的问题,与以往不同,本问题需要根据中国特殊的国情去研究,我们根据对问题的分析并结合实际情况认为对人口产生主要影响的因素有以下四个:生育率、死亡率、年龄结构、男女比例。在这里需要说明的是对于人口

7、产生影响的一些因素,如经济发展状况,生态环境情况、已蜡夫妇对生育所持的态度、医疗技术的发展等,我们认为它们对人口的增长是通过作用于以上四个指标而间接发挥作用的。而对于诸如战争爆发、疾病流行等突发因素,由于其不可预测性,我们不考虑1 .生育率生育率代表育龄妇女生育人口的能力,从一定意义上讲生育率的高低控制着人口增长率高低,通常来说生育率越高人口增长率越高,所以说生育率是人口增长的源头。生育率的影响因素很多,首先是年龄因素,不同年龄段的育龄妇女的生育率不同,通常20岁至30岁的育龄妇女的生育率最强;此外是地域因素,受政策因素、观念认识、周边环境等影响乡村育龄妇女的生育率高于城市育龄妇女的生育率;还

8、有其它因素的影响,比如大规模疾病会降低育龄妇女的生育率。2 .死亡率死亡率表示一定时期内一个人口群体中死亡的人数占该人口群体的比值,和生育率一样死亡率的高低同样控制着人口增长率高低,如果说生育率是人口增长的源头,则死亡率是人口增长的汇点。同样影响死亡率的因素很多,首先不同年龄段的死亡率不同,通常老年人和刚出生的婴儿的死亡率较高;从长远来看,随着医疗水平的提高,整个人口群体的死亡率将会成下降趋势;此外一些突发事件,如战争、疾病等,将会使使那一段的人口死亡率大幅度提高。3 .年龄结构年龄结构反映了总体人口在各年龄段分布情况,年龄结构蕴涵的信息量很大,从其中我们可以实现对很多问题的分析,比如从年龄结

9、构我们可以分析出社会的老年化程度,此外从年龄结构我们可以判断出不同时间段人口出生的情况,比如年龄结构不仅反映了总体人口在各年龄段分布情况,而且考虑到不同年龄段人口生育率、死亡率不同等情况,我们可以在年龄结构中有效反映这些差异4 .男女比例男女比例反映了总体人口中男性与女性人数的比较关系,男女比例值能反映出体人口中男性与女性人数是否协调,男女比例主要受男女出生比和男女死亡率的影响,男女出生比正常范围在103107,也就是说出生100个女儿的同时会有103107个男儿出生,但是在现实社会中,女性死亡率低于男性,所以男性与女性人数大致相等,社会维持在一个稳定状态。但目前我国男女出生比超过110,这不

10、仅将导致男女比例失调,还会对人口的预测产生影响,所以在人口预测时必须将男女比例问题考虑进去。考虑到人口预测分为中短期预测和长期预测,两类预测因为涉及的时间长短不同,所以考虑的因素不同,采用的方法不同。对于中短期预测,我们假设生育率、死亡率、年龄结构、男女比例均维持在同一稳定水平,这样我们采用方法有很多,。对于长期预测,我们需要考虑生育率、死亡率、年龄结构、男女比例等因素随时间变化,此外城乡人口迁移对城乡人口结构产生影响,尽管以上因素短期内积累效应较小,但在长期中必须考虑。在预测方法上我们选用了基于以往人口数据的一次线性回归,灰色、时间序列预测,逻辑斯蒂模型和基于年龄结构并生育率、死亡率随时间L

11、eslie人口模型中国人口预测模型中按人口统计量建立模型按影响增长因素建立模型长期一次线型回归中逻辑斯蒂干灰色预测Leslie人口模型BP神经网络模型四数学模型4.1. 嫡权组合模型有关于人口增长预测的模型很多,比如灰色GM(1,1),移动平均数法,指数平滑法,一元线型回归,马尔萨斯人口模型,宋健人口模型等等,但是每种预测方法的精度往往也不同。组合模型和单个模型比起来,具有较高的预测精度,组合预测的关键就在于确定各个预测方法的权重。本文将从一个新的角度进行研究,即从信息论的观点出发,根据各个体预测方法误差指标的信息嫡,确定组合预测模型的权重,进行人口组合预测模型。本文选用了一元线性回归法,逻辑

12、斯蒂模型法,灰色GM(1,1)模型法对中国人口增长进行预测。而1978至2005年的数据见本文表一。.4.1.1灰色预测模型1.模型建立灰色系统是指部分信息已知,部分信息未知的系统。灰色系统的理论实质是将无规律的原始数据进行累加生成数列,再重新建模。由于生成的模型得到的数据通过累加生成的逆运算一一累减生成得到还原模型,再有还原模型作为预测模型。预测模型,是拟合参数模型,通过原始数据累加生成,得到规律性较强的序列,用函数曲线去拟合得到预测值。灰色预测模型建立过程如下:1)设原始数据序列X?Wn个观察值,X(0)=x(0l1)X(l2).,X(0Xn,通过累加生成新序列X)=xC*1)XC*2).

13、,xCtn,利用新生成的序列X(虫拟和函数曲线。2)利用拟合出来的函数,求出新生序列XC柏预测值序列X(1)3)利用X(0)(k)=X(1)(k)-X(1)(k-1)累减还原:得到灰色预测值序列:Xo=Xo(1),X02,.凡力而(共n+m个,m个为未来的预测值)。将序列XC疥为乂和Z。,其中Y0反映X?)的确定性增长趋势,Zo反映X()的平稳周期变化趋势。利用灰色GM(1,1)模型对X()序列的确定增长趋势进行预测2模型求解根据2006全国统计年鉴数据整理得到全国历年年度人口统计表如表1.表1:全国历年年底的人口统计年份1978年1980年1985年1989年1990年1991年1992年总

14、人口/万人9625998705105851112704114333115823117171年份1993年1994年1995年1996年1997年1998年1999年总人口/万人11857119850121121122389123626124761125743年份2000年2001年2002年2003年20042005年总人口/万人126743127627128453129227129988130756根据上述数据,建立含有20个观察值原始数据序列X(上X0-196259987051058511127041111276271284531299881307561利用Matlab软件对原是数列X?让

15、行一次累加,得到新数列为X(1),如表2:表2:新数列X1加差和误差率X0X(*2)xCXC*4)X(15)XC6)X(27)XC8)拟核值108504109773111056112354113668114997116343误差-9799.1-3921.81647.81978.32154.62173.62175.0误差/%-9.93-3.701.461.731.861.861.84xOXC*9)X10)X()11)X(1%12)XC13)XC14)XC15)拟核值117702119079120471121879121879123304124746误差2147.72042.51918.21746

16、.61456.61039.9538.3误差/%1.791.691.571.411.170.830.42xOX。*16)X。)17)X。)18)X/19)Xt20)X(1)(21)拟核值126204127680129173130683132211133757误差-53.3-720.1-1456.4-2223.4-3001.3-3010.4误差/%-0.04-0.56-1.13-1.71-2.30-2.421、利用表2,拟合函数,如下:00116241x(t1)=9280043e-91837842、精度检验值c=0.3067(很好)P=0.9474(好)3、得到未来20年的预测值:表3:全国历年年

17、底的人口统计未来20年预测值年份2006年2007年2007年2008年2009年2010年2011年总人口/万人135321.2136903.4138504.1140123.5141761.9143419.4145096.2年份2012年2013年2014年2015年2016年2017年2018年总人口/万人146792.7150245.5152002.2153779.4155577.4157369.5159236.8年份2019年2020年2021年2022年2023总人口/万人161098.7162982.2164887.8166815.7168766.24.1.2 一元线性回归法根据表

18、一中的数据,本文建立一元线性回归模型Y=a+bX进行预测;Y为人口数单位:万人X为年份。利用Matlab软件,用麦夸特法进行回归拟合,得到拟核值及回归方程,如下:表八一元线性回归模型拟合值104546.9106119.3107691.6109264110836.4112408.8113981.2拟合值M15553.5117125.9118698.3120270.7121843.1123415.5124987.8126560.2128132.6129705131277.4132849.7134422.1由此,建立如下的一元线性回归方程Y=102974.50531572.3805X相关系数:R=0

19、.93594.1.3 逻辑斯蒂模型(Logisticgrowthmodel)考虑自然资源和环境对人口的影响,并以Nm记自然资源和环境条件所能允许的最大人口数。把人口增长的速率除以当时的人口数称为人口的净增长率。如果人口的净增长率随着N(t)的增加而减小,且当N(t)TNm时,净增长率趋于零。因此人口方程可写成如以r(1-叫N(t)dtNm其中r为常数,此模型就叫逻辑斯蒂模型。我们把1978年至2005年全国历年年底总人口的数值组成一个观察矩阵,其中的每一个数值称之为观察值。本文利用spss软件,得出与观察值一一映射的拟核值,残差值和cook距离,见下表:表九用spss软件得到各观察值所对应的拟

20、核值,残差值和标准残差拟合值97077.7101458.9105412.6108940.84112057.91114787.4117159.2残差-818.74-2753.91438.353763.152275.081035.5111.73标准残差-0.7505-2.05480.30512.56991.55370.70980.0080拟合值119206.2120962.7122462.4123737.3124817.2125729.2126497.3残差-689.28-1112.76-1341.41-1348.34-1191.28-968.25-711.37标准残差.-0.4707-0.754

21、0-0.9009-0.8985-0.7899-0.6410-0.4720拟合值127142.9127684.4128138.0128517.4128834.5129099.2残差-399.93-57.47314.93709.501153.451656.76标准残差-0.2670-0.03870.21470.49060.81010.941从新数据得到F=372.3471p值=0.001本文建立逻辑斯蒂模型:y=130517.5/(19884.8相关系数R=0.98884.1.4 .组合模型建立1、嫡权法的概念及基本步骤嫡权法是一种决定指标的方法,我们知道,综合指标取决于单个指标数的确定,一般情况

22、下的权重是根据经验来确定的,但是这种确定权重的方法缺少科学根据,也不能保证确立的综合指标能反映原始指标的大部分信息,且权重的确立因人而异,所以其应用受到了限制,而嫡权法就能够避免这些问题,使权重的确立具有科学的根据,具有说服力。嫡权法的步骤确立如下:计算第j项指标下第i个方案的指标比重pu=YijmYiji1m(k=Inm计算指标j的嫡值ej=-kZpjInpjiW计算第j项指标的差异系数gj=1-ej定义权重Wij=-mjgji1则Wj就为嫡权法确定的权重。2、误差指标的选举为了能全面的各个预测方法以及组合预测的预测效果,必须制定一套切实可行的误差指标。按照预测效果的评价惯例,本文选取如下指

23、标作为参考:(1)、平方和误差n2SSE-(Yi-)t=1(2)、平均绝对值误差Yi-Yi1/MAE=一ntw(3)、均方误差MSE(V-乂)n.t/(4)、平均绝对值百分比误差(yi-yi)1nMAPE二nt4(5)、均方百分比误差(yi-yi)23、组合模型权重的确定设以选定m种个体预测方法,n个误差指标,m种个体预测方法对应n个误差指标构成了评价指标值矩阵;R=(rj)mn第j个指标下第i种个体方法的指标比重值Pj为Pij=rm/rijij11第j个指标的嫡值为:PjlnPjej=lnEj第i个指标的权重为:m=(1-ej户(ej)I记矩阵R中每列最优值为口二对该矩阵所有元素做标准化处理

24、,可得:|rij/r节旨标j的指标值越大越好djj/rj指标j的指标值越小越好这样,各个体预测方法的嫡权评价值九可以表示为:mi?d(ji=0,1,12,m,)11将上式进行归一化处理,即可以得到各个个体的权重4.1.6嫡权组合模型求解本文利用Matlab软件对上述的模型、指标进行综合的运算处理,得到嫡权系的基本数据资料,见下表:加权系数为:0.24282,0.34055,0.41663。年份20062007200820092010预测值134840.9137027.351377785.7139360.4140857.44.2Leslie人口模型4.2.1模型建立在这里我们将人口按年龄大小等分

25、为n个年龄组,记i=1,2,,n同时将时间离散为时段,长度与年龄组区间相等,记k=1,2,定义d(t)为第t时间区间内第i个年龄段人口总数,bi(t)为第t时间区间内第i个年龄段人的生育率。则有下面关系:na1(t1)=ai(t)bii1定义第i年龄组在1时段内的死亡率为di,则存活率为6=1-di则有下面关系aiKt1)=ai(t)s(,i=1,2JH,n-1定义A(t)为第t时间区间内各年龄段人口总数的向量人二母鼻川定义P(t)为第t时间区间各年龄段人口总数向量转移矩阵4501H0b20s2:P(t)=H00工0bn.:0Sn-1:bn0IIIIII0J由以上定义有进而有以下关系n1A(t

26、)=A(1)P(i)i1需要说明的是为减小误差每次计算A(t)完后用公式an(t+1)=an(t)MSn+Hn(t)父Sn校正3n(t+1)4.2.2数据分析及处理我们分别对m=1和m=5进行说明m表示每个年龄段上年龄值的数目4.2.2.1 对于m=1的情况,1、各年龄分层人口占总人口的比率对于m=1的情况,各年龄分层人口占总人口的比率就是各年龄值占总人口的比率,为消除各年数据随机性我们我们采用对各年数据取平均值的方法得到数据。2、各年龄分层人口的死亡率与上面分析相同我们采用对各年数据取平均值的方法得到数据。3、各年龄分层上育龄妇女的生育率通过观察我们发现2003年生育率很低,我们猜想这是由于

27、那一年有非典的原因,因此在剔除这一年的数据后对各年数据取平均值的方法得到数据。我们假设各年龄分层上育龄妇女的生育率呈正态分布进行数据拟合。图2m=1时育龄妇女的生育率正态分布图4.2.2.2 对于m=5的情况为了实现年龄结构分析,同时也为了对生育率和死亡率这些与年龄段有明显联系的指标分析我们决定对人口统计数据进行年龄分层处理。具体实现办法为以5年为年龄分段长度对附件中数据进行分层,例如04岁为第1年龄段,1519岁为第4年龄段,90岁以上老人由于所占比例较小,不对统计产生显著影响,故与最后一组一起研究。需要说明的是与m=1情况的处理方法一样,我们先对各年数据取平均值的方法得到分析数据。1 .各

28、年龄分层人口占总人口的比率附表的数据给出了不同年龄值男性和女性人数占总人数的比率,对于某一年龄段人口占总人口的比率为该年龄段中各年龄值男性或女性人数占总人数的比率之和,公式如下5Cij(t)=、Gjk(t)k=1式中j=1,2其中1表示男性,2表示女性附表中给出的数据是分别给出男性比率和女性比率,这里由于我们要把男女作为一个整体,所以我们对各年龄分层男性比率和各年龄分层女性比率相加得到各年龄分层人口占总人口的比率,公式如下Ci(t)=Ci1(t)-Ci2(t)式中Ci(t)表示第t时间区间内第i个年龄段人口总数占总人口的比例?表示第t时间区间内第i个年龄段中男性比率加表示第t时间区间内第i个年

29、龄段中女性比率2 .各年龄分层人口的死亡率各年龄分层男性死亡率或女性死亡率为各年龄分层中不同年龄值男性死亡率或女性、系数加权得到,公式如下:5ckij(t)dkij(t)dij(t)Ckij(t)k=1式中j=1,2其中1表示男性,2表示女性与上面一样我们对各年龄分层男性死亡率和各年龄分层女性死亡率系数加权得到第t时间区间内第i个年龄段人的死亡率d_C1(t)di1(t)Ci2(t)di2(t)iq1(t)与式中di(t)表示第t时间区间内第i个年龄段人的死亡率%(t)表示第t时间区间内第i个年龄段男性的死亡率di2(t)表示第t时间区间内第i个年龄段女性的死亡率在这里需要说明的是第0岁较高,

30、出现奇异,分析原因我们认为这是婴儿的出生造成的,我们对第1个年龄段人的死亡率进行校正,5kk、Cij(t)dij(t)dij(t)工cj(t)k2说明:为便于表示令第0岁为第1年龄值表10城镇乡各年龄段人口的死亡率城1.64880.268030.219260.329180.368740.43237镇2.37760.337350.31755P0.491860.684.1292乡4.05890.497890.461640.882891.29821.4728城0.618710.933161.44752.4933.50185.2388镇0.865221.27531.852.81084.45516.69

31、04乡1.80952.08852.52543.85545.12567.9473城8.922815.18124.60141.70669.243104.09镇10.6817.74429.18749.5981.08588.734乡13.105:21.89437.0459.39294.537114.413.各年龄分层上育龄妇女的生育率同以上分析e(t)为每个年龄段上对应各个年龄值的育龄妇女的生育率之和我们假设e(t)呈正态分布:E图3m=5时育龄妇女的生育率正态分布图4.2.3 模型求解4.2.3.1 对于m=1的情况表Hm=1时人口预测年份|2006200720082009201020112012人

32、数(万130990131230131430131620131800132000132220人)图4m=1时人口预测图象4.2.3.2 对于m=5的情况表12m=5时人口预测年份2006-20102011-20152016-20202021-20252026-20302031-20352036-20402041-2045人数(万人)134000139000144000148000150000150000151000150000图5m=5时人口预测图象4.2.4 模型改进1 .考虑到生育率和死亡率是随时间变化的,我们可以定义生育率和死亡率为时间函数(1)生育率影响生育率因素有受政策因素、观念认识、

33、周边环境等,通常来说农村的生育率高于城市,为了有效区分这种差异性,我们定义b(t)为反映城、镇、乡平均生育率水平的基准生育率,定义cb(t)、tb(t)、vb(t)分别为城、镇、乡平均生育率贝Ucb(t)=a1Mb(t),tb(t)=a2Mb(t),vb(t)=a3Mb(t)其中a1、a2、a3为反映生育率高低的系数,系数的大小根据具体情况确定显然有a1:二a2:二a3考虑到随着时间的推移,计划生育政策深入人心,农村生育率将降低用下面函数反映这种变化vb(t)=vb(0)ae式中a,b为参考系数(2)死亡率随着时间的推移,医疗水平的提高,死亡率将下降,但死亡率中有一部分是非疾病死亡,对于青年人

34、死亡率比较平稳,死亡率变化主要体现在老年人。定义di(t)为第t时间区间内第i个年龄段人的死亡率di(0),i1di(t)=八di(0)ae,i1式中a,b为参考系数,用来区分青年与中老年2 .考虑到城乡人口转移因素城乡人口转移将会对城乡人口结构产生影响,因此必须进行研究,考虑到人口主要是从镇转入城,从乡转入城,从乡转入镇因此定义B(t)为从镇转入城的转移向量,C(t)为从乡转入城的转移向量,D(t)为从乡转入镇的转移向量。以C(t)为例说明转移向量,C(t)-1wi(t)M(t),W2(t)V2(t)J|,wn(t)vn(t)?式中Vi(t)表示第t时间区间内第i个年龄段的农村人数,W(t)

35、表示第t时间区间内第i个年龄段人的农村转入城市的百分比则A(t)=A(t)+B(t)+C(t)表示城乡人口转移后的人口向量每次计算完A(t)=A(t-1)P(t-1)再计算A(t)=A(t)+B(t)+C(t)3 .2.5模型优缺点分析1. Leslie人口模型可以分析不同年龄组生育率与死亡率不同的情况2. Leslie人口模型中可以考虑生育率与死亡率随时间变化的情况3. Leslie人口模型中可以分析出年龄结构的情况4. Leslie人口模型中对给出的关于年龄结构的统计数据要求较高5. Leslie人口模型对男女比例不平衡情况反映敏感6. Leslie人口模型中选取分组的年龄段长度不同,适于

36、的预测期长短不同4.3BP神经网络人口预测模型基于BP神经网络的时间序列预测模型与传统模型不同的是:此模型只需以历史数据作为输入,通过抑制与激活神经结点,自动决定影响性能的参数及影响程度,自动形成模型,无需进行模型假设,再加上神经网络对复杂的非线性系统具有曲线拟核能力,预测能力强,所以是合适的对比检验模型。matlab实现:P为输入样本矢量集;T为对应的目标样本矢量集.设:输入样本p=1996199719981999200020012002200320042005(年份归一化后的数据)p=0.19960.19970.19980.19990.20.20010.20020.20030.20040.

37、2005输出样本观测值(对应1996-05年的总人口归一化后的数据):T=0.1223890.1236260.1247610.1257860.1267430.1276270.1284530.1292270.1299880.130756采用神经网络模型进行运算,系统仿真产生输入数据的收敛结果见图示:Performanceis1.09337e-009,Goal论0M舞函数ammgucsl一lu600jrl40on300llrl_2LjLo图6:BP训练函数表13:BP算法的结果:年份20062007200820092010201120122013人口数(万131340131940132490133

38、010133490133940134360134750五模型优缺点的评判在上文中,每个模型的后面,针对该模型的优缺点本文都做了深刻地评判,此时就不再重复赘言了,却还没有从宏观角度出发,对本文的所有模型进行整体的优缺点的总评判。优点:1、具有很好的创新性,在对传统模型的理解的基础,取模型之长,利用嫡权法对模型进行组合预测,大幅度提高了预测准确度;2、本文的思路宽阔,在不同时期,建立起不同的模型,能够与实际紧密的联系,结合当前具体国情,对问题进行求解,使该模型具有很好的推广性和通用性;3、模型的的计算采用专业软件求解,例如Matlab软件,spss软件,dps软件等,数据可信度较高。4、对于题目附

39、录里为涉及到的数据,均到“中国统计局”下载官方数据加以补充,并且对论文中涉及到的众多影响因素进行了量化处理,使得论文的说服里更强,实际性更高。缺点1、影响人口增长预测的动态因素很多,而且不可能都能波及到,所以模型与实际还是有一些距离的;2、不同模型在相应的时间阶段具有很高的预测能力,但是一旦脱离了这个时间阶段,模型的预测能力就会回落。六全文总结人口预测就是根据一个国家、一个地区人口的现状,考虑到社会政治经济条件对人口再生产和转化的影响,分析其发展规律,运用科学的方法测算未来某个时期人口的发展状况。人口的预测包括通常指的是中短期预测和长期预测。为了能够提供合理地预测值,本文进行了深刻地研究,建立

40、了4个模型,进行全方位的深刻讨论。通过,灵敏度的分析比较,模型一适合中短期的预测,模型二综合面广,考虑全面,在本文假设的条件下,就符合中国人口特点,例如,老龄化进程加速、出生人口性别比持续升高,以及乡村人口城镇化都作为模型中的因子元素,对中国的人口未来长期发展状况进行了科学性的预测。本论文的创新性和技术性主要表现在这几个方面:1、本文为了提高预测的精确度,对于各种的传统预测方法,有针对性的做了筛选,通过权重关系,建立起了组合模型,特别地在权重问题上,采用了嫡权法分配权重,思路巧妙,可以为以后提供合理参考。2、本文建立BP神经网络模型,无需进行模型假设,同时能利用模型自身对复杂的非线性曲线进行拟

41、核,利用拟核函数对人口增长趋势作出了合的预测。3、本文与计算机实用软件,计算机编程紧密的结合在了一起,在本文中运用了诸如spssdps等一些统计性软件,同时利用Matlab进行了一些编程,大大提升了数据的处理能力,也使得数理统计变得不在十分棘手了。4、本文的模型具有很好的推广性,而且在其它领域发挥很好的效果。七相关建议、最近几年中国人口发展特点(一)人口增长速度快但增长速度回落表一:全国历年年底的人口统计年份1978年1980年1985年1989年1990年1991年1992年总人口/万人9625998705105851112704114333115823117171年份1993年:1994年

42、1995年1996年1997年:1998年1999年总人口/万人11857119850121121122389123626124761125743年份2000年2001年2002年2003年20042005年总人口/万人126743127627128453129227129988130756140000.0000120000.0000100000.000080000.000060000.000040000.000020000.00000.00002件中国人口走势2叶农村人口走势图05101520252叶城镇走势系列1(三)人口老龄化加剧男女性别比偏高有所回落(二)农村人口比重大,但人口城市化快

43、速发展0笄不同年龄段性别比系列1二、中国人口的发展趋势预测中国人口的发展趋势有以下几点:目前生育率经过近二十年的控制已达到了较低水平,自然增长率已由1974年22.2%下降到1983年的11.5%,几乎降低了一半,这是世界人口史上罕见的,但生育率继续下降的余地已经不大了。由于20世纪60-70年代生育高潮形成的人口年龄结构的影响,在1995年前后形成一个生育高峰,平均每年进入婚育年龄的人数在1100万对以上,生育率的降低较为困难。中国目前人口死亡率在世界上是属于较低的,随着经济的迅猛发展,生活水平和医疗水平的进一步提高,死亡率继续下降是有可能的。人口城乡结构比较落后,乡村人口比重依然很大,且在

44、相当长的时间里降低乡村的人口生育率仍然较为困难。综上所述,以目前13亿人口为基础,人口增长率能继续得到控制,到21世纪中期将达到16亿。人口学家普遍认为,这是中国人口的极限,即中国土地可负荷和供养的最大人口数。此后我国人口数会略有回落,并在某一时期到达最佳人口数而稳定下来。八参考文献1王能超,数值分析简明教程,北京:高等教育出版社,19992廉庆荣,线性代数与解析几何,北京:高等教育出版社,20023张兴永,MATLA歆件与数学试验,江苏:中国矿业大学出版社,20004张兴永,数学建模简明教材,江苏:中国矿业大学出版社,20045华东师大数学系,数学分析(第三版),北京:高等教育出版社,199

45、86附录%此程序解决长期预测问题ht=1.2121;total_person_05=130756;kind=9;m=3%1.13921.1721121.21表示男女人口比重%total_person_05表示05年的总人数%kind表示哪种人口:城市或镇;%ht表示05年的男比女的比率;%a5表示2005年所有人口分年龄段的占的比率%A表示第t时间段时内各年龄段人口总数占总人口的比例向量bili=a5(:,kind)+a5(:,kind+2)%比例表示人该年龄段的人口比例,a5(:,kind)男性比率a5(:,kind+2)女性比率dead_lv=final_siwang_lv(:,m);de

46、ad_lv=dead_lv/1000;s=1-dead_lv;A=bili*total_person_05/100;%各年龄段的人口数A=A;forsum=1:9%预测45年,5年为一个周期%ShengYu=00010.87660.40182.09427.3072.22290.0442840.0002159100000000%城市生育率0.22690.0923%ShentYu=0.00000020.0279111.087893.191611.82410.00070.00000.00000000000%town生育率ShengYu=00061.0809142.1392113.247730.892

47、42.88520.00100.00000000000%农村生育率p=zeros(18,18);%p表示p矩阵,b=ShengYu*5/1000;%为矩阵赋值,第一列为当年按年龄分段生育率c=1/(1+ht);b=b*c;%c为当年的女性比率,c=1/(1+ht)p(:,1)=b;%s为存活率fori=1:17p(i,i+1)=s(i);enddhj=A(18)A=A*p;A(18)=A(18)+s(18)*dhj;fff(sum,:)=A;end附录二.组合模型预测程序:%组合模型%一元非线性回归yt=96259.000098705.0000105851.0000112704.00001143

48、33.000015823.0000117171.0000118517.0000119850.0000121121.0000122389.0000123626.0000124761.0000125786.0000126743.0000127627.0000128453.0000129227.0000129988.0000130756.0000yt_=97077.7451101458.9137105412.6482108940.8426112057.9144114787.4901117159.2664119206.2898120962.7665122462.4186123737.342012481

49、7.2841125729.2541126497.3789127142.9323127684.4757128138.0659128517.4964128834.5488129099.2384%GM模型yt1=98705.0000105851.0000112704.0000114333.0000115823.0000117171.0000118517.0000119850.0000121121.0000122389.0000123626.0000124761.0000125786.0000126743.0000127627.0000128453.0000129227.0000129988.0000

50、130756.0000yt_1=108504.1027109772.7542111056.2390112354.7306113668.4043114997.4379116342.0107117702.3046119078.5032120470.7927121879.3611123304.3988124746.0982126204.6544127680.2642129173.1272130683.4450132211.4217133757.2639%线性回归yt2=96259.00098705.0000105851.0000112704.0000115823.0000117171.0000118

51、517.0000119850.0000121121.0000122389.0000123626.0000124761.0000125786.0000126743.0000127627.0000128453.0000129227.0000129988.0000130756.0000yt_2=104546.8857107691.6466109264.0271110836.4075112408.7880113981.1684115553.5489117125.9293118698.3098120270.6902121843.0707123415.4511124987.8316126560.2120128132.5925129704.9729131277.3534132849.7338134422.1143n=20;m=3;sse=sum(yt-yt_).A2);mae=sum(abs(yt-yt_)/n;mse=sqrt(sum(yt-yt_).A2)/n;mape=sum(abs(yt-yt_)./abs(yt)/n;mspe=sqrt(sum(abs(yt-yt_)./abs(yt).A2);r(1,1)=sse;r(1,2)=mae;r(1,3)=mse;r(1,4)=mape;

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论