基于MATLAB的人口预测模型.doc_第1页
基于MATLAB的人口预测模型.doc_第2页
基于MATLAB的人口预测模型.doc_第3页
基于MATLAB的人口预测模型.doc_第4页
基于MATLAB的人口预测模型.doc_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

。基于 MATLAB 的人口预测模型摘要本文以 1980-2014 年中国年终总人口数据资料为依据,分别使用了一次拟合、灰色预测模型和时间序列模型进行拟合,最终得出时间序列模型的效果最优,得到了中国人口数量逐年增长,但同时增长速度逐渐放缓的结论,为政府制定人口、经济政策提供了一定的依据。关键词:人口数量;一次拟合;灰色预测;时间序列前言世界人口的迅猛增长引起了许多问题。特别是一些经济不发达国家的人口过度增长,影响了整个国家的经济发展、社会安定和人民生活水平的提高,给人类生活带来许多问题。为了解决人口增长过快的问题,人类必须控制自己,做到有计划地生育,使人口的增长与社会、经济的发展相适应,与环境、资源相协调。我国是世界上人口最多的发展中国家。人口数量多、增长快、可耕地少、国家底子薄,这是我国的基本国情。人口增长过快,严重制约着我国经济和社会发展的进程,影响着人民生活的改善和民族素质的提高。从而造成社会再生产投入不足,严重影响国民经济的可持续发展。认真分析我国目前的人口现状和特点,采取切实可行的措施控制人口的高速增长,提高人口的整体素质,已成为我国目前经济发展中需要解决的首要问题。本文以中国近 35 年的人口数据尝试建立模型,分别建立了一次模型、灰色预测 GM(1,1)模型和时间序列 AR 模型,最终选取了拟合效果最好的时间序列模型,用于说明我国人口问题以及预测短期内人口数量变化,以及为我国即将面临的人口问题提供一些建议。20202020202020202020202020202020。概念与引理定义 11 :人口问题,是由于人口在数量、结构、分布等方面快速变化,造成人口与经济、社会以及资源、环境之间的矛盾冲突。人口数量问题,主要由非均衡生育(多子化和少子化)以及人口迁移造成,只有通过均衡生育(发达国家 2.17 胎,发展中国家 2.3 胎)和调控迁移来解决。人口结构问题,主要包括年龄、性别、收入、人种、民族、宗教、教育程度、职业、家庭人数等人口结构问题;其中最为突出的是年龄(多子化、少子高龄化)、性别(男女比例失调)和收入(基尼系数高、中产塌陷)结构问题。人口年龄结构问题,只有通过均衡生育(发达国家 2.17 胎,发展中国家 2.3 胎)来解决。人口性别结构问题,只有通过限制堕胎来解决。人口收入结构问题,原因较复杂,但最终都只有通过壮大中产阶层,使中产阶层成为社会主体才能真正解决。人口分布问题,主要包括大城市病、高密度连绵城市群的环境污染问题、大片乡村缺少就近(200 公里内)特大城市辐射带动的发展难题、生态气候等自然条件恶劣地区人口的生存困境、以及高密度大流量的人口迁移等问题。人口分布问题,主要是通过城镇化的合理布局,构建合理的城镇体系来解决。定义 22:最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。最小二乘法还可用于曲线拟合。其他一些优化问题也可通过最小化能量或最大化熵用最小二乘法来表达。原理:在我们研究两个变量 x,y)之间的相互关系时,通常可以得到一系列成对的数据1, 1, 2, 2 m, );将这些数据描绘在x y直角坐标系中,若发现这些点在一条直线附近,可以令这条直线方程如(式 1-1)。1(式 1-1)其中:、 1 是任意实数为建立这直线方程就要确定和 1,应用最小二乘法原理,将实测值 与利用计算值1 )(式 1-1)的离差 )的平方和 )2最小为“优化判据”。令: )2(式 1-2)把(式 1-1)代入(式 1-2)中得: 1)2(式 1-3)当 )2最小时,可用函数 对、 1求偏导数,令这两个偏导数等于零。亦即:11)(式 1-4)(式 1-5) 1(式 1-6) )(2) 1 )(式 1-7)得到的两个关于、 1为未知数的两个方程组,解这两个方程组得出:) 1 )(式 1-8)1) (式 1-9)这时把 、 1代入(式 1-1)中, 此时的(式 1-1)就是我们回归的一元线性方程即:数学模型。在回归过程中,回归的关联式不可能全部通过每个回归数据点 1, 1, 2, 2 m, ),为了判断关联式的好坏,可借助相关系数“R”,统计量“F”,剩余标准偏差“S”进行判断;“R”越趋近于 1 越好;“F”的绝对值越大越好;“S”越趋近于 0 越好。 ) ( 22) 22)(式 1-10) *在(式 1-10)中,m为样本容量,即实验次数; 、分别为任意一组实验数据的数值。定义 33 :灰色预测是一种对含有不确定因素的系统进行预测的方法。灰色预测通过鉴别系统因素之间发展趋势的相异程度,即进行关联分析,并对原始数据进行生成处理来寻找系统变动的规律,生成有较强规律性的数据序列,然后建立相应的微分方程模型,从而预测事物未来发展趋势的状况。其用等时距观测到的反应预测对象特征的一系列数量值构造灰色预测模型,预测未来某一时刻的特征量,或达到某一特征量的时间。GM(1,1)模型令x )x ) 1), x ), , x ),x(0)=(x,x,x(n)作一次累加, 生成消除数据的随机性和波动性,即x 1) ) =1 x ) ),1, , , n有x 1)(x 1) 1),x 1), , x 1)x ) 1), x ) 1) x ), , x ) 1) x ) )x可建立白化方程:dxaxu即gm 1,1)dt该方程的解为: x 1) k)x 1)1)u) uaax(k+1)=(x-u/a)exp()+u/a其中:称为发展灰数;称为内生控制灰数定义 44 :时间序列(或称动态数列)是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列。时间序列分析的主要目的是根据已有的历史数据对未来进行预测。AR 模型是一种线性预测,即已知 N 个数据,可由模型推出第 N 点前面或后面的数据(设推出 P 点),所以其本质类似于插值,其目的都是为了增加有效数据,只是 AR 模型是由 N点递推,而插值是由两点(或少数几点)去推导多点,所以 AR 模型要比插值方法效果更好。主要结果数据:我国自 19802013 年的年末总人口数据(单位:万人)年份人口年份人口年份人口年份人口1980 年987051990 年1143332000 年1267432010 年1340911981 年1000721991 年1158232001 年1276272011 年1347351982 年1016541992 年1171712002 年1284532012 年1354041983 年1030081993 年1185172003 年1292272013 年1360721984 年1043571994 年1198502004 年1299882014 年1367821985 年1058511995 年1211212005 年1307561986 年1075071996 年1223892006 年1314481987 年1093001997 年1236262007 年1321291988 年1110261998 年1247612008 年1328021989 年1127041999 年1257862009 年133450表 1注:1981 年及以前人口数据为户籍统计数;1982、1990、2000、2010 年数据为当年人口普查数据推算数;其余年份数据为年度人口抽样调查推算数据。总人口和按性别分人口中包括现役军人,按城乡分人口中现役军人计入城镇人口。数据来源:国家统计局观察数据:使用 MATLAB 软件根据表 1 数据画散点图图 1根据散点图可得,年末总人口数目随着时间的增长而增长,存在明显的正相关关系。模型的构建与分析模型一不考虑任何其他因素,直接使用表数据使用线性最小二乘法进行一次拟合,可得图图 2 根据图可以明显看出一次拟合拟合的效果较差,需重新拟合寻找更优模型模型二在考虑到人口与时间的关系以及生物指数性增长的特征,使用灰色预测模型 GM(1,1)进行拟合,可得图图根据图可以明显看出灰色预测模型 GM(1,1)的效果也比较差,需重新拟合寻找更优的模型模型三从较长的时间来看,人口增长遵循一点的规律,而从短期来看,波动较小,预测较简单。自回归模型在人口问题预测中既考虑了人口数量在时间序列上的依存性,又考虑了随机波动的干扰性,对于人口数量增长的短期趋势的预测准确率较高,是应用比较广泛的一种方法。作为人口问题的一个重要指标,年终总人口数量具有一定的稳定性和增长性,且与前几年的人口数量具有一定的关联性,因此可以采用时间序列方法对人口数量的增长建立预测模型。记原始时间序列数据为a1, , ,35),首先检验序列a 是否是平稳的,对显著水平 . 5可算得1,计算得统计量 T=+,上分位数的值t ). 345,所以丨 T 丨 t(n ),故认为序列是非平稳的;因为 ,所以序列有上升趋势。图 4为了构造平稳序列,对序列a1, , ,35)作一阶差分运算b =a +1 a ,得到序列b 1, , ,34)。从时间序列b 散点图来看,时间序列是平稳的。可建立如下自回归模型(AR(2)模型)对b 进行预测:yc1y 1 c2y 2 其中:c1,c2为待定参数; 为随机扰动项。根据表 1 的数据,采用最小二乘法可计算得出b 的预测模型为y 1.144 y 1 .1661y 2 利用该模型,求得时间为 2015 年时,年终人口总数的预测值为a138149.15根据已知数据对上述模型的预测和相对误差见表 2 以及图 5,。可以看出该模型的拟合效果和预测精度是较高的。单位:万人年份年终总人口数据年终总人口预测数据相对误差1980987059870501981100072100072019821016541014390.002119831030081030210.000119841043571043750.000219851058511057240.001219861075071072180.002719871093001088740.003919881110261106670.003219891127041123930.002819901143331140710.002319911158231157000.001119921171711171900.000219931185171185380.000219941198501198840.000319951211211212170.000819961223891224880.000819971236261237560.001119981247611249930.001919991257861261280.002720001267431271530.003220011276271281100.003820021284531289940.004220031292271298200.004620041299881305940.004720051307561313550.004620061314481321230.005120071321291328150.005220081328021334960.005220091334501341690.005420101340911348170.005420111347351354580.005420121354041361020.005220131360721367710.005120141367821374390.00482015138149表 2图 5问题分析:从上述建模结果来看,我国未来人口还将继续增加,但增长速度有所放缓。虽然我国人口目前世界第一,增长率在世界上排名靠前,但这并不意味着要禁止人口增长,甚至减少人口,毕竟人口问题归咎到底是经济问题,控制人口的目的也是为了提高国民的物质生活水平和综合素质水平。先来看几个图片:自然增长率%20151050198019821984198619881990199219941996199820002002200420062008201020122014年份图 6自然增长率自 1987 年后逐年下降,现在为 5%左右。65岁及以上人口占比12.00%10.00%8.00%6.00%4.00%2.00%0.00%1994年1995年1996年1997年1998年1999年2000年2001年2002年2003年2004年2005年2006年2007年1990年1991年1992年1993年2008年2009年2010年2011年2012年2013年2014年图 7自 2001 年起,中国 65 岁以上老年人口占人口总数已经超过 7%,且比重越来越大即中国自 2001 年已经步入老龄化社会,十多年过去了,老龄化越来越严重。GDP增长率16.0%14.0%12.0%10.0%8.0%6.0%4.0%2.0%0.0%1980年1982年1984年1986年1988年1990年1992年1994年1996年1998年2000年2002年2004年2006年2008年2010年2012年2014年图 8GDP 增长率自 2008 年之后走下坡路,现已进入“新常态”GDP 年增长率为 7%左右。劳动人口占总人口比重60.00%50.00%40.00%30.00%20.00%10.00%0.00%图 9劳动人口占总人口比重自 1990 年达到 56%左右就几乎没什么大变化了。城镇单位就业人员工资总额占GDP比重18.00%16.00%14.00%12.00%10.00%8.00%6.00%4.00%2.00%0.00%图 10城镇单位就业人员工资总额占 GDP 比重自 2008 年起逐渐上升,现已达到 16%左右,比之前的平台上升了 1/3 左右。以上数据皆来自国际统计局。通过以上五个图表,我们可以下结论:中国面临老龄化问题,且日益严重;在经济上,处于下行状态,随着劳动力成本的增加,中国也在逐步失去廉价劳动力市场的竞争力,这无疑会使中国面临的的老龄化问题更加严峻。通过结论再结合现状我们建议:一, 扩大内需,拉动国家经济二, 放松人口增长控制,既可以让母婴产业促进经济增长又可以稳定未来的劳动力成本,还可以缓解因养老制度不够完善而面临的社会老龄化压力三, 在之后随着社会老龄化压力降低要逐步加强人口增长控制,使总人口数量趋于一个合理区间,再通过第三产业、高科技产业来发展经济,从而提高人民生活物质水平和综合素质,达到控制人口的目的。参考文献1网络.百度百科链接:/link?url=DJa-2bj3kfhewKRD30gD-DSYvTKMdvp9vlTJZI7KAunKpNN75reHHlYvTCmh dm2uk2xwhfY3LNiqoKOJSZCMia2 网络.百度百科链接:/link?url=BeU9kisW6J_EHWwxbNqtkhA2Ywxc9DuRwIytVdcBnKIgL4RqaLru3hGH7i9S 0nVKOa9TgmAIjnfwP6zXnd3jEK3 网络.百度百科链接:/link?url=NPNxZy_08GToCkkHjK5qLSgM6r618PEPRB-hBaQ6wYUdjbfhXEKacenayT8-T9ytXH7MxFL0rUBeua9bLKpd3q4 网络.百度百科链接:/link?url=SeywMZk7-xvENyg1mngaQCH98c_RRFTGb4u_Hh8wTKuA0aSO7O72ApU761MA0oSWT-cdPX1QRHQoNNLv7aioT_5贾凌云.人口预测的灰色增量模型及其应用D.南京信息工程大学.2006 年6方建卫;王文娟;楚霹.基于最小二乘法的 GM(1,1)模型在人口预测中的应用J.贵州大学学报(自然科学版).2007(4)7付艳茹.基于 MATLAB 的人口预测研究D.华东师范大学.2010 年8徐晓飞.人口老龄化对我国 GDP 及其构成的影响D.东北财经大学.2012 年9顾海燕.时间序列分析在人口预测问题中的应用J.黑龙江工程学院学报.2007(3)附录MATLAB 代码清单画散点图代码:clc;clearx=1980:2014;y=98705100072101654103008104357105851107507109300111026112704114333115823117171118517119850121121122389123626124761125786126743127627128453129227129988130756131448132129132802133450134091134735135404136072136782;plot(x,y,k*)title(1980 年-2014 年中国年末总人口数据)xlabel(年份)ylabel(人口数量(万人)一次拟合代码:clc;clearformat longx=1980:2014;y=98705100072101654103008104357105851107507109300111026112704114333115823117171118517119850121121122389123626124761125786126743127627128453129227129988130756131448132129132802133450134091134735135404136072136782;% 多项式拟合n=1; %n 是给定的多项式的次数A=polyfit(x,y,n);%A 是拟合出来的系数向量y1=polyval(A,x);%计算出拟合的 y 值plot(x,y,k*,x,y1,r-); %画出数据对比图,黑点为原始数据,红线是拟合曲线 title(1980 年-2014 年中国年末总人口数据与预测值) xlabel(年份)ylabel(人口数量(万人) legend(原始值,预测值);灰色预测模型(,)代码: clcclearx0=98705 100072 101654 103008 104357 105851 107507 109300 111026 112704 114333 115823 117171 118517 119850 121121 122389 123626 124761 125786 126743 127627 128453 129227 129988 130756 131448 132129 132802 133450 134091 134735 135404 136072 136782;n=length(x0);m=1980:2014; lamda=x0(1:n-1)./x0(2:n)%计算级比range=minmax(lamda)%计算级比的范围x1=cumsum(x0);%累加运算B=-0.5*(x1(1:n-1)+x1(2:n),ones(n-1,1);Y=x0(2:n);u=BY %拟合参数 u(1)=a,u(2)=b x=dsolve(Dx+a*x=b,x(0)=x0)%求解微分方程的符号解x=subs(x,a,b,x0,u(1),u(2),x0(1)%带入估计参数值和初始值yuce1=subs(x,t,0:n-1)%求已知数据的预测值y=vpa(x,6)%其中的 6 表示显示 6 位数字yuce=x0(1),diff(yuce1)%差分运算,还原数据 plot(m,x0,*,m,yuce,r)xlabel(年份) ylabel(年终人口总数量(万人)) title(每年年终人口总数目与预测值) legend(原始值,预测值) epsilon=x0-yuce %计算残差delta=abs(epsilon./x0)%计算相对误差rho=1-(1-0.5*u(1)/(1+0.5*u(1)*lamda%计算级比偏差值,u(1)=a时间序列模型代码:clccleary=1980:2015;a=98705100072101654103008104357105851107507109300111026112704114333115823117171118517

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论