统计方法选讲课程论文-中国人口增长率的非参数自回归预测_第1页
统计方法选讲课程论文-中国人口增长率的非参数自回归预测_第2页
统计方法选讲课程论文-中国人口增长率的非参数自回归预测_第3页
统计方法选讲课程论文-中国人口增长率的非参数自回归预测_第4页
统计方法选讲课程论文-中国人口增长率的非参数自回归预测_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计方法选讲课程论文统计方法选讲课程论文课程中国人口增长率的非参数自回归预测专业班级姓名学号摘要:人口是制约我国社会和经济发展的瓶颈,已经引起了党和政府的高度关注,也是人口专家、社会学家和经济学家等研究的重要课题。人口的合理建模是人口预测、控制与管理的基础性工作,是当前人口研究的热点问题之一。传统的线性模型不能反映人口数据中所存在的非线性特征,与之对应的非参数方法不仅能克服线性模型的不足而且因其建模的灵活性而成为研究非线性模型的重要方法。本文建立了我国人口的非参数自回归模型。针对传统的人口增长预测模型不能理想地捕获我国人口增长率数据的非线性性特征,本文基于局部线性非参数估计理论,对我国建国以来的年人口增长率建立了非参数自回归NAR(1)模型,并对2004-2006年的年人口增长率进行了预测,计算结果表明,相对于参数自回归模型而言,非参数自回归模型能够很好地解决人口增长预测这一非线性问题,预测精度较高。关键词:AR模型;非参数自回归模型;预测1引言中国人口基数大、资源有限的历史现状决定了中国人均占有资源相对较。资源是一个国家经济发展的命脉,面对资源逐渐匮乏的现实,为了更好地适应当今社会的发展,中国需要进一步了解中国在人口和资源利用等方面的现实情况,以便中国在经济发展上更上一层楼。从而,认识中国人口数量的变化规律,建立人口模型,做出较为准确的预测,以便更为有效地控制人口数量的增长。同时,无论是对我国目前经济发展状况的科学认识,还是对我国未来经济发展状况的准确预测,人口数量增长问题的研究都具有十分重要的意义。1非参数自回归预测模型基本原理1.1非参数自回归模型非参数自回归模型(NAR(p))为:Yt=m(Xt)+εt,其中,解释性变量Xt∈Rp由响应变量(或被解释性变量)Yt∈R的一些滞后项所组成(p为正整数):随机误差序列{εt}独立同分布,E(εt)=0,E(ε2t)=σ2,并且εt与Xs,s≤t相互独立;未知函数m(•)称为条件均值函数(或自回归函数)。1.2非参数预测对一组平稳时间序列{Yt},t=1,2,…,n,我们的目的是对确定的正整数k,k≥1,预测Yn+k的值。非参数自回归模型对未知值Yn+k进行预测的计算步骤如下:对这组平稳时间序列建立相应的非参数自回归模型Yt=m(Xt)+εt(1)其中Xt=(Yt-1,Yt-2,…,Yt-p),随机误差序列{}独立同分布,并且εt与Yt-1,Yt-2,Yt-p相互独立,,。对上述非参数自回归模型(1)中的自回归函数采用非参数的方法进行估计,记作。(3)利用对未知值Yn+k(k≥1)进行非参数预测。2非参数自回归预测模型的建立2.1模型阶数p的选择为了应用非参数自回归模型(1)对未知值Yn+k(k≥1)进行预测,必须首先确定滞后变量个数p的值。本文采用Cheng和Tong提出的一种相合的定阶方法[1],即Cross-Validation方法对p进行确定。Cross-Validation方法的原理:对上述的非参数自回归模型(1)的一段样本Y1,Y2,…,Yn,令Xt(k)=(Yt-1,Yt-2,…,Yt-k),定义cv(k)=1n-k∑nt=k+1{Yt-^m-t(Xt(k))}2W(Xt(k)),其中是去掉第t个数据后,对自回归函数的核估计,其阶数p用尝试阶数k代替,其估计为:其中是核函数,为适当选取的非负权函数,对预先给定的模型(1)的阶数的上界L,在{1,2,…,L}上极小化cv(k),这时模型阶数的估计满足。2.2非参数预测方法本文采用循环预测法[2]进行预测。这种预测方法的主旨就是对一步向前预测值的循环使用,其基本思想是:对于非参数自回归模型,当K=1时(即对预测时),和直接预测法相同,我们利用非参数方法对条件期望进行估计,就可以得到一步预测值;当对预测时,把一步预测值添加到原样本(Y1,Y2,…,Yn)中组成新的样本(Y1,Y2,…,Yn,Yn(1)),再采用前述的非参数估计方法就可以得到两步预测值;然后再对构成的新样本(,,…,,,采用非参数估计得到三步预测值,如此循环,直到得到所需要的k步预测值为止。由于第k步(k>1)预测时使用了,,…,所包含的信息,因此,和直接预测方法相比,循环预测法预测误差较小。3人口增长率的非参数自回归预测模型本文的研究样本是我国1978~2013年的人口增长率的历史数据,样本容量n=36。首先用非参数自回归模型对其建模拟合,再对2014~20163年的人口增长率作事后预测。(数据来源于《中国统计年鉴》[3])。表1是我国1978-2013年的人口自然增长率的原始数据,图1是我国人口自然增长率时序图,从图中数据分析可以看出人口增长率序列是非平稳时间序列,而建立非参数自回归模型的前提是时间序列必须具有平稳性,因此,我们通过一阶差分将其转化为平稳序列。图2是一阶差分后的自然增长率时序图,从图2可以看出原序列经过一阶差分后达到平稳。表3-11978年-2013年我国年人口增长率原始数据年份出生率死亡率自然增长率年份出生率死亡率自然增长率197818.256.2512.00199318.096.6411.45198018.216.3411.87199417.706.4911.21198120.916.3614.55199517.126.5710.55198222.286.6015.68199616.986.5610.42198320.196.9013.29199716.576.5110.06198419.906.8213.08199815.646.509.14198521.046.7814.26199914.646.468.18198622.436.8615.57200014.036.457.58198723.336.7216.61200113.386.436.95198822.376.6415.73200212.866.416.45198921.586.5415.04200312.416.406.01199021.066.6714.39199119.686.7012.98199218.246.6411.60图1我国人口自然增长率时序图图2一阶差分后的自然增长率时序图先对人口增长率差分序列{ΔYt}建立参数自回归预测模型:(给定此模型阶数的上界为10时,使用AIC准则确定的阶数为2阶,AIC=140.6697)ΔYt=0.4581ΔYt-1-0.5054ΔYt-2其中模型参数是由最小二乘估计得到的。再对人口增长率差分序列{ΔYt}建立非参数自回归模型:ΔYt=m(ΔYt-1,ΔYt-2,…,ΔYt-p)+εt(2)其中,随机误差序列{}独立同分布,E(εt)=0,E(ε2t)=σ2,εt与ΔYt-1,ΔYt-2,…,ΔYt-p相互独立。利用Cross-Validation方法确定p时取上界L=10,用Matlab编程计算出相应的cv(k)值如图3所示。由图3可得,当k=1时,cv(k)值最小,即最佳模型的阶次为1阶,此时非参数自回归模型为ΔYt=m(ΔYt-1)+εt(3)利用非参数自回归模型(3)对我国1978~2013年人口增长率差分序列进行非参数自回归估计。表2给出了拟合所得的差分序列数据按照平稳化公式反推回来的人口增长率的拟合值与实际值,为便于比较,同时在表2中也列出了利用参数自回归模型(最小二乘估计)得到的拟合值。图3模型的阶数及对应的cv(k)值表2我国1978-2003年人口增长率的非参数拟合结果年份实际值局部线性拟合值最小二乘拟合值年份实际值局部线性拟合值最小二乘拟合值197812.009.2818.51199112.8913.3018.37197911.619.9718.78199211.6011.9218.06198011.8710.2318.64199311.4511.2518.13198114.5512.9118.95199411.211.1918.76198215.6814.0420.50199510.5510.1018.73198313.2912.9619.21199610.429.9718.55198413.0812.7517.55199710.069.8118.82198514.2612.2518.6619989.148.8918.72198615.5713.5619.3119998.187.9318.48198716.6114.6019.3020007.587.638.21198815.7313.7919.1220016.957.098.71198915.0413.1018.1920026.456.528.92199014.3913.5318.3220036.015.958.75从表2的拟合数据可以看出,局部线性估计优于线性最小二乘估计。为便于进一步说明,我们将参数自回归模型的最小二乘估计和非参数自回归模型的局部线性估计的平均绝对误差与均方误差列于表3。局部线性估计最小二乘法估计MAE0.92155.5347MSE1.35046.5468表3平均绝对误差与均方误差的比较从表2可看出,局部线性估计的平均绝对误差与均方误差都比最小二乘估计小得多,前者的拟合度高于后者。分别利用非参数自回归模型和参数自回归模型对2000-2003年的人口增长率进行事后预测,结果如表3。年份实际值非参数自回归预测值参数自回归预测值20045.875.768.6420055.895.748.5720065.285.028.31表3人口增长率的实际值与预测值由表3可以看出,由非参数自回归模型所得到的关于20

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论