不同地区职工平均收入差距预测_第1页
不同地区职工平均收入差距预测_第2页
不同地区职工平均收入差距预测_第3页
不同地区职工平均收入差距预测_第4页
不同地区职工平均收入差距预测_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

不同地区职工平均收入差距预测第1章绪论1.1论文背景和意义在如今社会飞速的的发展着,职工工资也在年年变化,随着职工工资的上涨,其他的很多问题,例如人们的收入差距越来越大,同工不同薪等等的一系列问题。收入差距进一步的增加会加剧一系列的矛盾。在这方面,十三五规划进程加强了全球视角和战略思维,并以五年计划为基础,侧重于政府和市场之间的关系,以设定规划目标。积极推进城乡规划改革,坚持民主规划,适应时代要求,更好地尊重发展规律,更好地代表十三五规划的意志,确保顺利实现建立全面的社会大目标的完成,以确保关键要素全面深化改革领域的干预,转变经济发展观念,保证实质性的进展,尽可能充分重视改革的差距,甚至要调整和优化人民群众的收入分配格局,把全社会收入差距努力减小。为了了解调整的效果和需要调整的方向,预测地区间的收入差距,有利与在地区间进行宏观调控政策的制定还有利于判断已经实施的措施的效果。判断将来收入差距问题的情况也有利于现在政策的改革。在国民收入方面绝大部分的人都是依靠工资,所以研究预测未来的各地区的职工工资就可以体现出全国各地区间人民的收入差距。1.2国内外研究状况时间序列能运用到社会经济的各个方面,时间序列的发展迅速,产生了除了常用的AR,MA,ARMA模型之外,杨念,司秋丽等运用CensusX12季节调整法、H-P滤波法以及建立门限GARCH模型,分析我国甜瓜市场价格波动的主要特征[1]。孟毅选用了ARIMA时间序列方法、BP神经网络方法和BP-ARIMA组合模型的方法对2009-2017年我国的CPI月度数据进行建模,并以此预测2017年度各月的CPI,结果表明,BP-ARIMA组合模型预测效果最优[2]。陈蔚采用ARIMA和人工BP神经网络方法对1990-2013年的我国进口、出口贸易额时间序列进行线性与非线性信息挖掘,ARIMA模型的拟合精度较低,经过BP神经网络方法对非线性规律进行建模并对2014-2018年进出口额进行预测,结论显示:BP神经网络方法能够较好的体现进出口贸易额时序中的非线性规律,有效的修正了线性预测方法的误差[3]。徐超,项薇等研究自回归综合移动平均(ARIMA)模型与自适应过滤法的组合预测模型对来自澳大利亚Monash大学的RobHyndman教授创建的TSDL算例研究,结果发现:对于短期预测,ARIMA-自适应过滤组合预测模型的预测精度趋势优于传统ARIMA模型,预测精度增大了80%-99%,并且预测出的未来趋势也更加接近实际情况[4]。舒服华,张中兴依据2007-2017年浙江省个人所得税统计数据,运用了等维新息GM(1,1)模型,对2018年浙江省个人所得税进行预测,结果表明,该模型的平均预测的误差是3.7257%,比传统GM(1,1)模型的平均预测误差6.1414%,减小了64.8388%,提高了预测精度[5]。滕永平运用X12季节调整法和H-P滤波法把2007年1月-2018年3月我们国家的玉米价格时间序列给分解了,研究玉米价格波动的规律,最后发现,我国的玉米价格被季节因素影响而且影响比较大,整体呈现为先上升后下降,并其是周期性波动,而利用ARIMA时间序列模型预测玉米价格走势,发现短时间内我国的玉米价格会小幅度的上涨[6]。徐超采用了基于ARIMA和SVR的混合方法对四种货币对美元的汇率进行了预测,实验的结果表明了混合模型的预测精度和ARIMA模型、SVR方法以及随机游走模型相比起来要高一些[7]。于雅凝,过榴晓基于2016-2017年贵州茅台股票收盘价数据,应用时间序列分析理论中长期趋势和随机波动之间存在复杂的交互影响关系建立ARIMA-GARCH模型进行分析,经过验证建立了GARCH(0,2)模型,并根据该模型的拟合并预测未来股票价格,在短期时间内可以对投资可以起到一定的指导作用[8]。李娟丽,许英利用1983年4月至2017年9月的WTI国际原油期货价格的月度数据建立GARCH模型,实证结果表明,原油期货价格波动率时间序列表现出随机波动趋势,GARCH(1,1)模型拟合效果最好[9]。在对工资预测方面,国内学者也有很大的兴趣,学者们一般采用时间序列分析中的各种模型对未来工资的水平进行短期预测,郑侠,崔玉杰,赵桂梅据上海市2007-2016年职工平均工资的数据[10],利用灰预测GM(1,1)模型对数据来进行预测,最终的结果经过检验表明了,利用该模型预测具有较高的精度,可以较好的预测未来几年上海市职工的工资水平的变化趋势[11]。利用我国国有单位在岗职工的工资总额历史数据,运用了离异系数的方法,建立了组合预测模型,结果显示,经检验组合预测模型要比单项预测模型在时间序列数据预测中具有更高的精度[12]。以我国劳动统计年鉴1985-2010年中的每年工资数据为研究对象,李媛使用了基于ARIMA模型的时间序列方法,对未来几年的平均工资进行预测[13]。魏正曦,邱玲采集由四川省政府和省统计局于1991-2010年发布的城镇在岗职工平均工资数据,利用Logistic模型对未来几年的工资水平工资进行短期预测[14]。李生彪以山东省在1978-2010年间职平均工资依据,进行了曲线拟合并用使用阻滞增长模型,来短期内预测山东省职工的年平均工资[15]。袁艳杰,刘自强,刘彪文搜集湖南2006-2015年不同行业年平均工资数据,分别运用数据拟合、Logistic增长模型[16]、三次指数平滑法,预测未来五年湖南省金融业、教育业、农业、采矿业等行业年平均工资水平,并对各模型进行比较分析,运用三次指数平滑法呈抛物线走势其效果会比其他方法的效果好,同时预测数据[17]。1.3本文的主要工作利用1990-2018年全国各地区就职人员平均工资的数据,通过这28年的年平均工资建立数学模型对未来三年的各地区年平均工资进行预测,并找到各地区间最大差距变化,本文按照以下步骤进展:第一章本文主要介绍了薪酬预测的意义以及国内外薪酬预测的研究现状。第二章本文主要介绍趋势外推方法、趋势外推预测模型中的多项式曲线模型和时间序列中的ARIMA模型。第三章主要对三次曲线模型,ARIMA模型建模和分析预测。最后将两个模型进行比较,并用更优的模型预测值最为结论。第2章时间序列理论分析2.1时间序列的定义时间序列是按时间顺序验证的统计指标值,结果序列是时间序列[18]。对于随机变量,将一列随机变量按照时间进行排序得到如下序列:上式就可以称为一个随机变量的时间序列,表示为{,}。通常情况下,一个时间序列的个观察值可以表示为:,通过这个观测值挖掘研究出这个序列隐藏的性质,进而通过所得的序列{}的性质,进而能够推断出整个随机时序的性质[19]。2.2时间序列的预处理2.2.1时间序列的平稳性1.平稳时间序列的定义时间序列{}{}称为是平稳的,如果它满足:对任一,,是与无关的常数[20]。对任意的整数和 (2-1)其中与无关,称为时间序列{}的自协方差函数,称为自相关函数,称为滞后期,平稳性定义中的两个条件,也就是说时间序列的均值和自方差函数不随时间的变化而变化[21]。检验平稳时间序列检验时间序列稳定性的一般方法有三种:时间序列可视化、自相关和单位根的验证。(1)时间图测试方法:建立时间图,如果数据变成常数,时间序列将是一个稳定的序列;否则,这将是一个不稳定的序列。(2)自相关图的测试步骤:稳定序列通常在短时间内相关,因此稳定序列的自相关函数会迅速降低到零,而不稳定序列的自相关函数降低得更慢。(3)单位根测试方法:单位根检验是指在一个序列中验证单个根的存在,以及在一个固定的时间序列中验证单个根的存在。三种情况的ADF检查:第一种类型:非固定数的平均值、无趋势的阶自回归过程第二种类型:有常数均值、无趋势的阶自回归过程第三种类型:既有常数均值、又有线性趋势的阶自回归过程2.2.2时间序列的平稳性1.白噪声序列的定义是白噪声序列,它满足: 也就是说随机序列{}的均值为0,方差为,且互不相关,它代表不能用模型说明的随机因素。白噪声序列有两个特性,即纯随机性,和方差齐性,过去不影响对将来的发展,用数学语言,也就是纯随机序列之间是不相关的,遇到这种纯随机序列就没有必有构建模型来研究其相关关系了[21]。纯随机性检验原理是定理:若时间序列为纯随机的,则可得一个观察期数为的观察序列,非零延迟样本观测序列的自相关系数近似为正态分布,平均值为0,方差为序列观测周期的倒数:[22]2.假设条件由于序列值之间的可变性是绝对的,并且相关性是随机的,因此做出以下假设::零假设:延迟周期的数量小于或等于期的序列值之间相互独立备择假设:延迟期数小于或等于期的序列值之间有相关性用数学语言可描述为:,至少存在某个,检验统计量序列被检验为平稳后,需要进行纯随机性检验,检验统计量具有统计学意义和统计量。(1)统计量(大样本): (2-2)其中为序列观测期数,为指定延迟期数。当Q统计量大于分位点,或该统计量的值小于时,则可以以1-该模型的置信水平拒绝原始假设,并认为该序列是非白噪声序列。否则,它接受最开始的假设,并认为该序列是一个纯随机序列。只有通过测试这种稳定的非白噪声序列,才能在以后进行建模和预测[22]。(2)统计量(小样本): (2-3)其中为序列观测期数,为指定延迟期数,统计量也近似的服从自由度为的卡方分布,实际上统计量是统计量的修正,检验方法同统计量[22]。2.2.3模型相关准则衡量统计模型拟合的优良性标准众多,其中最常用的准则是和准则。评估模型的标准取决于概率函数的值和模型中的未知参数。一个模型的参数越多,它就越灵活,但风险也越大[23]。准则准则全称是最小信息量准则=-2ln(模型的极大似然函数值)+2(模型中未知参数的个数)(2-4)准则=Ln(n)(模型中的参数数)-2ln(模型的最大似然函数值)(2-5)两个准则所得的函数值最小的即是所有模型中的最优模型[23]2.3趋势外推法预测模型2.3.1趋势分析法的定义和类型趋势分析被称为趋势曲线分析、曲线调整或曲线回归。这是迄今为止研究过的最好的定量预测方法,也是最常用的方法。。趋势外推模型将根据已知的历史数据曲线进行调整,以反映负荷本身的增长趋势,然后根据负荷预测的增长曲线估计某一点,许多类型的负荷预测通常采用简单的函数模型,例如指数曲线、多项式模型、增长曲线等。选择这些模型时,可以先画出散点图,然后对模型进行初步判定[24]。2.3.2多项式曲线模型在现实生活中很多的经济问题,其预测对象并不是随着时间的变化呈现线性趋势变化,而是呈现非线性趋势的,而在本文的工资序列中,该趋势与多项式曲线模型、指数模型非常相似。多项式曲线的基本数学模型为:(2-6)一般采用最小二乘法来确定模型参数,使得偏差平方和最小,从而算出这个参数,以三次多项式预测模型为例,其预测模型为:(2-7)使得以下偏差平方和最小:并且对,,,求偏导数,并令其偏导数为0,整理后得到方程组: (2-8)解这个四元一次方程组,可求出我们需要确定的四个参数。2.4非平稳时间序列模型2.4.1ARIMA模型模型的基本思想是:随着时间的推移预测对象数据该序列被认为是随机序列,在某种程度上是随机的;我们用一致的数学模型来粗略地描述它们[25]。求和自回归移动模型,可简记作(,,),它满足下面条件: (2-9)其中为延迟算子,,...,记,其中,为白噪声序列,,分别是(,)模型的自回归系数多项,移动平滑系数多项式。(,,)的实质就是差分运算与(,)的组合。当=0时,0,,)模型变形为(,)模型;当=0时,(,,0)模型变形为(,)模型;当=1,==0时,(0,,0)模型就变成随机游走模型。建立ARIMA模型的步骤:1.首先要判断时间序列是否为平稳序列。有以下三种判定方法:图形观测法,相关函数判断法,单位根判断法。2.如果序列是非平稳序列,则需要将序列做差分处理,最终形成平稳序列。一般情况下,序列是随时间増长具有明显上升趋势的,因此则必须通过差分进行处理,消除其增长或下降趋势,使其变为平稳序列,然后判断其适用模型。3.识别时间序列模型结构。作出平稳序列的自相关与偏相关函数图,通过图形的截尾和拖尾直观地判定模型类型,确定序列适应于模型、模型还是模型。4.确定模型参数。识别模型结构的同时,基本可以从自相关和偏相关函数图的分布情况,确定模型的参数范围,在范围内计算每组参数对应模型的值或值,最后选择值或值最小的对应参数,建立效果最优的模型。5.模型检验。评估模型的好坏需要对所建立的模型作假设检验,时间序列模型可以通过拟合序列观测到模型的拟合效果,其次要检验模型预测的残差序列是否是白噪声序列,若模型通过检验,说明可以用于进一步的推广预测,否则需重新确定参数。6.通过所建模型预测未来的短期的序列值。第3章数据分析3.1运用趋势外推法建立模型3.1.1问题的提出我国马上就会全面的消除贫困人口这一重大难题,人们的生活水平也与往年不可同日而语,在这种兴兴向荣的社会大背景下任然是存在着些许问题等待着我们去解决的。随着人们收入的增加,人们的收入差距任然是一大问题。许多存在同工不同酬,地区间的职工工资差异,也是非常大的问题。为了使得在各地区间的收入宏观调控方面,来减少收入差距,增强人们的生活幸福感。提高人们的生活舒适度。参考我国经济发展数据,认真分析将来各地区职工收入的差距,建立模型,预测未来三年的职工年均收入,并计算最大差距。3.1.2数据来源通过文献查阅以及在线检索中国统计网站每年颁布的《中国统计年鉴》,获得1990-2017年全国各地区职工工资的数据,如下表3-1根据行政区域划分A(北京市,天津市,内蒙古自治区,山西省,河北省)B(辽宁省,吉林省,黑龙江省)C(上海市,江苏省,浙江省,安徽省,福建省,江西省,山东省)D(河南省,湖北省,湖南省,广东省,广西壮族自治区,海南省)E(四川省,重庆市,贵州省,云南省,西藏自治区)F(陕西省,甘肃省,青海省,宁夏回族自治区,新疆维吾尔自治区)(我国香港特别行政区,澳门特别行政区,台湾省等地区并未统计在内);表3-1各地区历年职工平均工资统计数据ABCDEF19902213.401972.672161.862121.002316.502324.4019912407.202162.002373.142339.332491.752475.8019922774.802439.332821.862757.672749.502779.6019933473.602876.333621.863425.003404.503294.8019944748.803770.004920.864629.004881.754419.6019955667.804515.335994.715386.835412.755213.8019966481.405067.676742.715853.836922.755779.8019977078.605381.337328.576142.676991.756232.8019988026.406650.008354.437043.837751.506958.4019998908.807382.339632.007723.338770.507688.40200010100.608190.0010752.148584.179999.508744.20200111713.009275.3312566.149872.6712151.5010539.00200213436.4010525.0013927.2911303.3314436.5011843.00200315431.4011709.0016051.7112666.3315819.7513072.00200418124.0013303.0018073.7114374.0017987.0014596.00200521159.8015399.3320568.5716366.1718815.0016317.60200624431.6017570.6723553.5718503.1721224.0019180.20200728953.0021033.6727639.5722164.1727139.7523218.60200834954.8024753.6731692.4325509.8330237.5027269.60200937608.4027090.3334394.0028094.6731774.0029864.60201043273.2030391.6739127.4332196.6735523.2533554.00201149359.4034355.3345005.2936447.3339225.0038509.20201255141.4038890.3349864.4340384.0043207.2543849.40201359882.0043048.3355781.5744101.0048887.2548242.40201464574.4046247.3360721.8648986.8353165.7552581.60201570267.8050923.6766143.8654749.5067257.2557904.60201675267.8054849.3372083.7159907.3373471.7562622.00201783202.0059557.0078698.8665971.3379784.2568497.20根据数据绘制得散点图3-1;图3-1A区域1990-2017平均工资散点趋势图由图3-1可知,该趋势为非线性趋势,可以考虑拟合趋势外推法常用的数学模型,指数曲线,多项式曲线等。3.1.3检验数据平稳性表3-2游程检验表合计检验值a(均值)16777.7案例<检验值14案例>=检验值14续表3-2案例总数28运行次数2Z-4.796渐近显著性(双侧)0.000A地区1990-2017年的平均工资的长期趋势表现出非线性的,单样本运行试验表明存在一定的趋势规律。(=-4.796,=0.000),该序列是非平稳的,因此我们尝试使用趋势曲线模型来拟合该序列。3.1.4趋势外推拟合指数模型表3-3指数模型拟合结果表模型形式R-square0.9880AdjR-square0.9876RMSE2826df11df226F2947.1Sig.0.000预测结果如下图3-2:图3-2指数模型拟合图从指数模型拟合结果表中可得知模型的拟合优度R-square为0.9880,其均方根误差RMSE为2826,表明其预测效果好,其sig小于0.05所指数型模型可以建立。从指数模型拟合图中能看到预测值就在实际值的是一定范围内上下浮动。2.修正指数模型表3-4修正指数模型拟合结果表模型形式R-square0.9941AdjR-square0.9937RMSE2019df11df226F3024.8Sig.0.000预测结果如下图3-3:图3-3修正指数模型拟合图从修正模型拟合结果图中可得知模型的拟合优度R-square为0.9941,其均方根误差RMSE为2019,表明其预测效果好,其sig小于0.05所指数型模型可以建立,具有统计意义。从修正指数模型拟合图中可知预测值与实际值贴合比较紧密,效果还算可以。3.线性模型表3-5线性模型拟合结果表模型形式R20.8904AdjR20.8862RMSE8554df11df226F211.3Sig.0.000预测结果如下图3-4:图3-4线性模型拟合图从线性模型拟合结果表中可得知模型的拟合优度R-square为0.8904,其均方根误差RMSE为8554,表明其预测效果不是很良好,但其sig小于0.05所指数型模型可以建立,具有统计意义。从线性模型拟合图中很直观的发现预测值与实际值相差比较的大,效果不是很好。4.二项式模型表3-6二项式模型拟合结果表模型形式R-square0.9971AdjR-square0.9969RMSE1410df12df225F3168.1Sig.0.000预测结果如下图3-5:图3-5二项式模型拟合图从二项式模型拟合结果表中可得知模型的拟合优度R-square为0.9971,其均方根误差RMSE为1410,表明其预测效果好,其sig小于0.05所指数型模型可以建立,具有统计意义。从二项式拟合结果图中可以看法预测结果再开始的时候与实际值相差较大,但是到了中后期预测值与实际值贴合很紧密,表明中后期预测效果比较好。5.三阶多项模型表3-7三阶多项模型拟合结果表模型形式R-square0.9976AdjR-square0.9973RMSE1327df13df224F3277.04Sig.0.000预测结果如下图3-8:图3-8三阶多项模型拟合图从三阶多项式模型拟合结果表中可得知模型的拟合优度R-square为0.9976,其均方根误差RMSE为1327,表明其预测效果好,其sig小于0.05所指数型模型可以建立,具有统计意义。从三阶多项式模型拟合结果图中可以直观的看到,预测值与实际值全程贴合都比较紧密,表明预测结果良好。6.选择模型将所有的模型预测结果汇总到下表3-8;表3-8各模型预测结果汇总年份实际值指数模型修正指数模型线性模型二阶多项式模型三阶多项式模型19902213.44003.0200.4-118124524.61404.719912407.24468.4943.4-89043802.41759.119922774.84988.01758.5-59963359.42190.519933473.65568.02652.7-30883195.62712.119944748.86215.43633.7-1803311.03339.019955667.86938.24709.827283705.64087.419966481.47744.95890.256364379.44975.119977078.68645.57185.285445332.46021.419988026.49650.88605.8114526564.67246.319998908.810772.910164.2143608076.08670.9200010100.612025.611873.7172689866.610316.720011171313423.913749.12017611936.412205.3200213436.414984.815806.32308414285.414357.8200315431.416727.218063.22599216913.616794.020041812418672.220538.92890019821.019532.1200521159.820843.423254.83180823007.622587.8200624431.623267.026234.23471626473.425973.420072895325972.529502.53762430218.429697.0200834954.828992.533087.94053234242.633761.8200937608.432363.737021.04344038546.038165.3201043273.236126.941335.74634843128.642898.4201149359.440327.746068.84925647990.447944.9201255141.445016.951261453281.020135988250251.356957658875.2201464574.456094.563205.55798064251.064687.7201570267.862617.070060.16088870229.670670.9201675267.869898.077579.66379676487.476769.520178320278025.685828.46670483024.482921.3201887098.394877.46961289840.689057.9201997225.9104804095106.22020108531.2115693.775428104310.6100989.0总结由以上几种趋势外推模型方法可知,三阶多项式模型的拟合优度R-square最高,为0.9976,其均方根误差RMSE为最小,表明其预测效果最好;除此之外,指数模型,二阶多项式模型,修正指数模型拟合优度均在0.98以上,RMSE均较小,可以应用于数据的预测;但线性模型拟合优度低,预测数据相较原本数据误差较大,不适用于该数据的预测。3.1.5对三阶多项式模型的分析表3-9三阶多项式模型的模型汇总表RR方调整R方估计值的标准误0.9990.9980.9971327.05表3-10三阶多项式模型的方差分析表平方和df均方FSig.回4135771132307.473277.050.000残差42265812.26241761075.51总6727表3-11三阶多项式模型的系数表未标准化系数标准化系数tSig.B标准误Betax-496.23338.616-0.161-1.4650.156x^286.0326.8810.8243.1630.004x^31.250.610.3312.0570.051(常数)38341154.0713.3220.003由方差分析表可知,小于0.05,则该三次曲线模型可以建立起来,该模型有统计意义,再看系数的检验表,x的一次项和三次项的>0.05,表明这两项的系数并不显著。因去掉一次项与三次项,但经检验,现有模型已为最有模型。其R方为0.997,拟合优度很高,因此模型拟合效果较好。3.2建立ARIMA模型3.2.1平稳性检验A地区1900-2017年平均工资的时序图呈现出指数型增长形式,从直观上看出该序列为非平稳序列,因此要对序列进行进一步处理,也就是将数据转换为固定行,然后执行其他操作。ADF单位根测试用于稳定性测试,而连续规律性测试通常在5%的水平上进行。ADF的单个根的初始假设是时间序列中只有一个根,并且行是不稳定的,时序图和Eviews输出结果如下图3-9,表3-12所示:图3-9A地区工资时序图表3-12原序列单位根检验结果表t-Statistic

Prob.*AugmentedDickey-Fullerteststatistic

9.7547071.0000Testcriticalvalues:1%level-3.6998715%level-2.97626310%level-2.627420由原序列的时序图可以得知,变量A的原始序列中存在很明显的上升趋势,是一个不平稳的序列;由输出表可知,变量A的原序列单位根ADF的测量值为9754707,p值为1000,远远大于0.05。因此,我们必须接受序列有单位根且不稳定的零假设。检验其一阶差分的平稳性是必要的。该序列的一阶差分序列的时序图为图3-10和输出结果如下表3-13所示:图3-10一阶差分后时序图表3-13一阶差分序列单位根检验结果表t-Statistic

Prob.*AugmentedDickey-Fullerteststatistic-4.072005

0.0186Testcriticalvalues:1%level-4.3560685%level-3.59502610%level-3.233456该一阶差分时序图显示,经过一阶差分后,原序列的剧烈增长的趋势得到了一定的消除;由上表可知,第一差分序列的单位根检验的ADF测量值为-4072005,相应的p值00186,远远小于0.05。所以我们应该拒绝零假设,即序列中没有单位根,序列是静止的。根据上面的单位根检验,在第一个差异之后,序列是平稳的,可以确定对于变量A来说,其(p,d,q)模型中的参数d=1。3.2.2确定其他参数与建模模型中还有两个未知参数需要确定,分别是p和q,对于它们的确定,通常使用自相关图和偏自相关图进行判断,其输出结果如图3-11所示:图3-11数据的偏相关与自相关图由上图可知,该序列的部分自相关图可分为1阶截断图和2阶截断图,所以AR模型本文选用AR(0)AR(1)或者是AR(2)模型;而根据自相关图我们课取为MA(0)MA(1)MA(2)MA(3)MA(4)MA(5)MA(6),所以我们原序列建立的模型是(p,1,q)模型,然后根据aic和sc准则进行最优模型的选择,各个模型的aic和sc如下表3-14,3-15所示:表3-14AIC值表AIC值MA0MA1MA2MA3MA4MA5MA6AR018.6132618.6607318.6184518.5861718.7228518.77026AR117.2567916.9977317.3299817.3179317.3084217.3308717.32522AR217.4181617.3717917.4556317.4403817.3461117.4759717.45793表3-15SC值表SCMA0MA1MA2MA3MA4MA5MA6AR018.6132618.7567218.7144418.6821518.8188418.86625AR117.3527817.2946317.4739617.4619117.4524017.4748517.60192AR217.5141517.5157717.5996117.5843617.4900917.6199617.60192AIC信息量准则又称赤池信息量准则,SC信息量准则又叫施瓦茨信息准则,二者越小,说明模型建立的越好,所以由上边两个表可知,应该选择(1,1,1)模型,说明软件将偏自相关图看做是1阶截尾的,这样会使模型更精确。输入命令“lsd(a)ma(1)ar(1)”,模型的输出结果如表3-16所示:表3-16模型检验结果输出表VariableCoefficientStd.Errort-StatisticProb.

SIGMASQ11863873146593.7703850.0009AR(1)0.9905780.02137146.350580.0000MA(1)-0.4255450.161512-2.6347600.0145R-squared0.968207

Meandependentvar3217.088AdjustedR-squared0.947135

S.D.dependentvar2198.316S.E.ofregression1105.439

Akaikeinfocriterion16.99773Sumsquaredresid26883889

Schwarzcriterion17.29463Loglikelihood-209.0755

Hannan-Quinncriter.17.00661F-statistic36.45609

Durbin-Watsonstat2.106738Prob(F-statistic)0.000000InvertedARRoots

.98

-.53由检验结果输出表可知,模型的F检验统计量为36.45609,相应的p值约为0,所以有理由拒绝原假设,认为模型中存在线性关系;D.W值为2.106738,接近于2,所以判断模型中不存在自相关性;模型整体建立恰当,整体还是要进行测试白噪声。3.2.3白噪声检验输入命令“genre=resid”,对该模型进行残差的测试白噪声,检验结果如图3-12所示:图3-13白噪声残差检验结果图一般认为,如果残留序列不是白噪声序列,则意味着残留序列中仍然存在一些信息,建立的模型并没有把信息提取充分。由上图所知,各个阶数对应的这都是大于0.05显著性水平的,所以认为残差序列并没有自相关现象,残差序列是白噪声序列,并且模型提取足够的信息用于短期预测。3.2.4预测在ARIMA(1,1,1)模型结果输出窗口中,点击Forecast选项,即可直接进行短期预测,结果如图3-13所示:图3-13预测结果输出图由上图的右侧可知,Theil不等系数为0.014523,偏差比率近似为0,方差比率为0.020849,在0-1的范围内都是比较小的靠近0,协方差比率为0.790856,在0-1的范围内较大靠近1,因此认为此模型的预测效果还是较好。由图中及预测的序列显示,变量A的2018年预测值为89840。2019年和2020年的预测值见下表3-15:表3-15A地区预测结果表年份20192020预测值97507104906同理,可以得到B、C、D、E、F变量的2018-2020年的预测值如下表3-16:表3-16其他地区预测结果表变量201820192020B628376620169643C854389229799272D715727678582663E854019082295914F7300277657824583.3比较两个模型表3-20两个模型比较R方MAPE三阶多项式曲线模型0.9989.88ARIMA模型0.9683.87平均绝对百分误差()是用来选择模型,一般认为如果平均绝对百分误差()的值低于10,则认为预测精度较高。模型选择的时候通常选择平均绝对百分误差()最小的模型。通过对两个模型对比分析,发现两个模型的R方相差不大,看他们的,其中模型更小,模型更优。因此选用ARIMA模型预测的结果。结论本文使用了趋势外推法预测模型中的三阶阶多项式曲线模型,模型预测方法对全国各地区的年平均资序列进行建模。通过对两个模型对比分析,发现两个模型的R方相差不大,看他们的,其中模型更小,模型更优。因此选着了模型的预测结果。与预测结果分析可知各地区间工资收入在未来三年的最大差值分别为27003,31306,35263.从这同时我们必须知道,实际的工资受到政策、经济等各个方面的影响,是模型无法完全精确预测到的,因此该模型只能作为参考。从预测结果来看,地区间的收入差距依旧在随着收入的增加而增加,造成这种现象的原因有很多。如今我们总体上已经发展起来了,现在迫切需要这个地区收入差距增大的问题解决。特别是在B地区(辽宁省,吉林省,黑龙江省),他的工资收入水平处于全地区末尾,与其他地区的差距越来越大,但是工资收入增长比例不是最低因此差距增加速度在放缓。在我们当给予利好条件,帮助低水平地区发展,来加快提高收入水平来减小地区间的收入差距。在2016年10月18日,召开的国务院振兴东北地区等老工业基地推进会议,部署进一步推动东北振兴工作,会议审议通过《东北振兴“十三五”规划》。相信进一步加大力度落实此规划下东北地区能借此机会迎头赶上。致谢转眼间大学生活就要结束了,在学校期间我度过了充实的且难忘的四年,我得到了很多老师、同学和朋友的关怀和帮助。仔细一回想我觉得我不应该带着太多的伤感,我应该心中揣着憧憬与希望奔向未来。在这论文完成之际,我要向所有期间给予我支持、帮助和鼓励的人表示我最诚挚的谢意。首先,我要感谢我的指导老师王麟老师对我的教导。从论文的选题、构思、撰写到最终的定稿,王麟老师都给了我悉心的指导和热情的帮助,使我的毕业论文能够顺利的完成。王麟老师面对我们的问题总是耐心的帮助我们任劳任怨,在学术方面认真严谨,细心指导我们方法。这些都让我收获良多。还要特别感谢在我求学过程中给我授课的各位老师。我在刚上大学期间因为突然换了一种学习方式自治能力不够,没有主动的去学习,导致我基础薄弱了。对于所学的知识总是有许多的欠缺,诸位老师的言传身教,认真负责从始至终督促我好好学习,给予我鼓励,我在大三期间压力真的特别的大,因为之前的学习不努力导致了我有些厌学,准确的来说是没有了自信心。但是在这期间在苑老师的课程实际上我的准备得到了肯定,苑老师说一句;没想到的你做的挺好的。这一下给了我很大的鼓舞,我觉得有自信了,在接下来的课程实际中每次我都主动的上去答辩,都得到了老师的肯定,老师对于我的肯定我每一句话都记在了心里。此外还要感谢同学们,在我学习期间给予的关心和鼓励,我将珍惜这来之不易的缘分和与诸位的友谊我也会将此牢牢记在心中。最后,对即将参加本论文评议、评阅、答辩和对本论文提出宝贵意见的所有老师们表示诚擎的谢意。参考文献1杨念,司秋利,王蔚宇,吴敬学.基于门限GARCH模型的我国甜瓜市场价格波动[J].中国瓜菜,2019年04期.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论