我国就业人数或城镇登记失业率建模_第1页
我国就业人数或城镇登记失业率建模_第2页
我国就业人数或城镇登记失业率建模_第3页
我国就业人数或城镇登记失业率建模_第4页
我国就业人数或城镇登记失业率建模_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

我国就业人数或城镇登记失业率建模 广东商学院 贝健凤、陈铿、陈建逢 摘要 失业、经济增长和通货膨胀为宏观经济中特别重要的三个指标,就业是社会、国民经 济中极其重要的问题。本模型从经济、教育和人口等众多因素中,通过采用统计分析等不 同的方法,分别对问题做了以下处理: 模型一,对收集到的多个可能因素采取逐步引入-剔除法,利用 spss 进行主要因素进 行分析,也对未被选上因素进行分析,然后用相关分析法对因素进行验收,得到最终结果; 模型二,通过对模型一中的显著相关因素的系数分析建立模型二: 921.57614.09.641.32032 xxxy 模型三,收集不同地区的相关因素,初步建立幂函数模型,再在对其取对数,发现具 有明显的多项式关系,于是在对变量进行多次变换之下,最终得以建立多变量非线性回归 模型: )(4905.)log(0741.2 321 XXdY 结果我们发现该曲线的拟合度较高。 模型四,通过建立 BP 神经网络模型,得到了各个因素与就业人口总量之间的关系模 型,并建立子网络系统对每个因素的未来指标进行预测,然后利用预测出来的指标值对 2010 年和 2011 年的就业人口总量进行仿真预测,并预测出 2010 年城镇就业人口 总量比 2009 年增加 1200(万人) ,2011 年城镇就业人口总量比 2010 年增加 1070(万人) 。 结论,通过对已经建立起的模型进行分析,针对我们的结果,针对国家和工人,我们 给出了相应的措施和建议。 关键词:逐步引入-剔除法 相关分析法 多元线性回归 幂函数 BP 神经网络 一、 问题叙述 失业、经济增长和通货膨胀为宏观经济中特别重要的三个指标,就业(或者失 业)是社会、国民经济中极其重要的问题。按照已有研究,就业可以定义为三个月内 有稳定的收入或与用人单位有劳动聘用关系。失业的统计方法各国差异较大, 我国采 用城镇登记失业率,是指城镇登记失业人数同城镇从业人数与城镇登记失业人数之和 的比。其中,城镇登记失业人员是指有非农业户口,在一定的劳动年龄内(16 岁以 上及男 50 岁以下、女 45 岁以下) ,有劳动能力,无业而要求就业,并在当地就业服 务机构进行求职登记的人员。但由于统计口径不同,存在一定的差异,有些历史数据 也较难获得。 从经济学的角度,影响就业(或者失业)的因素很多。从宏观层面上,消费、 投资、政府购买和进出口都是重要的因素;而从中观层面,不同地区、不同产业也会 表现出不同的特征。当然,中央政府调整宏观经济政策(包括财政政策和货币政策) , 以及对不同地区和不同产业实行不同的扶持政策都会对就业产生巨大的影响。 就我国的现实情况,2008 年我国经济社会经受了历史罕见的考验,GDP 依然保 持 9%以上平稳较快增长,城镇新增就业 1113 万人,城镇登记失业率为 4.2%。2009 年我国就业面临更大的挑战,一是国际金融危机导致国际市场需求难以在短期内复苏; 二是今年我国经济增速下滑;三是国内消费需求乏力;四是一些行业产能过剩与市场 预期不确定导致企业投资不足,所以就业形势十分严峻。 为此,中央政府从 08 年 10 月开始实施了 40000 亿元的投资计划,确定了十大 产业振兴计划,采取扩大国内消费需求的措施,提高对外开放水平以增加出口。同时, 中央财政拟投入 420 亿元资金实施积极的就业政策。09 年我国在就业方面的目标: 城镇新增就业 900 万人以上,城镇登记失业率控制在 4.6%以内(以上数据取自温家宝 总理的政府工作报告) 。 本文参考就业问题的研究成果,利用近年来我国有关的统计数据并结合一年多 来我国国民经济的运行数据就我国就业人数或城镇登记失业率研究如下问题。 1、对有关统计数据进行分析,寻找影响就业的主要因素或指标。 2、建立城镇就业人数或城镇登记失业率与上述主要因素或指标之间联系的模型。 3、对上述模型从包含主要的经济社会指标、分行业、分地区、分就业人群角度, 尝试建立比较精确的模型。 4、利用所建立的关于城镇就业人数或城镇登记失业率模型,根据国家的有关决 策和规划对 2011 年我国就业前景进行仿真预测,对模型的长期走式进行估计, 即性态分析。 5、根据所建立的数学模型和仿真结果,如何对可控制因素进行合理控制来提高 我国城镇就业人口数或减少城镇登记失业率。 二、 模型的假设 1、 官方网站上的统计数据真实可靠 2、 城乡登记就业操作规范 3、 我国经济保持平稳发展 三、 模型的符号说明 3.1 问题一的符号说明 3.2 问题二的符号说明 :就业人口数,单位:万人y : 居民消费价格指数2x :城乡人均收入3 :国内生产总值4x 3.3 问题三的符号说明 :从业人数增长率y : 人均支出1x : GDP2 : 人均收入3x 四、 模型的分析、建立和求解 V1: 时间(单位:年) V6: 进出口总额(单位:亿元) V2: 从业人员(单位:万人) V7: 全国居民(单位:元) V3: 劳动者(单位:万人) V8: 居民消费价格指数 V4: 人均收入(单位:元) V9: 总人口数(单位:万人) V5: 国内生产总值(单位:亿元) V10: 全社会固定资产投资 4.1 模型一的分析、建立和求解 4.11 分析 一个多元化的时代,影响社会就业的因素是多种多样的。由问题一,我们通过 相关的资料查找,发现影响就业因素有:从业人员、 劳动者、人均收入、 国内生产 总值、 进出口总额、全国居民、 居民消费价格指数、总人口数、全社会固定资产投 资等因素。 4.1.2 模型一建立和求解 1、逐步引入-剔除法,选出显著相关因素 根据上面的文字理论分析,我们在中国统计局等相关网站,找到了对应的数据, 通过使用 SPSS 软件,对数据进行逐步引入-剔除法回归分析,得出不同因素对就业人 数的影响大小,附录二表 4-1 反映了逐步引入-剔除法回归分析的各个过程。 如表4-1中所示,SPSS根据设定的F值,逐步地把 V5、V10、V8、V6 从线性方程里面 剔除。 2、对相关变量进行方差分析和t检验 附录二中表4-2给出了在剔除V5、V10、V8、V6的方差分析和t检验结果. 标准方差分析中,显示所用模型的检验结果:F值为:482.770,P值为0,因此我们认 为这个回归模型的是有统计学意义的。而且,使用t检验对包括常数项在内的所有系数进行 检验,P值均小于0.05,所以在模型中所有的系数都具有统计学意义。 3、对未被选上因素进行分析 为了提高筛选的严密性,我们对没有选上的各个因素进行分析,求出P值,进行讨论。 附录二表4-3反映没有进入模型的各个变量的检验结果,可见在Model中未引入模型的 4个候选变量的P值均大于0.05,无需再进行分析。因此影响就业的主要因素有:劳动者 (15 64岁) 、 国内生产总值 ,城乡人均收入,居民消费。 4.1.3 模型二的建立 利用相关分析法,求出各个相关因素的相关系数,表 4-4 给出了各个因素与就业人口 总量之间的相关系数。 表 4-4 劳动者 0.354 全国居民消费 0.9235 城乡人均收入 0.9354 居民消费价格指数 0.8703 国内生产总值 0.9068 总人口数 0.9904 进出口总额 0.9255 全社会固定资产投资 0.6532 由表 4-4 可以看出:城镇人均收入、国内生产总值、进出口总额、城镇居民消费指数、 总人口数与就业人口总量的相关性较强,居民消费价格指数、全社会固定资产投资次之, 劳动者最弱。 4.2 模型二的分析、建立和求解 4.2.1 分析 在问题一的两个模型中得出的结果是有差异的,所以,在进行问题二的求解时,我们 取两个模型中的结果的交集作为对就业人口影响最主要的因素进行建模。 4.22 模型二的建立和求解 模型一通过逐步引入-剔除法,对就业人数相关因素进行系数分析。在模型二中,我 们将模型一中的显著相关因数:居民消费价格指数( )、城乡人均收入、( )国内2x3x 生产总值( ) 与就业人口数 ,建立模型二:4xy4321xx 由于各指标之间没有一个统一的量纲,所以我们通过 excel,将 、 、 、 中的y2x34 数据进行“归一化”处理,将处理后的的数据输入到 spss 中,进行线性回归分析. 附录二表8中,对模型综合分析中有模型的负相关系数R,样本决定系数 ,修正的样2R 本决定系数 ,估计标准误,模型变化导致的可决系数及F值的变化等值。由表中可知模2 型二的修正的可决系数为0.971,其模型的拟合程很好。下面我们看看方差分析。 从附录二表 9 中发现 F 值为 222.758,回归效果不错。但为了进一步分析,我们用 spss 作出标准化残差图进行讨论。 图4-1 从图 4-1 中可以看出,残插图中的点分布是随机的,没有出现趋势性,所以回归模型 是有效的,模型二的最终表达式为: 921.57614.09.641.32032 xxxy 4.3 模型三的分析、建立和求解 4.3.1 问题三的分析 本模型选取从不同地区的角度来对模型进行更精确的建立。 第一步: 通过上述问题分析得出影响就业的主要因素,我们以此因素为分析对象,收集福建省, 广东省两省的城镇从业人数,人均支出,人均收入,生产总值的相关数据(见附表) 。 第二步: 为了对数据具有一定的可比性,对数据表进行归一化。见附录二表 4-8 和表 4-9; 第三步:利用 excel 作出折线图初步分析其相互关系,以确定模型: 图 4-2 福建省 图 4-3 广东省 通过图 4-2 和图 4-3 我们发现它们各自具有非常明显的曲线关系,且都呈上升趋势, 因此,可建立一函数模型来表示它们的关系。 4.32 模型三的建立和求解 下面以福建省为例进行模型的求解,广东省可以此类推得出: 对 GDP 进行相应的变型 ,得出结果如附录二表 4-5 所示,最终得到方程2X2log()dX 如下: 1230.3586()0.18790.2YDLOGX (0.585140) (0.103514) (0.555937) (0.043286) 或 (0.601330) (4.467351) (0.330609) (7.622111) R2 =0.942777 SE=0.022256 DW=0.638309 4.3 模型四的建立与求解 4.3.1 分析 在问题二中,我们建立了城镇就业人口总量与各相关指标之间的多元线性回归模型, 上述模型虽然能够对变量之间的相互关系进行很好的拟合,但其在对未来预测时则发生的 困难,因为它忽略了各变量自身的发展规律,所以必须考虑从各变量的自身发展规律出来, 并结合自变量与因变量之间的关系进行建模求解。 4.3.2 模型四的建立 由于就业人口问题的影响因素众多,所以,我们很难找到一个显示模型来准确的描述, 且不必说用线性模型了。因此想采用传统的数学建模方法,对影响因素众多,而又无确切 规律可循的就业人口数量进行比较科学的预测还是比较困难的,而 BP 神经网络则具有预测 未来发展的非连续性变化的巨大潜力。所以,我们将对所确定的 3 个因素建立 BP 神经网络 模型。 1)BP 神经网络模型原理: BP 神经网络按拓扑结构分,属前向网络,但它采用的是反向传播的学习方法,故又 称为反向传播神经网络(Back-Propagation Neural Network),简称为 BP 网络。 BP 模型是一种多层感知器结构,由若干层神经元组成,除输入层和输出层外,包括 一个或多个中间隐含层。一个具有 3 个输入和一个隐含层的 BP 网络模型结构如图 4-6。 输入节点 输出节点 隐节点 图 4-6 BP 网络模型结构图 BP 网络各层节点之间全部互相连接,同层节点之间不连接,每层节点的输出只影响 下一层节点的输出。BP 算法的主要思想是:对于 n 个输入学习样本 已知与其,21na 相对应的输出样本 学习的目的是用网络的实际输出 与目标矢量,21qy qc 之间的误差来修改其权值,使 与其期望的 尽可能的接近。qy,21 ),21(qkcky 即:使网络输出层的误差达到最小,它是通过连续不断地在相对于误差函数斜率下降的方 向上计算网络权值和阀值的变化而逐渐逼近目标的。每一次权值和偏差的变化都与网络误 差的影响成正比,并以反向传播的方式传递到每一层的。 2)神经网络模型的建立 我们采用前面提出的居民消费价格指数 、城镇人均收入 、国内生产总值)(1ic)(2ic 这 3 个指标作为输入变量,故输入层单元个数为 3 个。采用三层网络结构,其中中间)(ic 层选取 8 个,将就业人口总量 作为输出层,则输出层单元个数为 1。)(is 4.3.3 神经网络模型的求解 首先,为了使所有数据有一个统一的度量,因此对各组数据进行归一化处理,归一化 处理所选用的方法是: 1)(2minaxy 归一化后对新的数据进行神经网络训练,其中: 训练的次数为:net.trainParam.epochs=1000; 训练的结束目标为:net.trainParam.goal=0.0001; 训练的学习率为:LP.lr=0.1; 其他的以系统默认为准。 通过训练网络的预测后得出结果,为了使预测的结果与期望值具有可比性,所以得先 对预测的结果进行反归一化处理,处理的方法是: 1)(2minaxy 分别为每组因子变量的最大值和最小值; 分别为每组因minaxy、 y、 子变归一化前和归一化后的值。 以上步骤具体在 matlab 上实现(源代码见附录程序 1) 利用 1996-2009 年就业人口总量及相关指标数据对神经网络模型进行训练,经过 163 次训练,网络收敛,达到预设的误差目标值 0.0001,从表 4-10 可以看出预测结果与实际值 的误差和拟合图 4-7 是可以接受的。 图 4-7 在归一化下的残差为 9.99988e-005= .100). 3 . V10 Backward (criterion: Probability of F-to-remove = .100). 4 . V8 Backward (criterion: Probability of F-to-remove = .100). 5 . V6 Backward (criterion: Probability of F-to-remove = .100). 表4-2 ANOVA(f) (方差分析) Model Sum of Squares df Mean Square F Sig. 5 Regression 108433373.112 4 27108343.278 482.770 . 000 (e) Residual 449213.196 8 56151.649 Total 108882586.308 12 Coefficients(a)(t检验) Model Unstandardized Coefficients Standardized Coefficients t Sig. B Std.Error Beta 5 (Constant) -19653.638 7264.499 -2.705 .027 V3 .007 .002 .102 3.413 .009 V4 4.132 .887 2.922 4.660 .002 V7 -4.814 1.105 -2.672 -4.356 .002 V9 .654 .069 .722 9.454 .000 表4-3 Excluded Variables(e) Model Beta In t Sig. Partial Correlation Collinearity Statistics Tolerance 2 V5 .945(a) .402 .708 .197 .000 3 V5 .000(b) .000 1.000 .000 .000 表4-5 V10 -.378(b) -.446 .674 -.196 .001 4 V5 -.619(c) -.465 .658 -.186 .000 V10 -.532(c) -.658 .535 -.260 .001 V8 -.168(c) -1.046 .336 -.393 .021 5 V5 -.896(d) -.777 .462 -.282 .000 V10 -.021(d) -.033 .975 -.012 .001 V8 -.102(d) -.667 .526 -.245 .024 V6 .138(d) .814 .442 .294 .019 Dependent Variable: PEOPLE Method: Least Squares Date: 06/30/11 Time: 01:37 Sample (adjusted): 1991 2007 Included observations: 17 after adjustments Coefficient Std. Error t-Statistic Prob. PAY 0.351862 0.585140 0.601330 0.5580 DLOG(OUTPUT) 0.462432 0.103514 4.467351 0.0006 INCOME 0.183798 0.555937 0.330609 0.7462 C 0.329932 0.043286 7.622111 0.0000 R-squared 0.942777 Mean dependent var 0.676734 Adjusted R-squared 0.929572 S.D. dependent var 0.125689 S.E. of regression 0.033356 Akaike info criterion -3.760844 Sum squared resid 0.014464 Schwarz criterion -3.564794 Log likelihood 35.96718 Hannan-Quinn criter. -3.741356 F-statistic 71.39365 Durbin-Watson stat 0.638309 Prob(F-statistic) 0.000000 表 4-8 福建省 年份 城镇从业人数 城镇家庭人均支出 城镇生产总值(现价) 城镇家庭人均收入 1990 0.49924 0.12945 0.05658 0.1128 1991 0.53483 0.1501 0.06725 0.12592 1992 0.54992 0.17043 0.08517 0.14722 1993 0.57835 0.21172 0.12047 0.1831 1994 0.61993 0.28559 0.17779 0.23685 1995 0.62157 0.34808 0.2265 0.29066 1996 0.6336 0.3843 0.26859 0.33361 1997 0.64176 0.44649 0.3104 0.39621 1998 0.62617 0.46869 0.34164 0.41826 1999 0.61949 0.4764 0.36914 0.4424 2000 0.618 0.51006 0.40702 0.47931 2001 0.62765 0.5441 0.44035 0.53612 2002 0.64874 0.59987 0.48302 0.59263 2003 0.70251 0.66542 0.53883 0.64488 2004 0.75152 0.73822 0.62312 0.72071 2005 0.82504 0.7955 0.71022 0.79461 2006 0.90539 0.88716 0.82001 0.88696 2007 1 1 1 1 表 4-9 广东省 年份 城镇从业人数 城镇家庭人均支出 城镇生产总值 (现价) 城镇家庭人均收入 1990 0.41479 0.138375 0.04735 0.130127 1991 0.44975 0.166617 0.057281 0.155497 1992 0.472

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论