




已阅读5页,还剩16页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人力资本、市场参与与农村贫困动态性 展模型实证分析 云南财经大学 摘 要 中国 是 发展中国家 之一 , 与 其 它 发展中国家一样, 贫困问题严重威胁到社会的稳定 。 要维持社会稳定,首先要重视贫困问题。 中国的贫困主要发生在农村,我国现有国家级贫困县 592个,东部 72个,中部 154个,西部 366 个, 西部贫困问题尤为严重。尽管 中国政府扶贫开发成效显著,但“减贫”进程出现波动,甚至出现“返贫”现象。 本 文从新的视角即人力资 本 和市场参与对农户贫困动态性的影响。首先提出人力资 本 和市场 参与对贫困具有影响,然后用传统的面板模型包括随机效应和固定效应面板模型做了回归,发现我们 重点选取 的变量都不显著, 结果有悖于客观经济规律, 说明用传统模型估计存在缺陷。 考虑到传统面板模型的不足,本文考虑农户异质性的 多层 展模型做计量分析 。 模型在建立的过程中, 以位于中越边境的云南红河哈尼族彝族自治州统计局 2006 2009 年调查的农户家计面板数据为样本 做实证分析。及 统计 软件,用现代回归和分类中的随机森林法挑选出相对重要的变量, 用挑选出来的变量做了 传统面板模型和 多层 与前人研究的多元线性回归和传统的面板模型比较 ,可以发现本文 多层 有效,估计的结果也更准确。 最后 得出 结论人力资本中 劳动力平均受教育年限、受过专业培训的人数、劳动力人数以及市场参与中用商品化率、劳动参与率对贫困的动态转化具有显著的影响,具体来说具有显著的正效应,即人力资本和市场参与程度越高,农户脱离贫困的可能性越大,陷入贫困的可能性越小。 本文 还针对研究结果 提出农村扶贫政策要 重点 提高劳动力整体素质 和 鼓励劳动力参与市场。 综上,本文最大的创新之处 有两点:( 1)实证分析的变量不是简单的主观判断,而是通过现代回归和分类中的随机森林法来挑选的;( 2)从新的视角即人力资本和市场参与的角度来研究贫困的动态转化,并将 多层 展模型 引入贫困动态性研究。 关键词: 农户贫困 人力资源 市场参与 动态变化 目 录 摘 要 . 录 .、问题的提出 . 1 二、研究现状及存在的问题 . 2 三、理论假说和研究方法 . 3 (一)理论假说 . 3 (二)研究方法 . 4 1、随机森林法 . 4 2、多层 展模型思想 . 5 四、数据描述与变量选择 . 6 (一)数据描述 . 6 (二)变量选择 . 8 五、多层 展模型的构建 . 10 (一)面板模型 . 10 (二)多层 展模 型 . 11 六、结论与政策涵义 . 14 (一)结论 . 14 (二)政策涵义 . 14 附录 . 16 参考文献 . 18 1 一、 问题的提出 贫困是发展经济学最为关注的主题之一, 贫困发生率是衡量贫困的基本指标。比较不同时期的贫困率,只是从总体方面说明了贫困发生的变化趋势。但在上一年向下一年 转化 的过程中,有些农户可能陷于贫困而有些 农户又脱离了贫困,贫困发生率的变化并没有细致地刻画贫困的这些动态特征。我们 有必要 引入贫困动态性概念来描述这种变化。 贫困的动态性 (指在一段较长的历史时期内,由于社会收入水平和生活水平不断提高而引起的贫困标准的变化连同个人或者家庭状况的改变共同引起的个人或者家庭进入或者退出贫困的运动和状态。根据进入和退出的频率以及处于贫困状态的时间长短,一般把贫困分为长期贫困、短期贫困和从不贫困。贫困动态性研究主要集中在以下几方面:一是长期贫困和短期贫困的发生率、特征及其决定因素的研究;二 是贫困 陷 入与 脱离 概率及影响因素的研究;三是短期贫困和长期贫困的减少对策及其政策侧重性的评价研究,等等。 因此 在贫困动态研究中 ,更为值得关注的问题是 ,对于特定的家庭或个人来说 ,哪些因素可能有利于贫困家庭脱贫 ? 哪些非贫困户又易于陷入贫困状态 ? 针对各地不同的贫困状况,政府实施了一系列的扶贫措施。但大多数是 利用贫困地区的自然资源,进行开发性生产建设 的开发式扶贫。 在农业增长乏力、资源开发遇到环境约束的背景 下,开发式扶贫遭遇了瓶颈。在新的形势下要想稳步提高农民收入, 在外部环境约束既定的条件下 ,家庭特征对农户贫困有显著 影响 ,要进一步有效扶贫则必须瞄准贫困户 ,实现从以自然资源开发为重点向以提高农户人力资本 、市场参与 开发为重点的转变 ,完善扶贫的内容和途径 ,应当更多地强调贫困农户能力的提高。 鉴于此 , 本文的研究主要侧重于第二方面。即 首先从理论上对问题进行描述,描述贫困 的多个 影响方 面 。 然后 针对前人的研究提出本文研究要关注的重点 :人力资本和市场参与对农户贫困的动态影响,影响的路径和为什么有影响 。 本文假定人力资本和市场参与对于贫困户脱离贫困是有影响的 ,且是正向的,即农户受教育水平、专业技术培训的人数、商品化率以及劳动参与率等因素的 提高有助于脱离贫困。具体结构安排如下:第一,问题的提出;第二,研究现状及存在的问题;第三,理论假说和研究方法;第四,数据描述与变量选择;第五,多层 型的构建;最后,结论和政策建议。 2 二、 研究现状 及 存在的问题 中国贫困问题的研究,是发展经济学中非常活跃的研究领域,以往国内外研究中,产生了大量的研究成果。对我国农村贫困的动态变化给出了富有洞察力的观察和解释,大大丰富了我们对中国农村贫困问题的认识,推动了我国扶贫开发工作的发展。 一方面,从宏观上探讨中国农村贫困大幅下降的原因。多数研究都遵照了004)13所概括的“ 经济增长 贫困变动”三角的分析框架 , 在对中国农村贫困的动态研究中,尽管不同的学者采用了不同的分解方法,但所得结论是一致的,即经济增长大幅减少了农村贫困,但收入差距扩大抵消了部分经济增长的减贫效应。如:李实与 1998) 3、万广华和张茵( 2006) 8、夏庆杰,宋丽娜, pp 2007) 11、陈立中( 2009) 1等。另一方面,从微观上探讨农村住户贫困的长期性和短期性及其影响因素。研究认为农村贫困中 暂时性贫困占先导,大部分家庭陷入贫困是由于暂时性的外生冲击造成的。如: 1998,2000) 17、 罗楚亮( 2010) 6等 。 再者, 在降低贫困的影响因素中, 大多数研究者认为人力资本投资对于贫困的动态具有影响,其改善了个人及其家庭的收入,促使农户由贫困向非贫困转化。针对人力资本理论的这种一般性分析结论,国内已经有一些学者从农民收入角度进行了实证检验。 001)16通过对教育回报率的研究发现劳动力平均受教育年限对收入的作用是显著的 ,表明不断提高劳 动力教育程度仍然是当前贫困地区农村人力资本投资诸多形式中最为重要的一种。王海港和黄少安( 2009)9讨论了职业技能培训对珠江三角洲农村居民非农收入的影响,得到参加培训者在 2007年的平均非农收入比未参加者高了近 4000元,培训收益率高达 19%。杨国涛( 2010) 12分析家庭特征对农户贫困的影响时发现劳动者是否接受培训对打工收入的影响并不显著,认为可能是农民技术培训 重 于形式 ,没有达到实质性地改善接受培训者的人力资本状况的目标。另外,很多研究结果表明 市场化改革是 减少贫困的另 一条重要的途径 ,中国农村贫困的 降低主要来自于市场化改革所带来的经济增长。 如 ,001)19等。但另一些研究结论却并非如此。 如 004) 18研究了次撒哈拉非洲国家的市场化改革对农业增长的影响后发现 ,自由市场的建立和发展并没有普遍带来农业的增长 ,农村贫困也并没有显著降低。 如此看来人力资本和市 场参与 程度的提高 能否降低贫困并没有一个统一的结论,不同国家不同地区的情况都不相同。之所以会出现这样的情况 主要 是因为市场参与,像外出务工、专业化生产是有风险的。 上述学者在 宏观、微观甚至具体到农户 市场参与、人力资本对 贫困动态性 影响 方面 都 做了大量研究工作,为后续研究做了很好的铺垫,但是 所得结论并不完3 全一致 , 尤其是对于农户贫困动态性的影响因素中,人力资本和市场参与程度的提高对于农村减贫没有一致的效果,同时我们必须承认 一个共同的存在的问题:大多数研究都是在面板数据的情况下直接建立方差与农户特征变量的回归来估计方差,很少有人考虑到嵌套数据的异质性可能会对收入或者消费的估计带来不利影响。本文采用多层 除了异质性的影响,结果更为可靠。一些不足,在本文中也可能存在,还需进一步研究。 三、 理论假说和 研究 方法 (一)理论假说 由于我们把农户作为一个个体,因此一个农户在参与市场时要么外出务工、要么进行专业化生产,两者只能选其一。大多数研究者在研究市场参与对农户贫困的影响时,仅仅把那些外出务工的与没外出务工(也没进行专业化生产)的进行比较或仅仅把那些生产了农产品并在市场上进行交易的农户与那些生产了农产品没在市场上交易的农户进行比较。如章元,万广华( 2009) 1把农户假设为第一个农户完全自给自足 ,不参与任何市场交易 ; 另一个农户自己生产的农产品全部到市场上交易 , 然后用销售农产品的收入在消费品市场上购买他所需要的全部 消费品。这样虽然能够分析市场参与对农户贫困的影响。但是并没有考虑市场参与的风险对农户贫困动态变化的影响。我们的研究考虑了市场参与的风险对农户贫困的动态影响,弥补了以前研究的不足。 人力资本对农户贫困有显著影响 , 包括教育水平 、 职业培训、外出务工等 ,教育水平和外出务工起到了明显减缓贫困的作用。人力资本投资有利于改善贫困地区农民个人及其家庭的收入状况 , 证明了人力资本理论的一般性分析结论具有广泛的适用性。 市场参与率主要可以用商品化率和劳动参与率等指标来衡量 ,其中 商品化率是生产的总产品中用于在市场中出售获取现金收益的 比例;劳动参与率是指劳动年龄人口在劳动力市场中从事有偿工作的程度和比例。劳动参与率的概念是从微观角度而言的 , 可以用工资性收入占总收入的比例来衡量。 我们知道 , 人力资本和市场参与对农户贫困都有动态影响, 我们 所关注的问题是 : 影响的路径是什么和为什么有影响 ? 显然 , 寻求这个问题的答案具有重要的现实意义。 1 章元 、 万广华 、 刘修岩 、 许 庆 , 参与市场与农村贫困:一个微观分析的视角 J, 世界经济, 2009年第 9 期 4 因此,在本文的研究中,我们 做如下 假定 : ( 1) 人力资本和市场参与对于贫困户脱离贫困是有影响的 ,且是正向的,即人力资本和市场参与的提高有助于脱离贫困 ; ( 2)本文的样本数据对于研究贫困尤其是贫困动态 转化 具有很强的代表 性,样本 个体 间存在差异性,对于做 多层 有效。 在以往的研究中都没有考虑贫困个体之间的异质性,本文在经典线性回归模型和普通面板模型的基础上,引入近年发展起来的多层 分考虑异质性来探索人力资本和市场参与对贫困动态性的影响,以得到比较明确且与实际相符合的结论。 (二) 研究方法 1、 随机森林法 由于传统的分类模型往往精度不高 , 且容易出现过拟合问题。因此 , 很多学者通过聚集多个模型来提高预测精度 , 这些方法称为组合 (分类器组合 (法 1。 随机森林是 现代回归和分类中的方法之一 ,是 一个包含多个决策树的分类器 , 并且其输出的类别是由个别树输出的类别的众数而定。 而 “ 是他们的商标。这个术语是 1995年由贝尔实验室的 来的 。 这个方法则是结合 想法 和 以建造决策树的集合。 在生成树的时候,在每个节点都仅仅在随机选出的少数变量中选择。 不但样本是随机的,每棵树、每个节点的产生都有很大的随机性。随机森林让每个树尽量增长,而且不进行修剪。 随机森林法具有的优点如下: (1)对于很多种资料, 它比它产生以前所有的经典回归方法都精确,且不需要考虑分布假定; ( 2)它对于大的数据库和很大的维数也很有效率,正符合本文实证分析的大样本量;( 3) 它可以在决定类别时,评估变量的重要性 ;( 4) 在建造森林时,它可以在内部对于一般化后的误差产生不偏差的估计 ; ( 5) 它包含一个好方法可以估计遗失的资料,并且,如果有很大一部分的资料遗失,仍可以维持准确度 ;( 6) 它提供一个实验方法,可以去侦测 ( 7)对于不平衡的分类资料集来说,它可以平衡误差 ;( 8) 它计算各例中的亲近度,对于数据挖掘、侦测偏离者( 将资料视觉化非常有用。 1 方匡南 、 吴见彬 ,随机森林方法研究综述 J,统计与信息论坛, 2011 年第 3 期。 5 本 文 对贫困影响的因素很多,鉴于 随机森林具有 以上其他方法无法比拟的优点, 运用 其 选取重要的变量 ,将 挑选出 来 的 变量 进一步做计量分析 , 有利于揭示影响贫困 动态性 不曾被关注或者关注很少的因素, 此 过程 采用 2、多层 展模型思想 从现有的研究中,大多数研究者都采用的回归的方法,即用回归的方法估计收入或者消费的函数,在根据拟合的模型预测未来收入或者未来消费,再根据预测结果计算未来收入或者消费的均值和方差。而在对收入或者消费建立回归模型时, 存在两种情况:一是只有横截面数据,这种情况文献较少,方法也很少如002)1用非参数的方法来计算;二是面板数据的情况下,这种情况文献较多,研究者们有些直接建立方差与农户特征变量的回归来估计方差,如 003)2, 有些建立面板固定效应回归和随机效应回归估计永久性收入或者消费,如 006,2008,2009)。但是已有的研究中,很少有人考虑到嵌套数据的异质性可能会对收入或者消费的估计带来不利影响。 用横截面数据对消费建立多水平模型,很好的考虑异质性问题,但是对于纵向数据考虑异质性问题大多用面板随机效应模型,即使估计出来的 2R 很小或者其他的统计检验效果并不好。 纵向数据的应用越来越广泛,纵向数据具有几个明显的特征: ( 1) 每个研究对象反复地收集数据,研究对象内观察值之间会存在相关。即组内同质。 ( 2) 变异的来源有两个。研究对象个体变异和研究对象个体内变异。这些变异都可能随时间变化而变化。 ( 3) 数据常常不完整。因为可能由于各种原因而没对研究对象及时记录。 一方面,传统的普通最小二乘法 (适用于分析纵向数据。首先 察对象相互独立、同方差性等。均不适合于纵向数据。 致统计检验的第 类错误,可能得出不正确的推论 。 其次 是说, 而不能分析结局测量发展轨迹的个体特征和变异。 另一方面,传统的数据分析方法不适用纵向数据。 无论是 单元重复测量 差分析 )还是 多元重复测量 差分析 )都 不适用于纵向分析。 因此, 本 文选用近年来发展起来的多水平模型 10来做计量分析, 对于前面所述重复性调查收集的纵向数据的 特点 即 研究对象重复测量嵌套于个体中。 我们可以 把研究对象在各时点的测量看做水平 1单位。 把研究 对象则看做为水平 2单位,1 G . 002: 2 957, to 6 因为个体内高度相关。应用于纵向数据中,这样的多层模型叫做发展模型。 发展模型具有简单线性回归模型和面板模型所不具备一些优点:第一, 在随机缺失的前提下,发展模型具有处理不完整数据的能力。可在最大似然或限制性最大似然的基础上利用全部数据 ;第二, 发展模型有很大的灵活性,不仅能处理研究对象重复次数不等的情况,而且还可以处理重复测量间隔时间不等的情况。第三,发展模型不要求研究对象内的观察值相互独立,也不受某些限制性假设。该方法可以从研究对象个体内变异的角度,也可以从研究对象个体间变异的角度或同 时两个角度来分析纵向数据。 最后,发展模型很容易纳入时间变化协变量。 类似于两水平, 发展模型分为线性发展模型和曲线发展模型,本文主要介绍简单线性发展模型。 一般线性发展模型 水平 1观察单位是各研究对象的重复观察值,水平 2观察单位则是个体研究对象。水平 1表达式如下: 01ij j j ij t e 其中平 2单位 j )的第 i 次(水平 1单位)的 被解释变 量;0j为截距;单位时间变量;1j是设其服从以零为均值、以 2 为方差的正态分布)。0j和1j都是随机回归系数,代表不同研究对象有不同的 被解释变 量 初始值和 被解释变 量 随时间变化的不同变化率。 水平 2模型表达式 : 0j 个观察个体结局变量初始水平和变化率与平均初始水平和变化率的差异;该随机效应假设分别服从零均值、以 20u和 21u为方差的正态分布 。 又由于 本文研究的 因变量是是否贫困的分类变量所以 建立了 多层 困 的决定因素 , 多层 型在纵向数据中的应用 与普通发展模型的思路一致。 四、 数 据描述与变量选择 (一) 数据 描述 本 文 研究所用的数据来自云南省红河 哈尼族彝族自治州 统计局 2006 2009年调查的农户家计面板数据。 红河哈尼族彝族自治州地处云南省南部 , 下辖 2市、 11个县 , 基本特征是多山区、多民族、贫困人口多、边境线长 ; 有 10个世居民族,少数民族人口占 56%; 河口、金平、绿春三县与越南接壤,边 境线长 8480 0 0 0 1 0j j 1 1 0 1 1 1j j 7 公里 ; 各民族社会发育程度不平衡, 是西南边疆民族地区的典型代表。红河 哈尼族彝族自治州 统计局的农户调查覆盖全州 13 个县(市), 295 个行政村,每个行政村抽样调查 10 或 15 户,总样本数量有 3000 户。 在建立模型之前,我们将对数据做一些处理。首先,由于数据具有一定的时间跨度,为了扣除价格因素的影响,我们根据云南省农村 价格 指数对农户 2006次,因为所建模型 需要考查调查对象人均纯收入连续年份的变化情况,我们剔除了统计不连续等情况的不符合要求的部分数据。 最后从 3000 个样本中剔除了 368个,每年共计样本量 2632 户, 覆盖 276个行政村。 首先 运用转移矩阵描述性的讨论 样本数据中农户 贫困的动态转化,探讨哪些家庭是上一年贫困而下一年脱离贫困,哪些家庭又是由非贫困陷入了贫困,或脱离贫困后短时间内又重新陷入贫困。在低收入标准( 1196元)下,分析 2006: 表 1 贫困动态转换矩阵 绝对转换绝阵 (户) 相对转换绝阵 ( %) 年份 2006 2007 2008 2009 年份 2006 2007 2008 2009 2006 550 2006 1 2007 236 486 2007 2008 152 166 362 2008 2009 79 75 61 271 2009 由表 2可以发现, 2006年,在样本总体 2632户农户中,有 550 户处于贫困,其中 236户在 2007 年继续贫困,占 2006年贫困总体的 43%,换个角度说, 2006年贫困的农户中有 57%的成功脱离贫困; 2006 年处于贫困状态的 550 户有 152户在 2008年继续贫困,占 2006年贫困总体的 28%; 2006年处于贫困状态的 550户有 79 户在 2009 年继续贫困,占 2006 年贫困总体的 28%。 同理, 2007 年,在样本总体 2632 户农户中,有 486 户处于贫困,但是由于上一年持续贫困的只有236户,说明 2007 年又有新的 250个家庭由非贫困陷入贫困,其中 2007年贫困的家庭中有 166 户在 2008 年继续贫困,占 2007 年贫困总体的 34%,即 2007 年贫困的农户中有 66%的成功脱离贫困; 2007 年处于贫困 的 486户有 75户在 2009年仍然贫困,占 2007 年贫困总体的 15%。在 2008 年,在样本总体 2632 户农户中,有 362户处于贫困,但是由于 2007年持续贫困的只有 166户,说明与 2007年相比, 2008 年又有新的 196 个家庭由非贫困陷入贫困,其中这 196 个家庭中有 152 个家庭是 2006 年发生过贫困, 2007 年暂时脱离贫困后在 2008 年又陷入贫困,说明这 152 个家庭非常脆弱,经不住外界的风险冲击,其中 2008 年贫困的家庭中有 61户在 2009年继续贫困,占 2008 年贫困总体的 17%,换个角度说,2008年贫困 的农户中有 83%的成功脱离贫困。 在 2009年在样本总体 2632户农户中,有 271 户处于贫困,但是由于 2008 年持续贫困的只有 61 户,说明与 20088 年相比, 2009 年又有新的 210 个家庭由非贫困陷入贫困,其中这 210 个家庭中有 79 个家庭是 2006 年发生过贫困, 2007 年和 2008 年脱离贫困后在 2009 年又陷入贫困,还有 75 个家庭是 2007 年发生过贫困,在 2008 年暂时脱离贫困后在2009年又陷入贫困说明这 154个家庭也非常脆弱,经不住外界的风险冲击。 由以上 动态性描述 分析可以发现, 农户动态转化比较活跃,因此 研 究贫困的动态性对于政府制定扶贫政策具有很好的指导意义。 (二)变量选择 这里首先对贫困动态性这个因变量加以说明, 贫困动态有绝对和相对之分。绝对贫困动态可以用“贫困发生率” (贫困人口调查指数 )、“贫困缺口率” (贫困差距指数 )和“贫困缺口结构变动率”来反映 ,但 研究 不同时期贫困率的变化并不能细致地刻画贫困的动态特征。在贫困动态研究中 , 更为值得关注的问题是要研究 有利于贫困家庭脱贫 和导致 非贫困户陷入贫困状态 的因素,从而有针对性的开展扶贫工作 。 因此在本文的研究中 , 我们以 国家统计局在 2009 年的公布的农村低收入标准 1196元 为贫困的分界点,即农户家庭每年人均纯收入低于 1196元的属于贫困户,反之则非贫困, 动态性贫困 这个变量 是这样定义的: 如果某个家庭是上一年贫困而下一年脱离贫困 则定义为 1,若 下一年由非贫困陷入了贫困则定义为 保持上一年的状态不变则定义为 0,是一个三元分类变量 。 且因为是研究农户贫困的动态转化,即要用下一年与上一年的贫困状态做比较得出动态性, 2006007 跟农户家庭相关的变量包括物资资本、人力资本、市场参与、收 支结构 和地理环境五 个方面。综合考虑章元、万广华( 2009),黄祖辉、刘西川和程恩江( 2009)2,李兴绪、刘曼莉和葛珺沂( 2010) 1中对于贫困影响的指标,本文中物资资本包括人均耕地1x、人均生产性固定资产原值2均期末金融资产余额3x;人力资本用家庭常住人口4x、劳动力平均年龄5 按上学年数进行折算,其中:文盲半文盲 0,小学 6,初中 9,高中 12,中专 12,大专 15)、受过专业培训的人数7x、劳动力人数8场参与则用商品化率10x、劳动参与率11x、转移劳动力人数12x、外出就业的劳动力人数13支结构包括农户家庭经营收入中非农产业收入15x、人均第一产业收入16x、人均工资性收入17理环境则有距是否参加合作医疗19x(1 =是 ,0=否)、1 李兴绪 、 刘曼莉 、 葛珺沂 , 西南边疆民族地区农户收入的地理影响因素分析 J,地理学报, 2010 年第 2期 。 9 最近县城的距离201=5公里以内、 0=5公里以上)、地势22x( 1 = 山区地区, 0= 其他地区)、住宅外道路23x( 1=水泥路或柏油路, 0=其他路面)、民族 村24x(1=是 ,0=否)。本课题以这 24个变量为自变量研究对贫困 动态性 的影响。 由于变量较多,首先对变量进行重要性挑选,本文采用现代回归和分类中的随机森林法,选用 程序及输出结果见附录 A) 。 根 据随机森林分析的变量重要性程度和本文想关注的因素,最终选取 物资资本包括人均耕地、 人均生产性固定资产原值 ; 人力资本用 劳动力平均受教育年限、受过专业培训的人数、劳动力人数和家庭劳动力负担系数; 市场参与则用 商品化率、劳动参与率 ; 收 支结构 包括 人均第一产业收入、人均工资性收入和人均生活消费支出; 地理 环境 中 地势上述 11变量作为贫困的衡量指标来做计量分析,变量的名称和定义如下表 2: 表 2 模型涉及的变量名称和定义 变量 变量组别 定义 户贫困 贫困动态转化 (1=上一年贫困而下一年非贫困 ; 0=贫困与 非贫困 状态保持不变; 一年非贫困而下一年贫困 ) 序号变量 农户的序号 1, 2 2632 间变量 赋值为 1, 2, 3, 4 分别代表 2006的时间点 物质资本 人均耕地 质资本 人均生产性固定资产原值 力资本 农户劳动力平均受教育年限(年 /人),按上学年数进行折算 力资本 农户劳动力中受过农业技术培训的人数(人) 力资本 农户劳动力人数(人) 市场参与 农户农产品商品化率( %): 家庭农产品现金收入占农产品收入的比重 场参与 劳动参与率( %):工资性收入占纯收入的比重 支结构 人均第一产业收入 支结构 人均工资性收入 支结构 人 均生活消费支出 理环境 地势:山区取 1,其它取 0 由于本文的样本数据是 2006农户家计 纵向数据,而纵向数据具有2个方面特征:第一,每个研究对象反复收集,所以对象内的观察值之间会存在相关;第二纵向数据有两种变异,即研究对象个体变异和研究对象个体间的变异。而这些变异可能会对时间的变化而发生改变;这就要求有合适的模型来估计收入或者消费模型。 我们接下来采用处理纵向数据的模型来进行回归分析, 在模型的构建中, 拟首先 运用 面板模型(包括随机效应和固定效应模型), 再 引出 多层 发展模型 ,本文中 的因变量 一个分类变量,所以模型都采用多层 展模型 。 10 五、 多层 展模型的构建 ( 一 ) 面板模型 面板数据是对同一组样本连续追踪多个时期所得到的数据。面板数据模型是研究面板数据的计量模型 , 可以建立静态 和 动态面板计量模型。静态面板数据模型包含混合模型,固定效应模型,随机效应模型,确定系数面板数据模型,随机系数模型等。 根据对个体影响处理形式的不同,变截距模型分为固定影响模型和随机影响模型两种,因此,在利用面板数据建模时所面临的主要问题便是如何在固定影响模型和随机影响模型中进行选 择。在确定固定影响还是随机影响时,一般的做法是:先建立随机影响的模型,然后检验该模型是否满足个体影响与解释变量不相关的假设,如果满足就将模型确定为随机影响的形式,反之则将模型确定为固定影响的形式。对于如何检验模型中个体影响与解释变量之间是否相关,1978)提出了一种严格的统计检验方法 验。该检验的原假设是:随机影响模型中个体影响与解释变量不相关 。 运用 件操作 (操作程序见附录 B) 得到回归结果如下表 3。首先定义截面变量和时间变量分别 为序号变量和时间变量。然后以农户贫 困为因变量, 人均耕地、 人均生产性固定资产原 值等 11 个变量为自变量做 随机效应和固定效应模型 。 表 3 随机效应和固定效应模型回归结果 随机效应模型 (模型 ) 固定效应模型 (模型 ) 变量名称 参数估计 T 值 参数估计 T 值 20 10 15 出结果可以看出, 无论是 随机效应模型 还是 固定 效应模型 中, 虽然 过了显著性检验,另外在模型 中 著,在11 模型 中地势显著, 通过了显著性检验说明变量对贫困的动态性具有显著的影响,反之则否。 但 本文 重点 想要关注的人力资本和市场参与中的五个变量 通不过显著性检验, 在 模型 中, 强 通过显著性检验 。 说明本文的数据用面板模型来做计量分析是不合适的。同时我们注意到 对数 似然 比比 较中 , 相 对来 说 模型 明,我们拒绝了原假设, 也说明了这一点 。 ( 二 ) 多层 展模型 前面用 用 面板模型 对贫困动态性做回归,结果不理想,主要是其自身存在的局限性导致的,这里引入本文在方法研究中重点介绍的多层 展模型 ,与普通发展模型是类似的。 多层 型只能处理因变量是二元的情况,但本文的贫困转化的状态有三种状态,所以这里分 两种情况进行讨论 。 第一种就是分析农户由非贫困陷入贫困的影响因素 , 我们设定由非贫困陷入贫困的状态为 1,其他的两种状态为0;第二种就是分析农户脱离贫困的影响因素,我们设定由贫困到非贫困的状态为 1,其他的两种状态为 0; 这里 件操作 ,用限制性最大似然估计方法( 行估计。 本 文 首先 采用随机效应的多层 展模型。水平 1 即是个体内模型表示个体 i 次因变量值由他的因变量初始水平定 ,水平 1的解释 变量是 平 2 即是个体间模型,个体间模型将个体 j 的初始因变量水平分解成两部分00和个体效应平 2 的解释变量为 随机森林 挑选出来的12个变量。 这里我们 还加入水平 1和水平 2解释变量的交互效应, 设定 因变量随时间推移的变化率是以固定系数10。个体特异性效应被假设为均值为零、方差为 20u的正态分布,( 2,1,2,1 ) ,则基本模型表达式如下: 0190 j 0 0 0 0191 j 1 0 11990 0 0 1 0 1 0111 l o g i t ( ) l o g ( )122l o g i t ( )j j j i m i j m i j m m i j m i j m i j j i i m i m e x u T i m e 水 平 :水 平 :水 平 :组 合 模 型 :本文将农户数据按 时间 进行分层,首先检验农户 贫困的 数据是否存在层次结12 构,考虑无解释变量的空模型 。 数据存在显著性组内相关,说明有必要进行分层分析。 在 5%的显著性水平下, 对于模型 中,空模型 1 . 2 3 2 1 1 . 3 0 2 7 50 . 1 0 90 ()是显著的,说明层间差异大,需要进行分层分析;截距项 1 . 8 4 6 . 1 5 3 80 . 0 3 90 也是显著的 。而对于模型 空模型0不显著的 ,本文仍然进行分层分析。 把所有的变量全部加进去,发现有些变量 统计检验 不显著,经过多次的放入和删除变量, 得到了如表 4的结果。 表 4 多层 展模型 回归结果 陷入贫困因素回归结果 (模型 ) 脱离贫困因素回归结果 (模型 ) 变量名称 参数估计 T 值 参数估计 T 值 空模型0j 0 0j 0 二元选择模型中估计的系数不能成对因变量的边际影响,只能从符号上判断。如果为正,表明解释变量越大,因变量取 1的概率越大;反之如果系数为负,13 表明相 应的概率越小。 在其他变量控制不变的时候, 模型 估计结果中 估计值为 其发生比率为 示 人均耕地 每增加一亩 ,农户陷入贫困的发生比率约为 表明农户农产品商品化程度越高,脱离贫困的概率越大 ; 估计值 ,表明农户劳动参与程度越高,脱离贫困的概率越大 ,表示农户 工资性收入占纯收入的比重每增加 1%, 农户 脱离 贫困的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论