【毕业学位论文】(Word原稿)南京市流动人口医保问题统计研究-统计教育学_第1页
【毕业学位论文】(Word原稿)南京市流动人口医保问题统计研究-统计教育学_第2页
【毕业学位论文】(Word原稿)南京市流动人口医保问题统计研究-统计教育学_第3页
【毕业学位论文】(Word原稿)南京市流动人口医保问题统计研究-统计教育学_第4页
【毕业学位论文】(Word原稿)南京市流动人口医保问题统计研究-统计教育学_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

I 南京市流动人口医保问题统计研究 南京财经大学 目 录 摘要 . 、 绪论 . 1 (一) 研究背景 与问题的提出 . 1 (二)问题研究综述 . 1 (三)建模思路与技术路线 . 2 二、流动人口的人口学特征统计分析 . 5 (一)调研设计 . 5 (二) 列联 表 分析 . 5 (三) 对应分析 . 8 三、 基于离散选择模型的参保影响因素分析 . 10 (一) 变量选取 . 10 (二) 基于因子分析思想解决多重共线性问题 . 10 . 10 想 . 11 . 12 (三) 基于二元离散选择模型的实证研究 . 14 . 14 型介绍 . 15 . 17 . 20 (四) 基于多元离散选择模型的实证研究 . 21 型介绍 . 21 . 22 四、 基于结构方程模型的满意度分析 . 25 (一) 结构方程模型说明 . 25 . 25 . 25 (二) 变量说明 . 26 (三) 实证分析 . 27 . 27 . 28 五、 主要结论及相应政策建议 . 30 六、本文的创新与不足 . 33 参考文献 . 34 附录 . 38 要 上世纪 90 年代以来,随着城乡改革和对外开放的扩大,我国出现了人类历史上最为壮观的人口流动大潮。然而,在大规模农村劳动力进入城市,为城市繁荣做出巨大贡献的同时,他们在社会保障方面却没有得到应有的待遇。 本文通过对 南京市 流动人口的医保状况进行调研,对流动人口参保的影响因素以及医保满意程度进行分析 建模 ,以 期给政府部门提供一些可靠的建议供参考决策,从而能建立一种具有一定针对性的让流动人口普遍满意的医疗保障制度,并能吸引流动人口积极参加到务工地的医疗保障中。 首先从描述统计的角度进行分析,并将流动人口的参保选种和相应的人口学特征变量,以列联表的形式描绘出来,通过 2 检验,初步判断是否参保与哪些变量有关。在此基础上 进行 对应分析,通过对应分析图直观的反应出参保选种与各变量间的关联。 其次,在描述统计的基础上,使用离散选择模型从定量的角度上进行实证分析 ,并 得出结论: 报销比率的提高会促进流动人口的参保;从事职业与具体参 加哪种保险并无显著关系,但与是否参加保险有关;收入增加、受教育年数增加与具体参加哪种保险并无显著关系,但对是否参保有积极的作用;户籍对是否参保无显著关系,但持非农户口的更有可能参加城镇职工医保。 最后,通过建立结构方程模型对流动人口的医疗状况满意度进行分析,得出结论:就医服务质量感知和医保服务质量感知影响了流动人口的满意度;当流动人口医疗满意度提高,未来参保意愿就会提高,这个关系十分显著;另外,政策认知能显著影响就医和医保服务质量感知。 本文建模的创新之处在于通过因子分析的思想寻找工具变量,以解决离散选择模 型中的多重共线性问题;另外,将那些在户籍地参加了新农合,但在务工地无法享受到相应福利的那部分流动人口界定为无医保者,这也是本文的一大创新。 关键词:流动人口;医疗保障; 型;结构方程模型 1 一、 绪论 (一) 研究背景 与问题的提出 上世纪 90 年代以来,随着城乡改革和对外开放的扩大,我国出现了人类历史上最为壮观的人口流动大潮。数量庞大的流动人口,其主体是从农村转移到城市的务工人员,即通常所说的农民工。南京市作为江苏省省会,有着较为发达的政治经济文化,是一个重要的流动人口流入地。然而 流动人口 在 为市场经济的发展和城市的繁荣做出巨大贡献的同时,他们在社会保障方面却没有得到应有的待遇。 主要表现在:( 1) 原则上 规定 用人单位必须给职工参加 城镇 职工 医疗保险(以下简称职工医保) ,但 由于 农民工文化程度有限,一般都在小型不正规企业, 真正能 参加职工医保的人数很少。 ( 2) 城镇居民基本医疗保险 (以下简称居民医保)明确规定了覆盖人群为城镇中那些不属于城镇职工基本医疗保险制度覆盖范围的学生、儿童以及其他非从业城镇居民。即对于没有南京户口的流动人口,即使是那些没有经济来源的妇女、儿童,也不太可能参加居民医保 1。 ( 3) 所以大 部分流动人口 只能参加新型农村合作医疗(以下简称新农合) 。但新农合 除了保障水平低外,还 存在着 一个 问题:流动人口在户籍地参加了新农合,然而对于长期在南京打工的流动人口来说,每次生病都返乡看病不太现实,在定点医院看病再回乡报销的手续十分繁琐。也就是说,一部分在户籍地参加了新农合的流动人口,来了南京后 无法享受到应有福利。 对于这样一部分人,本文将其视为无医保者,这也是本次 建模 的一个 创新之处 ,后文中提到的无医保者均是这个概念。 因此, 建立健全有关流动人口的医疗保障制度,不仅对于解决该人群在城市务工期间的医疗保障问题具有 重要的作用,而且对我国产业结构的调整和市场经济的发展,乃至构建和谐社会都具有极其重要的现实意义。 (二)问题研究综述 国内对这方面的研究较晚,大多是以定性分析为主,定量分析的 较 少。这些文献大多集中在最近 10 年,也反映出我国逐渐开始重视到流动人口这个特殊群体的医疗保障问题。 首先,从对流动人口医疗保障制度及政策方面的分析来看,主要有以下一些观点。王向( 2003) , 佟艳超、刘芮( 2010)对流动人口社会保障政策方面的分1事实上,在调研的 150 名流动人口中,确实无人参加居民医保。 因此在 后 文 的分析中,不再单列一栏 城镇居民医保 。 2 析后,提出了一个观点,就是通过改革户籍制度,最终把农民工纳入城市,一方面可以提高城市化率,另一 方面可以更有效的解决流动人口的医疗保障问题。蔡建民( 2006)提出要建立以农民工为主体的流动人口社会保障体系框架,需要建立并完善包括现行社保基金管理机构服务方式在内的各项配套服务。陈海波、肖样敏( 2008)通过对衡阳市流动人口的调研,得出了类似的结论,建议构建 协同互补型 的流动人口医疗保障体系。贾勇、王琼( 2009)主张通过加大对政策的宣传力度,以此提高流动人口医疗保险的参保率;重视不同人群的不同健康问题这一点很重要,并有针对性的采取医疗保障措施。常传颂( 2010)对浙江省农民工医疗保障的现在调查后,主要 站在法治的角度上,提出:国家必须制定一部相关法律;强化用工单位的法律责任;加强对农民工医疗保障的监管。 其次,从流动人口医疗保障状况及影响因素的实证分析方面,主要有以下一些观点。彭绩、程锦泉( 2005)通过对深圳市流动人口进行分层随机抽样调查,采用定性研究与定量研究相结合的方法,结果表明,流动人口在社区卫生服务提供与利用中均处于弱势地位,即卫生需求高,但利用率很低。王兰芳、陈万明、崔晓宁( 2006)通过 适度性 测评,发现当前江苏省新农合保障水平低于适度性的下限,呈现低态,必须从合作医疗的基金供给和基金支出 2 个方面采取适度性调控,以达到平衡策略。朱考金、狄金华( 2008)通过对南京市的进城农民工调研,发现农民工居住状况差,基本消费占了整个消费支出的很大比重,相比较而言,医疗支出的比重很小,与农村居民相比,进城农民工的身体健康情况略好,而在医保处理这方面,农民工比较消极,通常选择成本低的方式。黄乾( 2009)利用城市农民工调研数据,通过 型进行实证分析,研究农民工参加医保及模式选择的影响因素,得出结论是提高农民工的人力资本和收入水平,是增加农民工医疗保障需求和提高医疗保障参保率的最重要途径。刘宏、王 俊( 2010)利用 中国健康与营养调查 ) 数据,从居民对医疗保障信息认知情况进行分析,得出对医疗保障信息认知如何显著影响其卫生医疗需求的结论。研究发现,对医疗保障信息缺乏认知的城乡居民,在卫生医疗需求方面不足,从而使医疗改革的效果大打折扣,体现出公共政策的重要性。 (三) 建模思路与技术路线 本文 建模 目的是通过对 南京市 流动人口的医保状况调研分析,以期给政府部门提供一些可靠的建议供参考决策, 从而能 建立一种具有一定针对性的能让流动人口普遍满意的医疗保障制度,并 引导 流动人口积极参加医保。围绕着这个目标,笔者倒 着逆推出本文的脉络,并以此为 建模的 路线。 3 图 逆推 建模 思路 由本文的 建模 目 的 ,既然要建立一种让流动人口普遍满意的医疗保障制度从而让流动人口积极参保,所以必然要先解决这样两个问题: 1. 什么样的流动人口对应会选择哪种医保? 2. 怎样的医保才是让流动人口 普遍 满意的?或者说流动人口对于医保的满意程度取决于哪些因素?这样逆推得到的写作思路可以避免出现为了建模而 建模、 陷入 唯方法论 、 计量模型脱离主题的问题。 思路上的逻辑关系 方法上的逻辑关系 图 技术路线 流动人口人口学特征描述统计 流动人口医疗保障参保影响因素分析 研究意义 文献综述 政策建议 列联分析 2检验 描述统计图表 对应分析 结构方程 满意度分析 离散选择模型 二元多元 基于因子分析构造工具变量 建模目的 怎样的医保才是让人满意的,并能引导人参与? 什么样的流动人口对应会选择哪种医保? 参考文献 调研考察 汇总数据 统计建模 流动人口医疗保障满意度分析 4 根据 以上建模 思路,可以得到本文 建模 的技术路线 , 如图 2 条主要的脉络,一条是思路上的逻辑关系(图 半边),一条是方法上的逻辑关系,图中细箭头代表逻辑上的递进关系。 本文在借鉴国内外相关理论研究成果的基础上,通过设计调查问卷,对南京市流动人口进行抽样调查 。先采用列联分析和对应分析,用图表的方式直观的先验反应出流动人口医保选种与人口学特征之间的联系,在此基础上采用离散选择模型解决第一个问题,即“ 什么 样的流动人口对应会选择哪种医保 ”;再采用结构方程模型解决第二个问题,即“ 流动人口对于医保的满意程度取决于哪些因素 ”。综合以上建模得出的结论提出政策建议, 为完善流动人口医疗制度提出有益的决策参考。 5 二 、流动人口的人口学特征统计分析 (一) 调研设计 通过前期文献研究和专家座谈,本次调研地点选择流动人口日流动量较大的人才交流市场,从走出劳务市场的人中每隔 4 人抽取一人进行调研,共与 150名流动人口进行面对面访谈。 调研问卷共分 4 个部分: 其中包括了流动人口的个人基本信息、职业信息以及家庭信息; 中包括了被访者个人的参保信息、被访者子女和配偶的参保信息,被访者的就医信息; (二)列联表分析 使用马克威 件 对调研 问卷中 的 一些 重要变量进行描述性统计 分析 , 得出 被访者的 户 人均收入、受教育年限以及去年医疗支出 额的均值、中位数、极值、标准差、偏峰度等信息 , 从而对南京市流动人口这个群体在宏观有一个大致把握。如表 表 重要 变量的描述统计表 均值 中 位数 最大值 最小值 标准差 偏度 峰度 受教育年数 15 0 人均收入 4500 39000 3400 年医疗支出额 210 5000 0 中可以初步得出以下一些结论: 教育年数的中位数和均值都在 6 左右,即小学毕业,有一半人不超过小学文化; 为据南京市统计局发布的数据, 2010 年南京城市居民家庭人均收入为 ,仅为南京市总体水平的 55%。 3. 三 个变量的偏度均大于 0,表明数据右偏,即表明数据左边比较密集,右边分散。尤其是医疗支出的偏度最大,表明流动人口的医疗支出还处于一个低水平,大多数人的医疗支出很少,都集中在左边,也就是说多数人的医疗水平是小于平均值 1300 元的,只是少数人医疗支出水平高的人拉动了平均水平。 三 个变量的峰度均大于 0,表明它比正态分布要陡峭,为尖峰分布,成尖峰厚尾的特征, 6 尤其是医疗支出数据,峰度最 大,从一个侧面反映了悬殊比较大。 以上 从单个变量的角度 初步进行 分析, 但 在研究流动人口参保状况的时候,通常不仅需要单独考察某一方面的信息,而且还要将几个方面的信息联合起来 一 并考察,从而得到更客观合理的结果,因此这里进一步做列联分析。 使用 件对流动人口参保情况的列联分析,结果如表 们可以得到一些基本的人口学信息: ( 1)总共 150 名受访流动人口中,参与新农合的有 66 人( 44%),参与职工医保的有 36 人( 24%),无医保的有 48 人( 32%)。其中,男性占 59%,女性占 41%,性别对于参保情 况有统计学意义( 2=P 值 =从经济学角度来看,性别与医保没有直接联系,但考虑到性别与工作、收入、教育等相关,从而间接的影响到了参保状况。 ( 2)年龄方面, 18的青壮年占 49%, 35 岁以上者占 51%,与性别的解释类似,年龄对于参保情况也具有统计学意义。 ( 3)受教育年数方面,受教育年数在 3 年以下的占 19%, 4的占 47%,7的占 26%, 10 年以上的占 8%,受教育年数方面对于参保情况具有统计学意义,直观上看,受教育时间长的人比短的人更有可能选择医疗保障。 ( 4)被访者 中农村户口的占 79%,非农户口占 21%,户口对于参保情况具有统计学意义,从表中可以看出,有非农户口的人选择职工医疗保险的人的相对比重更高,而农村户口的流动人口多为新农合。 ( 5)收入方面,年家庭人均收入在 1 万元以下的占 22%, 1 万到 2 万的占41%, 2 万到 3 万的占 32%, 3 万以上的占 7%,收入对于参保情况具有很显著的统计学意义,收入高的人享有医疗保障的人比例明显大,收入 3 万元以上的人均有医疗保险。 ( 6)被访者中有超过一半( 58%)的人没有享受到报销,没有享受到报销的这 87 人当中,有 48 人是没有参保,当然不会 有报销,另外 39 人参保了却没有享受过报销;另外可以发现,参加职工医保的人明显报销比率要比参加新农合的人高。 ( 7)健康自评方面,由差到好的 5 个等级所占比重依次为 1%, 7%, 25%,51%, 5%。职业方面,服务业占 36%,工业占 51%,商业占 13%。健康自评与职业对于参保情况不具有统计学意义( P 值分别为 不过,由于 2检验是一个总体检验,不排除可能有少数类别间的联系被淹没在绝大多数无关类别的情形出现,因此通常 2 不以严格的统计学上的 判断准则,具体 界 值 7 表 参保情况列联表 新农合 职工医保 无医保 合计 2 值 P 值 人数 构成比 人数 构成比 人数 构成比 人数 构成比 性别 男 38 8 2 8 28 6 2 年龄 181 4 9 4 5 以上 35 2 9 6 受教育 0 7 8 5 3 3 1 79 3 9 10 以上 5 2 暂住证 有 49 5 3 07 17 1 5 3 户口 农村 61 9 9 19 农 5 7 1 健康 差 0 差 4 1 一般 16 3 8 好 39 9 9 7 很好 7 1 2 婚姻 未婚 15 0 4 婚 47 4 4 05 离婚 4 1 职业 服务业 24 1 4 业 35 9 3 7 商业 7 9 收入 (万元) 1 以下 8 2 3 1 1 1 21 0 6 3 以上 6 0 报销比率 0 30 8 7 24 1 25%- 12 0 2 66 6 8 50 8 为多少并无统一标准,有学者认为如果 P 值大于 没有做对应分析的必要 2。介于此,笔者在下面的对应分析中就排除了这 2 个变量,不过由于谨慎性原则,在后面章节 的回归方程中,还是会考虑这 2 个变量。 ( 8)被访者中有暂住证的占 71%,无暂住证的占 29%;未婚的占 23%,已婚的占 70%,离婚的占 7%。这 2 个变量的 P 值过大(分别为 故可认为这 2 个变量对参保情况不具有统计学意义,可以不再做进一步分析。 (三) 对应分析 上一节使用了列联表 2 检验的方法对数据进行了一个先验的分析,得到了参保状况和人口学特征等分类变量两两之间的联系。但现在更进一步分析多个分类变量之间关系时, 2 检验显得不够,可以 通过 对应分析 的方法, 将上一节的 列联 表转换成一张散点图,从而 将列联表中包含的类别关系信息用各散点空间位置关系的形式 直观的 表现出来。 图 对应分析图 基于上一节列联表 2 检验的研究,选定参保情况、受教育年数、家庭人均收入、年龄、性别、户口、报销比率作为变量进行对应分析,而婚姻状况、职业状况、自评健康状况、是否有暂住证由于 2 检验的 P 值过大,而不被选入进行2张文彤,董伟 计分析高级教程 M等教育出版社, 2004: 309 9 对应分析。对应分析图如图 图 判别度量 由图 别度量可以看出,变量间都呈锐角,表明对应分析效果不错。从图 应分析图可以 得出以下一些 结论: ( 1)职工医保、非农户口、较高报 销、 10 年以上教育、家庭人均收入 3 万元以上之间有联系。这类流动人口通常具有较高的素质与稳定的收入,虽然是流动人口,但是非农户口,这类人一般有比较不错的工作,公司会给予员工参加职工医保,并有较高(超过 25%)的报销比率。 ( 2) 0文化、家庭人均收入 1 万元以下、无医保之间有联系,这类人文化程度很低,小学没毕业或文盲半文盲,相应的收入水平也低,他们进城后多半成为苦力,这就是城市中的弱势群体。由于贫困不愿意主动花钱参加医保,或者是无信息来源,不知道如何参保,或者是在户籍地参加了新农合,但所参合的新农合在务工地 (南京)不起作用,本人也不愿意在务工地参保。这样的人群缺少起码的医疗保障,并且他们多半从事苦力,易患疾病,所以这样的人群应该是政府部门重点关注对象。 ( 3)低报销和新农合之间有联系。由数据分析,可以得到这样的结论,新农合在报销比率上不如职工医保。笔者认为这主要有 2 个原因,一是我国的城乡差距较大,农村的医疗保健水平本身不如城市;二是流动人口在户籍地参加了新农合,现在到了务工地(南京),存在一个异地就医的问题,即便户籍地的新农合能报销,但手续烦杂,影响了报销比率。 10 三 、基于离散选择模型的参保影响因素分 析 在 上一章的多重对应分析中,我们将繁杂的数据以类别联系的方式直观的表现在了二维图形中,一目了然的得出了很多有用的结论。但是对应分析这种方法只能从直观的角度定性分析问题,不能用于相关关系的假设检验,无法得到确切的统计结论, 也 无法从定量的角度更深层次的分析流动人口的参保情况。因此本章将在上一章研究的基础上, 采用离散选择模型,以定量分析的形式研究流动人口参保的影响因素,明确解决“ 什么样的流动人口对应会 具体 选择哪种医保 ”这个问题, 使结论更加细致客观。 (一) 变量选取 按照上章对应分析及列联表 2 检验,由于 谨慎性原则,建模之初,本文将健康自评与职业( 2 检验 P 值分别为 纳入到自变量当中,而是否有暂住证和婚姻情况( 2 检验 P 值分别为 被排除在外。因此本文以流动人口是否参保作为被解释变量,以被访者年龄、受教育年数、自评健康状况、家庭人口、家庭人均收入、报销比率、性别、户口、职业为解释变量,具体如表 表 变量选取及说明 变量 变量说明 因变量 Y 参保情况 0=无医保 1=参保 自变量 龄 取绝对数 教育年数 取绝对数 评健康状况 1=很差 2=较差 3=一般 4=较好 5=很好 庭人口 取绝对数 庭人均收入 取绝对数 销比率 取绝对数 别 1=男 2=女 口 1=农村户口 2=非农户口 业 1=服务业 2=工业 3=商业 (二) 基于因子分析思想解决多重共线性问题 由常识知,流动人口的年龄与受教育年数会有反向关系,即一般年龄大的人文化水平低;流动人口的家庭人均收入会与受教育年数有正向关系,即一般文化 11 水平高的人收入相应会高。经检验,流 动人口的年龄与受教育年数的偏相关系数为 动人口的家庭人均收入与受教育年数的偏相关系数为 2 个数值都很高。至于收入与年龄之间的偏相关系数比较低(为 很可能是因为文化对收入的正效应,与文化对年龄的负效应正负相抵了。 确定是否存在多重共线性可以通过辅助回归的方法,辅助回归结果如表 表 辅助回归结果 因变量 自变量 T 统计量 P 值 年龄 受教育年数 庭人均收入 受教育年数 辅助回归结果知,年龄、家庭人均收入分别与 受教育年数回归,都有很好的解释作用,所以可以认为他们之间存在显著的共线性关系 3。模型存在多重共线性的时候会影响到方程的效果。从逻辑上讲,本身就不应该将冗余变量纳入模型进行分析;更重要的是,与多元回归模型一样, 归也对多重共线性比较敏感,当存在多重共线性的时候,系数标准误的估计将产生偏差( 985),当共线性严重时甚至会导致系数估计符号的变化 ( 977)。这是建模中一个个比较严重而又经常被学者们忽略的问题。 模型中其他解释变 量之间也存在着一定的共线性,但相关系数都在 下,这时多重共线性带来的问题不严重,可以忽略 4。 ( 1) 学者孙敬水( 2008)建议将那些存在多重共线性的变量,通过主成份分析的方法,将存在相关性的变量组合成新的主成份,用较少的新指标代替原来较多的旧变量,而这些较少的新指标之间是不存在相关性的。所以再对新指标建立回归方程时,实际上就避免了多重共线性的问题。 本文结合理论知识后,决定探索性的采用因子分析的思想来解决多重共线性问题。因为因子分析在某种程度上可以看成是主成份分析的推广与扩展,它对 问题的研究更加深入,与主成份分析类似,因子分析实质上也是个 降维 的过程,同样不受量纲的影响,将多个相关的变量用少量不相关的因子来代替。而比起主成份分析,因子分析有它特有的优势,可以通过因子轴的旋转,可以使得到新的因子载荷意义更加明显。 ( 2) 因子分析的基本思想是:设有 N 个样本, P 个指标, X=( ,T 为随机向量,要寻找的公因子为 F=( , T,则模型 3孙敬水 M. 上海:上海财经大学出版社 ,2009:126王济川,郭志刚 归模型 方法与应用 M等教育出版社, 2001: 19012 + a 1 1 + a 2 2 + a p ( 就称为因子模型,写成矩阵形式为: X = ( 其中 A=( 因子载荷矩阵, 因子载荷,其实质是公因子 变量相关系数 为特殊因子,代表公因子以外的影响因素,在实际分析时忽略不计。 对求得的公因子,需要观察它们在哪些指标上有较大的载荷,再据此说明该公因子的实际含义。通 常会进一步作因子旋转,以求旋转后能得到更加合理的解释。 ( 3) 在建完因子分析模型后,可以通过回归估计的方法写出如下的因子表达式: + b ( i=1, 2, , m) ( 通过上面 子表达式,计算出 F 的因子得分(变量标准化后),后面建立回归方程模型的时候用 F 的因子得分数值代替原来的变量 X 数值,在解释方程的时候再将 F 还原成 X。这样就基本解决了多重共线性问题。 ( 1)提取公因子: 对上文提到的变量中具有多重共线性的 3 个变量,即被访者年龄,受教育年数,家庭人均收入用 性分析。由表 为 0,表明各变量间确实具有较大相关性,可以提取公因子。 表 形检验 卡方值 由度 3 方差贡献率 因子个数 单位根 方差贡献率 累计方差贡献率 1 表 以看出, 当选取 2个因子的时候,累计方差贡献率达到了 13 说明选取 2个因子基本能很好的解释原来 3个变量了。这里实际上是将 3维降到了 2维,用 2个新的没有相关性的变量代替原来 3个变量。 采用方差最大旋转的方法后,结合因子载荷矩阵和公式 们可以写出该实际问题的因子模型,如下: = 受教育年数 = ( = 过观察公式 以发现公因子 教育年数越长、家庭人均收入越高, 公因子 教育年数越短、年龄越大, ( 2)选取 工具变量 : 因子分析提取公因子的目的是找到新的 2个指标代替原来的 3个,作为工具变量放入后面的模型中,从而没有多重共线性。这里通过回归估计的方法并结合公式 出上述 2个公因子的因子表达式,如下: 年龄 + 受教育年数 + 家 庭人均收入 年龄 - 受教育年数 + 家庭人均收入 (将年龄、受教育年数和家庭人均收入的标准化数值,带入公式 可以算出 2个公因子对应于每个样本的具体数值,也就是因子得分。 ( 3) 检验多重共线性 : 这里对计算出的 2列因子得分再进行一次简单相关分析,检验结果如表 时再进行一次辅助回归,结果如表 可以看出, 2之间已经基本完全没有相关性了;另外, 以相关系数均不超过 下面在建回归方程的时候,就直接将公式 代替此前的 3个变量的具体数值。这样就解决了此前的多重共线性问题 。 5注: 同。 14 表 2 1 2 表 辅助回归结果 因变量 自变量 T 统计量 P 值 1 (三) 基于二元离散选择模型的实证研究 变量说明 本文以 流动人口是否参保作为被解释变量,以被访者年龄、受教育年数、家庭人均收入、自评健康状况、家庭人口、报销比率、性别、户口、职业为解释变量。根据前文基于因子分析思想,提取了 2 个新的公因子 替此前被访者年龄、受教育年数、家庭人均收入这 3 个变量,处理后的变量如表 表 处理后的变量说明 变量 变量说明 因变量 Y 参保情况 0=无医保 1=参保 自变量 评健康状况 1=差 2=较差 3=一般 4=较好 5=很好 庭人口 取绝对数 销比 率 取绝对数 别 1=男 2=女 口 1=农村户口 2=非农户口 业 1=服务业 2=工业 3=商业 值为公式 果 值为公式 果 在做离散选择模型的时候,取决对数的连续型变量直接纳入计算即可;而性别和户口虽然是离散变量,但是只有 2个取值,像这样的二分类也可以直接纳入方程,也可以对系数得到很好的解释;自评健康状况这样的有序自变量,学者叶勇( 2001)从专业角度出发认为可以将该变量作为连续型变量进行分析;而职业 15 这样的无序分类变量 , 1、 2、 3仅仅是一个代码,不代表水平高低,并且 3者之间差别并不能强行规定为 等距 ,所以不能直接带入方程,需要设定虚拟变量,设置如下: 职业 1 工业; 0 其他 职业 1 商业; 0 其他 ( 1) 线性概率模型 : 这里由于被解释变量为流动人口是否参保,是 0不是连续型数值变量,如果直接用普通最小二乘法进行估计的话,即建立线性概率模型,会造成以下几个问题: 由于在线性概率模型中残差的非齐性,参数估计的估计方差将是有偏的,因此任 何假设检验如 检验都是无效的; 由线性概率模型估计的事件概率值在遇到很大或很小的 能会超出0, 1区间,这是不合常理的,无法解释的; 最严重的问题在于它的函数形式,因为线性概率模型是线性的,即无论 归估计系数 、 都是常数,而在最小二乘法估计的线性概率模型中,截距 和斜率 对于所有的 ( 2) 引入 由于上面提到的线性概率模型存在一些致命的缺陷,所以当因变量是离散变量的时 候,不能直接用最小二乘估计建立线性方程。需要使用非线性函数,最好事件发生的概率 着 一种值域在( 0, 1)区间内并且有着 常用的最流行的一种分布就是 图 累计分布函数为一个比较简单的形式: P( 1|= Pi = (+ = 1/( 1+ (先值域在 0且曲线呈 明 6的作用对于发生某个事件的可能性是变化的,在中间的时候敏感变化大,两头变化小。这很符合常理,比如收入越高越倾向于参加医保,收入水平在中间某个阶段内变化对参加医保概率的影响较大,而收入太低或太高时则不那么敏感(特别穷困的人收入增

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论