




已阅读5页,还剩53页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
回归建模的一些新方法 王明进博士北京大学光华管理学院2008年6月11日 主要内容 线性回归模型 回顾 分位数回归模型非参数回归半参数回归模型总结与讨论 1 线性回归模型 从一个例子开始 国家统计局2004年中国城市入户调查数据 随机抽取5000个人组成的样本 具体变量 年收入 y 元 受教育年限 x1 接受正规教育年数 研究生18 5 本科15 5 专科14 5 中专高中11 5 初中8 5 小学5 5 未上学或文盲0 性别 x2 男0 女1 是否属于东部地区 x3 是1 否0 工龄 x4 参加工作年限 年龄 z 收入的分布 收入取对数之后的分布 对收入分布的统计描述 回归分析 regressionanalysis 理解一个变量当中的变异性 与什么因素有关 是什么因素导致的 SirFrancisGalton 1822 1911 回归函数 对收入变异性的理解 从人力资本投资的角度理解收入的差异 明瑟 Mincer 1958 1974 收入函数 明瑟收益率 个人教育的收益率 一个扩展的Mincer收入函数 写成矩阵形式 回归系数的最小二乘估计 当时 系数的估计值 解读得到的结果 个人教育收益率10 46 男女之间收入的差距 27 21 地区之间存在的收入差距 36 23 工龄对收入的影响 工龄的曲线 传统回归模型的局限 回归函数 只是条件分布的均值 条件方差 常数 同方差假设 条件分布 正态 古典假定 回归函数形式的设定 线性形式 2 分位数回归模型 条件分布的分位数 一个现实的例子 如何判断孩子的身高体重是否正常 线性 分位数回归模型 Koenker Bassett 1982 或者写成这里的 参数的估计 其中 估计系数的 渐近 协方差矩阵 对协方差矩阵的估计 用分位数回归计算教育的收益率 Buchinsky 1994 1998 系数估计结果 不同分位数下对应的教育收益率 不同分位数下对应的男女收入差距 不同分位数下对应的地区收入差距 直接针对收入进行的分位数回归 估计结果 教育导致的绝对收入的差距 给出条件分布的更详细的信息 一个大学毕业在东部地区工作的男性 他的收入随着工龄变化 分位数回归的有关问题 特别适合于条件分布具有异方差的问题 如果除了常数项之外 不同分位点对应的其它回归系数都相同 那么意味着条件分布的变异特征一样 此时没有必要用分位数回归 分位数回归函数的设置 3 非参数回归 回归函数的非参数形式 其中假定 是一个光滑函数 误差项满足 非参数回归的任务 给定一组样本 如何得到对甚至它的导函数的估计 基本思想 在x的一个小的范围内 可以用直线 多项式 近似 可以用落在该范围内的样本点来估计出这条直线 曲线 回归函数的局部线性近似 局部线性回归估计 1 用落在x临近的样本观测估计如下的线性模型其中对的估计将分别给出及其导函数在x处值的估计 局部线性回归估计 2 所以 核函数及其作用 高斯核 均匀核 三角核 Epanechnikov核 带宽系数 h 的作用 收入与年龄的关系 局部线性回归 带宽的选择 GCV函数 其中常被称为帽子矩阵 该例子的GCV函数 非参数回归的有关问题 进行非参数回归的其它方法 注意的问题 样本不能太小 自变量不能太多 curseofdimensionality 4 半参数回归模型 Mincer收入函数的一个自然拓展 工龄对收入的影响为什么是二次曲线 有没有可能更出更合理的形式 这对估计教育收益率有什么影响吗 王明进 陈良焜 2008 部分线性模型 PLM 其中 部分线性模型的估计 其中是对进行非参数回归时对应的帽子矩阵 Speckman 1988 Hamilton 1997 对收入数据的估计结果 估计得到的工龄的函数形式 兰色实线为半参数估计结果 其中带宽系数 0 4倍的工龄的样本标准差 4 1655 红色虚线为前面估计的二次曲线 将参数模型中工龄曲线设置为四次 兰色实线为半参数估计结果 其中带宽系数 0 4倍的工龄的样本标准差 4 1655 红色虚线为前面估计的四次曲线 更深入的推广 教育收益率是否与工龄有关 王明进 岳昌君 2008 变系数部分线性模型 关于模型的估计可以参见Fan王明进 岳昌君 2008 对收入数据的估计结果 教育收益率随着工龄的变化 对另外一个函数的估计 半参数回归模型的有关问题 回归函数结合了参数和非参数的特征以避免维自变量的维数比较大时带来的困难 能够有效地揭示出一些新的规律 帮助确定参数模型的形式 通常算法比较复杂 当前研究的一个热点方向 总结与讨论 回归模型 理解变量之间的关系 如何合适地设置关系 给出条件分布的信息 如何给
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 民爆物品安全培训会课件
- 初二八校联考试卷及答案
- 棒球专业考试题库及答案
- 民族风课件教学课件
- 算力与新质生产力的关联
- 安全生产管理系统讲解
- 新质生产力的发展策略
- 文旅产品融入新质生产力探索
- 民族的课件教学课件
- 陕西新质生产力十大产业榜单
- 2025版全新离婚协议书:财产分割、子女抚养及离婚后财产保全合同范本
- 石油钻井知识课件
- “学回信精神·助改革发展”专题调研报告
- 2025年医学基础知识题库及答案
- (2025秋新版)苏教版三年级数学上册全册教案
- 职业院校实习生考核评价标准
- 水果保鲜的秘密课件
- 无人机公开课课件
- 2025年事业单位招聘考试综合类职业能力倾向测验真题模拟试卷:电子信息工程领域
- 仓库维修协议书
- 城管协管员面试题及答案
评论
0/150
提交评论