




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1,多元回归分析:虚拟变量,y = b0 + b1x1 + b2x2 + . . . bkxk + u,2,Dummy Variables,A dummy variable is a variable that takes on the value 1 or 0 Examples: male (= 1 if are male, 0otherwise), south (= 1 if in the south, 0 otherwise), etc. Dummy variables are also called binary variables, for obvious reasons,3,A D
2、ummy Independent Variable,Consider a simple model with one continuous variable (x) and one dummy (d) y = b0 + d0d + b1x + u This can be interpreted as an intercept shift If d = 0, then y = b0 + b1x + u If d = 1, then y = (b0 + d0) + b1x + u The case of d = 0 is the base/benchmark group,4,Example of
3、d0 0,x,y,d0,b0,y = (b0 + d0) + b1x,y = b0 + b1x,slope = b1,d = 0,d = 1,5,6,例7.1 是否存在性别歧视,7,例7.2 拥有计算机 与大学GPA,8,例7.3 培训津贴对培训小时数的影响,问题的关键是:定性变量所度量的影响是否为因果性? 办法之一是,尽可能控制与虚拟变量及因变量相关的因素。,9,当因变量为log(y)时对虚拟变量系数的解释,当自变量中有一个或多个虚拟变量时,因变量以对数形式出现,虚拟变量的系数具有一种百分比解释。,在保持其他因素不变的情况下,一套殖民地建筑风格的住房的卖价预计高出约5.4%。,10,当y有较
4、大比例变化时,如何更准确估计y变化的百分比?,11,12,Dummies for Multiple Categories,在应用研究中,我们需要使用多个虚拟变量。 在控制性别的基础上,研究婚姻状态的影响; 在区域研究中,往往区分东、中、西部;在省级面板数据中,甚至会引入n-1个地区虚拟变量。 虚拟变量可以描述包含序数的信息:信用等级,13,例7.6 工资方程,估计一个工资对如下四组都不同的模型:已婚男人、已婚女人、单身男人、单 身女人。首先选择基组:单身男人,对剩下的每一组定义一个虚拟变量,并称 之为marrmal,marrfem,和singfem。因此,三个虚拟变量的估计量度量的都是与 单身
5、男人相比,工资的比例差异。,14,如果要比较特定两组之间工资的差异,可以重新设定基组进行回归分析。例如,为检验单身女人和已婚女人之间的估计差异是否显著,以已婚女人组作为基组重新估计得到: 在方程中包括虚拟变量来象征不同组的一般原则:如果回归模型有g组或g类不同的截距,在模型中则包含g-1个虚拟变量和一个1截距。,15,通过虚拟变量来包含序数信息,序数变量:穆迪或标准普尔对地方政府债券的质量进行了级别评定,假设等级范围从零到四,零为最低的信用等级,四位最高的信用等级,记为CR。然而,很难有意义地解释CR变化一个单位对MBR的影响。,16,17,例7.7 相貌吸引力对工资的影响,在劳动力市场中,除
6、了存在性别歧视之外,还可能存在相貌、身高等歧视。如果将样本相貌分为三类:一般水平、低于一般水平、高于一般水平,并以一般水平组作为基组,分别对男人、女人估计方程得:,18,19,例7.8 法学院排名对起薪的影响,20,21,涉及虚拟变量的交互作用,虚拟变量之间的交互作用 例7.6根据婚姻状况和性别定义了四个类别,在模型中引入三个虚拟变量,以单身男性为基组研究了不同类别之间的工资差异。除此之外,还有什么方法?,22,此外,我们还可以在female和married分别出现的模型中,增加一个female和married的交互项,同样可以进行组别工资差异比较。,23,例7.9 计算机使用对工资的影响,2
7、4,容许出现不同的斜率,虚拟变量之间的交互项反映的是截距之间的差异,斜率并未发生变化。含义是:样本回归曲线是平行的。 虚拟变量与非虚拟变量之间也有交互作用,使得出现不同的斜率。,25,26,我们关心的两个假设: 男性和女性受教育的回报是相同的。 受教育水平相同的男性和女性的平均工资相同。,27,例7.10 对数小时工资方程,28,29,检验不同组之间回归函数上的差别,现在,我们考察的虚拟假设是:两个总体或两组具有同一个回归函数;对立假设是,各组间有一个或多个斜率是不同的。,30,31,32,一般的检验方法:邹至庄统计量,33,邹至庄检验的步骤:,确立回归的一般模型,明确受约束模型和不受约束模型
8、的自由度。(约束个数:k+1) 分别将两组进行回归得到SSR1和SSR2。 将两组数据混合并重新估计模型得到受约束模型的残差平方和SSR. 运用公式计算邹统计量,检验显著性水平。,34,35,7.5 二值因变量:线性概率模型,迄今为止,我们讨论的因变量均具有定量的含义。如果用多元回归解释一个定性事件,需引入二值因变量,即y只取0和1两个值。例如,y表示一个成年人是否受过高中教育,或一个大学生在给定年份是否用过非法毒品等。,36,37,38,17,39,40,41,7.6 对政策分析和项目评价的进一步讨论 内生性问题,在社会科学研究中,对照组和处理组并不是随机指定的,因此可能遭遇变量内生性问题。,42,43,自选择(sel
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 春节茶园活动策划方案
- 景区日常活动方案
- 景区五一旅游活动方案
- 景区演绎活动方案
- 村民登山活动方案
- 机关七夕节活动策划方案
- 服饰圣诞活动方案
- 村社干部比武活动方案
- 包装绿色采购方案(3篇)
- 智能产品促销活动方案
- 2025至2030年中国飞行控制器行业市场供需态势及未来趋势研判报告
- 2025年黑龙江省龙东地区中考数学试卷真题(含答案)
- 2025至2030年中国锦氨纶汗布市场分析及竞争策略研究报告
- 2025年建筑电气工程师职业资格考试试卷及答案
- 2024年江苏地质局所属事业单位招聘考试真题
- 2025年湖北省中考物理试题(含答案及解析)
- 2025年中小学暑假安全教育主题家长会 课件
- 房地产销售计划书
- 2025年劳动争议仲裁员(二级)考试试卷
- 空中安全保卫课件
- 中兴-5G-A高频毫米波网络规划方法论介绍V1.0
评论
0/150
提交评论