版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、虚拟变量的应用,多元线性回归,Contents,一、虚拟变量的建立,虚拟变量(Dummy Variable):取值为0和1的变量,当案例属于一个虚拟 变量所代表的类别时,这个虚拟变量就赋值为1,否则变赋值为0,Di = 1 ,是女性 = 0 ,不是女性,例1:,例2:大学生年级变量具有四个类别,如何构造?,其中, D1=1,是大一,否则为0; D2=1,是大二,否则为0; D3=1,是大三,否则为0; D4=1,是大三,否则为0。,“虚拟变量陷阱”,虚拟变量的建立,D1+D2+D3+D4=1,说明D1,D2,D3,D4存在线性相关,造成多重共线性,解决办法:,原则:当一个分类量具有k个类别时,
2、则仅引入k-1个虚拟变量。 当所有k-1个自变量都取0的时候,那这个案例就属于第k类,我们称这类为参照类,参照类不仅解决了共线性的问题,而且在分析回归结果时也有非常重要的意义,二、虚拟变量回归系数的意义,因变量为大学生的月支出,自变量有家庭月收入,年级,性别 建立回归方程:,(0),其中, DG2=1,是大二,否则为0; DG3=1,是大三,否则为0; DG4=1,是大三,否则为0。 DS=1,是女生,否则为0,虚拟变量回归系数的意义,(1),参照类:大一男生(所有虚拟变量均取0),变式1:大二男生(DG2=1,虚拟变量均取0),(2),变式2:大一女生(DS=1,虚拟变量均取0),(3),参
3、照类中,b0为直线的截距,b1为直线斜率,即 INCOME 的回归系数 由式(1)到式(2),截距项增加了b2,因此b2就是大二男生比大一男生月支出高的部分;由式(1)到式(3),截距项增加了b4,因此b4就是大一女生比大一男生月支出高的部分。 差别截距:所有表示各类别虚拟变量的回归系数(bj)表示的是该类与参照类的均值之差。(对于序次变量还可计算相邻分类的边际效应,任意两类的边际效应),虚拟变量回归系数的意义,1. 只考虑年级对月支出的影响 等价于 单因素方差分析(1-way ANOVA),2. 同时考虑年级、性别对月支出的影响 等价于 双因素方差分析(2-way ANOVA),只考虑主效应
4、的双因素方差分析,3. 同时考虑年级、性别、家庭月收入的影响 等价于 协方差分析(ANCOVA),含交互作用的饱和双因素方差分析,三、虚拟变量回归系数的检验,对整个模型的检验(F检验) H0:B1=B2=Bk=0 H1:B1,B2,Bk中至少有一个不为0 对各回归系数的检验(t检验) H0:Bj=0 H1:Bj0 对于虚拟变量,由于取值只能为0和1,所以检验的是取值为1的类别与参照类(所有取值为0)的平均值是否有显著性差异,虚拟变量回归只能做其他类和参照类的比较 直接对任意两个回归系数之差进行检验的方法: 1、建立无差异假设:H0:Bi=Bj; H1:BiBj 2、构造t统计量: 3、检验其显
5、著性,其中,补充问题,参照类的选择 根据研究者的选择偏好,无实质性影响 其他编码方法 效应编码(effect coding)、正交编码(orthogonal coding)、非正交编码(nonorthogonal coding) 效应编码 虚拟编码:定义参照类,回归系数表示各类与参照类均值的差 效应编码:其回归系数反映的是各类的平均值与样本平均值的差,效应编码原则: 对于前k-1个效应变量,当案例属于该效应变量时,效应变量取值为1,不属于取值为0; 当案例属于最后一类不设虚拟变量的一类时,所有效应变量取-1,四、SPSS实例操作,例:分析妇女的年龄(AGE)、文化程度(EDU)及居住地(AREA)状况对妇女曾生子女数(CEB)的影响。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 人教 八年级 语文 下册 第3单元《11.核舟记 第1课时》课件
- 购买尿动力学分析仪项目可行性研究报告
- 克孜勒苏可行性研究报告
- 聚氨酯复合保温热水管项目可行性研究报告
- 刑事诉讼违法行为的法律后果
- 2026年及未来5年市场数据中国发酵工程行业市场全景评估及投资规划建议报告
- 钻孔灌注桩钢筋笼吊装方案
- 2025 高中信息技术数据与计算之算法的矩阵链乘法算法课件
- 急性ST段抬高型心肌梗死指南精要
- 智能农机装备应用与发展:技术赋能农业现代化
- 上交所2026校招笔试题
- 2026延安志丹县人力资源和社会保障局公益性岗位招聘(50人)笔试备考题库及答案解析
- 车间内部转运车管理制度
- 2026年山东省立第三医院初级岗位公开招聘人员(27人)笔试参考题库及答案解析
- 2026湖北武汉市江汉城市更新有限公司及其下属子公司招聘11人笔试备考题库及答案解析
- 2026年温州永嘉县国有企业面向社会公开招聘工作人员12人笔试备考题库及答案解析
- 2026年广东省辅警笔试题库及1套参考答案
- 2026年高考数学二轮复习:专题13 数列的综合大题(含知识融合)9大题型(专题专练)(全国适用)(原卷版)
- 交通电路处理 11
- 2026年时事政治测试题库100道附完整答案【考点梳理】
- 2025至2030中国变频器行业调研及市场前景预测评估报告
评论
0/150
提交评论