版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、0 + 1Rt + ut , ( 0 + 2) + 1Rt + ut , D = 1 D=0 MeiWei 81 重点借鉴文档】 虚拟变量 ( dummR variable ) 在实际建模过程中, 被解释变量不但受定量变量影响, 同时还受定性变量影响。 例如需 要考虑性别、民族、不同历史时期、季节差异、企业所有制性质不同等因素的影响。这些因 素也应该包括在模型中。 由于定性变量通常表示的是某种特征的有和无, 所以量化方法可采用取值为 1 或 0。这 种变量称作虚拟变量,用 D 表示。虚拟变量应用于模型中,对其回归系数的估计与检验方 法与定量变量相同。 1 截距移动 设有模型, Rt = 0 +
2、 1 Rt + 2D + ut , 其中 Rt,Rt为定量变量; D 为定性变量。当 D = 0 或 1 时,上述模型可表达为, (D = 0) (D = 1) 2显著不为零, 图 8.1 测量截距不同 D = 1 或 0 表示某种特征的有无。反映在数学上是截距不同的两个函数。若 说明截距不同;若 2 为零,说明这种分类无显著性差异。 例:中国成年人体重 R( kg)与身高 R(cm)的回归关系如下: 105 + RD = 1 (男 ) R = - 100 + R - 5D = 100 + RD = 0 ( 女) 若定性变量含有 m 个类别, 应引入 m-1 个虚拟变量, 否则会导致多重共线性
3、, 称作 虚拟变量陷阱( dummR variable trap )。 关于定性变量中的哪个类别取 0,哪个类别取 1 ,是任意的,不影响检验结果。 定性变量中取值为 0 所对应的类别称作基础类别( base categorR)。 对于多于两个类别的定性变量可采用设一个虚拟变量而对不同类别采取赋值不同的 方法处理。如: 1 (大学 ) D = 0 (中学 ) -1 (小学 )。 【案例 1】 中国季节 GDP 数据的拟合(虚拟变量应用, file: case1及 case1-solve) MeiWei_81 重点借鉴文档】 MeiWei 81 重点借鉴文档】 GDP 序列图 不用虚拟变量的情形
4、 若不采用虚拟变量,得回归结果如下, GDP = 1.5427 + 0.0405 T (11.0) (3.5)R2 = 0.3991, DW = 2.6, s.e. = 0.3 定义 1 ( 1 季度) 1 (2季度) 1 ( 3 季度) D1 = D2 = D3 = 0 (2, 3,4季度) 0 ( 1, 3, 4 季度) 0 (1, 2, 4 季度) 第 4 季度为基础类别。 GDP = 2.0922 + 0.0315 T 0.8013 D1 0.5137 D2 0.5014 D3 (64.2) (15.9) (-24.9) (-16.1) (-15.8) R2 = 0.9863, DW
5、= 1.96, s.e. = 0.05 附数据如下: 年 GDP t D1 D2 D3 1996:1 1.3156 1 1 0 0 1996:2 1.6600 2 0 1 0 1996:3 1.5919 3 0 0 1 1996:4 2.22096 4 0 0 0 1997:1 1.46856 5 1 0 0 1997:2 1.84948 6 0 1 0 1997:3 1.7972 7 0 0 1 1997:4 2.3620 8 0 0 0 1998:1 1.58994 9 1 0 0 MeiWei_81 重点借鉴文档】 MeiWei 81 重点借鉴文档】 1998:2 1.88316 10
6、0 1 0 1998:3 1.97044 11 0 0 1 1998:4 2.51176 12 0 0 0 1999:1 1.6784 13 1 0 0 1999:2 1.9405 14 0 1 0 1999:3 2.0611 15 0 0 1 1999:4 2.5254 16 0 0 0 20RR:1 1.8173 17 1 0 0 20RR:2 2.1318 18 0 1 0 20RR:3 2.2633 19 0 0 1 20RR:4 2.7280 20 0 0 0 数据来源:中国统计年鉴 1998-20RR 2 斜率变化 以上只考虑定性变量影响截距,未考虑影响斜率,即回归系数的变化。当需
7、要考虑时, 可建立如下模型: Rt = 0 + 1 Rt + 2 D+ 3 Rt D + ut , 其中 Rt为定量变量; D为定性变量。当 D = 0 或 1时,上述模型可表达为, ( 0 + 2 ) + ( 1 + 3)Rt + ut ,(D = 1) 0 + 1 Rt + ut ,(D = 0) 为零,可判断模型斜率是否发生变化。 0 (1950 - 1977) 例 2:用虚拟变量区别不同历史时期( file: case2 及 case2-solve) 中国进出口贸易总额数据( 1950-1984 )见上表。试检验改革前后该时间序列的斜率是 否发生变化。定义虚拟变量 D 如下 D = 中
8、国进出口贸易总额数据( 1950-1984) (单位:百亿元人民币) 年 trade T D T RD 年 trade T D TRD 1950 0.415 1 0 0 1968 1.085 19 0 0 MeiWei_81 重点借鉴文档】 MeiWei 81 重点借鉴文档】 1951 0.595 2 0 0 1969 1.069 20 0 0 1952 0.646 3 0 0 1970 1.129 21 0 0 1953 0.809 4 0 0 1971 1.209 22 0 0 1954 0.847 5 0 0 1972 1.469 23 0 0 1955 1.098 6 0 0 1973
9、 2.205 24 0 0 1956 1.087 7 0 0 1974 2.923 25 0 0 1957 1.045 8 0 0 1975 2.904 26 0 0 1958 1.287 9 0 0 1976 2.641 27 0 0 1959 1.493 10 0 0 1977 2.725 28 0 0 1960 1.284 11 0 0 1978 3.550 29 1 29 1961 0.908 12 0 0 1979 4.546 30 1 30 1962 0.809 13 0 0 1980 5.638 31 1 31 1963 0.857 14 0 0 1981 7.353 32 1
10、32 1964 0.975 15 0 0 1982 7.713 33 1 33 1965 1.184 16 0 0 1983 8.601 34 1 34 1966 1.271 17 0 0 1984 12.010 35 1 35 1967 1.122 18 0 0 以时间 T =time为解释变量,进出口贸易总额用trade 表示,估计结果如下: trade = 0.37 + 0.066 time - 33.96D + 1.20 time D (1.86) (5.53) (-10.98) 0.37 + 0.066 time = - 33.59 + 1.27 time (12.42) (D =
11、0, 1950 - 1977) (D = 1, 1978 - 1984) 上式说明, 改革前后 无论截距和斜率都发生了变化 。进出口贸易总额的年平均增长量扩大了 18 倍。 【案例 3】香港季节 GDP 数据(单位:千亿港元)的拟合( file: case3 及 case3-solve) 19901997 年香港季度 GDP 呈线性增长。 1997 年由于遭受东南亚金融危机的影响,经 济发展处于停滞状态, 199820RR 年底 GDP 总量几乎没有增长(见上图) 。对这样一种先 增长后停滞, 且含有季节性周期变化的过程简单地用一条直线去拟合显然是不恰当的。 为区 别不同季节,和不同时期,定义
12、季节虚拟变量D2 、D3 、D4 和区别不同时期的虚拟变量 DT 如下(数据见附录): 1 (第 2 季度) D2 = 0 (其他季度) 1 (第 3 季度) D3 = 0 (其他季度) 1 (第 4 季度) D4 = 0 (其他季度) 1 (1998:120RR:4 ) DT = 0 (1990:1 1997:4) MeiWei_81 重点借鉴文档】 MeiWei 81 重点借鉴文档】 得估计结果如下: GDPt = 1.1573 + 0.0668 t + 0.0775 D2 + 0.2098 D3 + 0.2349 D4+ 1.8338 DT - 0.0654 DT t (50.8) (6
13、4.6) (3.7) (9.9) (11.0) (19.9) (-28.0) R2= 0.99, DW = 0.9, s.e. = 0.05, F=1198.4, T=52, t0.05 (52-7) = 2.01 对于 1990:1 1997:4 GDPt = 1.1573 + 0.0668 t + 0.0775 D2 + 0.2098 D3 + 0.2349 D4 对于 1998:120RR:4 GDPt = 2.9911 + 0.0014 t + 0.0775 D2 + 0.2098 D3 + 0.2349 D4 如果不采用虚拟变量拟合效果将很差: GDPt = 1.6952 + 0.0
14、377 t (20.6) (13.9) R2 = 0.80, DW = 0.3, T=52, t0.05 (52-2) = 2.01 【案例 4】 天津市粮食市场小麦批发价与面粉零售价的关系研究(file: RiezhiRong ) 首先看天津市粮食市场小麦批发价格的变化情况(图1)。 1995 年初,天津市粮食市场 的小麦批发价格首先放开。在经历 5 个月的上扬之后,进入平稳波动期。从1996 年 8 月份 开始小麦批发价格一路走低。至 20RR 年 12 月份,小麦批发价格降至是 1160 元/吨。 其次看面粉零售价的变化情况。 因为面粉零售价格直接关系到居民的日常生活, 所以开 始时没有
15、与小麦批发价格一起放开。当小麦批发价格一路看涨时, 1995年 1月至 1996年 6 月面粉零售价格一直处于 2.14元/千克的水平上。 1996年 7 月起,面粉零售价格也开始在市 场上放开。 受小麦批发价格上涨的影响, 一个月内面粉零售价格从 2.14元/千克涨到 2.74 元 /千克。在这个价位上坚持了 11 个月之后,面粉零售价格开始下降。与小麦批发价格的下降 相一致,在经历了 5年零 7 个月的变化之后,面粉零售价格又恢复到接近开放前 2.14 元/千 克的水平上( 2.17 元)。 散点图如图 2。按时间分析这些观测点的变化情况 (见图 3,逆时针方向运动) 。见图 4, 直接拟
16、合这些数据效果将很差( R2 = 0.027, r = 0.17 )。 MeiWei_81 重点借鉴文档】 MeiWei 81 重点借鉴文档】 图1 2 2 0 0 图2 利用虚拟变量技术,在模型中加入虚拟变量。定义 D = 0 ,(1995: 11996:6 ,面粉零售价格放开之前) , D = 1 ,( 1996:720RR:12 ,面粉零售价格放开之后) 取对数关系建立模型。 Lnsale 的系数没有显著性(对于面粉零售价格放开之前的散点来说回归直线是一条水 平线)。剔出 Lnsale 变量,得估计结果 PRICE = 2.140 + 1.1215 Lnsale D 7.7458 D (131.5) (23.9) (-23.0) 2 R2 = 0.9054, PRICE = 2.140, PRICE = 5.6058 + 1.1215 Lnsale, 一条回归直线的斜率为零,一条回归直线的斜率为 D=0 D=1 1.12。可决系数从不加虚拟变量模型的 0.046 增加到 0.905 (输出结果见下) MeiWei_81 重点借鉴文档】 Mei
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 医疗器械网络销售监督管理办法培训试题及答案
- 187红色喜庆金榜题名感谢恩师升学宴活动策划模板下载
- 2025《林教头风雪山神庙》课件
- 2026年山西省财政税务专科学校单招职业倾向性考试题库含答案详解(培优a卷)
- 2026年山西省财政税务专科学校单招职业技能测试题库附答案详解(考试直接用)
- 2026年多媒体制作协议
- 年产 4000 吨环氧树脂固化剂项目可行性研究报告
- 2026学年中考历史一轮复习-近代世界(含答案)
- T∕CAICI 131-2025 液冷系统工程技术规范
- 2026年广西农业工程职业技术学院单招职业倾向性考试题库含答案详解(综合卷)
- 2026年中学新团员入团测试题及答案
- (一模)东北三省三校2026年高三第一次联合模拟考试语文试卷(含答案详解)
- 2026河南郑州建设集团所属公司社会招聘工作人员44名笔试备考题库及答案解析
- 2026辽宁大连理工大学后勤处自聘管理岗位招聘2人笔试备考题库及答案解析
- 2026年吉安职业技术学院单招综合素质考试题库含答案详解
- 2026年春五年级下册数学教学计划(附教学进度表)
- 薄抹灰施工方案
- 2025年青岛农商银行春招笔试及答案
- 绍兴2025年浙江绍兴市政务服务办公室招聘政务服务专员6人笔试历年参考题库附带答案详解
- 雨课堂学堂在线学堂云《船》单元测试考核答案
- 大学生创新创业基础(创新创业课程)完整全套教学课件
评论
0/150
提交评论