第五章线性回归模型的扩展.ppt_第1页
第五章线性回归模型的扩展.ppt_第2页
第五章线性回归模型的扩展.ppt_第3页
第五章线性回归模型的扩展.ppt_第4页
第五章线性回归模型的扩展.ppt_第5页
免费预览已结束,剩余59页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章线性回归模型的扩展,对数线性模型半对数模型线性对数模型双曲函数模型多项式回归模型特征:参数线性,变量不一定线性包含虚拟变量的回归模型,第一节对数线性模型:度量弹性,双对数线性模型对数线性模型的假设检验多元对数线性回归模型,一、双对数线性模型,考虑函数:Y=AXb1变量X非线性恒等变换:lnY=lnA+b1lnXln表示自然对数(以e为底的对数)lnY=lnA+b1lnX+u令b0=lnAlnY=b0+b1lnX+u将形式如上式的模型称为双对数模型。,双对数线性模型,令y=lnY,x=lnX则有y=b0+b1x+u若上式满足古典线性回归模型的基本假定,则很容易用普通最小二乘法估计它,并且得到的估计量是BLUE估计量。,双对数线性模型,双对数模型特性:斜率b1度量了Y对X的弹性,即给X一个很小的变动所引起Y变动的百分比。弹性=Y变动百分比/X变动百分比双对数模型又称为不变弹性模型,例:对widget教科书的需求,二、双对数模型的假设检验,在随机误差项u满足假定的情形下,线性模型与双对数模型的假设检验方法相同。,三、多元对数线性回归模型,将双变量对数线性回归模型推广到模型中解释变量多于一个的情形如三变量双对数模型lnY=b0+b1lnX1+b2lnX2+u在这个模型中,偏斜率系数b1、b2又称为偏弹性系数。b1是Y对X1的弹性(X2不变)b2是Y对X2的弹性(X1不变),多元对数线性回归模型,在多元对数线性模型中,每一个偏斜率系数度量了在其他变量保持不变的条件下,因变量对某一个解释变量的偏弹性。,例:柯布道格拉斯生产函数,lnY=b0+b1lnX1+b2lnX2+u令X1表示劳动投入,X2表示资本投入柯布道格拉斯生产函数(C-D函数)Y:19551974年间墨西哥产出(GDP,百万比索)X1:劳动投入(总就业人数,千人)X2:资本投入(固定资本,百万比索),柯布道格拉斯生产函数,lnY=-1.6524+0.3397lnX1+0.8640lnX2se=(0.6062)(0.1857)(0.09343)t=(-2.73)(1.83)(9.06)R2=0.995,对回归方程解释,b1:产出对劳动投入的弹性b2:产出对资本投入的弹性以上两个弹性系数相加(b1+b2)得到规模报酬系数,反映产出对投入的比例变动。规模报酬系数=1:规模报酬不变规模报酬系数1:规模报酬递增规模报酬系数1:规模报酬递减,对回归方程解释,b1=0.3397b2=0.8640规模报酬系数(b1+b2)=1.2037墨西哥经济特征是规模报酬递增资本投入对产出影响大于劳动对产出的影响。,例:对能源需求,数据:19601982年间7个OECD国家(美国、加拿大、德国、英国、意大利、日本、法国)的总最终能源需求指数Y;实际GDP(X1);实际能源价格(X2)所有指数均以1970年为基准(1970=100),回归结果,lnY=1.5495+0.9972lnX1-0.3315lnX2se=(0.0903)(0.0.0191)(0.0243)t=(17.17)(52.09)(13.61)R2=0.994,回归结果分析,能源需求与收入(GDP)正相关,与实际能源价格负相关收入弹性:0.9972价格弹性:-0.3315,缺乏弹性(基本消费品),第二节:半对数模型:测度增长率,政府根据预计的GDP增长率指标确定预算赤字规划美联储根据未偿付消费者信贷的增长率指标监视其货币政策的运行效果,例:美国未偿付消费者信贷的增长,数据:19731987年间未偿付消费者信贷Y:未偿付消费者信贷复利计算公式:Yt=Y0(1+r)tY0Y的初始值Yt第t期的Y值r复利率,例:美国未偿付消费者信贷的增长,求对数:lnYt=lnY0+tln(1+r)令b0=lnY0;b1=ln(1+r)引进随机误差项u,得到:lnYt=b0+b1t+u半对数模型:仅因变量以对数出现,OLS回归结果,lnYt=12.007+0.0946tse=(0.0319)(0.0035)t=(376.4)(26.03)R2=0.9824未偿付信贷增长率0.0946(9.46%)半对数模型中,斜率度量了给定解释变量的绝对变化所引起的被解释变量的相对变动,线性趋势模型,Yt=b0+b1t+u将因变量对时间t回归,其中t按时间先后顺序计算,这类模型称为线性趋势模型。时间t称为趋势变量若斜率为正,则称Y有向上的趋势;若斜率为负,则称Y有向下的趋势,例:美国为偿付消费者信贷,Yt=98084+35289tse=(23095)(2540.1)t=(4.247)(13.893)R2=0.9369因变量不同,不能比较R2,回归结果分析,在样本区间内,未偿付消费者信贷的年绝对增加值为35289百万美元。在此期间,未偿付消费者信贷有一个向上趋势。,第三节:线性对数模型,线性对数模型:解释变量是对数形式,而因变量不是对数形式。,例:美国GNP与货币供给,考虑模型:Y=b0+b1lnX+u其中:Y=GNP;X=货币供给回归结果:Y=-16329.0+2584.8lnXt=(-23.494)(27.549)R2=0.9832,第四节:双曲函数模型,双曲函数模型:Y=b0+b1(1/X)+u参数线性变量非线性(X以倒数形式进入模型)特征:X无限增大时,1/X趋近于0,Y逐渐接近b0渐近值。,双曲函数模型,平均固定成本恩格尔消费曲线菲利普斯曲线,例:美国菲利普斯曲线,数据:美国19581969年间小时收入指数(Y)和城市失业率(X)回归结果:Y=-0.2594+20.588(1/X)t=(-0.2572)(4.3996)R2=0.6594线性模型:Y=8.0147-0.7883Xt=(6.4625)(-3.2605)R2=0.5153,第五节:多项式回归模型,多项式回归模型:在模型等式右边只有一个解释变量,但却以不同的次幂出现,可将它们看作多元回归模型。多项式回归模型在生产与成本函数领域中被广泛应用。,多项式回归模型,形式:变量非线性,参数线性变量之间不完全共线性,三次多项式函数,形式:c=a0+a1Q+a2Q2+a3Q3又称为立方函数变量Q的最高次幂代表了多项式函数的次,上式最高次为3。,例:成本产出,数据Y=141.7667+63.4776X-12.961X2+0.9396X3,第六节包含虚拟变量的回归模型,虚拟变量:定性的或者反映质的差别的或者分组的信息结合到回归模型中。比如性别、种族、宗教、季节、战争/和平、有自然灾害/无自然灾害、南方/北方。我们可以用只取0和1的变量来表示这些定性或者分组的因素。称为虚拟变量。指标变量、二元变量、分类变量、二分变量,虚拟变量,(1)D=1表示男,0表示女(2)D=1表示生活在南方,0表示不生活在南方一般地D=,虚拟变量,季节i=1、2、3、4四个变量合起来可以表示各个季度,虚拟变量的性质,如果定性变量有m种情形,则应引进m-1个虚拟变量。否则就会陷入虚拟变量陷阱,即完全多重共线性。虚拟变量赋值是任意的。赋值依习惯而定。赋值为0的一类称为基准类、控制类、对比类。基准类的选择根据研究目的确定。虚拟变量D的系数称为差别截距系数,表明赋值为1的类和基准类截距值的差距。,1、方差分析模型,虚拟变量和定量变量一样可以用于回归分析。模型中的解释变量可以同时包含定量变量和虚拟变量。若回归模型中的变量仅仅只有虚拟变量,这样的模型称为方差分析模型(ANOVA)。,例:大学毕业生的初职年薪,模型:Y=b0+b1D1+uY:初职年薪D1=1:大学毕业D1=0:其他(非大学毕业)毕业生初职年薪的期望为:E(Y|D1=0)=b0+b1*0=b0E(Y|D1=1)=b0+b1*1=b0+b1,大学毕业生的初职年薪,截距b0表示非大学毕业生的平均初职年薪“斜率”b1表明大学毕业生的平均初职年薪与非大学毕业生的初职年薪的差距b0+b1表示大学毕业生的平均初职年薪,例:回归结果/图形,例:工作权利法对工会会员的影响,为了研究工作权利法的效果(该法使工会的劳资谈判合法化),Brennan等人建立了工会会员(属于工会的工人占所有工人的百分比)对工作权利法(1980年)的函数模型,这项研究包括了50个州,其中19个州制定了工作权利法,31个州允许有工会会员制度(即允许进行劳资谈判),工作权利法对工会会员的影响,回归结果:Y=26.68-10.51DSe=(1.00)(1.58)t=(26.68)(6.65)R2=0.497Y工会会员占工人的比例(1980)D=0,制定工人工作权利法的州D=1,未制定工作权利法的州,2、协方差模型,在许多的经济研究中,回归模型中的解释变量有些是定量的,有些是定性的,我们将这种模型称为协方差模型(ANCOVA)。包含一个定量变量,一个定性变量的回归模型包含一个定量变量,两个定性变量的回归模型,例:教师年薪与教龄、性别的关系,考虑ANCOVA模型:Y=b0+b1D+b2X+uY:大学教师的年薪,X:教龄D=1:男教师,D=0:女教师男教师平均年龄:E(Y|X,D=1)=b0+b1+b2X女教师平均年龄:E(Y|X,D=0)=b0+b2X,例:教师年薪与教龄、性别的关系,虚拟变量多种分类的情况,个人假期旅游的年支出对其收入与受教育水平的回归教育变量是定性变量,假设本问题有三种分类:未达到中学水平、中学水平、大学水平,假期旅游支出与教育水平,模型:Y=b0+b1D1+b2D2+b3X+uY:用于假期旅游的年支出X:年收入D1=1:中学教育,D1=0:其他D2=1:大学教育,D2=0:其他基准类:未达到中学水平,假期旅游支出与教育水平,未达到中学水平平均旅游支出E(Y|D1=0,D2=0,X)=b0+b3X中学水平的平均旅游支出E(Y|D1=1,D2=0,X)=b0+b1+b3X大学毕业的平均旅游支出E(Y|D1=0,D2=1,X)=b0+b2+b3X,回归结果,包含一个定量、两个定性变量的模型,教师年薪一例中,假定除教龄、性别外,肤色也是一个重要的决定因素。模型:Y=b0+b1D1+b2D2+b3X+uY:年薪,X:教龄D1=1:男教师,D1=0:女教师D2=1:白种,D2=0:非白种,3、回归模型中的结构稳定性:虚拟变量法,美国储蓄收入关系是否在严重萧条之后于1982年经历了一个结构变动。模型:19701981年:Y=A1+A2X+u19821995年:Y=B1+B2X+uY个人储蓄;X个人可支配收入,美国储蓄收入关系,四种可能结果:一致回归:A1=B1,A2=B2平行回归:A1B1,A2=B2并发回归:A1=B1,A2B2相异回归:A1B1,A2B2,美国储蓄收入关系,虚拟变量法:Y=M1+M2D+M3X+M4(DX)+uY个人储蓄;X个人可支配收入D=0:观察值是从1970年到1981年D=1:观察值是从1982年到1995年E(Y|D=0,X)=M1+M3XE(Y|D=1,X)=(M1+M2)+(M3+M4)X,美国储蓄收入关系,M2:差别截距;M4:差别斜率回归结果Y=1.02+152.48D+0.0803X-0.0655(DX)se=(20.16)(33.08)(0.0145)(0.0159)t=(0.05)(4.61)(5.54)(-4.10)R2=0.822;F=54.78,例:美国菲利普斯曲线失灵了吗?,回顾19581969年菲利普斯曲线数据:美国19581969年间小时收入指数(Y)和城市失业率(X)回归结果:Y=-0.2594+20.588(1/X)t=(-0.2572)(4.3996)R2=0.6594,美国菲利普斯曲线失灵了吗?,样本区间:19581977年回归方程:Y=M1+M2D+M3(1/X)+M4D(1/X)+uY:小时工资指数的年变化率X:失业率D=1:1969年以前观察值D=0:19701977年观察值,回归结果,Y=10.078-10.337D17.549(1/X)+38.137D(1/X)se=(1.4024)(1.6859)(8.3373)(9.3999)t=(7.1860)(-6.1314)(-2.1049)(4.0572)R2=0.878719581969:Y=-0.259+20.588(1/X)19701977:Y=10.078-17.549(1/X)(失灵),4、虚拟变量在季节分析中的应用,许多用月度或季度数据表示的经济时间序列,呈现出季节变化的规律性(季节模式)例如:春节前后商场的销售量;节假日期间家庭对货币的需求;夏天对冰激凌、软饮料的需求,虚拟变量在季节分析中的应用,通常可以从时间序列中将季节因素或成分剔除,进而将注意力集中在其他成分上。把季节成分从时间序列中剔除的过程称为消除季节成分或季节调整时间序列。美国政府公布的一些重要的经济时间序列数据就是经过季节调整后得到的。,例:澳大利亚支出消费关系,数据:澳大利亚从1977年第一季度到1980年第四季度的个人消费支出Y(衣服、硬件、电器、家具的零售价),个人可支配收入X模型:Y=b0+b1D1+b2D2+b3D3+b4X+uD1=0:第二季度

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论