第五章线性模型的扩展_第1页
第五章线性模型的扩展_第2页
第五章线性模型的扩展_第3页
第五章线性模型的扩展_第4页
第五章线性模型的扩展_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章 线性回归模型的扩展第一节 非线性回归模型一、 可线性化模型(1)倒数变换模型模型: 可以设:,进行变量的倒数变换,就可以将其转化成线性回归模型,所以该模型为倒数变换模型。观察:倒数变换模型有一个明显特征:经济学中哪些经济现象有类似的变动特征?(平均固定成本曲线,菲利普斯曲线等。) 例:某地十六年中化学工业投资与相应年份的国民生产总值的统计数据如下表所示: X表示国民生产总值,Y表示化工总投资,用双曲函数模型表示两个变量之间的非线性关系 年份国民生产总值 (X)化工总投资 (Y)年份国民生产总值(X)化工总投资 (Y)12345678523563594635688753796868001

2、6001500160019002500290028002891011121314151693598210631171130614131516169200310034003400350044005600620066(2)双对数模型(幂函数模型)模型:设:因为,恰好就是被解释变量关于解释变量的弹性(3)半对数模型模型: 这些模型中的回归系数的含义也很明确。(4)多项式模型模型:进行变量间的代换后,可以将之转化成为多元线性回归模型。例:为了分析某行业的生产成本情况,从该行业中选取了10家企业,表中列出了这些企业总产量X(吨)和总成本Y(万元)的有关资料,试建立该行业的总成本函数和边际成本函数。总成本

3、Y19.3 22.6 24.0 24.4 25.7 26.0 27.4 29.7 35.0 42.0总产量X10 20 30 40 50 60 70 80 90 100二、 不可线性化模型用高斯牛顿迭代法估计非线性回归模型(两种做法进行比较)例: 我国国有企业生产函数。我国国有独立核算工业企业的非线性模型如何估算?运用CD生产函数: 我国国有独立核算工业企业统计资料年份时间t工业总产值Y(亿元)职工人数L(万人)固定资产K(亿元)19781979198019811982198319841985198619871988198919901991199219931994123456789101112

4289.183 581.263 782.173 877.864 151.254 541.054 946.115 586.145 931.366 601.607 434.067 721.017 949.558 634.809 705.5210 261.6510 928.663 1393 2083 3343 4883 5823 6323 6693 8153 9554 0864 2294 2734 3644 4724 5214 4984 5452 225.702 376.342 522.812 700.902 902.193 141.763 350.953 835.794 3

5、02.254 786.055 251.905 808.716 365.797 071.357 757.258 628.779 374.34作业:1某制造厂表面处理车间试验将铬后污水同电解污泥混合,使之生成无毒溶液,效果很好。但实际排出污水的浓度不完全相同,而且一定浓度的定量铬后污水只有同定量的电解污泥混合后,才能反应完全。现通过试验,找出铬后污水用量与电解污泥用量之比对于铬后污水浓度之间的关系。试验数据如下: 表序 号 X:铬后污水浓度(G/L)Y:铬后污水用量(ML)/电解污泥用量(ML)123456789101135103040506080100120160 310 200 100 49

6、40 32 28 23 16 14 102某市19801996年国内生产总值Y,生产资金K和从业人数L的统计资料如下表所示。分别利用线性化方法和迭代法估计C-D生产函数:时 期时间变量tGDP(亿元)生产资金(亿元)从业人数(万人)1980110352461673947919812107964763241302198231141049913420501983412340527224356019845147475610244750198561757163211455901986719467710514669419878222007801247093198892596489566465151989

7、10283349886546979199011310951 0753747007199112342751 1845847967199213411241 3441448570199314536101 6880250310199415725142 2214251300199516920112 84348515301996171 102103 3643451200三、回归模型的比较(一) 图形观察分析观察被解释变量与解释变量的相关图,可以直观地看出两者的相关程度和相关类型。为设定模型的具体函数形式指出了大致方向。(二) 模型估计结果观察分析回归系数的符号和值的大小是否符合经济意义,这是对所估计模型的

8、最基本要求;改变模型形式之后是否使判定系数的值明显提高;各个解释变量的t检验的显著性;系数的估计误差较小。(三) 残差分布观察观察分析残差分布表中,各期残差是否大多数都落在的虚线框内;残差分布是否具有某种规律性;近期残差的分布情况。例:我国税收预测模型的比较分析 如下表,列出了我国19851998年期间税收收入Y和国内生产总值(GDP)X的统计资料。(单位:亿元人民币) 我国税收与GDP统计资料 年份税收GDP年份税收GDP19851986198719881989199019912 0412 0912 1402 3912 7272 8222 9908 96410 20111 96314 928

9、16 90918 54821 61819921993199419951996199719983 2974 2555 1276 0386 9108 2349 26326 63834 63446 75958 47867 88574 46379 396(1) 相关图分析:将模型初步设定为指数函数模型、二次函数模型和双对数模型。(2) 估计模型。(3) 残差分布分析。(4) 拟合预测分析。(5) 外推预测。作业:为了研究生产率与废料率之间的关系,记录了如下的数据,试根据这些数据拟合适当的模型。(提示:分别用指数曲线和直线拟合,并比较) 生产率x(单位/周)1 0002 0003 0003 5004 0

10、004 5005 000废品率y(%)5.26.56.88.110.210.313.0第二节 虚拟变量一、 虚拟变量及其作用经济变量的影响因素中间有时还包括一些定性因素,例如,消费习惯、地区差异将直接影响居民的消费支出;劳动者素质、季节因素对产品的生产和销售都会产生影响。舍弃定性因素,一方面不能真实地描述经济变量之间的相关关系,增大模型的设定误差,同时也不能计量这些定性因素的影响。 ,1为城镇居民,0为农村居民 ,1为销售旺季,0为销售淡季 , 1政策紧缩,0为政策宽松 ,1为本科以上学历,0以本科以下学历在计量经济模型中引入虚拟变量有以下作用:(1) 可以描述和测量定性因素的影响(2) 能够

11、正确反映经济变量之间的相互关系,提高模型的精度。(3) 便于处理异常数据;当样本资料中存在异常数据时,一般有三种处理方式,一是在样本容量较大的时候直接剔除异常数据;二是用平均数方式修匀异常数据;三是设置虚拟变量: ?虚拟变量的设置有规律吗?练习:中日关系的冷热也是一个定性因素,如果让你设置,你怎么设置呢?表 一个局部数据列表个人编号WAGEEDUCFEMALEMARRIED1234525525310324300600115635011121181614110010010110问:如果1表示女性,0表示男性,那么的经济含义是什么呢-通过图形来说明。二、 虚拟变量的设定(一) 虚拟变量的引入方式:

12、加法方式,乘法方式,一般方式。1. 加法方式居民家庭的教育费用支出除了受收入水平的影响之外,还与子女的年龄结构密切相关。如果家庭中有适龄子女,教育支出就多一些。 ,1为有适龄子女,0为无适龄子女。将家庭教育费用支出函数取成: 这样,就形成了两个函数:没有适龄子女家庭的教育费用支出:有适龄子女家庭的教育费用支出:=画出样本回归方程的图像可知,以加法方式引入虚拟变量时,反映的是定性因素对截矩的影响,即平均水平的差异情况。以加法方式加入虚拟变量时,暗含着什么意思呢 - 2. 乘法方式 定性因素的影响不仅表现在截矩上,有时可能还会影响斜率。例如,随着收入水平的提高,家庭教育支出的边际消费倾向可能会发生

13、变化。于是用乘法方式引入,将家庭教育费用支出函数取成:其中,该支出函数等价于以下两个等式:通过画图可以说明,以乘法方式引入虚拟变量,反映的是定性因素对斜率的影响,系数描述了定性因素的影响程序。3. 一般方式 用不同方式引入虚拟变量将反映不同的经济效果,所以最初是大致判断定性因素的影响类型,然后用加法方式或乘法方式在模型中设置虚拟变量。 但是在实际应用中,却不是这样。实际做法是:先都引入,再进行回归,对D和XD前的系数进行T检验,决定以什么样的方式来加入。表: 我国城镇居民家庭抽样调查资料关于彩电拥有量收入等级彩电拥有量Y(台/百台)人均收入X(元/年)困难户最低收入户低收入户中等偏下户中等收入

14、户中等偏上户高收入户最高收入户83648701967510090105891096411513122542 198882 476753 303174 107265 118996 370597 8776910 962。16作法:1.设置虚拟变量。 2以两种方式同时引入,进行回归。 3进行经济解释。(二)虚拟变量的设置原则:一个因素多个类型,多个因素两种类型1 一个因素多个类型 例如,某公司职员的年薪与工龄和学历有关。学历分成三种类型:大专以下、本科、研究生。为了反映“学历”这个定性因素,应该设置几个虚拟变量呢?(假设以加法形式引入)A方案: 年薪函数取成:方案A好吗?B方案:,方案B好吗?C方案

15、:好在哪里?总结规律。 一个定性因素,M个属性,设M-1个虚拟变量。对上例进行图解说明。课堂练习:已知冷饮的销售量Y除受k种定量变量Xk的影响外,还受春、夏、秋、冬四季变化的影响,要考察该四季的影响,只需引入哪几个虚拟变量呢?2多个因素两种类型 研究居民住房消费函数时,考虑到城乡差异以及不同收入层次的影响,将消费函数取成:其中,Y,X分别是居民住房消费支出和可支配收入,虚拟变量,其中,1指农村居民,0指城镇居民,其中,1指高收入家庭,0指低收入家庭这样,可以反映各类居民家庭的住房消费情况:四类: 因此,如果有M个定性因素,且每个因素各有两个不同的属性类型,则引入M个虚拟变量。三、虚拟变量的特殊

16、应用(一) 调整季节变动 利用季节资料建立模型时,经常存在着季节波动。例如,利用季度数据分析某公司利润Y与销售收入X之间的相互关系时,为研究四个季度对利润的季节性影响,引入三个虚拟变量 取利润函数为:系数分别反映了第一、二、三、四季度对利润的平均影响,根据这些系数的T检验可以判断季节因素对利润是否存在影响。例如,教材第150页第6题。 (二)检验模型结构的稳定性 利用不同的样本数据估计同一形式的计量经济模型,可能会得到不同的估计结果。如果估计的参数之间存在着显著差异,则称模型结构是不稳定的,反之则认为是稳定的。 例如:可以利用我国改革开放前后的统计资料建立储蓄函数,通过比较两个时期的回归方程,

17、可以分析改革开放前后居民的储蓄行为是否发生了明显变化。又如,利用我国发达地区和不发达地区GDP和投资的资料分别建立模型,可以比较不同地区投资对经济增长影响的差异情况。可以用Chow检验法。也可以用虚拟变量来进行检验。以练习为例。 设根据两个样本估计的回归模型分别为:样本1:样本2:设置虚拟变量: ,1指样本2,0为样本1。 将样本1和样本2的数据合并,估计以下模型: 其中,。利用T检验判断D、XD系数的显著性, (三)分段回归 在实际经济问题的研究中,有些经济关系需要用分段回归加以描述:当解释变量X低于某个已知的临界水平X*时,Y与X之间是某种线性相关关系,而大于这个临界水平时,又是另一种线性

18、相关关系。 例如,假设某企业的成本和产量成线性关系,产量超过一个值后,成本会急速上升,办法之一是进行分段回归,但也带来问题。可以取虚拟变量为:将分段回归模型设置成:这样就将各段的奖金函数表示为:(四)混合回归建立计量经济模型时,有时能同时获得变量的时序数据和横截面数据,就提出了一个问题:如果能同时获得变量的时序数据和横截面数据,是否可以将它们“混合”成一个样本来估计模型?下表为我国城镇居民1998年、1999年全年人均消费支出和可支配收入的统计资料,试使用混合样本数据估计我国城镇居民消费函数。过程:1.分别设1998年和1999年的居民消费函数2 设置虚拟变量,并合并两年的数据,估计新模型。3 根据估计出的虚拟变量前系数,看是否能够运用混合回归。画表来表示用不同样本计算出的回归模型的情况。收入等级

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论