




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二章 简单回归模型 简单回归模型的定义 普通最小二乘法的推导 OLS的操作技巧 度量单位的函数形式 OLS估计量的期望值和方差 过原点回归计量12.1 简单回归模型的定义 回归模型的基本形式: 简单回归模型的基本形式: 称为一元线性总体回归模型。( )yf xuuxy10简单回归模型的定义 简单回归模型定义的几个讨论 公式变量与参数的解释 用x解释y时面临的三个问题 该公式的不足 该公式的假设计量3简单回归模型的定义公式变量与参数的解释 Y:被称为因变量(dependent variable)、被解释变量、被预测变量、回归子 X:被称为自变量(independent variable)、解释
2、变量、预测变量、回归元、协变量 u:为随机扰动项或随机误差项,表示除x以外其他因素对y的影响。 0和1为两个待定参数。从几何意义上讲,为直线的截距; 为直线的斜率(又称斜率系数)。计量4简单回归模型的定义用x解释y时面临的三个问题计量5x能否来解释y的变化?x和y存在着怎样的相关关系 ?既然两个变量间没有一个确切的依存关系,应该如何考虑x以外的其他因素对y的影响? 如何确定是在其他条件不变的情况下描述x和y的关系形式? 简单回归模型的定义该公式的不足计量6简单回归模型的定义该公式的假设spring 2012计量7( |)( )0iE u xE u1要使得固定,需要施加一个约束:表明:表明: u
3、中不包含系统性的影响因素,既没有变量遗漏问题,解释变量也不存在系统的测量误差,模型函数形式设定正确。u均值独立于解释变量随机变量x和u不相关的三个层次: “独立”:意味着对于x 、y和的任意可测函数 和 ,有 “均值独立”:意味着 “线性无关”:意味着 ( )g u( )f xcov ( ), ( )0g uf x =cov ,( )0u f x=cov( , )0u x =spring 2012计量9简单回归模型的定义该公式的假设计量10.x1x2E(y|x) = 0 + 1xyf(y) 计量1111每每 月月 家家 庭庭 可可 支支 配配 收收 入入 X200025003000350040
4、0045005000550060006500131215301631184320372277246929243515352113401619172619742210238828893338372139541400171317862006232525263090365038654108每每1548175018352265241926813156380240264345月月1688181418852367252228873300408741654812家家173819851943248526653050332142984380庭庭1800204120372515279931893654431245
5、80消消19022186207826892887335338424413费费220021792713291335344074支支231222982898303837104165出出2316292331673834 Y Y238730533310249831873510268932861591191520922586275430393396385340364148()iE Y X假如已知由假如已知由100100个家庭构成的总体的数个家庭构成的总体的数据据 (单位单位:元元) 12消费支出的条件期望与收入关系的图形消费支出的条件期望与收入关系的图形)(iXYE2.2 普通最小二乘法的推导计量13
6、最小二乘法是法国数学家勒让德(A.M.Legendre,1752-1833)于1805正式提出的,但他的研究没有涉及到误差分析问题。这一缺陷由德国数学家高斯 (C.F.Gauss1777-1855) 于1809年发布的正态误差理论补足,加上高斯宣称自1799年以来他一直使用在这种方法,许多人将最小二乘法的发明权归之于高斯。 总体回归线和总体回归函数计量14E(y|x) = 0 + 1xxy 对于实际的经济问题,通常无法掌握所有总体单位的数值,总体回归函数实际上是理论上存在,又称理论回归方程样本回归方程 通过对样本观测获得的信息去估计总体回归函数 如果变量x和y之间存在线性相关关系,对于任意抽取
7、的若干个观测(样本)点( ), 有 称为样本回归模型 由两部分组成 :系统分量和随机分量 系统分量 , iix y01iiiyxeiy01ix样本回归函数与总体回归函数的区别 总体回归函数虽然未知,但它是确定的(PRF唯一唯一) ; 样本回归线随抽样波动而变化,每次抽样都能获得一个样本,就可以拟合一条样本回归线,(SRF不唯一); 样本回归线只是样本条件均值的轨迹,还不是总体回归线,它至多只是未知的总体回归线的近似表现 样本回归函数与总体回归函数的关系样本回归函数与总体回归函数的关系 SRF1 * * SRF2 * * * * yxPRF样本回归函数的函数形式应与设定的总体回归函数的函数形式一
8、致 如果能够通过某种方式获得如果能够通过某种方式获得 和和 的数值,显然的数值,显然: 和和 是对总体回归函数参数是对总体回归函数参数 和和 的估计的估计 是对总体条件期望是对总体条件期望 的估计的估计 在概念上类似总体回归模型中的在概念上类似总体回归模型中的 ,可视,可视 为对为对 的估计。的估计。18对比:对比: 总体回归函数总体回归函数 样本回归函数样本回归函数10iyieiuiu10()iE y x1001()iiE y xx01iiiyxu01iiyx01iiiyxe对样本回归的理解对样本回归的理解普通最小二乘法(普通最小二乘法(OLS) (rdinary Least Squares
9、) 经典计量经济学最常采用的参数估计方法 它是建立在一个简单的估计准则最小二乘准则之上的 可以看出 最小二乘准则是使全部观测值的残差平方和为最小,即 01iiiiieyyyxminQ2ie201()iiyx= 由微积分求极值的原理知,要使 达到最小,必要条件是 对 和 的一阶偏导数等于零: Q01Q0100112()02()0iiiiiQyxQyx x 0101()0()0iiiiiyxyx x即 、 应满足下列方程组: 01这两个方程分别相当于0,0,iiiee x 经整理后得正规方程组 解得: 01201iiiiiiynxx yxx122201()()()()iiiiiiiiinx yxy
10、xxyynxxxxyx 01由此估计出的 和 称为参数的最小二乘估计量(OLSE)除了OLS以外,参数估计的方法还有最大似然估计(ML)方法、矩估计方法(MM)等 基于条件期望为0的普通最小二乘法的推导 由由E(u)=0 得得E(y 0 1x) = 0 对于给定的数据样本,有对于给定的数据样本,有 可得可得01101niiixynxyxy1010 由cov(x,u)=E(xu)=0 得Ex(y 0 1x) = 0 对于给定的数据样本,有计量23niiiniiniiiniiiniiiixxyyxxxxxyyxxxyyx1211111111001101niiiixyxn 计量24下0 在假设前提1
11、21211niiniiniiixxxxyyxxxy10易得:2.3 OLS的操作技巧计量25拟合值与残差OLSE的代数性质拟合优度拟合值和残差 拟合值:定义y在x= 的拟合值为 残差:观察值 与其拟合值的差。 为正,则回归线低估了 ;为负则回归线高估了 ;无数据点是必须在回归线上。ixixy10iiiixyu10iyiyiyOLS统计量的代数性质 OLS残差和及其样本均值均为零残差和及其样本均值均为零 代数表示代数表示 由由OLS的一阶条件得出的一阶条件得出计量27 01niiu01101niiixynOLSE的代数性质 回归元和回归元和OLS残差的样本协方差为零残差的样本协方差为零 代数表示
12、代数表示 由由OLS的一阶条件得出的一阶条件得出计量2801niiiux01101niiiixyxnOLSE的代数性质 OLS回归线过样本几何中心 代数表示 拟合值的样本均值与 的均值相等 拟合值与残差之间的样本协方差为0计量29xy10),(yxiyiiyy 0),cov(iiuy拟合优度拟合优度 定义定义 总平方和总平方和SST 解释平方和解释平方和SSE 残差平方和残差平方和SSR 计量计量30 2yyi 2yyi 2iu拟合优度拟合优度 SST=SSE+SSR的证明的证明计量计量31,所以得证0 又因为SSE 2SSR 222222yyuyyuyyyyuuyyuyyyyyyiiiiii
13、iiiiiiii拟合优度 拟合优度(又称判定系数) 我们定义R2 = SSE/SST = 1 SSR/SST为拟合优度,又称判定系数,总是介于0到1之间 一个接近于1的判定系数表明OLS给出了一个良好的拟合,一个于0的判定系数表明OLS给出了一个糟糕的拟合计量322.4 度量单位和函数形式度量单位和函数形式 改变度量单位对改变度量单位对OLS统计量的影响统计量的影响 在简单回归中加入非线性因素在简单回归中加入非线性因素 “线性线性”回归的含义回归的含义计量计量33改变度量单位对OLS统计量的影响 、 的计量单位 、 的经济含义是什么? X单位改变,y不变,影响 ,不影响 y单位改变,不管X是否
14、变化,影响 、 如果定义如果定义roedec = roe/100,那么样本回归线将会从,那么样本回归线将会从(estimated salary)=963.191 + 18.501roe改变到改变到(estimated salary)=963.191 + 1850.1roedec计量3401010110在简单回归中加入非线性因素 非线性因素的必要性:线性关系并不适合所有的经济学运用 通过对因变量和自变量进行恰当的定义,我们可以在简单回归分析中非常容易地处理许多y和x之间的非线性关系 例子:工资教育模型,计量35自然对数形式计量36计量37变量非线性模型中的斜率: 线性模型 边际贡献 线性-对数模
15、型 半弹性 对数-线性模型 半弹性 对数-对数模型 弹性经济学中的例子(x代表投资,y代表GDP)uxyuxyuxyuxyln3 . 131. 0ln115. 067. 0lnln12029887. 0368OLS估计量的期望值和方差 OLS的无偏性的无偏性 OLS估计量的方差估计量的方差计量38OLS的无偏性的无偏性 我们首先在一组简单假定的基础上构建我们首先在一组简单假定的基础上构建OLS的无偏性。的无偏性。假定假定SLR.1 线性于参数在总体模型中,因变量y与自变量x的误差项u的关系如下: 其中, 和 分别表示总体的截距和斜率参数。计量3901yxu01OLS的无偏性的无偏性假定假定SL
16、R.2 随机抽样 我们具有一个服从从整体模型方程 的随机样本 : i=1,2n,其样本容量为n.(更强假定:x非随机或固定,y独立同分布)计量4001yxu),(iiyxOLS的无偏性的无偏性假定假定SLR.3 解释变量的样本有变异x的样本结果即 ,i=1,n 不是完全相同的数值。计量41ix0)()var(2nxxxOLS的无偏性的无偏性假定假定SLR.4 零条件均值(或称严格外生假定、均值独立假定) 给定解释变量的任何值,误差的期望值都是零。换言之,E(u|x)=0恒成立。恒成立。暗含以下两个假定:1.随机项的条件均值等于无条件均值,随机项u均值独立于所有解释变量。2.表明模型函数形式设定
17、正确,即不存在函数形式设定偏误,内有变量遗漏问题,解释变量也不存在系统的测量误差。计量42OLS的无偏性的无偏性 定理定理2.1 在在SLR.1-SLR.4下,对 的任何值,我们都有 ,换言之公式的推导:引理: 计量431 10 0 和和0011(),()EE0011,对而言是无偏的对而言是无偏的1(1)(- )0niix x1111(2)( - )()( - )()( - )nnnniiiiiiiiiiix xyyx x yxnx yx x y1111(3)()()()()( - )nnnnxiiiiiiiiiiiSSTxxxxxx xxnx xx x xOLS的无偏性的无偏性 计量4401
18、11111( - )()( - )( - )()()()nnniiiiiiiiiinxxiiix xyyx x yx xxuSSTSSTxx xx0111111111=(- )+(- )+(- )0(- )(- )(- )nnniiiiiiiinniiiiiinxiiix xx xxx x ux x xx x uSSTx x u分子OLS的无偏性的无偏性 于是有计量451111111( - )1()( - )1()-nxiiniiiixxniiiiixSSTx x ux x uSSTSSTd udx xSST其中1111111111()()()()( )1()*0nniiiiiixxniixE
19、E d ud E uSSTSSTdSSTOLS的无偏性的无偏性计量46010110110011011011()()()=E()+E()( )()0(.()2.1yxxuxxuExE uEE故有利用至此,定理证毕OLS估计量的方差估计量的方差 除了知道 的抽样分布是以 为中心的以外,知道我们预期的 究竟离 多远也非常重要。在其他条件不变的情况下,这就容许我们从所有的无偏估计量中选择一个最佳估计量。度量估计量 分布的分散程度,最容易操作的一个指标就是其方差或者标准差。为了便于表示出估计量的方差,这里我们加入条假设SLR.5计量4711111OLS估计量的方差估计量的方差u假定假定SLR.5(同方差
20、性同方差性)给定解释变量的任何值,误差都具有相同给定解释变量的任何值,误差都具有相同的方差,换言之:的方差,换言之:Var(u|x)=u同方差的假定简化了同方差的假定简化了 方差的计算,而方差的计算,而且还意味着且还意味着OLS具有某种有效性。然而具有某种有效性。然而当当Var(u|x)是是x的函数事,往往就会出现的函数事,往往就会出现异方差的情形。异方差的情形。计量4821一个工资方程中的异方差性一个工资方程中的异方差性 其他条件不变情况下,其他条件不变情况下,educ对对wage的影响时的影响时无偏估计量,我们假定无偏估计量,我们假定E(u|educ)=0,若同时假若同时假定定Var(u|x)= ,即工资相对于其均值的波动不即工资相对于其均值的波动不依赖于受教育水平。在现实中这或许不太可能。依赖于受教育水平。在现实中这或许不太可能。 这是因为接受了更多教育的人可能有更广泛的这是因为接受了更多教育的人可能有更广泛的兴趣和更多的就业机会,从而导致收教育程度兴趣和更多的就业机会,从而导致收教育程度越高,工资变异越大;受教育水平越低,工资越高,工资变异越大;受教育水平越低,工资变异越小。图形见下张变异越小。图形见下张PPT 计量492spring 2012计量50OLS估计量的方差估计量的方差计量5112122122212221()(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- CQJTG/T E03-2021公路桥梁预应力施工质量验收规范
- 金属制品在环保监测设备中的实时监测能力考核试卷
- 校长在2025届高考百日誓师大会上的讲话横绝学海问鼎苍穹
- 2025年中国边缘智能计算芯片行业市场现状及未来发展前景预测分析报告
- 房产拍卖代理与中介服务合同
- 抖音平台合规性承诺及信息互发合同
- 2025年中国被动电子元器件行业市场规模调研及投资前景研究分析报告
- 网店过户交易保障及后续市场拓展与客户服务合同
- 电商广告媒体资源采购与销售转化服务协议
- 生态农业股权投资协议(SPA)及绿色生产标准协议
- 洋酒简介版课件
- 道路桥梁工程施工进度计划表
- 《用户协议和隐私政策》
- 大队委竞选笔试试卷
- 英语阅读教学【讲座课件】
- 高中信息技术 必修1 算法及其描述PPT 课件
- 舟山外钓岛光汇油库储运基地四期工程
- [甘肃]最新甘肃省造价文件汇编(310页)
- 工业企业环境管理工作要点
- 临床技术操作规范麻醉学分册
- 高中物理实验考点整合电学PPT课件
评论
0/150
提交评论