




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
线性回归模型
§1回归分析概述§2
线性回归模型的参数估计§3
线性回归模型的统计检验§4
回归预测§5
极大似然估计§6有约束回归§1回归分析概述
一、线性回归模型的特征二、线性回归模型的普遍性三、线性回归模型的基本假设一、线性回归模型的特征
1、线性回归模型的特征一个例子
凯恩斯绝对收入假设消费理论:消费(C)是由收入(Y)唯一决定的,是收入的线性函数:
C=+Y(2.2.1)
但实际上上述等式不能准确实现。原因⑴消费除受收入影响外,还受其他因素的影响;⑵线性关系只是一个近似描述;⑶收入变量观测值的近似性:收入数据本身并不绝对准确地反映收入水平。因此,一个更符合实际的数学描述为:
C=+Y+(2.2.2)其中:是一个随机误差项,是其他影响因素的“综合体”。线性回归模型的特征:
⑴通过引入随机误差项,将变量之间的关系用一个线性随机方程来描述,并用随机数学的方法来估计方程中的参数;⑵在线性回归模型中,被解释变量的特征由解释变量与随机误差项共同决定。2、模型的理论方程中为什么必须包含随机误差项?(1)在解释变量中被忽略的因素的影响;(2)变量观测值的观测误差的影响;(3)模型关系的设定误差的影响;(4)其它随机因素的影响。3、随机误差项主要包括哪些因素的影响?4.单方程线性回归模型的一般形式
二、线性回归模型的普遍性
线性回归模型是计量经济学模型的主要形式,许多实际经济活动中经济变量间的复杂关系都可以通过一些简单的数学处理,使之化为数学上的线性关系。1.线性的含义对变量而言对参数而言2.将非线性模型转化为线性模型的数学处理方法⑴变量置换例如,描述税收与税率关系的拉弗曲线:抛物线
s=a+br+cr2c<0s:税收;r:税率设X1=r,X2=r2,则原方程变换为
s=a+bX1+cX2c<0变量置换仅用于变量非线性的情况。⑵函数变换
例如,Cobb-Dauglas生产函数:幂函数
Q=AKLQ:产出量,K:投入的资本;L:投入的劳动方程两边取对数:
lnQ=lnA+lnK+lnL(3)级数展开例如,不变替代弹性CES生产函数:方程两边取对数后,得到:对在ρ=0处展开台劳级数,取关于ρ的线性项,即得到一个线性近似式。
变量置换得到结论:实际中的许多问题,都可以最终化为线性问题,所以,线性回归模型有其普遍意义。即使对于无法采取任何变换方法使之变成线性的非线性模型,目前使用得较多的参数估计方法——非线性最小二乘法,其原理仍然是以线性估计方法为基础。线性模型理论方法在计量经济学模型理论方法的基础。Back:三、线性回归模型的基本假设对于线性回归模型,模型估计的任务是用回归分析的方法估计模型的参数。最常用的估计方法是普通最小二乘法。为保证参数估计量具有良好的性质,通常对模型提出若干基本假设。如果实际模型满足这些基本假设,普通最小二乘法就是一种适用的估计方法;如果实际模型不满足这些基本假设,普通最小二乘法就不再适用,而要发展其它方法来估计模型。线性回归模型在上述意义上的基本假设
(1)解释变量X1,X2,…,Xk
是确定性变量,不是随机变量;解释变量之间互不相关。
(2)随机误差项具有0均值和同方差。即
E(i)=0i=1,2,…,n
Var(i)=2i=1,2,…,n
(5)随机误差项服从0均值、同方差的正态分布。即i~N(0,2)i=1,2,…,n(3)随机误差项在不同样本点之间是独立的,不存在序列相关。即
Cov(i,j)=0i≠ji,j=1,2,…,n(4)随机误差项与解释变量之间不相关。即
Cov(Xji,i)=0j=1,2,…,ki=1,2,…,n重要提示几乎没有哪个实际问题能够同时满足所有基本假设;通过模型理论方法的发展,可以克服违背基本假设带来的问题;违背基本假设问题的处理构成了单方程线性模型的理论方法的主要内容:
异方差问题(违背同方差假设)序列相关问题(违背序列不相关假设)共线性问题(违背解释变量不相关假设)随机解释变量(违背解释变量确定性假设)Back§2
线性回归模型的参数估计
--普通最小二乘法
假定变量yt与k
个变量xjt,j=1,…,k
,存在线性关系。多元线性回归模型表示为:其中yt是被解释变量(因变量),xjt
是解释变量(自变量),ut是随机误差项,i,i=0,1,…,k
是回归参数(通常未知)。这说明xjt,j=1,…,k,是yt的重要解释变量。ut代表众多影响yt变化的微小因素。模型描述即形式★★矩阵形式§2
线性回归模型的参数估计1.普通最小二乘法(OLS)
最小二乘法(OLS)的原理是通过求残差(误差项的估计值)平方和最小确定回归参数估计值。这是求极值问题。用Q表示残差平方和,求其最小值条件下的回归参数的估计值。minQ得到下列方程组求参数估计值的实质是求一个k+1元方程组正规方程变成矩阵形式★★最小二乘法的矩阵表示★★正规方程的结构Y——被解释变量观测值nx1X——解释变量观测值(含虚拟变量nx(k+1))X`X——设计矩阵(实对称(k+1)x(k+1)矩阵)X`Y——正规方程右端(k+1)x1——回归系数矩阵(k+1)x1——高斯乘数矩阵,设计矩阵的逆
——残差向量(nx1)
——被解释变量的拟合(预测)向量nx12.最小二乘估计量的性质线性(估计量都是被解释变量观测值的线性组合)无偏性(估计量的数学期望=被估计的真值)有效性(估计量的方差是所有线性无偏估计中最小的)1)线性因为X的元素是非随机的,(X‘X)-1X是一个常数矩阵,由上式知是Y的线性组合,为线性估计量。具有线性特性2)无偏特性3)有效性★★具有最小方差特性。★★随机误差项的方差的估计量
M=M'M2=M'M=M'利用上述性质,残差平方和'
e'e=(Mu)'(Mu)=u'M'Mu=u'Mu=u'[I-X(X'X)-1X']uE(e'e)=E{tr[u'(I-X(X'X)-1X')u]=tr[(I-X(X'X)-1X')E(uu')]=(n-K-1)3.样本容量问题样本是一个重要的实际问题,模型依赖于实际样本。获取样本需要成本,企图通过样本容量的确定减轻收集数据的困难。最小样本容量:满足基本要求的样本容量样本容量问题(X`X)-1存在|X`X|≠0X`X
为k+1阶的满秩阵R(AB)≤min(R(A),R(B))R(X)≥k+1因此,必须有n≥k+1,此为最小样本容量▲满足基本要求的样本容量一般经验认为:n≥30或者n≥3(k+1)才能满足模型估计的基本要求。n≥3(k+1)时,t分布才稳定,检验才较为有效§3
线性回归模型的统计检验1
拟合优度检验
2方程的整体显著性
3参数的显著性检验回归分析是要通过样本所估计的参数来代替总体的真实参数,或者说是用样本回归线代替总体回归。尽管从统计性质上已知,如果有足够多的重复抽样,参数的估计值的期望(均值)就等于其总体的参数真值,但在一次抽样中,估计值不一定就等于该真值。那么,在一次抽样中,参数的估计值与真值的差异有多大,是否显著,这就需要进一步进行统计检验。主要包括拟合优度检验、变量的显著性检验及模型整体的显著性检验。1.拟合优度检验
拟合优度指用
样本回归线对样本观察值的拟合程度.(1)总离差平方和的分解YX0*******△****Y9由回归方程解释的部分,表示解释变量X对Y的线性影响残差项,表示回归方程不能解释的部分总离差平方和(TSS)回归平方和(ESS)残差平方和(RSS)(1)总离差平方和的分解★★注意英文缩小的含义TSS:TotalSquareSum/总离差平方和RSS:ResidualSquareSum/残差平方和ESSExplainSquareSum/解释平方和(回归平方和)平方和分解的意义TSS=RSS+ESS被解释变量Y总的变动(差异)=解释变量X引起的变动(差异)+除X以外的因素引起的变动(差异)如果X引起的变动在Y的总变动中占很大比例,那么X很好地解释了Y;否则,X不能很好地解释Y。(2)样本可决系数样本可决系数是拟合优度评价的最重要指标,残差的标准差也能作为拟合优度评价的参考指标样本可决系数(Thecoefficient
ofDetermination)R2随机项μ的方差σ2的最小二乘估计量★★相关系数计算方法与样本决定系数一样含义有所不同:样本可决系数是判断回归方程与样本观测值拟合优度的一个数量指标,隐含的前提条件是X和Y具有因果关系相关系数是判断两个随机变量线性相关的密切程度,不考虑因果关系。(3)调整的可决系数(adjustedcoefficientofdetemination)增加解释变量时,很可能增加R2,容易引起错觉,认为只要在回归模型中增加解释变量就可以了,因此考虑对R2进行修正思考:调整的可决系数能否为负?如果为负,说明什么问题?★★注意TSS、ESS、RSS的自由度TSS(离差平方和):n-1RSS(残差平方和):n-k-1ESS(回归平方和):k=n-1★★赤池信息准则和施瓦茨准则为了比较所含解释变量个数不同的多元回归模型的拟合优度,常用的标准还有赤池信息准则和施瓦茨准则赤池信息准则的定义为:AIC
=ln(
e’e/n)
+[2(k+1)]/n施瓦茨准则的定义为:SC
=ln(
e’e/n)
+(k/n)lnn上面的两个准则均要求仅当所增加的解释变量能够减少AIC和SC的值时,才允许在模型中增加该解释变量2.方程整体线性的显著性检验(F检验)检验估计的回归方程作为一个整体的统计显著性3.参数估计量的t检验检验回归方程中每个解释变量的统计显著性3.参数估计量的t检验检验回归方程中每个解释变量的统计显著性★★参数的置信区间容易推出:在(1-)的置信水平下i的置信区间是其中,t/2为显著性水平为、自由度为n-k-1的t分布的临界值。★★回归模型统计检验的步骤(1)
查看拟合优度,进行F检验,从整体上判断回归方程是否成立,如果F检验通不过,无须进行下一步;否则进行下一步查看各个变量的t值及其相应的概率,进行t检验,如果相应的概率小于给定的显著水平,该自变量的系数显著地不为0,该自变量对因变量作用显著;否则系数与0无显著差异(本质上=0),该自变量对因变量无显著的作用,应从方程中删去,重新估计方程。★★但是,一次只能将最不显著(相应概率最大)的删除。每次删除一个,直至全部显著。§4
线性回归模型的预测
对于模型给定样本以外的解释变量的观测值X0=(1,X01,X02,…,X0k),可以得到被解释变量的预测值:它可以是总体均值E(Y0)或个值Y0的预测。但严格地说,这只是被解释变量的预测值的估计值,而不是预测值。为了进行科学预测,还需求出预测值的置信区间,包括E(Y0)和Y0的置信区间。1.E(Y0)的置信区间易知)()ˆ()ˆ()ˆ(00YEEEYE====BXBXBX000容易证明于是,得到(1-)的置信水平下E(Y0)的置信区间:其中,t/2为(1-)的置信水平下的临界值。),(~ˆ020XX)X(XBX100¢¢-sNY2.Y0的置信区间如果已经知道实际的预测值Y0,那么预测误差为:容易证明0))(())ˆ(()ˆ()(100000000=¢¢-=--=-+=-μXXXXBBXBXBXmmmEEEeEe0服从正态分布,即构造t统计量可得给定(1-)的置信水平下Y0的置信区间:§5
极大似然估计(MaximumLikelihood)极大似然估计基本原理:当从模型总体随机抽取容量为n的一组样本观测值后,最合理的参数估计量应该使得从模型中抽取该组样本观测值的概率最大。在满足基本假设条件下,对一元线性回归模型:
随机抽取容量为n的一组样本观测值后(Xi,Yi)(i=1,2,…n)。假如模型的参数估计量已经求得,为那么Yi服从如下的正态分布:于是,Y的概率函数为:(i=1,2,…n)因为Yi是相互独立的,所以的所有样本观测值的联合概率,也即似然函数(likelihoodfunction)为:
将该似然函数极大化,即可求得到模型参数的极大似然估计量。由于似然函数的极大化与似然函数的对数的极大化是等价的,所以,取对数或然函数如下:解得模型的参数估计量为:
可见,在满足一系列基本假设的情况下,模型结构参数的极大似然估计量与普通最小二乘估计量是相同的。§6
受约束回归一、模型参数的线性约束一般地,估计线性模型时,可对模型参数施加若干个线性约束条件,例如对模型:可施加约束:于是上面的模型转化为:采用普通最小二乘法得到参数的估计结果是:再由约束条件:可得:能否对直接施加了约束条件的模型进行估计?这需进一步的检验,常用的检验方法有F检验,x2检验与t检验记无约束条件模型的矩阵表示式为记受约束条件模型的矩阵表示式:于是,受约束样本回归模型的残差项可写为:受约束样本回归模型的残差平方和RSSR为:于是:由于无论对于无约束的回归模型还是受约束的回归模型,Y的总的离差平方和TSS相同,因此因此,通常情况下,受约束的回归模型的解释能力较无约束回归模型来说要差但如果约束条件为真,则无约束条件模型与受约束条件模型有相同的解释能力,即有由于:故:因此,我们可以采用此统计量进行x2检验,当σ2未知时,采用它的估计量代替.F统计量无需估计随机扰动项的方差σ2差,根据该统计量,如果约束条件无效,则F值较大,当对给定的显著性水平α,有认为约束条件无效当σ2未知时,可以构造F统计量认为约束条件有效二、对回归模型增加或减少解释变量对如下的两个回归模型:对模型中要不要增加解释变量,哪些解释变量要去掉?t检验可以对单个变量的取舍进行判断;F检验除了能对单个变量进行取舍判断外,还可以对多个变量的取舍进行判断.因此对模型解释变量取舍的问题的检验,我们经常采用的是F检验.其中(1)式可看成是对(2)式施加的如下的约束条件的受约束回归:相应的F统计量为:如果约束条件为真,则说明F统计量较小,无须加进这q个解释变量;否则F统计量较大,约束条件为假,说明这q个解释变量对Y有较
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 租书服务的社区文化大使项目考核试卷
- 粪便资源化利用在减少化肥使用中的作用考题考核试卷
- 江西师范高等专科学校《免疫与病原生物学实验Ⅲ》2023-2024学年第一学期期末试卷
- 吉林省辽源市重点名校2025届初三第三次模拟考试语文试题含解析
- 山东省滨州市达标名校2025年中考第三次调研考试语文试题试卷含解析
- 内蒙古自治区呼和浩特市赛罕区达标名校2025届初三中考模拟卷(二)化学试题含解析
- 西安邮电大学《非诉讼实务》2023-2024学年第二学期期末试卷
- 武汉工程大学《演讲与口才》2023-2024学年第二学期期末试卷
- 辽宁省辽河油田第二中学2025年高考模拟试卷(4)化学试题含解析
- 太原科技大学《医生与病人》2023-2024学年第二学期期末试卷
- 六下统编版复习2形近字
- 重庆十八梯介绍(改)课件
- 硒知识科普手册
- 起重吊装作业审批表
- 最新三角形的特性优质课教学设计公开课教案
- 新版冀教版科学四年级下册全册教案(双面打印)
- MSAGRR数据自动生成工具(已经解密)
- 招商工作策略与路径pptPPT通用课件
- DBJ 33-T 1268-2022工程建设工法编制标准(高清正版)
- 漫画教你精益生产
- 宫腔镜的仪器及噐械(课堂PPT)
评论
0/150
提交评论