版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
计量经济学课件PPT一元回归3一元线性回归模型的
参数估计一、普通最小二乘法OLS二、最大似然法ML(以后集中讨论)三、参数估计量的性质四、一元线性回归模型参数估计的实例
返回一、普通最小二乘法OLSOLS方法的由来实际观察值-对应拟合值=误差=纵向距离最小二乘—误差平方(二乘)和(综合)最小数学原理正规方程估计参数的公式(结构参数与分布参数)估计参数的公式的离均差形式数据结构的矩阵表示3北京林业大学经济管理学院统计系OLS(OrdinaryLeastSquare)
方法的由来1889年F.Gallton和他的朋友K.Pearson收集了上千个家庭的身高、臂长和腿长的记录企图寻找出儿子们身高与父亲们身高之间关系的具体表现形式下图是根据1078个家庭的调查所作的散点图(略图)4北京林业大学经济管理学院统计系160165170175180185140150160170180190200YX儿子们身高向着平均身高“回归”,以保持种族的稳定5北京林业大学经济管理学院统计系从图上虽可看出,个子高的父亲确有生出个子高的儿子的倾向,同样地,个子低的父亲确有生出个子低的儿子的倾向。得到的具体规律如下:如此以来,高的伸进了天,低的缩入了地。他百思不得其解,同时又发现某人种的平均身高是相当稳定的。最后得到结论:儿子们的身高回复于全体男子的平均身高,即“回归”——见1889年F.Gallton的论文《普用回归定律》。后人将此种方法普遍用于寻找变量之间的规律6北京林业大学经济管理学院统计系最小二乘法的思路1.为了精确地描述Y与X之间的关系,必须使用这两个变量的每一对观察值(n组观察值),才不至于以点概面(作到全面)。2.Y与X之间是否是直线关系(用协方差或相关系数判断)?若是,可用一条直线描述它们之间的关系。3.在Y与X的散点图上画出直线的方法很多。任务?——找出一条能够最好地描述Y与X(代表所有点)之间的直线。4.什么是最好?—找出判断“最好”的原则。最好指的是找一条直线使得所有这些点到该直线的纵向距离的和(平方和)最小——实际与理论抽象最接近。7北京林业大学经济管理学院统计系三种距离yx纵向距离横向距离距离A为实际点,B为拟合直线上与之对应的点8北京林业大学经济管理学院统计系纵向距离是度量实际值与拟合值
是否相符的有效手段点到直线的距离——点到直线的垂直线的长度。横向距离——点沿(平行)X轴方向到直线的距离。纵向距离——点沿(平行)Y轴方向到直线的距离。也就是实际观察点的Y坐标减去根据直线方程计算出来的Y的拟合值。实际值-拟合值=残差(误差、剩余)。9北京林业大学经济管理学院统计系最小二乘法的数学原理纵向距离是Y的实际值与拟合值之差,差异大拟合不好,差异小拟合好,所以又称为拟合误差或残差。将所有纵向距离平方后相加,即得误差平方和,“最好”直线就是使误差平方和最小的直线。于是可以运用求极值的原理,将求最好拟合直线问题转换为求误差平方和最小。10北京林业大学经济管理学院统计系数学推证过程11北京林业大学经济管理学院统计系关于所得直线方程的结论结论之一:由(5)式,得即拟合直线过y和x的平均数点。结论之二:由(2)式,得残差与自变量x的乘积和等于0,即两者不相关。12北京林业大学经济管理学院统计系拟合直线的性质1.估计残差和为零2.Y的真实值和拟合值有共同的均值3.估计残差与自变量不相关4.估计残差与拟合值不相关13北京林业大学经济管理学院统计系1.估计残差和为零
(ResidualsSumtozero)由(1)式直接得此结论无须再证明。并推出残差的平均数也等于零。14北京林业大学经济管理学院统计系2.Y的真实值和拟合值有共同的均值
(Theactualandfittedvaluesofyihavethesamemean)15北京林业大学经济管理学院统计系3.估计残差与自变量不相关
(Residualsareunrelatedwithindependentvariable)16北京林业大学经济管理学院统计系4.估计残差与拟合值不相关(Residualsareunrelatedwithfittedvalueofyi)17北京林业大学经济管理学院统计系关于回归直线性质的总结
残差和=0平均数相等拟合值与残差不相关自变量与残差不相关注意:这里的残差与随机扰动项不是一个概念。随机扰动项是总体的残差。18北京林业大学经济管理学院统计系数学推证19北京林业大学经济管理学院统计系正规方程20北京林业大学经济管理学院统计系估计参数的公式的离均差形式21北京林业大学经济管理学院统计系正规方程的矩阵表示22北京林业大学经济管理学院统计系随机误差项方差的估计23北京林业大学经济管理学院统计系一元回归模型的数据结构返回24北京林业大学经济管理学院统计系三、参数估计量的性质1、线性(Linear)2、无偏性(Unbiased)3、有效性(最小方差)(Best)3`、高斯-马尔可夫定理(Gauss_Markov)(BLUE)参数估计量的性质实际上指的是用某种方法(OLS)导出的参数估计量是否具有优良性。衡量优良性的标准:线性、无偏性、有效性、一致性、均方误最小等25北京林业大学经济管理学院统计系1、线性线性指的是参数估计量是被解释变量的线性函数。回归系数的估计量=正规方程的解从解的解析式(或矩阵形式),不难看出回归系数的估计量是被解释变量的线性组合。B=(X`X)-1X`Y26北京林业大学经济管理学院统计系2、无偏性无偏性指的是参数估计量的均值(数学期望)等于被估计的真值(模型中的参数)27北京林业大学经济管理学院统计系28北京林业大学经济管理学院统计系29北京林业大学经济管理学院统计系3、有效性(最小方差)OLS参数估计量的有效性指的是:在一切线性、无偏估计量中,OLS参数估计量的方差最小。1、导出参数估计量的方差(解析式)2、导出参数估计量的方差(矩阵表示)3、高斯-马尔可夫定理30北京林业大学经济管理学院统计系31北京林业大学经济管理学院统计系3`、高斯-马尔可夫定理关于高斯-马尔可夫定理的证明,参见其他文献。《计量经济学园地》有正反两种证明。根据高斯-马尔可夫定理,形如上页公式中表示的参数估计量的方差,在一切线性、无偏估计量中方差最小,所以OLS估计量是有效估计量。OLS估计量和是BLUE(BestLinearUnbiasedEstimator)的。32北京林业大学经济管理学院统计系4、随机误差项估计量的无偏性问题请同学们复习数理统计的相关内容。返回33北京林业大学经济管理学院统计系四、一元线性回归模型参数估计的实例我国用于文教科学卫生事业费用的支出(ED),主要由财政收入(FI)决定,二者之间具有线性关系。平均百分误差在10%以内,表明是一个拟合得比较好的模型34北京林业大学经济管理学院统计系35北京林业大学经济管理学院统计系我国财政文教科学卫生事业费支出模型EstimationCommand:=====================LSEDFICEstimationEquation:=====================ED=C(1)*FI+C(2)SubstitutedCoefficients:=====================ED=0.22341905*FI+30.052368
返回36北京林业大学经济管理学院统计系一元线性回归模型的检验假设检验参数的显著性检验1.t检验2.置信区间的检验3.F检验拟合优度的检验37北京林业大学经济管理学院统计系假设检验38北京林业大学经济管理学院统计系假设检验的原理1、提出二择一的假设:H0(往往与目的相反)与HA(往往是欲得到的结论)2、给定显著水平(小概率)3、在H0成立下,收集数据,构造检验统计量(如t、F),且已知统计量的分布,能计算出取各种值的概率4、查表得小概率发生的临界值(如t、F)5、将样本值和H0代入检验统计量进行计算6、将计算结果与临界值比较,若大于临界值,小概率事件发生,根据小概率原理,在一次试验中小概率事件是不会发生的。现在,居然发生了。错在哪里?7、原来是假设H0错了,因为一切都是在H0成立下推证的,于是拒绝H0。否则,不拒绝H0(注意没有使用“接受”)39北京林业大学经济管理学院统计系大海里捞针——反证法H0:一棵针掉进了大海里(海底只有一棵针)HA:海底不只一棵针显著水平=0.01(小概率事件发生的概率)进行抽样(试验)——到海底捞针通常用大海里捞针比喻不可能发生的事现在,一次潜水(抽样试验)就捞上一棵针,这掉下的一棵针居然被我们捞上来,不可能发生的事件发生了,于是拒绝H0,认为大海里不只一个针。“只有一棵针”,在一次抽样试验中是捞不上来的。40北京林业大学经济管理学院统计系两类错误之一——弃真1、H0:海底只有一棵针。但一次试验捞了上来。因为小概率事件发生,必须拒绝(H0)。然而此时此地海底真的只有一棵针,结论说不只一棵针,错了!犯“弃真”错误了。只有拒绝H0时才会犯弃真错误2、此时犯了弃真的错误,但是犯弃真错误的可能性,事先已经控制——只有显著水平(小概率)那么大3、所以拒绝不仅是坚决的,而且犯弃真错误的概率(冒险率—风险是事先控制的)也很小=。所得结论的可靠性=1-4、所以,人们提出的H0通常是无效的(null)41北京林业大学经济管理学院统计系犯两类错误之二——纳伪H0:某某(参加高考的考生)=大学生(准予参考就是提出这个假设,即假设他是优秀青年)进行抽样试验——参加高考检验统计量——考试总分(包括加分)众所周知,大学生乃同龄人中的佼佼者,而该某某平时素质和学业平平,距高等学府之路遥遥,被录取(总分超过报考学校的录取线)的概率很小。同时,在H0成立下,优秀毕业生考分低于录取线(失常)的概率很小。在此次抽样中他的总分喜煞人,由于小概率事件(优秀者失常)没有发生,于是不能拒绝H0某某“顺利”进入了重庆某学院,显然属于纳伪。42北京林业大学经济管理学院统计系不拒绝H0是无可奈何仅当不拒绝H0才会犯纳伪错误某某进入高校,招生工作犯了纳伪错误而且,进行检验时,没有事先控制纳伪的概率——无法度量犯纳伪的可能性。也就不能给出不拒绝H0结论(录取进大学)的可靠性(1-)。就一次试验而言,不拒绝H0是无可奈何的千万不可,以接受H0作为我们研究的结论(如有些市场调查的教科书)。欲证明H0成立必须继续抽样、继续检验,并采用功效函数。所以某某进校后不断地被抽样、被检验43北京林业大学经济管理学院统计系纳伪的概率
-H0实际总体/2/244北京林业大学经济管理学院统计系假设检验的种类1、参数检验已知分布形式(正态),检验分布的参数,例如检验均值、方差、回归系数等等2、非参数检验检验随机变量的分布形式,例如是否服从正态分布本课程主要讨论参数检验45北京林业大学经济管理学院统计系各种常用分布之间的联系46北京林业大学经济管理学院统计系抽样分布之间的联系返回47北京林业大学经济管理学院统计系显著性检验
—t检验(检验系数)方法48北京林业大学经济管理学院统计系t检验方法的直接计算返回49北京林业大学经济管理学院统计系显著性检验
—置信区间方法50北京林业大学经济管理学院统计系估计参数的置信区间51北京林业大学经济管理学院统计系回归系数1和2的置信区间52北京林业大学经济管理学院统计系回归系数1和2的置信区间2的显著水平为的置信区间为:同样,1显著水平为的置信区间为:53北京林业大学经济管理学院统计系2的置信区间返回54北京林业大学经济管理学院统计系2检验的显著性(2检验)返回55北京林业大学经济管理学院统计系假设检验中的两类错误第一类错误:拒绝真实;第二类错误:接受错误。两类错误之间存在一种替代关系(Trade-off)。56北京林业大学经济管理学院统计系F检验零假设H0:b=0备择HA:b<>0H0:b=0<==>RSS中的X不起作用,RSS变动无异于随机变动==>分子方差与分母方差是一回事==>F=1如果F显著地大于1,甚至F>F==>小概率事件发生了,根据小概率原理,小概率事件在一次试验中是不可能发生的,于是H0不成立。就不能认为X没有作用。则直线是有意义的。可靠性=1-57北京林业大学经济管理学院统计系F检验(总显著水平)算出F的估计值,与F分布表在选定显著水平上读出的F临界值相比较;或查找F统计量的估计值的P值。一元模型中b=0的t检验中的t统计量的平方和F检验德F统计量等价。
返回58北京林业大学经济管理学院统计系拟合优度的检验由最小二乘法所得直线究竟能够对这些点之间的关系加以反映吗?对这些点之间的关系或趋势反映到了何种程度?于是必须经过某种检验或者找出一个指标,在一定可靠程度下,根据指标值的大小,对拟合的优度进行评价。分四个问题进行讨论:平方和分解、方差分析、拟合优度、拟合优度与简单相关系数的关系。59北京林业大学经济管理学院统计系拟合优度检验拟合优度检验是指样本回归线与样本观测值之间拟合程度的检验。度量拟合程度的指标是判定系数R2。60北京林业大学经济管理学院统计系一、平方和与自由度的分解1、总平方和、回归平方和、残差平方和的定义2、平方和的分解3、自由度的分解61北京林业大学经济管理学院统计系1、总平方和、回归平方和、残差平方和的定义TSS度量Y自身的差异程度,RSS度量因变量Y的拟合值自身的差异程度,ESS度量实际值与拟合值之间的差异程度。62北京林业大学经济管理学院统计系2、平方和的分解63北京林业大学经济管理学院统计系平方和分解的意义TSS=RSS+ESS被解释变量Y总的变动(差异)=解释变量X引起的变动(差异)+除X以外的因素引起的变动(差异)如果X引起的变动在Y的总变动中占很大比例,那么X很好地解释了Y;否则,X不能很好地解释Y。64北京林业大学经济管理学院统计系3、自由度的分解总自由度dfT=n-1回归自由度dfR=1(自变量的个数,k元为k)残差自由度dfE=n-2自由度分解dfT=dfR+dfE65北京林业大学经济管理学院统计系平方和分解图正交分解66北京林业大学经济管理学院统计系为什么回归平方和是由X引起的变动ABC67北京林业大学经济管理学院统计系二、方差分析模型:y=a+bx+u==>LS估计:y^=a^+b^xH0:b=0HA:b<>068北京林业大学经济管理学院统计系拟合优度R2公式性质:r2与相关系数r不同在回归分析中,r2是一个比r更有意义的度量,因为前者告诉我们在因变量的变异中由解释变量解释的部分占怎样一个比例,因而对一个变量的变异在多大程度上决定另一个变量的变异,提供了一个总的度量。称为判定系数、决定系数,这里称为拟合优度。69北京林业大学经济管理学院统计系拟合优度等于实际值与拟合值之间简单相关系数的平方70北京林业大
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年芜湖某国有企业招聘建筑类工作人员考试备考题库及答案解析
- 职业教育教学设计案例分享
- 2026年江苏省省属事业单位统一招聘人员(621人)笔试参考题库及答案解析
- 2026黑龙江哈尔滨阿城区中医医院面向社会招聘编制外合同制护理岗位12人考试备考题库及答案解析
- 2026广东省四会市教育局赴高校招聘教师55人(第三轮)笔试备考试题及答案解析
- 2026贵州遵义仁怀市美酒河镇卫生院就业见习人员招聘2人笔试备考试题及答案解析
- 2026浙江丽水市莲都区教育局教育人才引进16人(二)考试备考题库及答案解析
- 现代仓储物流管理流程与优化策略
- 2026浙江宁波市生态环保产业集团有限公司招聘1人考试备考题库及答案解析
- 采购货到付款合同条款解析手册
- 2026四川成都成华区智慧蓉城运行中心招聘编外人员4人笔试备考试题及答案解析
- GB 6441-2025生产安全事故分类与编码
- 普通地质学课件-第三章-岩浆岩
- 北京市房屋质量缺陷损失评估规程及条文说明
- 青春期性生理发育与性问题
- 掘进机工程机械类外文翻译、中英文翻译
- GB/T 5754.1-2015钢丝绳芯输送带纵向拉伸试验第1部分:伸长率的测定
- GB/T 3690-2017织物芯输送带全厚度拉伸强度、拉断伸长率和参考力伸长率试验方法
- GB/T 11334-2005产品几何量技术规范(GPS)圆锥公差
- 《教师专业发展》课件
- 现代汉语语法(2)短语课件
评论
0/150
提交评论