




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、关于1,2.4回归模型的统计检查,2,2,2.4.1拟合度检查,拟合度的概念,对于任何两个变量的一组观测值,我们总是可以用最小二乘法得到直线,问题是该直线给定的观测值能否很好地适应,这就是拟合度问题。 适合度检查对模型样品观测值的适合度。 最小二乘法原理最小化了拟合误差(残差平方和)来估计模型,但这并不意味着模型能很好地描述样本数据之间的关系。 3、适合度图表、综合回归模型: y=10.5 xn (0,4 ) (绿色)样本回归函数: Y=12.67 0.40X e (红色)、4、适合度图表、综合回归模型: y=10.5 xn (0,16 )样本回归函数: y=6.43 2.4.1适合度检验、适
2、合度的概念残差平方和、回归标准偏差等可以作为模型适合度的尺度,但残差平方和是绝对量,不太理想。 为了测量模型对样本数据的适合度,有必要构建相对误差指标。 6、1 .整体平方和的分解,y的劣化的组成,还有TSS=ESS RSS,1 .整体平方和的分解, ESS是用模型说明变量说明的部分方差的大小RSS是用模型说明变量说明的部分方差的大小ess expinedsumofsquaresrss residualsumofsquarests totalsumofsqua 各观测值集中在回归直线的周围,直线和观测值的拟合越好,表示R2的值越大。 决定系数R2、定义决定系数R2为:9、0r21; 当R2=1
3、时,残差平方和RSS=0,回归式与样品观测值完全一致。 r21,r20,解释回归方程的拟合效果很高,表示回归方程的拟合不好。 R2是回归线适配各观测点的程度的测度。 决定系数R2,10,练习题,用y表示的整体平方和是_ _ _ _ _,回归平方和是_ _ _ _ _ _ _,残差平方和是_ _ _ _ _,决定系数的公式是_。 决定系数R2可取的值的范围为: _ _ _,R2接近1时为回归式,R2接近0时为回归式。 11、残差平方和的特征之一是,模型每次追加解释变量时,如果用变更后的模型进行再估计,残差平方和的值就会变小。 由此可以推测,决定系数是与解释变量的个数相关的量,当解释变量的个数增加
4、时R2增加,也就是说,可以用增加模型的解释变量的方法来增加R2的值。 因此,使用R2作为适合度的测度并不充分满足。修改的决策系数、12、修改的决策系数、实际上通常用修改的决策系数来验证模型的适合性:例2-2、例2-3、13、决策系数R2,在实际应用中,初学者被R2通过了多少模型的问题所困扰。 其实,以R2大小为代表的好坏没有绝对的基准,是根据研究的具体情况决定的。 在确定模型回归分析的质量时,拟合度不是唯一的标准。 只考虑最大化调整的判定系数,不注意方程式的经济意义和统计意义是危险的。 应用计量经济学,14,课外作业,P564线性回归模型和多元线性回归模型的判定系数R2在定义上有差异吗? 修正
5、的判定系数和R2的联系和差异是什么? 15,2.4.2模型的显性检验,显性检验包括模型的显性检验和解释变量的显性检验。 1、假说验证是根据实际问题的要求提出假说,称为原来的假说,记为H0。 逻辑上采用反证法,在统计上基于“小概率事件实际不可能发生的原理”,假设H0是正确的,建立检定统计量,确定其概率分布,构建小概率事件(排斥域)。 随机提取容量n的样品观测值,计算检验统计值,检验统计值处于拒绝区域时,拒绝原假设,说明原假设H0错误。16,2,回归方程的有效性检查F检查,即,所有的解释变量都对y没有影响,不是零,在原始的假定成立的情况下,关于多元线性回归模型:17,f分布,设X2(m ),Y2(
6、n ),x和y彼此独立这里,m表示第一自由度,n表示第二自由度,FF(m,n )。18、f分布密度函数图、f (1,20 )、f (2,20 )、19、f分布密度函数图、f (3,10 )、f (3,50 )、f (5,50 )、20,根据给定的有效水平和查找表求出阈值F(k,n-k-1 ) 如果拒绝f,H0,表明所有解释变量都对y有显着影响,并且所选模型可以为因素变量的行为提供一定程度的解释。 回归模型有着显着的意义。 2、回归方程的有效性检验F检验、21、f检验拒绝区、22,所有斜率系数都为零的检验实际上是检验R2的值是否为零,根据23、练习、例2-3的回归结果,以5%的有效性水平验证方程
7、式的有效性24,2.4.3解释变量的有效性检验对于多线性回归模型,方程式的总体线性关系是有效的,不能说明解释变量对解释变量的影响是有效的。 必须有效地验证每个解释变量,以确定是否作为重要的解释变量保留在模型中。 如果某个变量对要解释的变量的影响不明显,则需要考虑将它排除在外,建立一个更简单的模型。 如果2.4.3描述变量的有效性检验、1. t统计和模型为:26、对一维线性模型、27、t分布、x-n (0,1,1 )、Y2(n )和x-y彼此独立,则随机变量根据自由度n的t分布来描述为Tt(n )。 另外,在n-1的情况下,在t分布的数学期望E(t)=0的情况下,t分布的方差D(t)=n/(n-
8、2) t分布是类似于标准正态分布的对称分布,并且通常比标准正态分布更平坦地分布。 特定的分布取决于被称为自由度的参数。 随着自由度的增加,分布也为标准正态分布,28,t分布和标准正态分布的比较,标准正态分布,t分布n=1,t分布n=6,29,2.t检验,1,检验统计量的计算,2,根据t分布表,阈值t/2, 可以求出3,3,若|t| t/2,拒绝H0,Xi对y有显着的影响|t| t/2,则接受H0,认为Xi对y的影响不明显,将Xi从模型中除去,制作更简单的模型假设H0:i=0,即Xi对y没有显着的影响。 2.4.3说明变量的显着性检查,30,练习题,在1,5 %的显着性水平上检查变量x1,x2的
9、显着性。 2 .计量经济模型的统计检查一般是指,在说明变量的显着性检查中,检测的统计量是指,其顺从的分布是指: 从美国1960-1995年的36年间个人的实际可支配收入x和个人的实际消费支出y的数据,得出了以下回归结果。 根据计算关系表中空间a-e的数值,31,32,回归分析结果的报告,回归结果的报告通常采用以下形式:R2=0.4902,DW=2.15 t=(-0.60) (2.36) (1.24 ),财政资金农业支出和农民收入关系研究,33,课外工作在给出34、2.4.4参数的置信区间、置信度(1- )的情况下,t值落入区间(-t/2,t/2 )的概率为(1- )。即,由于是35、2.4.4
10、参数的置信区间,所以在1-的置信区间中,I的置信区间计算即36、练习、例2-3中的参数的95%置信区间、37、2.5预测,在预测时,计算总体回归模型点的预测值对应于Xf的回归值,即38,课外作业,p5610, 由于39、区间预测、预测误差为,因此,没有一个偏差的预测量、ef的方差是40、Yf的预测区间、41、区间预测,若将有效度水平设为,则求出t/2 (n-k-1 ),Yf的可靠性为1-的预测区间是Yf的平均E(Yf )的信号2.5.2样本内预测和样本外预测:【例2-2】、43、2.5.3预测评价标准、1、均方根误差和平均绝对误差、2、平均绝对误差百分误差、44、一、可线性化模型二、不可线性化
11、模型、但在实际问题中众所周知,柯布道格拉斯生产函数:是一个例子。 2.6非线性回归模型,在这些非线性关系中,有些可通过代数变换变成线性关系,而有些不能。 让我们用几个例子来讨论这个问题。 46、线性模型的语义线性模型的基本形式是:其特征在于可以写出各解释变量与系数相乘的形式。 线性模型的线性包含双重意义: (1)变量的线性。 变量不是作为X和lnX等函数,而是作为其原型出现在模型中。 (2)参数的线性。 变量y是各参数的线性函数。 能够直接线性化47,2.6.1的非线性模型,在这样的非线性模型中参数通常是线性的,但变量并不全部是线性的,属于非标准线性模型。 如果对1、倒数模型、指令、48、2、
12、多项式模型和模型执行:则该模型被转换为多元线性回归模型。 仅定义:定义:这个关系:另外:49,对数函数模型,指数函数模型,指数函数模型,3,半对数模型,50,4,对数模型,指令:1对X1的弹性,即X1是1%,X2 P56说明练习9模型中系数的意义,51,2.6.2可间接线性化的非线性模型,1,Cobb-Douglas生产函数模型,在模型两侧取对数,求出参数估计值后,样本回归函数:用Eviews软件直接估计对数线性模型52、【例】表示某市19801996年的国内生产总值y、生产资金k和就业人数l的统计。 用线性化法推定C-D生产函数:53,54,得到(1)变换为线性模型并推定输入的指令: gen
13、 rly=log (y ) gen RLL=log (l ) gen rlk=log (k ) lslnynycolnlnk,C-D生产函数的推定55 2、Logistic模型、2.6.2间接可线性化的非线性模型取模型为:两侧的对数,可:指令:56、2.6.2不可线性化的模型(例如模型: ),其一般形式为:针对这种模型常用的参数估计被称为这样的参数的非线性最小二乘估计。 57、计量经济包通常提供这种方法。 其步骤首先使用提供各参数的初始估计值(合理的估计值)的这些参数值和x的观测值数据计算y的预测值,计算各期间的残差,计算残差平方和,使一个或多个参数的估计值微小地变动:新的y的预测值, 如果要
14、计算残差平方和的新值小于旧值,则重复步骤4、5和6以新参数的估计值优于旧估计值,直到无法缩小为止。 最后的参数估计是最小二乘估计。非线性最小二乘法、58、非线性最小二乘法、NLS通常给出参数的初始值,并使用迭代方法来确定参数估计值,并且重复重复直到所估计值收敛为止,即,直到最后两次估计值之差小于事先提供的精度。 因此,用NLS求出的估计值只不过是一定精度下的近似解。(1)设定应推定的参数的初始值,在工作文件窗口双击序列c,在序列窗口中直接输入参数的初始值(2)。 输入推测非线性模型的【命令方式】命令: NLS被解释变量=非线性函数式,非线性回归模型的情况下NLS Y=C(1)*LC(2)*KC(3),60,【菜单方式】(1)在主菜单中为object
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 幼儿园区角设计教研实施框架
- 偏瘫并发症肩痛
- 谵妄的评估和护理
- 嗜酸细胞性肺炎临床诊疗解析
- 心理健康为人之道
- 幼师职业护眼健康管理
- 火炬传递健康教案大班
- 2025年殡葬服务项目规划申请报告
- 【台州】2025年浙江台州市交通工程试验检测中心招聘22人笔试历年典型考题及考点剖析附带答案详解
- 整活班会课件
- Filemaker数据库使用指南知识分享
- 国开《Windows网络操作系统管理》形考任务四
- 计算机控制系统 课件 第10章 网络化控制系统的分析与设计
- 铁道概论(第八版)佟立本主编
- 2024年海关与报关行业培训资料
- 《运动生理学》期末考试复习题库(含答案)
- 学生人力资源(董克用)复习题汇总
- 《小学语文阅读有效教学策略研究》开题报告
- 云南省昆明市西山区2022-2023学年五年级下学期期末科学试卷
- 儿科质控中心建设方案
- 2013免疫吸附治疗知情同意书
评论
0/150
提交评论