版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、检验自变量与因变量之间的线性关系是否显著将回归均方(MSR)同残差均方(MSE)加以比较,应用F 检验来分析二者之间的差别是否显著回归均方:回归平方和SSR除以相应的自由度(自变量的个数) 残差均方(MSE) :残差平方和SSE除以相应的自由度(n-2).线性关系的检验的步骤线性关系的检验的步骤 提出假设H0:1=0 线性关系不显著)2,1 (21nFMSEMSRnSSESSRF提出假设H0: 1=0 不良贷款与贷款余额之间的线性关系不显著计算检验统计量F753844.56225164421.90148598.22221nSSESSRF 在一元线性回归中,等价于线性关系的在一元线性回归中,等价
2、于线性关系的显著性检验显著性检验 检验检验 x 与与 y 之间是否具有线性关系,或之间是否具有线性关系,或者说,检验自变量者说,检验自变量 x 对因变量对因变量 y 的影响的影响是否显著是否显著 理论基础是回归系数理论基础是回归系数 的抽样分布的抽样分布1样本统计量样本统计量 的分布的分布 是根据最小二乘法求出的样本统计量,它有自是根据最小二乘法求出的样本统计量,它有自己的分布己的分布 的分布具有如下性质的分布具有如下性质(线性、无偏、最小方差线性、无偏、最小方差)分布形式:正态分布分布形式:正态分布数学期望:数学期望:标准差:标准差:由于由于 未知,需用其估计量未知,需用其估计量sy来来代替
3、得到代替得到 的估计的标准差的估计的标准差11111)(E21xxi121xxssie11)(E21xxssie回归系数的检验检验步骤回归系数的检验检验步骤 提出假设H0: b1 = 0 (没有线性关系) H1: b1 0 (有线性关系) 计算检验的统计量) 2(11ntstw对例题的回归系数进行显著性检验对例题的回归系数进行显著性检验(0.05)w提出假设提出假设wH0:b1 = 0 wH1:b1 0 w计算检验的统计量计算检验的统计量533515. 7005030. 0037895. 0twP 值的应用值的应用w在一元线性回归分析中,回归系数显著在一元线性回归分析中,回归系数显著性的性的t
4、检验、回归方程显著性的检验、回归方程显著性的F检验,检验,相关系数显著性相关系数显著性 t检验,三者等价的,检验,三者等价的,检验结果是完全一致的。检验结果是完全一致的。w对一元线性回归,只做其中对一元线性回归,只做其中w 的一种检验即可。的一种检验即可。l建立的模型是否合适?或者说,这个拟合的模型有多建立的模型是否合适?或者说,这个拟合的模型有多“好好”?要回答这些问题,可以从以下几个方面入手?要回答这些问题,可以从以下几个方面入手l所估计的回归系数所估计的回归系数 的符号是否与理论或事先预期相的符号是否与理论或事先预期相一致一致l在不良贷款与贷款余额的回归中,可以预期贷款余额在不良贷款与贷
5、款余额的回归中,可以预期贷款余额越多不良贷款也可能会越多,也就是说,回归系数的越多不良贷款也可能会越多,也就是说,回归系数的值应该是正的,在上面建立的回归方程中,我们得到值应该是正的,在上面建立的回归方程中,我们得到的回归系数的回归系数 为正值为正值l如果理论上认为如果理论上认为x与与y之间的关系不仅是正的,而且是之间的关系不仅是正的,而且是统计上显著的,那么所建立的回归方程也应该如此统计上显著的,那么所建立的回归方程也应该如此l在不良贷款与贷款余额的回归中,二者之间为正的线在不良贷款与贷款余额的回归中,二者之间为正的线性关系,而且,对回归系数的性关系,而且,对回归系数的t检验结果表明二者之间
6、检验结果表明二者之间的线性关系是统计上显著的的线性关系是统计上显著的1037895. 01回归模型在多大程度上解释了因变量回归模型在多大程度上解释了因变量y y取值的差取值的差异?可以用判定系数异?可以用判定系数R2R2来回答这一问题来回答这一问题在不良贷款与贷款余额的回归中,得到的在不良贷款与贷款余额的回归中,得到的R2=71.16%R2=71.16%,解释了不良贷款变差的,解释了不良贷款变差的2/32/3以上,说以上,说明拟合的效果还算不错明拟合的效果还算不错考察关于误差项考察关于误差项的正态性假定是否成立。因为的正态性假定是否成立。因为我们在对线性关系进行我们在对线性关系进行F F检验和
7、回归系数进行检验和回归系数进行t t检检验时,都要求误差项验时,都要求误差项服从正态分布,否则,我服从正态分布,否则,我们所用的检验程序将是无效的。们所用的检验程序将是无效的。正态性的简单正态性的简单方法是画出残差的直方图或正态概率图方法是画出残差的直方图或正态概率图计量单位的讨论,因果模型的特征计量单位的讨论,因果模型的特征Excel输出的部分回归结果输出的部分回归结果R2) 残差分析残差分析w1 用残差证实模型的假定用残差证实模型的假定w2 用残差检测异常值和有影响的观测用残差检测异常值和有影响的观测值值残差图残差图(residual plot)表示残差的图形表示残差的图形关于关于x的残差
8、图的残差图关于关于y的残差图的残差图标准化残差图标准化残差图用于判断误差用于判断误差的假定是否成立的假定是否成立 检测有影响的观测值检测有影响的观测值残差图残差图(形态及判别形态及判别)残差图残差图(例题分析例题分析)不良贷款对贷款余额回归的残差图不良贷款对贷款余额回归的残差图-4-2024680100200300400贷款余额(x)残差标准化残差标准化残差(standardized residual)w 残差除以它的标准差后得到的数值。计算公式为w sei是第i个残差的标准差,其计算公式为 iiieiieiesyysez22)()(111xxxxnshssiiyiyei标准化残差图标准化残差
9、图w 用以直观地判断误差项服从正态分布这一假定是否成立 w若假定成立,标准化残差的分布也应服从正态分布w在标准化残差图中,大约有95%的标准化残差在-2到+2之间 标准化残差图标准化残差图(例题分析例题分析)不良贷款对贷款余额回归的不良贷款对贷款余额回归的标准化残差图标准化残差图-2-1012340100200300400贷款余额标准化残差异常值异常值如果某一个点与其他点所呈现的趋势不相吻合,这个点就有可能是异常点,或称为野点.如果异常值是一个错误的数据,比如记录错误造成的,应该修正该数据,以便改善回归的效果如果是由于模型的假定不合理,使得标准化残差偏大,应该考虑采用其他形式的模型,比如非线性
10、模型如果完全是由于随机因素而造成的异常值,则应该保留该数据在处理异常值时,若一个异常值是一个有效的观测值,不应轻易地将其从数据集中予以剔除. 异常值识别异常值识别异常值也可以通过标准化残差来识别如果某一个观测值所对应的标准化残差较大,就可以识别为异常值一般情况下,当一个观测值所对应的标准化残差小于-2或大于+2时,就可以将其视为异常值有影响的观测值有影响的观测值如果某一个或某一些观测值对回归的结果有强烈的影响,那么该观测值或这些观测值就是有影响的观测值 一个有影响的观测值可能是一个异常值,即有一个值远远偏离了散点图中的趋势线对应一个远离自变量平均值的观测值或者是这二者组合而形成的观测值 有影响
11、的观测值图示有影响的观测值图示存在一个有影响观测值的散点图存在一个有影响观测值的散点图024681012010203040 xy不存在影响值的趋势有影响的观测值存在影响值的趋势w一、变量间关系的种类一、变量间关系的种类w二、相关系数的计算、评价及检验二、相关系数的计算、评价及检验w三、回归模型、回归方程、估计回归方程的概三、回归模型、回归方程、估计回归方程的概念,回归方程参数的最小二乘估计念,回归方程参数的最小二乘估计w四、判定系数、估计标准误差的四、判定系数、估计标准误差的w 计算,及线性关系检验及计算,及线性关系检验及w 回归系数的检验回归系数的检验w五、回归分析结果的评价五、回归分析结果
12、的评价利用回归方程进行估计和预测根据自变量 x 的取值估计或预测因变量 y的取值估计或预测的类型点估计y 的平均值的点估计y 的个别值的点估计区间估计y 的平均值的置信区间估计y 的个别值的预测区间估计利用回归方程进行估计和预测(点估计)0 yw y 的平均值的点估计的平均值的点估计w利用估计的回归方程,对于自变量利用估计的回归方程,对于自变量 x 的一个的一个给定值给定值 x0 ,求出因变量,求出因变量 y 的平均值的一个的平均值的一个估计值估计值E(y0) ,就是平均值的点估计,就是平均值的点估计w在前面的例子中,假如我们要估计人均国民在前面的例子中,假如我们要估计人均国民收入为收入为20
13、00元时,所有年份人均消费金额的元时,所有年份人均消费金额的的平均值,就是平均值的点估计。根据估计的平均值,就是平均值的点估计。根据估计的回归方程得的回归方程得)(98.1160200052638. 022286.540元yw y 的个别值的点估计的个别值的点估计0 y)(57.7127 .125052638. 022286.540元y点估计不能给出估计的精度,点估计值与实际值之间是有误差的,因此需要进行区间估计对于自变量 x 的一个给定值 x0,根据回归方程得到因变量 y 的一个估计区间区间估计有两种类型置信区间估计预测区间估计w参数最小二乘估计量的协方差分析w均是无偏估计w均是正态分布w协
14、方差w y 的平均值的置信区间估计的平均值的置信区间估计 w利用估计的回归方程,对于自变量利用估计的回归方程,对于自变量 x 的一个的一个给定值给定值 x0 ,求出因变量,求出因变量 y 的平均值的平均值E(y0)的的估计区间估计区间 ,这一估计区间称为置信区间,这一估计区间称为置信区间w E(y0) 在在1-置信水平下的置信区间为置信水平下的置信区间为niiyxxxxnSnty1220201)2(827.341603473077.9867 .125013195.14201. 257.7122【例】根据前例,求出人均国民收入为【例】根据前例,求出人均国民收入为1250.7元时,元时,人均消费金
15、额人均消费金额95%的置信区间的置信区间 解:根据前面的计算结果解:根据前面的计算结果 712.57,Sy=14.95, t(13-2)2.201,n=13置信区间为置信区间为:0 y0 yw y 的个别值的预测区间估计的个别值的预测区间估计 w利用估计的回归方程,对于自变量利用估计的回归方程,对于自变量 x 的一个的一个给定值给定值 x0 ,求出因变量,求出因变量 y 的一个个别值的的一个个别值的估计区间,这一区间称为预测区间估计区间,这一区间称为预测区间 w y0在在1-置信水平下的预测区间为置信水平下的预测区间为niiyxxxxnSnty12202011)2(827.3416034730
16、77.9867 .1250131195.14201. 257.7122w 【例】根据前例,求出【例】根据前例,求出1990年人均国民收入为年人均国民收入为1250.7元时,人均消费金额的元时,人均消费金额的95%的预测区间的预测区间w 解:根据前面的计算结果有解:根据前面的计算结果有w 712.57,Sy=14.95,t(13-2)2.201,n=13w 置信区间为置信区间为0 y0 y影响区间宽度的因素w1. 置信水平 (1 - )w区间宽度随置信水平的增大而增大w2. 数据的离散程度 (s)w区间宽度随离散程度的增大而增大w3. 样本容量w区间宽度随样本容量的增大而减小w4. 用于预测的
17、xp与x的差异程度w区间宽度随 xp与x 的差异程度的增大而增大置信区间、预测区间、回归方程xy10多元线性回归1 多元线性回归模型多元线性回归模型 2 回归方程的拟合优度回归方程的拟合优度3 显著性检验显著性检验学习目标w1.回归模型、回归方程、估计的回归方程回归模型、回归方程、估计的回归方程w2.回归方程的拟合优度回归方程的拟合优度w3.回归方程的显著性检验回归方程的显著性检验w 4.用用 Excel 进行回归分析进行回归分析 目的要求 :1.掌握多元线性回归模型的概念 2. 掌握多元线性回归模型的最小二乘估计 3.掌握多元线性回归模型的最小二乘估计量的统计性质 4.掌握多元线性回归模型的
18、统计检验 5.会用多元线性回归模型分析简单经济问题多元回归分析模型多元回归分析模型wy = b0 + b1x1 + b2x2 + . . . bkxk + u01 12211110111,1iiik ikiknnnkknyxxxyxxyxyxxy x 与简单回归的相似点与简单回归的相似点w b0 仍然是截距w b1 到 bk 都成为斜率参数w u 仍然是误差项或称扰动项)w仍然需要做一个条件期望为0的假设,现在假设:E(u|x1,x2, ,xk) = 0w 仍然最小化残差的平方和 现实经济问题是复杂的,用一个解释变量去说明往往是不够的。随着解释变量数目的增多,由一元线性回归模型可以引申出多元线
19、性回归模型。我们可以将多元线性回归模型用如下方式表述: 假定因变量Y与解释变量X1,X2 ,Xk具有线性关系,它们之间的线性模型可表示为:Yi= 0+ 1X1+ 2X2+k Xk +uiX X经济学看:例:商品的需求量例:商品的需求量Q Q,不仅取决价格,不仅取决价格P P,还取决收入还取决收入Y Y、其它商品的价格、其它商品的价格P1P1等因等因素。如果用线性回归模型表示:素。如果用线性回归模型表示:uYPQP13210这就是一个多元三元线性回归模型为了简化起见,以下将考察多元线性回归模型的特例,即二元线性回归模型。1 多元线性回归模型多元回归模型与回归方程多元回归模型与回归方程估计的多元回
20、归方程估计的多元回归方程参数的最小二乘估计参数的最小二乘估计多元回归模型与回归方程多元回归模型 (multiple regression model)一个因变量与两个及两个以上自变量的回归描述因变量 y 如何依赖于自变量 x1 , x2 , xp 和误差项 的方程,称为多元回归模型涉及 p 个自变量的多元回归模型可表示为ipipiixxxy22110多元回归模型(基本假定) 误差项是一个期望值为0的随机变量,即E()=0对于自变量x1,x2,xp的所有值,的方差2都相同误差项是一个服从正态分布的随机变量,即N(0,2),且相互独立多元回归方程 (multiple regression equa
21、tion)描述因变量 y 的平均值或期望值如何依赖于自变量 x1, x2 ,xp的方程多元线性回归方程的形式为 E( y ) = 0+ 1 x1 + 2 x2 + p xp二元回归方程的直观解释22110 xxy22110)(xxyE估计的多元回归方程估计的多元回归的方程(estimated multiple regression equation)p,210p,210ppxxxy22110p,210p,210y 用样本统计量 估计回归方程中的 参数 时得到的方程由最小二乘法求得一般形式为参数的最小二乘估计参数的最小二乘法最小niiniipeyyQ1212210) (),(), 2 , 1(00000piQQiiip,210参数的最小二乘法(例题分析) 二元线性回归模型 一、 模型的估计 Y= 0+ 1X1+ 2X2+u 1.四种关系式: (1) Yi= 0+ 1X1i+ 2X2i+ui (真实或总体关系式)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026北京市地质矿产勘查院所属事业单位招聘36人备考题库附答案详解(达标题)
- 2026永安财产保险股份有限公司临洮支公司招聘备考题库含答案详解(轻巧夺冠)
- 2026年银行无领导小组面试常见题型解析
- 2026年职业健康知识竞赛现场问答
- 2026年数据分析与应用技能测试题集
- 2026年职场社交恐惧与公众讲话焦虑缓解问答
- 2026年基层干部退役军人创业孵化基地题
- 2026年记忆力测试听觉记忆
- (2026年)糖尿病患者饮食健康宣教课件
- (2026年)预防静脉留置针所致静脉炎课件
- 购货合同模板写
- DL-T596-2021电力设备预防性试验规程
- NB-T11092-2023水电工程深埋隧洞技术规范
- 专题1.5 整式的乘除章末拔尖卷(北师大版)(解析版)
- 钢结构吊装专项施工方案(钢结构厂房)
- 天津市各地区2022年中考化学一模试题汇编-实验题
- HGT4134-2022 工业聚乙二醇PEG
- 国开2023秋《人文英语3》第5-8单元作文练习参考答案
- 煤矿班组长培训课件
- 《唐诗三百首》导读课(二稿)
- 昆明天大矿业有限公司寻甸县金源磷矿老厂箐-小凹子矿段(拟设)采矿权出让收益评估报告
评论
0/150
提交评论