第2章-一元线性回归-《应用回归分析》-课件_第1页
第2章-一元线性回归-《应用回归分析》-课件_第2页
第2章-一元线性回归-《应用回归分析》-课件_第3页
第2章-一元线性回归-《应用回归分析》-课件_第4页
第2章-一元线性回归-《应用回归分析》-课件_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第2章一元线性回归2.1一元线性回归模型2.2参数β0、β1的估计2.3最小二乘估计的性质2.4回归方程的显著性检验2.5残差分析2.6回归系数的区间估计2.7预测和控制2.8本章小结与评注12.1一元线性回归模型一元线性回归模型

y=β0+β1x+ε2回归方程E(y|x)=β0+β1x2.1一元线性回归模型样本模型

yi=β0+β1xi+εi, i=1,2,…,n3回归方程E(yi)=β0+β1xi,var(yi)=σ2,样本观测值(x1,y1),(x2,y2),…,(xn,yn)经验回归方程

回归方程平均意义的解释2.2参数β0、β1的估计一、普通最小二乘估计

(OrdinaryLeastSquareEstimation,简记为OLSE)4最小二乘法就是寻找参数β0、β1的估计值使离差平方和达极小称为yi的回归拟合值,简称回归值或拟合值

称为yi的残差有人用绝对值2.2参数β0、β1的估计52.2参数β0、β1的估计6经整理后,得正规方程组2.2参数β0、β1的估计7得OLSE为记2.2参数β0、β1的估计8二、最大似然估计

似然函数并不局限于独立同分布的样本。连续型:是样本的联合密度函数:离散型:是样本的联合概率函数。似然函数在假设εi~N(0,σ2)时,由(2.10)式知yi服从如下正态分布:2.2参数β0、β1的估计9二、最大似然估计

y1,y2,…,yn的似然函数为:对数似然函数为:与最小二乘原理完全相同

2.3最小二乘估计的性质10一、线性

是y1,y2,…,yn的线性函数

:2.3最小二乘估计的性质11其中用到

二、无偏性

无偏性的意义2.3最小二乘估计的性质12三、的方差

回归系数的相关情况2.3最小二乘估计的性质13三、的方差

在正态假设下Gauss—Markov条件

2.4回归方程的显著性检验14一、t

检验

原假设:H0:β1=0 对立假设:H1

:β1≠0

由当原假设H0:β1=0成立时有:

2.4回归方程的显著性检验15一、t

检验

构造t统计量

其中2.4回归方程的显著性检验16二、用统计软件计算

1.例2.1用Excel软件计算什么是P值?

(P-value)P值即显著性概率值

SignificenceProbabilityValue是当原假设为真时得到目前的样本以及更极端样本的概率,所谓极端就是与原假设相背离它是用此样本拒绝原假设所犯弃真错误的真实概率,被称为观察到的(或实测的)显著性水平17双侧检验的P值18/

2/

2

t拒绝拒绝H0值临界值计算出的样本统计量计算出的样本统计量临界值1/2P值1/2P值左侧检验的P值19H0值临界值a样本统计量拒绝域抽样分布1-置信水平计算出的样本统计量P值右侧检验的P值20H0值临界值a拒绝域抽样分布1-置信水平计算出的样本统计量P值利用P值进行检验的决策准则若p值>

,不能拒绝H0若p值<,拒绝H0双侧检验p值=2×单侧检验p值212.4回归方程的显著性检验22三、F检验平方和分解式

SST=SSR+SSE构造F检验统计量

在正态假定下,SSE/s2服从卡方分布,原假设成立时,SSR/s2也服从卡方分布,2.4回归方程的显著性检验23三、F检验一元线性回归方差分析表方差来源自由度平方和均方F值P值回归残差总和1n-2n-1SSRSSESSTSSR/1SSE/(n-2)P(F>F值)=P值2.4回归方程的显著性检验24四、相关系数的显著性检验

2.4回归方程的显著性检验25四、相关系数的显著性检验

2.4回归方程的显著性检验26四、相关系数的显著性检验

附表1相关系数的临界值表n-25%1%n-25%1%n-25%1%10.9971.000160.4680.590350.3250.41820.9500.990170.4560.575400.3040.39330.8780.959180.4440.561450.2880.37240.8110.947190.4330.549500.2730.35450.7540.874200.4230.537600.2500.32560.7070.834210.4130.526700.2320.30270.6660.798220.4040.515800.2170.28380.6320.765230.3960.505900.2050.26790.6020.735240.3880.4961000.1950.254100.5760.708250.3810.4871250.1740.228110.5530.684260.3740.4781500.1590.208120.5320.661270.3670.4702000.1380.181130.5140.641280.3610.4633000.1130.148140.4970.623290.3550.4564000.0980.128150.4820.606300.3490.44910000.0620.0812.4回归方程的显著性检验27四、相关系数的显著性检验

用SPSS软件做相关系数的显著性检验

2.4回归方程的显著性检验28四、相关系数的显著性检验

两变量间相关程度的强弱分为以下几个等级:当|r|≥0.8时,视为高度相关;当0.5≤|r|<0.8时,视为中度相关;当0.3≤|r|<0.5时,视为低度相关;当|r|<0.3时,表明两个变量之间的相关程度极弱,在实际应用中可视为不相关。2.4回归方程的显著性检验29五、三种检验的关系H0:b=0H0:r=0H0:回归无效2.4回归方程的显著性检验30六、样本决定系数

可以证明2.5残差分析

31一、残差概念与残差图

残差

误差项

残差ei是误差项ei的估计值。

2.5残差分析

32一、残差概念与残差图

2.5残差分析

33一、残差概念与残差图

图2.6火灾损失数据残差图2.5残差分析

34二、残差的性质

性质1E(ei)=0

证明:2.5残差分析

35二、残差的性质

性质2其中称为杠杆值

2.5残差分析

36二、残差的性质

2.5残差分析

37二、残差的性质

性质3.

残差满足约束条件:

这表明残差是相关的,不是独立的.2.5残差分析

38三、改进的残差

标准化残差学生化残差2.6回归系数的区间估计39

等价于β1的1-α置信区间2.7预测和控制

40一、单值预测

2.7预测和控制

41

二、区间预测找一个区间(T1,T2),使得

需要首先求出其估计值的分布

1.因变量新值的区间预测二、区间预测1因变量新值的区间预测42以下计算的方差从而得二、区间预测1因变量新值的区间预测43记于是有

则二、区间预测1因变量新值的区间预测44y0的置信概率为1-α的置信区间为

y0的置信度为95%的置信区间近

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论