8.2.2一元线性回归模型参数的最小二乘估计课件高二下学期数学人教A版选择性_第1页
8.2.2一元线性回归模型参数的最小二乘估计课件高二下学期数学人教A版选择性_第2页
8.2.2一元线性回归模型参数的最小二乘估计课件高二下学期数学人教A版选择性_第3页
8.2.2一元线性回归模型参数的最小二乘估计课件高二下学期数学人教A版选择性_第4页
8.2.2一元线性回归模型参数的最小二乘估计课件高二下学期数学人教A版选择性_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一元线性回归模型参数的最小二乘估计(2)对于响应变量Y,通过观测得到的数据为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为残差,即

=

y

-

残差是随机误差的估计结果,通过对残差的分析可判断回归

模型刻画数据的效果,

以及判断原始数据中是否存在可疑数据等,

这方面的工作称为残差分析.一元线性回归模型Y

=

bx

+

a

+

e经验回归方程

=

x+

,bˆ探究新知思考:儿子身高与父亲身高的关系

运用残差分析所得的一元线性回归模型的

有效性吗?

:作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据

或体重估计值等

,这样作出的图形称为残差图

.探究新知从上面的残差图可以看出

残差有正有负

残差点比较均匀地分布在横轴的两边

可以判断样本数据基本满足一元线性回归模型对于随机误差的假设.

所以

,通过观察残差图可以直观判断样本数据是否满足一元线性回归模型的假

,从而判断回归模型拟合的有效性.为了使数据更加直观

用父亲身高作为横坐标

残差作为纵坐标

可以画出残差图

如下图所示:探究新知(1)(2)图(3)说明残差的方差不是一个常数,

随观测时间变大而变大追问:观察以下四幅残差图,你认为哪一个残差满足一元线性回归模型中对随

机误差的假定?图(2)显示残差

与观测时间有

非线性关系,应

在模型中加入

时间的非线性

函数部分;图(4)的残差

比较均匀地集

中在以横轴为

对称轴的水平图(1)显示残差与观测时间

有线性关系,应将时间变量

纳入模型;(3)

(4)探究新知残差的性质:1.残差等于观测值减预测值

=y

-2.残差的平方和越小越好;3.原始数据中的可疑数据往往是残差绝对值过大的数据;4.对数据刻画效果比较好的残差图特征:残差点比较均匀的集

中在水平带状区域内

.一般地,建立经验回归方程后,通常需要对模型刻画数据的效

果进行分析.借助残差分析还可以对模型进行改进,使我们能根据改

进模型作出更符合实际的预测与决策.探究新知1.关于残差图的描述错误的是(

C

)A.残差图的横坐标可以是样本编号B.残差图的横坐标也可以是解释变量或预报变量C.残差点分布的带状区域的宽度越窄相关指数越小D.残差点分布的带状区域的宽度越窄残差平方和越小2.已知变量x,Y之间具有线性相关关系,其散点图如图所示,则其经验回归方程可能为(B

)A.

=1.5x+2

B.

=-1.5x+2

C.

=1.5x-2

D.

=-1.5x-2巩固练习x24568Y3040605070已知Y关于x的经验回归方程为=6.5x+17.5,则当广告支出费用为5万元时,残差为

10

.当x

=5时,

=6.5

×

5+17.5

=50,表格中对应y

=60,∴残差为60-50

=10.3.某种产品的广告支出费用x(单位:万元)与销售额Y(单位:万元)的数据如表:巩固练习得到的经验回归方程为

=

x

+

,则(

B

)A.

>

0,

>

0

B.

>

0,

<

0C.

<

0,

>

0

D.

<

0,

<

0

b^b^b^b^b^x23456Y42.5-0.5-2-3

(xi

-

x)2

=17.5i=1

=

=

-1.4b^

=

x

-

y

=

7.95bˆ4.根据如下样本数据:巩固练习记录/s··

··

·问题人们常将男子短跑100m的高水平运动员称为

“百米飞人”.下表给出

了1968年之前男子短跑100m世界纪录产生的年份和世界纪录的数据.试依据这

些成对数据

建立男子短跑100m世界纪录关于纪录产生年份的经验回归方程.编号12345678年份18961912192119301936195619601968记录/s11.8010.6010.4010.3010.2010.1010.009.95在左图中

散点看

上去大致分布在一条

直线附近

似乎可用

一元线性回归模型建

立经验回归方程.以成对数据中的世界纪录产生年份为横坐标,世界纪录为纵坐标作散点图,12.011.511.010.510.09.51890探究新知得到下图19201930

1940

19501960

1970年份19001910···来刻画世界纪录和世界纪录产生年份之间的关系.根据最小二乘法,

由表中的数

据得到经验回归方程为1

=-0.02033743t+

49.76913031将经验回归直线叠加到散点图

得到下图:··用Y表示男子短跑100m的世界纪录,t表示纪录产生的年份,利用一元线性

Y/s12.011.511.010.510.09.51890探究新知19201930

194019501960

1970回归模型19001910······t第一个世界纪录所对应的散点远离经验回归直线

,并且前后两时间段中的散点都在经验回归直线的上方

中间时间段的散点都在经验回归直线的下方.这说明散点并不是随机分布在经验回归直线的周围

,而是围绕着经验回

归直线有一定的变化规律

即成对样本数据呈现出明显的非线性相关的特征.··思考

:从图中可以看到

经验回归方程较好地刻画了散点的变化趋势

请再

仔细观察图形

你能看出其中存在的问题吗?Y/s12.011.511.010.510.09.51890探究新知19201930

194019501960

197019001910······t仔细观察

可以发现散点更趋向于落在中间下凸且递减的某条曲线附近回顾已有的函数知识

可以发现函数y=-lnx的图象具有类似的形状特征注意到100m短跑的第一个世界纪录产生于1896年,

因此可以认为散点是

集中在曲线y

=f(t)

=c1

+c2

ln(t-1895)的周围

其中c1,c2为未知参数

且c2

<0.··思考

:你能对模型进行修改,以使其更好地反映散点的分布特征吗?Y/s12.011.511.010.510.09.51890探究新知19201930

194019501960

197019001910······t对数据进行变化可得下表:y

=f(t)

=c1

+c2

ln(t-1895)这是一个非线性经验回归函数

如何利用成对数据估计参数c1,c2

令x=ln(t-1895)

,则Y

=c2x+c1对数据进行变化可得下表:编号12345678年份/t18961912192119301936195619601968x0.002.833.263.563.714.114.174.29记录/s11.8010.6010.4010.3010.2010.1010.009.95探究新知由表中的数据得到经验回归方程为:2

=-0.4264398x

+11.8012653将经验回归直线叠加到散点图

如图所示:上图表明,经验回归方程对于成对数据具有非常好的拟合精度.将x

=ln(t-1895)代入

2

=-0.4264398x

+11.8012653,

得2

=-0.4264398ln(

t-1895)

+11.8012653探究新知得到散点图如下:1

=-0.4264398x

+11.8012653

2

=

-0.4264398ln(t

-1895)+11.8012653②(1)直接观察法.在同一坐标系中画出成对数据散点图、

非线性经验回

归方程②的图象(蓝色)以及经验回归方程①的图象(红色).思考

:对于通过创纪录时间预报世界纪录的问题

,我们建立了两个回归模型,

得到了两个回归方程

,你能判断哪个回归方程拟合的精度更好吗?我们发现

散点图中各散点都非常靠近②的图象

表明非线性经验回归方程②

对于原始数据的拟合效果远

远好于经验回归方程①

.探究新知1

=-0.4264398x

+11.8012653

2

=

-0.4264398ln(t

-1895)+11.8012653②

(2)残差分析:残差平方和越小,模型拟合效果越好.2

≈0

.669,Q

2

=

2

≈0

.004Q2

明显小于Q1

说明非线性回归方程的拟合效果

要优于线性回归方程.思考

:对于通过创纪录时间预报世界纪录的问题

,我们建立了两个回归模型,

得到了两个回归方程

,你能判断哪个回归方程拟合的精度更好吗?探究新知①和②的R2分别为0.7325和0.9983R2越大

表示残差平方和越小

即模型的拟合效果越好;

R2越小

表示残差平方和越大

即模型的拟合效果越差.

显然0≤R2

≤1

R2越接近1

,则线性回归刻画的效果越好.在一元线性回归模型中

R2

=r2

即决定系数R2等于响应变量与解释

变量的样本相关系数r的平方.思考

:对于通过创纪录时间预报世界纪录的问题

,我们建立了两个回归模型,

得到了两个回归方程

,你能判断哪个回归方程拟合的精度更好吗?

(yi

-

i

)2R

2

=

1

-

=

1

-

(yi

-

y)2(3)利用决定系数R2刻画回归效果.探究新知总偏差平方和残差平方和在使用经验回归方程进行预测时,需注意以下问题1.回归方程只适用于我们所研究的样本的总体;

2.我们所建立的回归方程一般都有时间性;3.样本采集的范围会影响回归方程的适用范围;4.不能期望回归方程得到的预报值就是预报变量的精确

值.事实上,它是预报变量的可能取值的平均值.探究新知巩固练习巩固练习②两边取对数得lny=ln

ebx+a

,即

lny=bx+a令z=lny,把原始数据(x,

y)转化为(x,z),再根据求解线性回归模型的方法求出a

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论