一元线性回归模型参数的最小二乘估计+高二下学期数学人教A版选择性必修第三册_第1页
一元线性回归模型参数的最小二乘估计+高二下学期数学人教A版选择性必修第三册_第2页
一元线性回归模型参数的最小二乘估计+高二下学期数学人教A版选择性必修第三册_第3页
一元线性回归模型参数的最小二乘估计+高二下学期数学人教A版选择性必修第三册_第4页
一元线性回归模型参数的最小二乘估计+高二下学期数学人教A版选择性必修第三册_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第8章成对数据的统计分析8.2.2课时1一元线性回归模型参数的最小二乘估计

我们称

为Y关于x的一元线性回归模型,其中,Y称为_______或_________,x称为_______或_________;a和b为模型的未知参数,a称为_____参数,b称为_____参数;e是Y与bx+a之间的随机_____.因变量响应变量自变量解释变量截距斜率误差1.一元线性回归模型注意:与函数不同,回归模型的参数a和b

一般是无法精确求出的,只能通过成对样本数据估计这两个参数.2.函数模型与回归模型之间的差别函数模型:回归模型:变量之间具有的

关系,是一种

的关系函数确定性变量之间具有的

关系,是一种

的关系相关不确定探究:由上节课所学,我们知道儿子身高y与父亲身高x

线性相关.在知道y与x线性相关的前提下,你能找出近似描述y与x之间关系的一次函数表达式吗?根据所得到的关系式,你能估计父亲身高为176cm时,儿子身高约是多少?关键是如何确定b和a的值?分析:由模型的建立过程可知,参数a和b刻画了变量Y与变量x的线性关系,因此通过成对样本数据估计这两个参数,相当于寻找一条适当的直线,使表示成对样本数据的这些散点在整体上与这条直线最接近.思考:我们怎样寻找一条“最好”的直线,使表示成对样本数据的这些散点在整体上与这条直线最“接近”?你能想到哪些方法?利用样本数据寻找一条适当的直线方案1:先画出一条直线,测量出各点与直线的距离,然后移动直线,到达一个使距离的和最小的位置.测量出此时的斜率和截距,就可得到一条直线,如图.方案2:在图中选择两点画直线,使得直线两侧的点的个数基本相同,把这条直线作为所求直线,如图.方案3:在散点图中多取几对点,确定出几条直线的方程,再分别求出这些直线的斜率、截距的平均数,将这两个平均数作为所求直线的斜率和截距.上面这些方法虽然有一定的道理,但比较难操作,我们需要另辟蹊径.先进一步明确我们面临的任务:从成对样本数据出发,用数学的方法刻画“从整体上看,各散点与直线最接近”.通常,我们会想到利用点到直线y=bx+a的“距离”来刻画散点与该直线的接近程度,然后用所有“距离”之和刻画所有样本观测数据与该直线的接近程度.设满足一元线性回归模型的两个变量的n对样本数据为(x1,y1),(x2,y2),…,

(xn,yn).由

,得.显然

越小,表示点

与点

的“距离”越小,即样本数据点离直线

的竖直距离越小.

表示点

到直线

的距离,

表示点

到直线

的竖直距离,表示直线

的倾斜角,则

,所以方案1中的点到直线的距离可以用竖直距离替换.

可令n个样本点与直线的竖直距离之和最小y=bx+a由yi=bxi+a+ei(i=1,2,‧‧‧,n),得因此可以用这n个竖直距离之和

来刻画各样本观测数据与直线

的“整体接近程度”.

最小二乘法最小二乘法求经验回归方程图形推导编号1234567891011121314父亲身高/cm174170173169182172180172168166182173164180儿子身高/cm176176170170185176178174170168178172165182对于上表中的数据,利用公式可以计算出

得到儿子身高Y关于父亲身高x的经验回归方程为

相应的经验回归直线如图所示.1.经验回归方程:2.最小二乘估计:要点归纳3.经验回归方程的性质:要点归纳

含义2:父亲身高为176cm的所有儿子身高的均值的估计值为177cm.

含义1:由方程作出推测,当父亲身高为176cm时,儿子身高一般在177cm左右.问题3:根据方程,父亲身高为多少时,长大成人的儿子身高和父亲身高一样?模型理解试一试:儿子身高Y关于父亲身高x的经验回归方程为

你能解决以下问题吗?

斜率可以解释为父亲身高每增加1cm,其儿子身高平均增加0.839cm.问题3:根据方程,父亲身高为多少时,长大成人的儿子身高和父亲身高一样?模型理解试一试:儿子身高Y关于父亲身高x的经验回归方程为

你能解决以下问题吗?高个子父亲有生高个子儿子的趋势,矮个子父亲有生矮个子儿子的趋势,说一说:根据经验回归方程中斜率的具体含义,高个子的父亲一定生高个子的儿子吗?同样,矮个子的父亲一定生矮个子的儿子吗?

儿子身高有向平均身高回归的趋势(借助视频,理解回归的含义)一元线性回归模型中“回归”的含义:

6810122356解:(1)作出散点图如图所示.

6810122356(1)作出散点图,从直观上分析数据间是否存在线性相关关系;

(4)写出经验回归方程并对实际问题作出估计.利用经验回归方程进行预测的基本步骤方法归纳

分析模型的回归效果方法——残差分析残差表:残差=观测值-预测值残差之和为0.027(计算或测量时数据四舍五入)2.残差的作用:判断回归模型刻画数据的效果;发现原始数据中是否存在可疑数据,对模型进行改进,使我们能根据改进模型作出更符合实际的预测与决策.1.残差分析途径:列残差表、作残差图.以残差为纵坐标,以样本编号(或x)为横坐标.若存在某几个样本点的残差绝对值较大,则为可疑数据,需予以纠正或剔除,再重新建立回归模型.残差图:带状区域宽度越窄,残差绝对值越小,且较均匀地落在横轴附近,说明回归方程预报的精度越高.残差有正有负,比较均匀地分布在横轴的两边,说明残差比较符合一元线性回归模型中对于随机误差的假定.越窄越好思考:观察以下四幅残差图,你认为哪一个残差满足一元线性回归模型中对随机误差的假定?图(1)显示残差与观测时间有线性关系,应将时间变量纳入模型;图(2)显示残差与观测时间有非线性关系,应在模型中加入时间的非线性函数部分;只有图(4)满足图(3)说明残差的方差不是一个常数,随观测时间变大而变大;图(4)的残差比较均匀地集中在以横轴为对称轴的水平带状区域内.2.已知两个线性相关变量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论