一元线性回归模型高二下学期数学人教A版(2019)选择性必修第三册_第1页
一元线性回归模型高二下学期数学人教A版(2019)选择性必修第三册_第2页
一元线性回归模型高二下学期数学人教A版(2019)选择性必修第三册_第3页
一元线性回归模型高二下学期数学人教A版(2019)选择性必修第三册_第4页
一元线性回归模型高二下学期数学人教A版(2019)选择性必修第三册_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2024/6/28高二数学备课组第八章成对数据的统计分析8.2.1一元线性回顾模型8.2一元线性回归模型及其应用课时目标研究当两个变量线性相关时,如何利用成对样本数据建立适当的统计模型,能结合具体实例了解模型及其参数的含义.提出问题确定研究变量收集数据画散点图求回归模型做出预报(一元线性回归模型)在统计学中,回归分析指的是定量分析两种或两种以上变量间相关关系的一种统计分析方法。回归分析按照涉及的变量的个数,分为一元回归分析和多元回归分析。回归回归分析定相关关系计算r复习回顾1.样本相关系数:2.相关系数的性质:①当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关.②|r|≤1;③当|r|越接近1时,成对数据的线性相关程度越强;当|r|越接近0时,成对数据的线性相关程度越弱;特别地,当|r|=0时,成对数据的没有线性相关关系;当|r|=1时,成对数据都落在一条直线上.问题导入

通过前面的学习我们已经了解到,根据成对样本数据的散点图和样本相关系数,可以推断两个变量是否存在相关关系、是正相关还是负相关,以及线性相关程度的强弱等.思考

是否可以能像建立函数模型刻画两个变量之间的确定性关系那样,通过建立适当的统计模型来刻画两个变量之间的相关关系?并通过模型进行预测?下面我们研究当两个变量线性相关时,如何利用成对样本数据建立统计模型,并利用模型进行预测的问题.新知探究生活经验告诉我们,儿子身高与父亲身高存在正线性相关关系,即父亲的身高较高时,儿子的身高通常也较高.

以横轴表示父亲身高、纵轴表示儿子身高建立直角坐标系,由表中的成对样本数据作散点图,如图所示.可以发现,散点大致分布在一条从左下角到右上角的直线附近,表明儿子身高和父亲身高线性相关.利用统计软件,求得样本相关系数为r≈0.886,表明儿子身高和父亲身高正线性相关,且相关程度较高.

为了进一步研究两者之间的关系,有人调查了14名男大学生的身高及其父亲的身高,得到的数据如表所示.新知探究思考1:根据上表中的数据或散点图,儿子身高和父亲身高这两个变量之间的关系可以用函数模型刻画吗?存在父亲身高相同,而儿子身高不同的情况.也存在儿子身高相同,而父亲身高不同的情况。不符合函数的定义,可见儿子身高和父亲身高之间不是函数关系,不能用函数模型刻画.思考2:为什么儿子身高和父亲身高有相关关系而不是函数关系?因为影响儿子身高的因素除了父亲身高这个主要因素外,还受其他随机因素的影响,如母亲身高、生活环境、饮食习惯、锻炼时间(随机误差e)等.思考3:考虑上述随机因素的影响,你能否用类似于函数的表达式来表示父亲身高x和儿子身高Y的关系?新知探究用x表示父亲身高,Y表示儿子身高,e表示随机误差.假定随机误差e的均值为0,方差为与父亲身高无关的定值σ2,则它们之间的关系可以表示为:称为Y关于x的一元线性回归模型.Y称为因变量或响应变量;x称为自变量或解释变量;a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差.思考4:为什么要假设E(e)=0,而不假设它为某个不为0的常数?因为随机误差表示大量已知和未知的影响因素之和,因为误差是随机的,即取各种正负误差的可能性一样,它们会相互抵消,所以随机误差的期望值应为0.模型中的Y也是随机变量,其值虽然不能由变量x的值确定,但是却能表示为bx+a与e的和(叠加),前一部分由x所确定,后一部分是随机的.如果e=0,那么Y与x之间的关系就可用一元线性函数模型来描述.新知探究追问

为什么要假设E(e)=0,而不假设其为某个不为0的常数?(另解)因为误差是随机的,即取各种正负误差的可能性一样,所以它们均值的理想状态应该为0.

新知探究追问

如何理解随机误差e对儿子身高的影响?假设没有随机误差,则儿子身高Y只受父亲身高x影响,则事实上,相关系数,故也可以记作Y=bx+a+e随机误差e随机误差e的特征随机误差e是一个随机变量①可取正或取负②有些无法测量③不可事先设定

新知探究用x表示父亲身高,Y表示儿子身高,e表示随机误差.则它们之间的关系可以表示为下面的一元线性回归模型:思考5:你能结合身高案例解释上述模型的意义吗?由于E(Y)=bx+a,故模型可解释为父亲身高为xi的所有男大学生的身高(子总体)的均值E(Y)为bxi+a,即该子总体的均值与父亲身高是线性函数关系。yi不一定为bxi+a,yi=bxi+a+ei,bxi+a是子总体的均值,yi只是该子总体中的一个样本值,这个样本值yi与均值E(Y)有一个误差项ei=yi−(bxi+a).思考6:父亲身高为xi的某一名男大学生,他的身高yi一定为bxi+a吗?理解为新知探究思考7:你能结合上述身高案例解释模型中产生随机误差项e的原因吗?(1)存在其他可能影响儿子身高Y的因素,如母亲身高、生活环境、饮食习惯和锻炼时间等;(2)测量身高时,可能存在由测量工具、测量精度导致的测量误差;(3)实际问题中,我们不知道儿子身高和父亲身高的相关关系是什么,而利用一元线性回归模型来近似刻画这种关系,这种近似产生了误差.用x表示父亲身高,Y表示儿子身高,e表示随机误差.则它们之间的关系可以表示为下面的一元线性回归模型:理解为以上三项误差越小,说明我们的回归模型的拟合效果越好。课堂练习1.说明函数模型与回归模型的区别,并分别举出两个应用函数模型和回归模型的例子.函数模型与回归模型之间的差别函数模型:回归模型:

一元线性回归模型Y=bx+a+e增加了随机误差项e,因变量Y

的值由自变量x和随机误差项e共同确定,即自变量x只能解释部分Y的变化.解释变量x(身高)模型误差e

(其它所有变量)响应变量Y(体重)

解析:函数模型刻画的是变量之间具有的函数关系,是一种确定性的关系.回归模型刻画的是变量之间具有的相关关系,不是一种确定性关系,即回归模型刻画的是两个变量之间的随机关系.

举例:路程与速度的关系、正方体体积与边长的关系可以应用函数模型刻画,体重与身高的关系、冷饮销量与气温的关系可以用回归模型刻画。课本107页巩固练习课本107页2.在一元线性回归模型(1)中,参数b的含义是什么?解:参数b的含义可以解释为解释变量x对响应变量Y的均值的影响,变量x每增加1个单位,响应变量Y的均值将增加b个单位.

例如,教科书中父亲身高为175cm的儿子身高的均值比父亲身高为174cm的儿子身高的均值高出0.839cm.注意:因为响应变量Y最终取值,除了受变量x的影响,还要受随机误差e的影响,所以不能解释成解释变量x每增加一个单位,响应变量Y一定增加b个单位.巩固练习3.将图8.2-1中的点按父亲身高的大小次序用折线连起来,所得到的图象是一个折线图,可以用这条折线表示儿子身高和父亲身高之间的关系吗?课本107页解:不能.一是父亲的身高与儿子的身高之间是随机关系,不是函数关系;二是这组数据仅是总体的一个样本,不一定能很好地描述两个变量之间的关系.课堂小结1.一元线性回归模型:2.一元线性回归模型与函数模型的区别若Y与x呈现线性相关,则Y关于x的一元线性回归模型为:Y称

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论