一元线性回归模型+高二下学期数学人教A版(2019)选择性必修第三册_第1页
一元线性回归模型+高二下学期数学人教A版(2019)选择性必修第三册_第2页
一元线性回归模型+高二下学期数学人教A版(2019)选择性必修第三册_第3页
一元线性回归模型+高二下学期数学人教A版(2019)选择性必修第三册_第4页
一元线性回归模型+高二下学期数学人教A版(2019)选择性必修第三册_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

8.2.1一元线性回归模型8.2一元线性回归模型及其应用

第1课时1.相关关系的概念温故知新自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系.理解:相关关系—当自变量取值一定,因变量的取值带有一定的随机性(非确定性关系)2、散点图:将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中,以表示具有相关关系的两个变量的一组数据的图形叫做散点图.3、分类:(1)正相关、负相关正相关:如果散点图的点散布在从左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也近似的由小变大,对于两个变量的这种相关关系,我们称为正相关负相关:如果散点图的点散布的位置是从在左上角到右下角的区域,即一个变量的值由小变大时,另一个变量的值也近似的由大变小,对于两个变量的这种相关关系,我们称为负相关.(2)线性相关和非线性相关(1)经验作出推断(2)通过样本数据分析,从数据中提取信息,并构建适当的模型,再利用模型进行估计或推断温故知新4.两个变量之间相关关系的确定5.样本相关系数r

性质:(1)当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关.(2)r的取值范围为[-1,1]

(3)当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.

温故知新6.判断线性相关关系强弱的方法:(1)定量分析:公式法计算r,

r的绝对值越接近1,则两个变量的线性相关性越强;r的绝对值接近0时,两个变量几乎不存在线性相关关系。(2)定性分析:相关关系强弱体现在散点图中就是样本点越集中在某直线的附近,两变量的相关程度越强

通过前面的学习,我们知道先要通过抽样获取两个变量的一些成对样本数据,再计算出样本相关系数,通过样本相关系数去估计总体相关系数,从而了解两个变量之间的相关程度.进一步,如果像建立函数模型刻画两变量之间的确定性关系那样,通过建立统计模型刻画两个随机变量之间相关关系,那么我们可以利用这个模型研究两个变量之间的随机关系,并通过模型进行预测.引入

下面,我们研究当两个变量线性相关时,如何利用成对样本数据建立统计模型,并通过模型进行预测问题.

问题1:生活经验告诉我们,儿子的身高与父亲的身高不仅线性相关,而且还是正相关,即父亲的身高较高时,儿子的身高通常也较高.

为了进一步研究两者之间的关系,有人调查了14名男大学生的身高及其父亲的身高,得到的数据如表8.2-1所示.表8.2-1编号1234567891011121314父亲身高/cm174170173169182172180172168166182173164180儿子身高/cm176176170170185176178174170168178172165182新知探究:

那么,根据这组样本数据,能否判断儿子身高和父亲身高的关系?关系的相关程度如何?是函数关系还是线性相关关系?一元线性回归模型小组合作完成:整理和表示数据,以横轴表示父亲身高、纵轴表示儿子身高建立直角坐标系,将表中的成对样本数据表示为散点图,根据散点图作解读

问题1:生活经验告诉我们,儿子的身高与父亲的身高不仅线性相关,而且还是正相关,即父亲的身高较高时,儿子的身高通常也较高.

为了进一步研究两者之间的关系,有人调查了14名男大学生的身高及其父亲的身高,得到的数据如表8.2-1所示.表8.2-1编号1234567891011121314父亲身高/cm174170173169182172180172168166182173164180儿子身高/cm176176170170185176178174170168178172165182新知探究:

利用前面表示数据的方法,以横轴表示父亲身高、纵轴表示儿子身高建立直角坐标系,再将表8.2-1中的成对样本数据表示为散点图,如图8.2-1所示.可以发现,散点大致分布在一条从左下角到右上角的直线附近,表明儿子身高和父亲身高线性相关.求得样本相关系数为0.886,表明儿子身高和父亲身高正线性相关,且相关程度较高儿子身高/cm父亲身高/cm图8.2-1父亲身高/cm一元线性回归模型思考1(教材P105):根据表8.2-1中的数据,儿子身高和父亲身高这两个变量之间的关系可以用函数模型刻画吗?

在表8.2-1的数据中,存在父亲身高相同而儿子身高不同的情况例如,第6个和第8个观测的父亲身高均为172cm,而对应的儿子身高分别为176cm和174cm;同样,第3,4两个观测中,儿子身高都是170cm,而父亲身高分别为173cm和169cm.可见儿子身高和父亲身高之间不是函数关系,也就不能用函数模型刻画思考2:从成对样本数据的散点图和样本相关系数可以发现,散点大致分布在一条直线附近表明儿子身高和父亲身高有较强的线性关系.我们可以这样理解,由于有其他因素的存在,使儿子身高和父亲身高有关系但不是函数关系.那么影响儿子身高的其他因素是什么?图8.2-1中的散点大致分布在一条直线附近,表明儿子身高和父亲身高这两个变量之间有较强的线性相关关系,因此我们可以用一次函数来刻画父亲身高对儿子身高的影响,而把影响儿子身高的其他因素,如母亲身高、生活环境、饮食习惯等作为随机误差,得到刻画两个变量之间关系的线性回归模型其中,随机误差是一个随机变量.影响儿子身高的因素除父亲的身外,还有母亲的身高、生活的环境、饮食习惯、营养水平、体育锻炼等随机的因素,儿子身高是父亲身高的函数的原因是存在这些随机的因素.

思考3:由思考2我们知道,正是因为存在这些随机的因素,使得儿子的身高呈现出随机性各种随机因素都是独立的,有些因素又无法量化.你能否考虑到这些随机因素的作用,用类似于函数的表达式,表示儿子身高与父亲身高的关系吗?

思考3:由思考2我们知道,正是因为存在这些随机的因素,使得儿子的身高呈现出随机性各种随机因素都是独立的,有些因素又无法量化.你能否考虑到这些随机因素的作用,用类似于函数的表达式,表示儿子身高与父亲身高的关系吗?如果用x表示父亲身高,Y表示儿子的身高,用e表示各种其他随机因素影响之和,称e为随机误差,由于儿子身高与父亲身高线性相关,所以Y=bx+a.

其中,Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差,模型中的Y也是随机变量,其值虽然不能由变量x的值确定,但是却能表示为bx+a与e的和(叠加),前一部分由x所确定,后一部分是随机的,如果e=0,那么Y与x之间的关系就可用一元线性函数模型来描述.新知探究

模型(1)中参数b的含义是什么?Y关于x的一元线性回归模型解释变量x对响应变量Y均值的影响;解释变量x每增加一个单位,响应变量Y将增加b个单位.探究建立模型:一元线性回归模型概念思考4:请根据以上分析,你能建立一个数学模型表示儿子身高与父亲身高的关系吗?思考3P106:为什么要假设E(e)=0,而不假设其为某个不为0的常数?因为误差是随机的,即取各种正负误差的可能性一样,所以它们均值的理想状态应该为0.

思考4:你能结合父亲与儿子身高的实例,说明回归模型①的意义?①

思考5P106:你能结合具体实例解释产生模型①中随机误差项的原因吗?(1)除父亲身高外,其他可能影响儿子身高的因素,比如母亲身高、生活环境、饮食习惯和锻炼时间等.(2)在测量儿子身高时,由于测量工具、测量精度所产生的测量误差.(3)实际问题中,我们不知道儿子身高和父亲身高的相关关系是什么,可以利用一元线性回归模型来近似这种关系,这种近似关系也是产生随机误差e的原因.产生随机误差e的原因有:(2)请判断腐蚀深度y与腐蚀时间x之间的关系能否用一元性回归模型来刻画?请说明理由.2.一元线性回

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论