【数学】一元线性回归模型课件-2023-2024学年高二下人教A版(2019)选择性必修第三册_第1页
【数学】一元线性回归模型课件-2023-2024学年高二下人教A版(2019)选择性必修第三册_第2页
【数学】一元线性回归模型课件-2023-2024学年高二下人教A版(2019)选择性必修第三册_第3页
【数学】一元线性回归模型课件-2023-2024学年高二下人教A版(2019)选择性必修第三册_第4页
【数学】一元线性回归模型课件-2023-2024学年高二下人教A版(2019)选择性必修第三册_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

8.2

一元线性回归模型及其应用

通过前面的学习我们已经了解到,根据成对样本数据的散点图和样本相关系数,可以推断两个变量是否存在相关关系、是正相关还是负相关,以及线性相关程度的强弱等.进一步地,如果能像建立函数模型刻画两个变量之间的确定性关系那样,通过建立适当的统计模型刻画两个随机变量的相关关系,那么我们就可以利用这个模型研究两个变量之间的随机关系,并通过模型进行预测.

下面我们研究当两个变量线性相关时,如何利用成对样本数据建立统计模型,并利用模型进行预测的问题.温故知新分析顺序1先分析是否相关2判断是何种相关关系4判断拟合效果是否良好3量化关系独立性检验散点图相关系数r判断线性相关程度生活经验告诉我们,儿子身高与父亲身高存在正线性相关关系,即父亲的身高较高时,儿子的身高通常也较高.

以横轴表示父亲身高、纵轴表示儿子身高建立直角坐标系,由表中的成对样本数据作散点图,如图所示.可以发现,散点大致分布在一条从左下角到右上角的直线附近,表明儿子身高和父亲身高线性相关.利用统计软件,求得样本相关系数为r≈0.886,表明儿子身高和父亲身高正线性相关,且相关程度较高.为了进一步研究两者之间的关系,有人调查了14名男大学生的身高及其父亲的身高,得到的数据如表所示.问题引入思考1:根据上表中的数据或散点图,儿子身高和父亲身高这两个变量之间的关系可以用函数模型刻画吗?存在父亲身高相同,而儿子身高不同的情况.也存在儿子身高相同,而父亲身高不同的情况。不符合函数的定义,可见儿子身高和父亲身高之间不是函数关系,不能用函数模型刻画.思考2:为什么儿子身高和父亲身高有相关关系而不是函数关系?因为影响儿子身高的因素除了父亲身高这个主要因素外,还受其他随机因素的影响,如母亲身高、生活环境、饮食习惯、锻炼时间等.思考3:考虑上述随机因素的影响,你能否用类似于函数的表达式来表示父亲身高x和儿子身高Y的关系?问题提出——建立两个相关变量的关系式问题解决——建立两个相关变量的统计模型用x表示父亲身高,Y表示儿子身高,e表示随机误差.假定随机误差e的均值为0,方差为与父亲身高无关的定值σ2,则它们之间的关系可以表示为:称为Y关于x的一元线性回归模型.Y称为因变量或响应变量;x称为自变量或解释变量;a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差.思考4:为什么要假设E(e)=0,而不假设它为某个不为0的常数?因为随机误差表示大量已知和未知的影响因素之和,因为误差是随机的,即取各种正负误差的可能性一样,它们会相互抵消,所以随机误差的期望值应为0.函数模型:回归模型:

理解模型——回归模型与函数模型的区别理解模型——一元线性回归模型的实际意义用x表示父亲身高,Y表示儿子身高,e表示随机误差.则它们之间的关系可以表示为下面的一元线性回归模型:思考5:你能结合身高案例解释上述模型的意义吗?由于E(Y)=bx+a,故模型可解释为父亲身高为xi的所有男大学生的身高(子总体)的均值E(Y)为bxi+a,即该子总体的均值与父亲身高是线性函数关系。yi不一定为bxi+a,yi=bxi+a+ei,bxi+a是子总体的均值,yi只是该子总体中的一个样本值,这个样本值yi与均值E(Y)有一个误差项ei=yi−(bxi+a).思考6:父亲身高为xi的某一名男大学生,他的身高yi一定为bxi+a吗?理解为理解模型——一元线性回归模型的实际意义思考7:你能结合上述身高案例解释模型中产生随机误差项e的原因吗?(1)存在其他可能影响儿子身高Y的因素,如母亲身高、生活环境、饮食习惯和锻炼时间等;(2)测量身高时,可能存在由测量工具、测量精度导致的测量误差;(3)实际问题中,我们不知道儿子身高和父亲身高的相关关系是什么,而利用一元线性回归模型来近似刻画这种关系,这种近似产生了误差.用x表示父亲身高,Y表示儿子身高,e表示随机误差.则它们之间的关系可以表示为下面的一元线性回归模型:理解为解:

(1),(2),(3),(4),(5)回归模型(6),(7)函数模型.1.判断下列变量间哪些能用函数模型刻画,哪些能用回归模型刻画?

(1)某公司的销售收入和广告支出;(2)某城市写字楼的出租率和每平米月租金;(3)航空公司的顾客投诉次数和航班正点率;(4)某地区的人均消费水平和人均国内生产总值(GDP);(5)学生期末考试成绩和考前用于复习的时间;(6)一辆汽车在某段路程中的行驶速度和行驶时间;(7)正方形的面积与周长.练习巩固1.一元线性回归模型2.一元线性回归模型与函数模型的区别Y称为因变量或响应变量x称为自变量或解释变量e是Y与bx+a之间的随机误差.a称为截距参数b称为斜率参数归纳小结思考1:如何从散点图中寻找到一条适当的直线,使得这些散点在整体上与这条直线最接近?问题提出——由散点图寻找一条适当的直线方案1:先画出一条直线,测量出各点与直线的距离,然后移动直线,到达一个使距离的和最小的位置.测量出此时的斜率和截距,就可得到一条直线,如图.方案2:在图中选择两点画直线,使得直线两侧的点的个数基本相同,把这条直线作为所求直线,如图.方案3:在散点图中多取几对点,确定出几条直线的方程,再分别求出这些直线的斜率、截距的平均数,将这两个平均数作为所求直线的斜率和截距.上面这些方法虽然有一定的道理,但比较难操作,我们需要另辟蹊径.问题提出——由散点图寻找一条适当的直线思考2:如何利用成对样本数据,用数学方法刻画“从整体上看,各散点与直线最接近”?问题提出——利用样本数据寻找一条适当的直线设满足一元线性回归模型的两个变量的n对样本数据为(x1,y1),(x2,y2),…,

(xn,yn).

问题提出——利用样本数据寻找一条适当的直线设满足一元线性回归模型的两个变量的n对样本数据为(x1,y1),(x2,y2),…,

(xn,yn).

问题提出——利用样本数据寻找一条适当的直线思考2:如何利用成对样本数据,用数学方法刻画“从整体上看,各散点与直线最接近”?析:可令n个样本点与直线的竖直距离之和最小y=bx+a问题提出——利用样本数据寻找一条适当的直线思考3:如何求a,b的值,使

最小?记问题提出——利用样本数据寻找一条适当的直线注意到所以当

取最小值时,

取最小值0,即.此时问题提出——利用样本数据寻找一条适当的直线上式是关于b的二次函数,因此要使Q取得最小值,当且仅当b的取值为综上,当a,b的取值为时,Q达到最小.问题提出——利用样本数据寻找一条适当的直线最小二乘法

样本点中心问题提出——利用样本数据寻找一条适当的直线小结最小二乘法模型运用——求身高案例的经验回归方程

含义2:父亲身高为176cm的所有儿子身高的均值的估计值为177cm.

斜率可以解释为父亲身高每增加1cm,其儿子身高平均增加0.839cm.含义1:由方程作出推测,当父亲身高为176cm时,儿子身高一般在177cm左右.思考6:根据方程,父亲身高为多少时,长大成人的儿子身高和父亲身高一样?模型运用——求身高案例的经验回归方程模型运用——求身高案例的经验回归方程高个子父亲有生高个子儿子的趋势,矮个子父亲有生矮个子儿子的趋势,思考7:分析案例中的经验回归方程可得到什么结论?儿子身高有向平均身高回归的趋势英国统计学家高尔顿把这种后代身高向中间值靠近的趋势称为“回归现象”(自阅课本P122-123了解“回归的含义”)随机抽查了205对夫妇及其928个成年子女的身高数据记中亲身高为X,子女身高为Y

女子身高×1.08换算为男子升高父母身高取平均数得中亲身高弗朗西斯·高尔顿(FrancisGalton,1822年2月16日-1911年1月17日),是英国人类学家、生物统计学家、英国探险家、优生学家、心理学家、差异心理学之父,也是心理测量学上生理计量法的创始人,遗传决定论的代表人物,晚年受封为爵士。他是查尔斯·达尔文的表弟,深受其进化论思想的影响,把该思想引入到人类研究。拓展阅读步步高

(1)若根据变量x与y的对应关系(如表),求得y关于x的经验回归方程为y=6.5x+17.5,则表中m的值为x24568y3040m5070A.60 B.55 C.50 D.45A巩固练习x24568y3040m5070巩固练习(2)重楼,中药名,具有清热解毒、消肿止痛、凉肝定惊之功效,具有极高的药用价值.近年来,随着重楼的药用潜力被不断开发,野生重楼资源已经满足不了市场的需求,巨大的经济价值提升了家种重楼的热度,某机构统计了近几年某地家种重楼年产量y(单位:吨),统计数据如表所示.年份2016201720182019202020212022年份代码x1234567年产量y/吨130180320390460550630①根据表中的统计数据,求出y关于x的经验回归方程;巩固练习②根据①中所求方程预测2024年该地家种重楼的年产量.年份2016201720182019202020212022年份代码x1234567年产量y/吨130180320390460550630=13020,年份2016201720182019202020212022年份代码x1234567年产量y/吨130180320390460550630由题可知,2024年的年份代码为9,即x=9,将x=9代入经验回归方程,所以预测2024年该地家种重楼的年产量为805吨.

归纳小结④解释变量的取值不能离样本数据的范围太远.一般解释变量的取值在样本数据范围内,经验回归方程的预报效果会比较好,超出这个范围越远,预报的效果越差.⑤不能期望经验回归方程得到的预报值就是响应变量的精确值.它是响应变量的可能取值的平均值.②经验回归方程只适用于所研究的样本的总体.如,根据我国父亲身高与儿子身高的数据建立的经验回归方程,不能用来描述美国父亲身高与儿子身高之间的关系.根据生长在南方多雨地区的树高与胸径的数据建立的经验回归方程不能用来描述北方干旱地区的树高与胸径之间的关系.①只有在散点图大致呈线性相关关系时,求出的经验回归方程才有实际意义,否则求出的经验回归方程毫无意义.③经验回归方程一般都有时效性.例如,根据20世纪80年代的父亲身高与儿子身高的数据建立的经验回归方程,不能用来描述现在的父亲身高与儿子身高之间的关系.经验回归方程的理解判断模型拟合的效果:残差分析残差=观测值-预报值残差的定性研究父亲身高x174170173169182172180172168166182173164180儿子身高观测值yi176176170170185176178174170168178172165182174.943171.587174.104170.748181.655173.265179.977173.265169.909168.231181.655174.104166.553179.9771.0574.413-4.104-0.7483.3452.735-1.9770.7350.091-0.231-3.655-2.104-1.5532.0231.列残差表2.作残差图以残差为纵坐标,以样本编号(或x)为横坐标.若存在某几个样本点的残差绝对值较大,则为可以数据,需予以纠正或剔除,再重新建立回归模型.残差有正有负,比较均匀地分布在横轴的两边,说明残差比较符合一元线性回归模型中对于随机误差的假定残差的作用残差的作用:判断回归模型刻画数据的效果;发现原始数据中是否存在可疑数据,对模型进行改进,使我们能根据改进模型作出更符合实际的预测与决策.带状区域宽度越窄,残差绝对值越小,且较均匀地落在横轴附近,说明回归方程预报的精度越高.

一般地,建立经验回归方程后,通常需要对模型刻画数据的效果进行分析.借助残差分析还可以对模型进行改进,使我们能根据改进模型作出更符合实际的预测与决策.

残差与观测时间有线性关系,应将时间变量纳入模型残差与观测时间有非线性关系,应在模型中加入时间的非线性函数部分残差的方差不是一个常数,随观测时间的变大而变大残差比较均匀地分布在以取值为0的横轴为对称轴的水平带状区域内残差的作用课本典例P113-例.经验表明,一般树的胸径(树的主干在地面以上1.3m处的直径)越大,树就越高.由于测量树高比测量胸径困难,因此研究人员希望由胸径预测树高.在研究树高与胸径之间的关系时,某林场收集了某种树的一些数据(如下表),试根据这些数据建立树高关于胸径的经验回归方程.编号123456789101112胸径d/cm18.120.122.224.426.028.329.632.433.735.738.340.2树高h/m18.819.221.021.022.122.122.422.623.024.323.924.7解:以胸径为横坐标、树高为纵坐标作散点图,可见两个变量呈正线性相关,因此可用一元线性回归模型刻画树高h与胸径d之间的关系.课本典例根据经验回归方程,由表中的胸径d的数据可以计算出树高的预测值(精确到0.1):以胸径为横坐标,残差为纵坐标,作残差图如下:残差的绝对值最大是0.8,所有残差分布在以横轴为对称轴、宽度小于2的带状区域内.可见经验回归方程较好地刻画了树高与胸径的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论