高中数学第三章统计案例3_1回归分析的基本思想及其初步应用课件新人教a版选修2-3_第1页
高中数学第三章统计案例3_1回归分析的基本思想及其初步应用课件新人教a版选修2-3_第2页
高中数学第三章统计案例3_1回归分析的基本思想及其初步应用课件新人教a版选修2-3_第3页
高中数学第三章统计案例3_1回归分析的基本思想及其初步应用课件新人教a版选修2-3_第4页
高中数学第三章统计案例3_1回归分析的基本思想及其初步应用课件新人教a版选修2-3_第5页
已阅读5页,还剩79页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章 统计案例 3.1 回归分析的基本思想及其初步应用,主题1 回归分析的概念及回归方程 1.在必修3中学习的利用最小二乘法估计计算得出的回归方程是什么? 提示:,2.在回归方程中 与线性回归模型中y=bx+a+e中真实 值a,b之间是否存在误差?它是否引起预报值 与真实 值y之间存在误差? 提示:在回归方程 中, 和 为斜率和截距的估计 值,由于样本不一样,其值可能不一样,所以它们与真 实值a,b之间存在误差.这种误差会引起预报值 与真实 值y之间存在误差.,结论: 回归直线方程 1.回归分析 (1)函数关系:函数关系是一种_关系.例如正方形 的周长C=4a,周长C与边长a之间就是一种确定性关系,对 于自变量(边长)的每一个确定的值,都有唯一确定的周 长与之相对应.,确定性,(2)相关关系:当自变量取值一定时,因变量的取值带有 一定的_的两个变量之间的关系.相关关系是一 种_关系. 回归分析:对具有相关关系的两个变量进行统计分析的 一种常用方法.,随机性,非确定性,2.回归直线方程 对于一组具有线性相关关系的数据(x1,y1),(x2,y2), (xn,yn),回归直线y=bx+a的斜率和截距的最小二乘估计 公式分别为 =_, =_, 其中( )称为样本点的中心.,【微思考】 1.现实生活中的两个变量有哪些关系?线性回归模型是用来刻画哪类变量间的模型? 提示:现实生活中的两个变量关系主要有确定性关系与非确定性关系,线性回归模型是用来刻画非确定性关系的模型.,2.回归分析中,利用线性回归方程求出的函数值是否一定为真实值? 提示:不一定是真实值,利用线性回归方程求的值,在很多时候是个预报值.例如,人的体重与身高存在一定的线性关系,但体重除了受身高的影响外,还受其他因素的影响,如饮食、是否喜欢运动等.,3.线性回归方程能否用散点图中的某两点来确定? 提示:不能用散点图中过某两点的直线方程来作为线性 回归方程.由散点图易发现样本点散布在某一条直线附 近,而不是一条直线上,不能用一次函数y=bx+a描述它 们之间的关系,因此用线性回归模型y=bx+a+e来表示, 其中a,b可以由最小二乘法估计 , ,就是a,b的估计值.,主题2 模型拟合效果的衡量 1.线性回归模型是函数关系吗? 提示:不是.回归模型是刻画一组数据的整体趋势,回归模型中的y由x和随机误差e共同确定,即x只能解释部分y的变化,因此它不是函数关系.,2.一个模型建立的好坏一般如何来衡量呢? 提示:可以用yi- 即残差的值来估计一个模型建立的好坏.当残差越小时,说明模型越好,反之,模型建立的不好.,结论: 刻画回归模型效果的概率及方法 1.相关概念 (1)残差:数据点和它在回归直线上相应位置的差 i=1,2,3,n,_称为相应于 点(xi,yi)的残差.,(2)残差图:利用图形来分析残差特性,作图时_ 为残差,_可以选为样本编号,或身高数据,或体 重的估计值等,这样作出的图形称为残差图.,纵坐标,横坐标,2.回归模型模拟效果的判断方法,合适,越窄,越小,解释变量,预报变量,越好,【微思考】 1.有时散点图的各点并不集中在一条直线的附近,仍然可以按照求回归直线方程的步骤求回归直线,显然这样的回归直线没有实际意义.用残差能否判断建立的回归模型是否合理?,提示:残差能对x,y的线性相关性进行检验.残差可以发现原始数据中的可疑数据,如果残差点比较均匀地落在水平的带状区域中说明选用的模型较为合适.,2.残差分析与计算R2的值来刻画模型函数的模拟效果有什么区别? 提示:残差分析只能从图形中直观感觉上得出结论,而计算R2的值是用数据说话,即一个是从形上,一个是从数上说明.,【预习自测】 1.下列两个变量之间的关系不是函数关系的是( ) A.角度和它的余弦值 B.正方形的边长和面积 C.正n边形的边数和内角度数和 D.人的年龄和身高,【解析】选D.函数关系是两变量之间有确定性的关系,选项A,B,C都是函数关系,而人的年龄和身高不具备确定性关系,不是函数关系.,2.线性回归方程 必过定点 ( ) A.(0,0) B.( ,0) C.(0, ) D.( ) 【解析】选D.因为 ,所以 .,3.线性回归模型y=bx+a+e中,e为随机误差,则E(e)=_. 【解析】由线性回归模型y=bx+a+e定义可知:E(e)=0. 答案:0,4.对某城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查后知,y与x具有线性相关关系,满足线性回归方程y=0.6x+1.5,若该城市居民人均消费水平为7.5(千元),则可以估计该城市人均消费额占人均工资收入的百分比约为_.,【解析】因为y与x具有线性相关关系,满足线性回归方 程y=0.6x+1.5,该城市居民人均消费水平为y=7.5,由 7.5=0.6x+1.5,得x=10,所以可以估计该城市的职工人 均工资水平为10,所以可以估计该城市人均消费额占人 均工资收入的百分比约为 100%=75%. 答案:75%,5.为了对某校高三(1)班9月月考成绩进行分析,在全班同学中随机抽出5位,他们的数学分数、物理分数、化学分数(均已折算为百分制)对应如表:,(1)求这5位同学中数学和物理分数都不小于85分的概率. (2)从散点图分析,y与x,z与x之间都有较好的线性相关关系,分别求y与x,z与x的线性回归方程,并用相关指数比较所求回归模型的拟合效果.,【解析】(1)这5位同学中数学和物理分数都不小于85 分,共有2人,故概率为P= .,(2)设y与x,z与x的线性回归方程分别是 ,根据所给的数据,可以计算出 =81-0.885=13, =86-0.685=35. 所以 =0.8x+13, =0.6x+35, 所以 =02+02+(-1)2+22+(-1)2=6, 所以 =(-2)2+22+12+02+(-1)2=10,又y与x,z与x的相关指数是R2=1- 0.964, R2=1- 0.90. 故回归模型 =0.8x+13比回归模型 =0.6x+35的拟合的 效果好.,类型一 求回归直线方程 【典例1】在一段时间内,某种商品的价格x(万元)和需求量y(t)之间的一组数据为:,(1)画出散点图. (2)求出y对x的线性回归方程. (3)如果价格定为1.9万元,预测需求量大约是多少.,【解题指南】(1)根据表中的数据,在直角坐标系中画出散点图. (2)将表中所给的数据代入公式,求出y对x的线性回归方程y=bx+a. (3)当价格定为1.9万元,即x=1.9,代入线性回归方程,即可预测需求量.,【解析】(1)散点图如图所示.,(2)采用列表的方法计算 与 .,所以y对x的线性回归方程为 =28.1-11.5x.,(3)当x=1.9时, =28.1-11.51.9=6.25(t). 所以价格定为1.9万元时,需求量大约是6.25t.,【方法总结】求线性回归方程的三个步骤 (1)画散点图:由样本点是否呈条状分布来判断两个量是否具有线性相关关系. (2)求回归系数:若存在线性相关关系,则求回归系数. (3)写方程:写出线性回归方程,并利用线性回归方程进行预测说明.,【巩固训练】(2017汉口高二检测)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此做了4次试验,得到数据如下:,(1)在给出坐标系中画出表中数据的散点图. (2)求y关于x的回归方程y=bx+a. (3)试预测加工10个零件需要的时间.,【解析】(1)散点图如图所示.,(2)由题中表格数据得 =3.5, =3.5, 由公式计算得 =0.7, =1.05,所以所求线性回 归方程为 =0.7x+1.05. (3)当x=10时, =0.710+1.05=8.05, 所以预测加工10个零件需要8.05小时.,【补偿训练】某个服装店经营某种服装,在某周内获纯利润y(元)与该周每天销售这种服装件数x之间的一组数据关系见表:,已知 (1)求 . (2)判断纯利润y(元)与每天销售件数x之间是否线性相关,如果线性相关,求出回归方程.,【解析】(1) (2)画出散点图知,y与x有线性相关关系,设回归直线方程: -64.7551.36,所以回归方程为 =4.75x+51.36.,类型二 线性回归分析 【典例2】(1)甲、乙、丙、丁四位同学各自对A,B两变 量做回归分析,分别得到散点图与残差平方和 如下表:,哪位同学的试验结果体现拟合A,B两变量关系的模型拟合精度高 ( ) A.甲 B.乙 C.丙 D.丁,(2)为研究质量x(单位:g)对弹簧长度y(单位:cm)的影响,对不同质量的6个物体进行测量,数据如表所示:,作出散点图,并求线性回归方程. 求出R2. 进行残差分析. 【解题指南】(1)可依据残差平方和与回归模型效果的关系处理.(2)通过残差表或残差图进行残差分析.,【解析】(1)选D.根据线性相关的知识,散点图中各样 本点带状分布越均匀,同时保持残差平方和越小(对于 已经获取的样本数据,R2表达式中 为确定的数, 则残差平方和越小,R2越大),由回归分析建立的线性回 归模型的拟合效果越好,由试验结果知丁要好些.,(2)散点图如图所示.,(5+10+15+20+25+30)=17.5, (7.25+8.12+8.95+9.90+10.9+11.8)9.487, =2275, =1076.2.计算得, 0.183, 6.285, 所求线性回归方程为 =0.183x+6.285.,列表如下: 所以 所以,R2=1- 0.9991,回归模型的拟合效果较好.,由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与质量成线性关系.,【延伸探究】 1.第(2)题在条件不变的情况下,画出残差图. 【解析】如图所示.,2.当x=35时,估计y的值. 【解析】当x=35时,y=6.285+0.18335=12.69.,【方法总结】刻画回归效果的三种方式 (1)残差图法:残差点比较均匀地落在水平的带状区域 内说明选用的模型比较合适. (2)残差平方和法:残差平方和 越小,模型的 拟合效果越好.,(3)R2法: 越接近1,表明回归的效果 越好.,【补偿训练】(2017郑州高二检测)收集一只棉铃虫的产卵数y与温度x的几组数据后发现两个变量有相关关系,并按不同的曲线来拟合y与x之间的回归方程,并算出了对应相关指数R2如下表:,则这组数据模型的回归方程的最好选择应是 ( ) A. =19.8x-463.7 B. =e0.27x-3.84 C. =0.367x2-202 D. 【解析】选B.用相关指数R2来刻画回归效果,R2的值越接近1,说明模型的拟合效果越好.,类型三 非线性回归分析 【典例3】(2017太原高二检测)下表为收集到的一组数据:,(1)作出x与y的散点图,并猜测x与y之间的关系. (2)建立x与y的关系,预报回归模型并计算残差. (3)利用所得模型,预报x=40时y的值.,【解题指南】(1)画出散点图,确定两变量x,y是否线性相关.由散点图得x,y之间的回归模型. (2)进行拟合,预报回归模型,求回归方程.,【解析】(1)作出散点图如图,从散点图可以看出x与y 不具有线性相关关系,根据已有知识可以发现样本点分 布在某一条指数函数曲线y=c1 的周围,其中c1,c2为 待定的参数.,(2)对两边取对数把指数关系变为线性关系,令z=lny, 则有变换后的样本点应分布在直线z=bx+a,(a=lnc1,b=c2) 的周围,这样就可以利用线性回归模型来建立y与x之间的 非线性回归方程了,数据可以转化为:,求得回归直线方程为 =0.272x-3.849, 所以 =e0.272x-3.849. 残差 (3)当x=40时, =e0.272x-3.8491131.,【方法总结】解决非线性回归问题的方法及步骤 (1)确定变量:确定解释变量为x,预报变量为y. (2)画散点图:通过观察散点图并与学过的函数(幂函数、指数函数、对数函数、二次函数)作比较,选取拟合效果好的函数模型.,(3)变量置换:通过变量置换把非线性回归问题转化为线性回归问题. (4)分析拟合效果:通过计算相关指数等来判断拟合效果. (5)写出非线性回归方程.,【巩固训练】(2017贵阳高二检测)研究“刹车距离”对于安全行车及分析交通事故责任都有一定的作用,所谓“刹车距离”就是指行驶中的汽车,从刹车开始到停止,由于惯性的作用而又继续向前滑行的一段距离.为了测定某种型号汽车的刹车性能(车速不超过140km/h),对这种汽车进行测试,测得的数据如表:,(1)以车速为x轴,以刹车距离为y轴,在给定坐标系中画出这些数据的散点图. (2)观察散点图,估计函数的类型,并确定一个满足这些数据的函数表达式. (3)该型号汽车在国道上发生了一次交通事故,现场测得刹车距离为46.5m,请推测刹车时的速度为多少?请问在事故发生时,汽车是超速行驶还是正常行驶?,【解题指南】(1)依据散点图的概念及作法,画出散点图;(2)细心观察散点图,然后确定其函数表达式;(3)依据(2)中的表达式,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论