2018年秋高中数学第1章统计案例1.1回归分析的基本思想及其初步应用学案新人教A版选修1_第1页
2018年秋高中数学第1章统计案例1.1回归分析的基本思想及其初步应用学案新人教A版选修1_第2页
2018年秋高中数学第1章统计案例1.1回归分析的基本思想及其初步应用学案新人教A版选修1_第3页
2018年秋高中数学第1章统计案例1.1回归分析的基本思想及其初步应用学案新人教A版选修1_第4页
2018年秋高中数学第1章统计案例1.1回归分析的基本思想及其初步应用学案新人教A版选修1_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1.1 回归分析的基本思想及其初步应用学习目标:1. 了解随机误差、残差、 残差图的概念.(重点)2.会通过分析残差判断线性回归模型的拟合效果.(重点)3. 了解常见的非线性回归模型转化为线性回归模型的方法.(难点)自主预习探新知1 回归分析的相关概念(1) 回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.(2) 回归直线方程方程y=bx+a是两个具有线性相关关系的变量的一组数据(X1,y, (X2,y?),(xn,yn)的回归方程,其中a,b是待定参数,其最小二乘估计分别为:n xyin X _ yi=1n- 2 2、XTn x -i=1y - y .a=ybX,(3)

2、线性回归模型样本点散布在某一条直线的附近,而不是在一条直线上,所以不能用一次函数y=bx+a来描述它们之间的关系,而是用线性回归模型y=bx+a+e来表示,其中a和b为模型的 未知参数,e称为随机误差,自变量X称为解释变量,因变量y称为预报变量.思考:在线性回归模型y=bx+a+e中,e产生的原因主要有哪几种?提示随机误差产生的原因主要有以下几种:(1) 所用的确定性函数不恰当引起的误差;(2) 忽略了某些因素的影响;(3) 存在观测误差.2.残差的概念对于样本点(X1,y1),(X2,y2),(Xn,yn)而言,它们的随机误差XiXzyMb=nti=1XiX其中匚=忘i, 7 = JZyi,

3、i=1i=1(X,y)称为样本点的中心.为e=ybxia,i= 1,2,n,其估计值为e=yi-y、=y-bxi-a,i= 1,2,n,e称为相应于点(Xi,y)的残差.3.刻画回归效果的方式残差图作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图残差图残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带法状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高残差平-八2残差平方和为X(yi-yi),残差平方和越小,模型的拟合效果越好方和i=1nWA2送yi-yi=1相关指戌=1 -,R2表示解释变量对于预报变量变化的贡献

4、率,R2越接近数R丈y-丁二i=1于 1 表示模型的拟合效果越好基础自测1. 思考辨析(1) 相关指数R2越小,线性回归方程的拟合效果越好.()(2) 在线性回归模型中,e是bx+a预报真实值y的随机误差,它是一个可观测的量.(3) 线性回归方程y=bx+a必过样本点的中心(x,y).()答案xx(3)V2.甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了 4种不同模型, 计算可得它们的相关指数R2分别如下表:甲乙丙丁F20.980.780.500.85建立回归模型拟合效果最好的同学是()【导学号:48662000】A.甲B.乙C.丙D. 丁A 相关指数 氏越大,表示回归模型的拟

5、合效果越好.3甲、乙、丙、丁 4 位同学各自对A、B两变量做回归分析,分别得到散点图与残差平n八2方和a ( yi-yi)如表所示:i=1甲乙丙丁散点图/L4 *R LR . *oA0PAOA残差平方和115am ”a ” ar- ”106a”.、八厶 J、rxvr A124103_(填“甲”“乙”“丙” “丁”)同学的试验结果体现拟合AB两 变 量 关 系 的模型拟合精度高.丁 根据线性相关的知识,散点图中各样本点条状分布越均匀,同时保持残差平方和n越小(对于已经获取的样本数据,R2表达式中 a (y 7)2为确定的数,则残差平方和越小,i=1氏越大),由回归分析建立的线性回归模型的拟合效果

6、就越好,由试验结果知丁要好些.4 设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系根据一组样本数据(Xi,yi)(i= 1,2,n),用最小二乘法建立的回归方程为y= 0.85x 85.71,则下列结论中正确的是 _ (填序号).【导学号:48662001】(1)y与x具有正的线性相关关系;(2)回归直线过样本点的中心(x,y);(3)若该大学某女生身高增加1 cm,则其体重约增加 0.85 kg ;若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg.(1)(2)(3)回归方程中x的系数为 0.850,因此y与x具有正的线性相关关系,(1)正确;由回归

7、方程系数的意义可知回归直线过样本点的中心(x , 7 ) , (2)正确;依据回归方程中b的含义可知,x每变化 1 个单位,y相应变化约 0.85 个单位,(3)正确;用回归方程对总体进行估计不能得到肯定结论,故(4)不正确.合作探究攻重难.j求线性回归方程纽 某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:x681012y2356(1)请画出上表数据的散点图(要求:点要描粗);(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+;试根据求出的线性回归方程,预测记忆力为9 的同学的判断力.【导学号:48662002】解如图:n(2) Xiyi=6X2+

8、8X3+10X5+12X6=158,i=16 + 8+ 10+ 12n2 2 2 2 2 Xi= 6 + 8 + 10 + 12 = 344,i=1y1584X9X414b= = = 0.7 ,3444X920y 一 y a=yb x=40.7X9=2.3,故线性回归方程为y= 0.7x 2.3.(3)由中线性回归方程当x= 9 时,y= 0.7X9 2.3 = 4,预测记忆力为 9 的同学的判 断力约为 4.规律方法 求线性回归方程的基本步骤:1 列出散点图,从直观上分析数据间是否存在线性相关关系2计算: ._“ - 0.82, 氏氏.(1)的拟合效果好于(2)的拟合效果.1已知x和y之间的

9、一组数据,则下列四个函数中,模拟效果最好的为哪一个?x123y35.9912.01X一1;y=3X2;y=log2X;y= 4x;y=x.提示:观察散点图中样本点的分布规律可判断样本点分布在曲线y= 3X2X一1附近.所以模拟效果最好的为.2 如何将上题函数变换为线性函数?提示:将y= 3X2X一1两边取自然对数得 Iny= In 3 + (x 1)ln 2.则原方程变为y= ln 3+xIn 2 ln 2= ln |+xIn 2.这样y与x成线性函数关系.断:y=a+bx与y=aedx哪一个作为繁殖的个数y关于时间x变化的回归方程类型为最佳?(给出判断即可,不必说明理由)xyz6为(Xix)

10、2i=16送(Xix) i=1(yiy)6送(XiX) i=1(Ziz)天数x/天123456繁殖个数y/个612254995190 x变化,繁殖的个数,收集数据如下:(1)用天数作解释变量,繁殖个数作预报变量,作出这些数据的散点图,根据散点图判5Zi=1Ayiyiyiy180=11 000 =0.82,令y,x=x,探究问题为了研究某种细菌随时间3.562.833.5317.5596.50512.0916其中Zi= Inyi;z= 6、Zi.6i=1(2)根据(1)的判断最佳结果及表中的数据,建立y关于x的回归方程.【导学号:48662004】n送Xi-xyiyi=1AA一A参考公式:b-,

11、a-yb x.n2Zxx思路探究: (1)根据收集数据,可得数据的散点图;(2)由散点图看出样本点分布在一条指数型曲线y=cebx(c0)的周围,贝 U Iny=bx+ Inc.变换后的样本点分布在一条直线附近,因此可以用线性回归方程来拟合,即可求出y对x的回归方程.解(1)作出散点图,如图 1 所示.由散点图看出样本点分布在一条指数函数y=C1ec2x的周围,于是选择y=dec2X.(2)令z= Iny,则z=bx+a.x123456z1.792.483.223.894.555.25相应的散点图如图 2.从图 2 可以看出,变换后的样本点分布在一条直线附近,因此可以用线性回归方程来拟 合.6

12、为XixZizi=1A由b=6 _Z Xi-x2i=1a=zb x= 1.115,得z= 0.69x+1.115 ;65斗32I0八0.69 x+1.115则有y= e.母题探究:1.(变结论)在本例条件不变的情况下,试估计第7 天细菌繁殖个数.A0.69x+1.115解 y = e ,当x= 7 时,y 382(个)即第 7 天细菌繁殖个数约为382 个.2.(变结论)计算相关指数.解残差计算如下表:天数123456残差0.080.120.830.821.061.52则 云.=Z (y. -y.Y =4. 8161, (v. - y) = 24642, R,i = i1i =01*a =1-

13、塩H沁即解释变量“天数”对预报变量“繁殖细菌个数”解释了99.98%.规律方法解决非线性回归问题的方法及步骤1确定变量:确定解释变量为x,预报变量为y;?画散点图:通过观察散点图并与学过的函数幕、指数、对数函数、二次函数作比较,选取拟合效果好的函数模型;变量置换:通过变量置换把非线性回归问题转化为线性回归问题;-1分析拟合效果:通过计算相关指数等来判断拟合效果;写出非线性回归方程.当堂达标固双基1 下表是x和y之间的一组数据,则y关于x的线性回归方程必过点()【导学号:48662005】x1234y1357A. (2,3)B. (1.5,4)C. (2.5,4)D. (2.5,5)C 线性回归

14、方程必过样本点的中心(x,y),即(2.5,4),故选 C.2.对变量x,y进行回归分析时,依据得到的4 个不同的回归模型画出残差图,则下列模型拟合精度最高的是()CDA 用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适带状区域的宽度越窄,说明模型的拟合精度越高.3. 若一组观测值(xi,yi) , gy2),,(Xn,yn)之间满足yi=bxi+a+ei(i= 1,2 ,n),且ei恒为 0,贝UR2为_.1 Tei恒为 0,.样本点(xi,yi) , (X2,y2),,(xn,yn)均落在直线y=bx+a上,变量x,y成函数关系,即R2= 1.4. 已知回归方程y= 2x+ 1,而试验得到一组数据是(2,4.9), (3,7.1), (4,9.1),则残差平方和等于_ .2 2 20.03(4.9 - 5) + (7.1 - 7) + (9.1 - 9) = 0.03.5.已知x,y之间的一组数据如下表:X0123y13572 2 2 2(1)分另U计算:x、y、X1y1+X2y2+X3y3+X4y4、为 +x2+x3+X4;【导学号:48662006】已知变量x与y线性相关,求出回归方程.0 + 1 + 2+ 31 + 3 + 5 + 7解(1) x=4=1.5,y=4=4

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论