2019-2020学年选修2-33.2回归分析学案_第1页
2019-2020学年选修2-33.2回归分析学案_第2页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、3. 2 回归分析ESI1会作出两个有关联变量的散点图,并利用散点图认识变量间的相关关系.2.了解线性回归模型,能根据给出的线性回归方程系数公式建立线性回归方程.3了解回归分析的基本思想、方法及简单应用.新知提炼1.线性回归模型(1)线性回归模型的概念:将 y= a + bx+ ?称为线性回归模型,其中 a + bx 是确定性函数,?称为随机误差.(2)线性回归方程:直线 y = a+ bx 称为线性回归方程,其中 a 称为回归截距,b 称为回归nA占 Xiyi nx ybn,inin系数,y 称为回归值,其中苕 x2 n(x )2其中 x =*苕 Xi, y =語 yi.A 一 A 一a =

2、 y b x2.相关关系(1)相关系数是精确刻画线性相关关系的量.相 关 系 数 rn_占 Xiyi n x yn一n一;占 x2 n ( x)2Eyi2 n ( y )2相关系数 r 具有的性质:1|r|w1;2|r|越接近于 1, x, y 的线性相关程度越强;3|r|越接近于 0, x, y 的线性相关程度越弱.相关性检验的步骤:1提出统计假设 H。:变量 x, y 不具有线性相关关系;2如果以 95%的把握作出推断,那么可以根据1 0.95 = 0.05 与 n 2 在附录 2 中查出一个 r 的临界值 ro.o5(其中 1 0.95 = 0.05 称为检验水平);3计算样本相关系数

3、r;4作出统计推断:若|r| ro.05,则否定 Ho,表明有 95%的把握认为 x 与 y 之间具有线性相关关系;若|r|wro.05,则没有理由拒绝原来的假设Ho,即就目前数据而言,没有充分理由认为 y 与 x 之间有线性相关关系.Q判断(正确的打“V”,错误的打“x”)(1) 求回归直线方程前必须进行相关性检验.()(2) 两个变量的相关系数越大,它们的相关程度越强.()(3) 若相关系数 r = 0,则两变量 x, y 之间没有关系.()答案:“(2)x(3)V因变量 x 与 y 之间的回归方程表示()A . x 与 y 之间的函数关系B. x 与 y 之间的不确定性关系C. x 与

4、y 之间的真实关系形式D. x 与 y 之间的真实关系达到最大限度的吻合答案:D幅 已知线性回归方程 y = 0.75x+ 0.7,则 x= 11 时,y 的估计值为 _答案:8.95探究点1线性回归方程观察值如下表x(s)5101520304050607090120y(m)610101316171923252946(1)画出散点图;(2) 求 y 对 x 的线性回归方程;利用线性回归方程预测时间为100 s 时腐蚀深度为多少.【解】 散点图如图所示.八4o| y对x的样本点分布在一条直线附io .匸-1在某种产品表面进行腐蚀刻线试验,得到腐蚀深度y 与腐蚀时间 x 之间的一组从散点图中,我们

5、可以看出近,因而求回归直线方程有意义.x =石(5+ 10+ 15 + + 120)5101214=77,y =石(6 +10+10 + + 46)=石,Xiyi=5X6+10X10+15X10+ - +120X46=13 910,X2= 52+ 102+ 152+ + 1202= 36 750,a= y bX =214-0.304X510=5.36.故腐蚀深度对腐蚀时间的线性回归方程为y= 0.304X+ 5.36.35.76( m),即腐蚀时间为 100 s 时腐蚀深度大约为 35.76 卩 m.冇 i 去归纳求线性回归方程的三个步骤(1)画散点图:由样本点是否呈条状分布来判断两个量是否具

6、有线性相关关系.求回归系数:若存在线性相关关系,则求回归系数.(3)写方程:写出线性回归方程,并利用线性回归方程进行预测说明.呱汗隊 1.炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系如果已测得炉料熔化完毕时钢水的含碳量x10与冶炼时间 y(从炼料熔化完毕到出钢的时间)的数据(Xi,yi)(i = 1,2,10)并已计算出i _ 1=159.8,=盒 yi= 172.i = 1|510 214Zx.y ri1-lit J13 910-11 xx4 1u.rfsioY36 7501 xi= 1ck11/所以 b=(3)根据(2)求得的线性回归

7、方程,当腐蚀时间为100 s 时,y= 5.36 + 0.304X100 =Xi10 10=1 598,yi= 1 720,i _1i _110的含碳量 X 的回归直线方程解:由Xii _ 110=1 598,i _ 1110yi= 1 720,可得 x =后 Xii = 1i11iia= b=1721.267X159.830.47.故冶炼时间 y 对钢水的含碳量 x 的回归直线方程为 y= 1.267x 30.47.探究点2线性回归分析A -10 名同学在高一和高二的数学成绩如下表:x74717268767367706574y76757170767965776272其中 x 为高一数学成绩,

8、y 为高二数学成绩.(1) y 与 x 是否具有相关关系?如果 y 与 x 具有线性相关关系,求回归直线方程.【解】由已知表格中的数据,求得x= 71, y= 72.3,n占(xi x ) ( yi y )rnn一“.78.& (x x )2占(yi y )2由检验水平 0.05 及 n 2= 8,在课本附录 2 中查得0.05= 0.632,因为 0.78 0.632, 所以y 与 x 之间具有很强的线性相关关系.(2) y 与 x 具有线性相关关系,设回归直线方程为ny y y yi =1(xi)(yi)y= a + bx, 则有 b=n1.22.E (xix)2i = 1a=yb

9、 x=72.31.22X71= 14.32.所以 y 关于 x 的回归直线方程为 y= 1.22x 14.32.(1)线性回归分析必须进行相关性检验;若忽略,则所求回归方程没有实际意义.(2)|r|越接近于 1,两变量相关性越强,|r|越接近于 0,两变量相关性越弱.故可得 b =y- Kkv- 10 x287 64010X159.8X172265 448 10X159.821.267.匪ll 诛 2关于两个变量 x 和 y 的 7 组数据如下表所示:x21232527293235y711212466115325试判断 x 与 y 之间是否有线性相关关系. 1解:x = 7X(21 + 23+

10、 25+ 27+ 29 + 32 + 35)2741y=7X(7+11+21+24+66+115+325)81.3.7首处=212+232+252+272+292+322+352=5 414.7首 Xiyi=21X7+23X11+25X21+27X24+29X66+32X115+35X325=18 542.7i星 yi2= 72+ 112+ 212+ 242+ 662+ 1152+ 3252= 124 393.18 5427X27.4X81.3-(5 4147X27.42)(124 3937X81.32)0.837 5.由检验水平 0.05 及 n 2 = 5,在课本附录因为 0.837 5

11、0.754.所以 x 与 y 之间具有线性相关关系.探究点3月份 x/月123456人数 y/人5261687478832 中查得0.05= 0.754,非线性回归分析y(人)与月份 x(月)之间满足函数关系,模7所以 r =2【解】 设 u = In y, c = In a,AAA得 u = c+ bx,则 U 与 x 的数据关系如下表:X123456u= In y3.954.114.224.3044.356 74.418 86由上表,得iHXi= 21,6 6省 ui= 25.359 5 , 每 X2= 91,6 6霭 u2-107.334,iHXiUi= 90.342 3,x = 3.5

12、, u 4.226 58,6 _ _工龙川-6x u所以$ =斗二-09,一6耳,u - i jt = 4, 226 58 - 0, 09 x 3, 5 = 3.911 58,所以彳=3.911 58 +0. 09乳占爲 T 4去9】1处0. O0.T/7f y = e户”求非线性回归方程的步骤(1)确定变量,作出散点图.根据散点图,选择恰当的拟合函数.变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程.(4)分析拟合效果:通过计算相关指数或画残差图来判断拟合效果.,(5)根据相应的变换,写出非线性回归方程.例 3)某地今年上半年患某种传染病的人数A,为 y = ae

13、bx,确定这个函数解析式.匪汗隊 3某种书每册的成本费 y(元)与印刷册数 x 仟册)有关,经统计得到数据如下:X(千册)123510203050100200y(元)10.155.524.082.852.111.621.411.301.211.151检验每册书的成本费 y(元)与印刷册数的倒数丄之间是否具有线性相关关系,如有,求出Xy 对 x 的回归方程,并画出其图形.1解:首先作变量置换 u =x,题目中所给的数据变成如下表所示的10 对数据.ui10.50.330.20.10.050.030.020.010.005yi10.155.524.082.852.111.621.411.301.2

14、11.15然后作相关性检测.经计算得 r疋0.999 80.632,从而认为 u 与 y 之间具有线性相关关系,由公式得 a 胡.125 ,AA1A8 973b8.973,所以 y= 1.125+ 8.973u,最后回代 u = -,可得 y = 1.125+ .XX这就是题目要求的 y 对 x 的回归方程.回归方程的图形如图所示,它是经过平移的反比例函数图象的一个分支.氏卜某商场经营一批进价是 30 元/台的小商品,在市场试销中发现,此商品的销售单 价 x(x 取整数)(元)与日销售量 y(台)之间有如下关系:x35404550y56412811(1)画出散点图,并判断 y 与 x 是否具有

15、线性相关关系;(2)求日销售量 y对销售单价 x 的线性回归方程(方程的斜率保留一个有效数字);设经营此商品的日销售利润为P 元,根据 写出 P 关于 x 的函数关系式,并预测当 销售单价 x为多少元时,才能获得最大日销售利润.【解】(1)散点图如图所示,从图中可以看出这些点大致分布在一条直线附近,因此 两个变量具有线性相关关系.2010JO 20 30 40 SO 6U 70占因为x= 4x(35 + 40+ 45+ 50)= 42.5,=4 (56 + 41 + 28+ 11) = 34 ,lx y=35 X 56 +40梵41 +45 x28 +50 x II=5 410,ix2=352

16、-+402+452+5O2=7 350,所以方二2盗-垢=410一4x426 34一i? -4? -1350 -4 x42. 5:t = ii=所以丘=y=34 (- 3)x42, 5 = 161.5.所以y - 16L 5 - 3,r依题意有 P = (161.5-3x)(x 30)=3x2+ 251.5X 4 845251.52251.52=3 x6+12 4 845.251 5所以当 x= 甲-42 时,P 有最大值,约为 426 元故预测当销售单价为42 元时,能6获得最大日销售利润.防范措施: (1)注重双基的积累基础知识及基本方法是解决所有问题的依据,需熟练掌握.如本例中回归方程的

17、特点是解决本题的关键所在.(2)注意题设信息的提取对于建模问题,合理提取题设信息可顺利地建立函数模型,如本例中利润函数的建立, 可直接利用“利润=销售收入成本”求解.1 关于回归分析,下列说法错误的是()A 回归分析是研究两个具有相关关系的变量的方法B .散点图中,解释变量在 x 轴,预报变量在 y 轴C.回归模型中一定存在随机误差D 散点图能明确反映变量间的关系解析:选 D.用散点图反映两个变量间的关系时,存在误差.2 下列关于统计的说法:1将一组数据中的每个数据都加上或减去同一个常数,方差恒不变;2回归方程 y=bx+ a 必经过点(,);3设回归方程为 y= 5x+ 3,若变量 x 增加

18、 1 个单位,则 y 平均增加 5 个单位.其中正确的为_ (写出全部正确说法的序号).解析:正确;正确;若变量 x 增加 1 个单位,则 y 平均减少 5 个单位,故错误. 答案:A 基础达标1.废 品 率x%和每吨生铁成本 y(元)之间的回归直线方程为 y= 256 + 3x,表明()A 废品率每增加 1%,生铁成本增加 259 元B废品率每增加 1%,生铁成本增加 3 元C 废品率每增加 1%,生铁成本平均每吨增加 3 元D .废品率不变,生铁成本为256 元解析:选 C.回归方程的系数 b 表示 x 每增加一个单位,y 平均增加 b,当 x 为 1 时,废品率应为 1%,故当废品率增加

19、 1%时,生铁成本平均每吨增加 3 元.2已知某产品连续 4 个月的广告费用为 xi(i = 1, 2, 3, 4)千元,销售额为 yi(i = 1, 2, 3, 4)万元,经过对这些数据的处理,得到如下数据信息: X1+ X2+ X3+ X4= 18, y1+ y2+ y3+ y4= 14 ;广告费用 x 和销售额 y 之间具有较强的线性相关关系;回归直线方程 y= bx +a 中,b=0.8(用最小二乘法求得),那么当广告费用为 6 千元时,可预测销售额约为()A.3.5 万元C. 4.9 万元D . 6.5 万元解析:选 B.依题意得x= 4.5,y= 3.5,由回归直线必过样本点中心得

20、a = 3.5 0.8X4.5=-0.1,所以回归直线方程为y = 0.8x 0.1.当 x= 6 时,y = 0.8X6 0.1 = 4.7.3.某化工厂为预测某产品的回收率y,需要研究它和原料有效成分含量之间的相关关XT二52,二系,现取了 8 对观测值,计算得 i心 1 gB,228=478,Xx v =1 849,i-丨- 1则 y 与 x 的线性回归方程是()A;= 11.47+ 2.62xB. y= 11.47 + 2.62xC. y= 2.62+ 11.47xD. y= 11.47 2.62x解析:选 A.由题中数据得 x= 6.5, y= 28.5,1 8498X6.5X28.

21、5367-=-V 624788X6.521402.62,a= b=28.52.62X6.5=11.47,所以 y 与 x 的线性回归方程是 y= 2.62x+ 11.47.故选 A.4.若某地财政收入x 与支出 y 满足线性回归方程 y= bx+ a + s(单位:亿元),其中 b =0.8, a= 2, |s0.5.如果今年该地区财政收入10 亿元,则年支出预计不会超过()A . 10 亿元B. 9 亿元C. 10.5 亿元D. 9.5 亿元解析:选 C.代入数据 y= 10+s因为|杆 0.5,所以 9.5Wyw10.5,故不会超过 10.5 亿元.B. 4.7 万元所以 b=5.某种产品

22、的广告费支出x 与销售额 y(单位:万元)之间的关系如下表:x24568y3040605070y 与 x 的线性回归方程为 y = 6.5x+ 17.5,当广告支出 5 万元时,随机误差的效应(残差)为_.解析:因为 y 与 x 的线性回归方程为 y= 6.5x+ 17.5,当 x= 5 时,y = 50,当广告支出 5万兀时,由表格得:y= 60,故随机误差的效应(残差)为 60 50= 10.答案:106.一唱片公司研究预支出费用x(十万元)与唱片销售量 y(千张)之间的关系,从其所发行的唱片中随机抽选了 10 千张,得到如下的资料:10工y =237,则 y 与 x 的相关系数 r 的绝

23、对值为解析:根据公式得相关系数(常-10刃陽-谅)23710X2.8X7.5=- - 0.3,(303.410X2.82)(598.510X7.52)所以 |r|= 0.3.答案:0.37.某个服装店经营某种服装,在某周内获纯利 y(元)与该周每天销售这种服装件数x 之间的一组数据关系见表:x3456789y6669738189909177已知睪1x2= 280,為 Xiyi= 3 487.(1)求 x , y ;已知纯利 y 与每天销售件数 x 线性相关,试求出其回归方程.3+ 4 + 5 + 6+ 7 + 8 + 9 解:(1)x = 6,XA598. 5 , X55一 66 + 69 +

24、 73 + 81 + 89 + 90 + 91559y=7=T.因为 y 与 x 有线性相关关系,7_ c c c 559人 i X-1|Xiyi一 7 x y 3 487 一 7X6X7 所以 b=二= 4.75,iEx2-77280-7X36i =1A559719a=6X4.75=P1.36.714故回归方程为 y= 4.75 x + 51.36.&已知某校 5 个学生的数学和物理成绩如下表:学生的编号 i12345数学 Xi8075706560物理 yi7066686462(1) 假设在对这 5 名学生成绩进行统计时,把这5 名学生的物理成绩搞乱了,数学成绩没出现问题,问:恰有

25、2 名学生的物理成绩是自己的实际分数的概率是多少?(2) 通过大量事实证明发现,一个学生的数学成绩和物理成绩具有很强的线性相关关系,在上述表格是正确的前提下,用 x 表示数学成绩,用 y 表示物理成绩,求 y 与 x 的回归方程.参考数据和公式:y = bx + a , 其中 b =a=23 190, i? =24 750.”i=LJ 1j= *解:(1)记事件 A 为“恰有 2 名学生的物理成绩是自己的实际成绩”,则P(A)=2C5=180+ 75 + 70+ 65 + 60因为 x= 70,一70 + 66 + 68 + 64 + 62y = 66,丫兀m -n x vL二- 二0. 36

26、,i=i1a=66 -0. 36 x70 =40. 8,所以回归直线方程为y =0. 36兀+468.B 能力提升1 假设关于某设备的使用年限x 和所支出的维修费用 y(万元)有如表的统计资料:使用年限 x23456维修费用 y2.23.85.56.57.0若由资料可知 y 对 x 呈线性相关关系:求线性回归方程 y= bx + a;估计使用年限为 10 年时,维修费用是多少?解:(1)列表如下:12345总计xi2345620yi2.23.85.56.57.025Xiyi4.411.422.032.542.0112.3x24916253690.V = 4 , y = 5 ;X/二90; y = 1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论