




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三章统计案例回归分析的基本思想及其初步应用人民教育出版社A版 高三|选修2-3人民教育出版社A版 高三|选修2-3线性回归方程: ,其中:axby1122211()()()nniiiiiinniiiixxyyx ynxybxxxnxyabx线性相关:如果所有点看上去都在一条直线附近波动,则两个变量间是线性相关,可用一条直线来近似表示.非线性相关:若所有点看上去都在某条曲线附近波动,则两个变量间是非线性相关,可用一条曲线来拟合.人民教育出版社A版 高三|选修2-3对于一组具有线性相关关系的数据1122( ,),(,),(,)nnx yxyxyL1211,nniixxxxxnnL1211,nni
2、iyyyyynnL则称点 为样本点的中心.), yx(线性回归方程: ,其中:axby1122211()()()nniiiiiinniiiixxyyx ynxybxxxnxyabx线性回归模型:y=bx+a+e,其中a和b为模型的未知参数, e称为随机误差.人民教育出版社A版 高三|选修2-3线性回归方程: ,其中:axby1122211()()()nniiiiiinniiiixxyyx ynxybxxxnxyabx线性回归模型:y=bx+a+e,其中a和b为模型的未知参数, e称为随机误差.数据点和它在回归直线上相应位置的差异是随机误差的效应, 称 为残差.由 得 . (1,2,3, )ii
3、eyy inLiiybxa(1,2,3, ).iiieybxa inL人民教育出版社A版 高三|选修2-3检测下预习效果:检测下预习效果:1.在画两个变量的散点图时,下面哪个叙述是正确的( )A.预报变量在 轴上,解释变量在 轴上B.解释变量在 轴上,预报变量在 轴上C.可以选择两个变量中任意一个变量在 轴上D.可以选择两个变量中任意一个变量在 轴上2.回归直线 必过( )A. B. C. D. B Dybxa(0,0)( ,0)x(0, )y( , )x y人民教育出版社A版 高三|选修2-3检测下预习效果:检测下预习效果:3.下列说法正确的是 ( )A.在统计学中,回归分析是检验两个分类变
4、量是否有关系的一种统计方法B.线性回归方程对应的直线 至少经过其样本数据点 中的一个点C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D.在回归分析中,相关指数 为0.98 的模型比相关指数 为 0.80的模型拟合的效果差C axby1122( ,),(,),(,)nnx yxyxyL2R2R人民教育出版社A版 高三|选修2-3检测下预习效果:检测下预习效果:4.两个变量 与 的回归模型中,分别选择了4个不同模型,它们的相关指数 如下,其中拟合效果最好的模型是( )A.模型1的相关指数 为0.99B.模型2的相关指数 为0.88C.模型3的相关指数 为0.50D.模型4的
5、相关指数 为0.20A2R2R2R2R2R人民教育出版社A版 高三|选修2-3检测下预习效果:检测下预习效果:5.有下列数据:下列四个函数中,模拟效果最好的为( )A. B. C. D. A 13 2xy 2logyx3yx2yxx123y35.9912.01人民教育出版社A版 高三|选修2-3检测下预习效果:检测下预习效果:6.已知回归方程 ,而试验得到一组数据是(2,4.9),(3,7.1),(4,9.1),则残差平方和是( )A.0.01B.0.02C.0.03D.0.04C21yx人民教育出版社A版 高三|选修2-3探究一:相关关系与函数关系是什么,如何画散点图?活动一 回顾旧知,回忆
6、相关关系与函数关系 在必修3中,我们已经学习过函数关系与相关关系,那么什么是函数关系,什么是相关关系?想一想:在以往数学学习和日常生活中,我们接触了哪些函数关系与相关关系?举例:请大家试着列举生活与学习中的相关例子.人民教育出版社A版 高三|选修2-3例如圆的周长 ,周长C与半径r之间就是一种确定性的关系,对于自变量半径的每一个确定的值,都有唯一确定的周长的值与之相对应.又如人的体重y与身高x,一般来说,身高越高,体重越重,但不能用一个函数来严格表示它们之间的关系.即变量之间有一定的联系,但取值也具有一定的随机性.2Cr1.函数关系与相关关系 函数关系是一种确定关系. 相关关系是一种不确定关系
7、.注意:判断两个变量是否具有相关关系,应该先看它们是否有关,再看这种关系是否是确定的函数关系.探究一:相关关系与函数关系是什么,如何画散点图?人民教育出版社A版 高三|选修2-3活动二 旧知推进,回忆散点图的画法 2. 散点图在分析两个变量的关系时,为了对变量之间的关系有一个大概的了解,我们通常将一个变量的数据作为横坐标,另一个变量的数据作为纵坐标,将这些点描在平面直角坐标系中,形成的图形就是散点图.(1)散点图直观反映了实例的成对观测值之间是否存在相关关系和存在什么样的相关关系.(2)若散点图中点的分布由左下方到右上方,则两个变量正相关;点的分析由左上方到右下方,则两个变量负相关.探究一:相
8、关关系与函数关系是什么,如何画散点图?人民教育出版社A版 高三|选修2-3问题探究二 线性回归分析步骤是什么? 活动一 通过实例,亲身体验 在必修3中,我们利用回归分析的方法对两个具有线性相关关系的变量进行了研究,你能利用回归分析对下列实例进行分析吗?例1 从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:编号12345678身高/cm165165 157 170 175 165 155 170体重/kg 48 57 50 54 64 61 43 59求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重. 人民教育出版社A版 高三|选修2-3详解
9、:(1) 作散点图,由于问题是根据身高预报体重,因此要求身高与体重的回归直线方程,取身高为自变量x,体重为因变量y,作散点图:问题探究二 线性回归分析步骤是什么? 活动一 通过实例,亲身体验人民教育出版社A版 高三|选修2-3 从散点图可以看出,样本点呈条状分布,身高和体重有比较好的线性相关关系,因此可以用回归直线y=bx+a来近似刻画它们之间的关系,从而可利用我们学过的最小二乘估计思想及计算公式求得线性回归直线方程.其计算公式如下:1122211()(),()nniiiiiinniiiixxyyx ynxybxxxnxaybx其中1211,nniixxxxxnn1211,nniiyyyyyn
10、n根据上面公式,可以得到712.85,849. 0ab于是得到线性回归方程:712.85849. 0 xy问题探究二 线性回归分析步骤是什么? 人民教育出版社A版 高三|选修2-3(1)画出两个变量的散点图;(2)判断是否线性相关;(3)求回归直线方程(利用最小二乘法);(4)并用回归直线方程进行预报点拨:回归分析的基本过程:问题探究二 线性回归分析步骤是什么? 对于身高172cm女大学生,由回归方程可以预报体重为 预测身高为172cm的女大学生的体重为约60.316kg.0.849 17285.71260.316(kg)y人民教育出版社A版 高三|选修2-3活动二 整理旧知,得出新概念1.样
11、本中心点对于一组具有线性相关关系的数据1122( ,),(,),(,)nnx yxyxyL1211,nniixxxxxnnL1211,nniiyyyyynnL则称点 为样本点的中心.), yx(问题探究二 线性回归分析步骤是什么? 人民教育出版社A版 高三|选修2-3活动三 总结反思,得出新结论由上计算过程可以得出:(1)样本点的中心坐标分别是两个变量的观测数据的算术平均数.(2)点 在回归直线上,即回归直线一定过样本点的中心., )x y(问题探究二 线性回归分析步骤是什么? 人民教育出版社A版 高三|选修2-3探究三:线性回归模型与函数模型有何差异, 随机误差是怎么产生的?重点知识活动一
12、结合实际,反思结果想一想:身高为172cm 的女大学生的体重一定是60.316kg吗?如果不是,你能解释一下原因吗?不一定,但一般可以认为她的体重在60.316kg左右.由样本点和回归直线的相互位置可以说明这一点.人民教育出版社A版 高三|选修2-3探究三:线性回归模型与函数模型有何差异,随机误差是怎么产生的?重点知识从散点图可观察出,女大学生的体重y和身高x之间的关系并不能用一次函数y=bx+a来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地刻画身高和体重的关系). 在数据表中身高为165cm的3名女大学生的体重分别为48kg、57kg和61kg,如果能用一次函数来描述体重与身高的
13、关系,那么身高为165cm的3名女在学生的体重应相同. 这就说明体重不仅受身高的影响还受其他因素的影响,这时我们把身高和体重的关系可用下面的线性回归模型 y=bx+a+e来表示,其中a和b为模型的未知参数,e称为随机误差.活动一 结合实际,反思结果人民教育出版社A版 高三|选修2-3活动二 层层推进 ,答疑解惑产生随机误差项e的原因是什么呢? 实际上,一个人的体重除了受身高影响外,还受其他许多因素的影响,例如饮食习惯、是否喜欢运动、度量误差等.另一方面,没有人知道身高和体重之间的真正关系是什么,现在只是利用线性回归方程来近似这种关系.而这种近似和上面提到的影响因素都会导致随机误差e的产生.探究
14、三:线性回归模型与函数模型有何差异, 随机误差是怎么产生的?重点知识人民教育出版社A版 高三|选修2-3探究三:线性回归模型与函数模型有何差异, 随机误差是怎么产生的?重点知识(1)线性回归方程中的 和 为估计值,与真实值b和a之间存在误差.ba(2)影响变量y的因素不止变量x一个,可能还包括许多因素(例如农作物的生长不仅要收日照时间的影响,还会受土壤的肥沃程度,施肥量等影响)(3)观测误差,由于测量工具及测量值一般也存在一定的误差,这样的误差也包含在e中. 所以随机误差e中包含体重不能由身高的线性函数解释的所有部分. 当残差变量恒等于0时,线性回归模型就变成一次函数模型. 因此,一次函数模型
15、是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式. 人民教育出版社A版 高三|选修2-3活动三 新知学习 在统计中,我们把自变量x称为解释变量,因变量y称为预报变量.线性回归模型与我们熟知的一次函数模型的不同之处就在于增加了随机误差e,预报变量y的值由解释变量x和随机误差e共同决定,即解释变量x只能解释部分预报变量y的变化.探究三:线性回归模型与函数模型有何差异, 随机误差是怎么产生的?重点知识人民教育出版社A版 高三|选修2-3探究四:建立回归模型的基本步骤是什么?活动一 归纳提升,总结一般方法例1 某城区为研究城镇居民月家庭人均生活费支出和月人均收入的相关关系,随机抽取10户
16、进行调查,其结果如下:月人均收入月人均收入x元元3003904205205707007608008501080月人均生活费月人均生活费y元元255324335360450520580600630750试预测人均月收入为1100元和人均月收入为1200元的两个家庭的月人均生活费.详解:作出散点分布图如图,由图可知,月人均生活费与人均收入之间具有线性相关关系.人民教育出版社A版 高三|选修2-3通过计算可知:639480.4xy,10214610300,iix10212540526,iiy3417560101iiiyx所以10110221100.6599.10iiiiix yxybxx751.58
17、xbya所以回归直线方程为.751.586599. 0 xy计算相关系数得r=0.993136,故月人均收入与月人均生活费之间具有显著相关关系.探究四:建立回归模型的基本步骤是什么?人民教育出版社A版 高三|选修2-3作残差图如图, 计算相关指数得 0.9863,说明城镇居民的月人均生活费的差异有98.63是由月人均收入引起的.2R探究四:建立回归模型的基本步骤是什么? 由图可知,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适.人民教育出版社A版 高三|选修2-3 由以上分析可知,我们可以利用回归方程 来作为月生活费的预报值.0.659958.751yx故预测月人均收入分别为11
18、00元和1200元的两家庭的月人均生活费分别为784.59元和850.58元.探究四:建立回归模型的基本步骤是什么?将x1100代入回归方程得y784.59元;将x1200代入回归方程得y850.58元. 人民教育出版社A版 高三|选修2-3点拨:建立回归模型的基本步骤(5)得出结论后分析残差图是否有异常(如个别数据对应的残差绝对值过大,残差呈现不随机的规律性等),若存在异常,则检查数据是否有误或模型是否合适等.探究四:建立回归模型的基本步骤是什么?(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.(2)画出解释变量和预报变量的散点图,观察它们之间的关系(是否存在线性关系等).(
19、3)由经验确定回归方程的类型(如果我们观察到诗句呈线性关系,则选用线性回归方程).(4)按一定的规则(如最小二乘法)估计回归方程中的参数.人民教育出版社A版 高三|选修2-3探究五:若两变量为非线性相关关系,如何建立回归模型?重点、难点知识活动一 整合旧知,发现新问题 当两个变量呈线性相关关系时,我们通过模拟线性回归模型,用回归分析的基本思想对两个变量进行研究.若当有些变量间的关系并不是线性相关,怎样确定回归模型?例2 一只红铃虫的产卵数y和温度x有关,现收集了7组观测数据列于下表中,试建立y与x之间的回归方程.编号编号1234567温度温度x/C21232527293235产卵数产卵数y/个
20、个711212466115325人民教育出版社A版 高三|选修2-3详解:根据收集数据,作散点图:探究五:若两变量为非线性相关关系,如何建立回归模型?重点、难点知识人民教育出版社A版 高三|选修2-3活动二 观察发现,寻找新模型 样本点并没有分布在某个带状区域内,因此两个变量不呈线性相关关系,即不能直接用线性回归方程来建立两个变量之间的关系.怎样确定回归模型? 首先要作出散点图,如果散点图中的样本点并没有分布在某个带状区域内,则两个变量不呈现线性相关关系,不能直接利用回归方程来建立两个变量之间的关系,根据已有的函数知识,观察样本点是否呈指数函数关系或二次函数关系,选定适当的回归模型. 根据已有
21、的函数知识,从散点图中可以看到样本点分布在某一条指数函数曲线 的周围.xcecy21探究五:若两变量为非线性相关关系,如何建立回归模型?重点、难点知识人民教育出版社A版 高三|选修2-3活动三 非线性转化为线性问题如果两个变量呈现非线性相关关系,怎样求出回归方程? 可以通过对解释变量进行变换,如对数变换或平方变换,先得到另外两个变量间的回归方程,再得到所求两个变量的回归方程.现在,我们通过对数变换把指数关系变为线性关系,即对 两边取自然对数xcecy2122111212lnlnlnlnlnlnlnlnc xc xyc ececc xecce x令 ,建立z与x之间的线性回归方程 yzlnxcc
22、z21ln12lnacbczabx令,即 分析x与z之间的关系,通过画散点图(如下图),可知x与z之间是存在着线性回归关系,可以用最小二乘法求出线性回归方程z=a+bx.探究五:若两变量为非线性相关关系,如何建立回归模型?重点、难点知识人民教育出版社A版 高三|选修2-3由表1的数据可以得到变换后的样本数据表x21232527293235z1.9462.3983.0453.1784.1904.7455.784探究五:若两变量为非线性相关关系,如何建立回归模型?重点、难点知识人民教育出版社A版 高三|选修2-3列表计算出各个量编号编号1234567合计合计温度温度x/C2123252729323
23、5192产卵数产卵数y/个个711212466115325569z=ln y1.946 2.398 3.045 3.178 4.190 4.745 5.784 25.285 xi2441529625729841102412255414xizi40.9 55.2 76.1 85.8 121.5 151.8 202.4 733.7 27.429 3.612 5414 733.71xzniix12niyiyx112221733.77 27.43 3.610.27254147 27.43niiiniix znxzbxnx ,3 .8 4 3azbx ,843.3272.0 xz0 .2 7 23 .8
24、 4 3lnln0 .2 7 23 .8 4 3.xzyyxye因 为, 所 以, 即探究五:若两变量为非线性相关关系,如何建立回归模型?重点、难点知识人民教育出版社A版 高三|选修2-3探究六:能否用其它模型来拟合上述问题?如何判断各种的模型的拟合效果?活动一 二次曲线模型样本点还可以看作是分布在二次函数曲线 周围.221cxcy2tx令,建立y与t之间的线性回归方程21ctcy12bcacyabt令,即分析y与t之间的关系,通过画散点图(如下图),可看到y与t的散点图并不分布在一条直线的周围,即不宜用线性回归方程来拟合它,即不宜用二次曲线 来拟合y与x之间的关系,这个结论还可以用残差分析得
25、到.221cxcy人民教育出版社A版 高三|选修2-3 活动二 对比提升 为比较两个不同模型的残差,需建立相应的回归模型,用线性回归模型拟合回归方程.yabt编编号号1234567合合计计温温度度x /C21232527293235192产产卵卵数数y /个个711212466115325569t = x2441529625729841102412255414ti2194481 279841 390625 531441 707281104857615006254652870tiyi308758191312517496555061177603981256109180 0. .3 36 67 77
26、73.42981.2864 46 65 52 28 87 70 06 61 10 09 91 18 8- -2 20 02 2. .5 54 43 3tniit12niiiyt1y2121znxzxnzxbniiniiixbza所以543.202367. 0ty2tx因为,即y关于x的二次回归方程为543.202367. 02xy探究六:能否用其它模型来拟合上述问题?如何判断各种的模型的拟合效果?人民教育出版社A版 高三|选修2-3活动三 残差分析 指数回归模型与二次回归模型中哪个能更好地刻画红铃虫的产卵数y与温度x的关系?通过什么数据说明? 一般在参数个数一定的条件下,相关指数越大或残差平方
27、和越小说明模型拟合得越好.计算每个模型的相关指数,并进行模型的比较.探究六:能否用其它模型来拟合上述问题?如何判断各种的模型的拟合效果?人民教育出版社A版 高三|选修2-3探究六:能否用其它模型来拟合上述问题?如何判断各种的模型的拟合效果?指数函数模型的相关指数:编编号号1234567合合计计温温度度x/C21232527293235192产产卵卵数数y/个个71121246611532556927.42981.2866.511.219.233.157.1129.2292.1548.374-74.3-70.3-60.3-57.3-15.333.7243.700.5-0.21.8-9.18.9-
28、14.232.920.62575518.44940.13634.43281.7233.71136.759396.7 78141.40.270.033.1083.7079.01200.321084.26 1450.681450.6878141.4y关关于于x的的指指数数回回归归方方程程xniiiniiyye1212niiyy12y843. 3272. 0 xeyiy iiiyye22iiiyye98. 0112122niiniiiyyyyR人民教育出版社A版 高三|选修2-3二次函数模型的相关指数: 从相关指数的计算结果来看,指数函数模型的 比二次函数模型的 更接近于1,所以指数函数模型的回归效
29、果好.2R2R探究六:能否用其它模型来拟合上述问题?如何判断各种的模型的拟合效果?人民教育出版社A版 高三|选修2-3再从残差图看:从图中可看出指数函数模型的残差点比较均匀地落在水平的带状域中,所以指数函数模型拟合精度较二次函数模型的高.探究六:能否用其它模型来拟合上述问题?如何判断各种的模型的拟合效果?人民教育出版社A版 高三|选修2-3点拨:归纳判断模型拟合效果的方法:(2)通过残差分析比较两种模型的拟合效果.一般情况下,比较两个模型的残差比较困难(某些样本点上一个模型的残差的绝对值比另一个模型的小,而另一些样本点的情况则相反),故通过比较两个模型的残差的平方和的大小来判断模型的拟合效果.
30、残差平方和越小的模型,拟合的效果越好.探究六:能否用其它模型来拟合上述问题?如何判断各种的模型的拟合效果?(1)可以通过变换后的散点图观察两个新变量之间是否存在线性回归方程;人民教育出版社A版 高三|选修2-3探究七:什么是相关系数?相关系数可以用来解释什么?活动一 理论研究,概念学习相关系数 我们知道,两个变量x和y正(负)相关时,它们就有相同(反)的变化趋势,因此可以用回归直线来描述这种关系.与此相关的一个问题:如何描述x和y之间种线性关系的强弱? 在统计中用相关系数r来衡量两个变量之间线性关系的强弱.若相应于变量x的取值 ,变量y的观测值为 ( ),则两个变量的相关系数r的计算公式为ix
31、iyni 1niniiiniiiyyxxyyxxr11221)()()(ixiy人民教育出版社A版 高三|选修2-3探究七:什么是相关系数?相关系数可以用来解释什么?niniiiniiiyyxxyyxxr11221)()()( 对于相关系数r:当r为正时,表明变量x和y正相关; 当r为负时,表明变量x和y负相关.统计学认为,对于变量x,y: 如果 ,那么负相关很强; 如果 ,那么正相关很强; 如果 或 ,那么相关性一般; 如果 ,那么相关性较弱.75. 0, 1r0.75,1r30. 0,75. 0r75. 0 , 3 . 0r25. 0 ,25. 0r活动一 理论研究,概念学习相关系数人民教
32、育出版社A版 高三|选修2-3活动二 学以致用,相关系数的应用例1 对下列各图中两个变量间的线性相关程度作出分析探究七:什么是相关系数?相关系数可以用来解释什么?人民教育出版社A版 高三|选修2-3 详解:图1,r=0.97相关性很强,而且是正相关;图2,r=-0.85相关性很强,而且是负相关;图3,r=0.24,不能用线性回归模型描述两个变量的关系;图4,r=-0.05乎没有什么关系,不能用线性回归模型描述两个变量的关系.点拨:当相关系数 越接近1时,两个变量的线性相关程度越高,当相关系数 越接近0时,两个变量的线性相关程度越低.rr探究七:什么是相关系数?相关系数可以用来解释什么?人民教育
33、出版社A版 高三|选修2-3探究八:什么是残差、及残差平方和、如何用残差判断拟合效果?重点、难点知识活动一 残差的定义 在线性回归模型中,e是用bx+a报真实值y的随机误差,它是一个不可观测的量,那么应该怎样研究随机误差呢? 在实际应用中,我们用回归方程 中的 估计回归模型y=bx+a+e中的bx+a.由于随机误差e=y-(bx+a),所以 是e的估计值.对于样本点axbyyyye1122( ,),(,),(,)nnx yxyxyL而言,它们的随机误差为,1,2,iiieybxa inL其估计值为iiiiieyyybxa ,1,2,inL称 是相对于点 的残差.ie),iiyx(人民教育出版社
34、A版 高三|选修2-3活动二 学以致用,残差的应用如何发现数据中的错误,如何衡量模型的拟合效果?通过残差可以发现原始数据中的可疑数据,判断所建立模型的拟合效果.下表是女大学生身高和体重的原始数据以及相应的残差数据.编号编号12345678身高身高/cm165165157170175165155170体重体重/kg4857505464614359yi54.37354.37347.58158.61862.86354.37345.88358.618ei-6.3732.6272.419-4.6181.1376.627-2.8830.382我们可以利用图形来分析残差.作图时纵坐标为残差,横坐标可以选为样
35、本的编号或者解释变量的数值,这样作出的图形称为残差图.下表是以女大学生编号为横坐标的残差图.探究八:什么是残差、及残差平方和、如何用残差判断拟合效果?重点、难点知识人民教育出版社A版 高三|选修2-3从残差图中可以看到第1个样本点和第6个样本点的残差较大,需要确认是否出现人为的错误.探究八:什么是残差、及残差平方和、如何用残差判断拟合效果?重点、难点知识人民教育出版社A版 高三|选修2-3残差所能说明的情况: 残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,带状区域的宽度越窄,模型拟合精度越高,回归方程的预报精度越高.探究八:什么是残差、及残差平方和、如何用残差判断拟合效果?重点
36、、难点知识 样本点的残差比较大,确认采集数据时是否出现人为的错误或其他原因;人民教育出版社A版 高三|选修2-3活动三 多角度刻画拟合效果 从残差图中我们可以大致判断模型的拟合效果,能否定性分析模型的拟合效果呢? 我们可以用 是刻画回归效果的量,除了表示回归模型的拟合效果,也表示解释变量和预报变量的线性相关关系(在线性回归模型中).其计算公式是2R22121()1()niiniiyyRyy 探究八:什么是残差、及残差平方和、如何用残差判断拟合效果?重点、难点知识人民教育出版社A版 高三|选修2-3探究八:什么是残差、及残差平方和、如何用残差判断拟合效果?重点、难点知识64. 0112122ni
37、iniiiyyyyR即解释变量对预报变量变化约贡献了64%,而随机误差贡献了剩余的36%. 对于已获取的样本数据, 表达式中的 为确定的数.因此 越大,说明残差平方和 越小,模型的拟合效果越好; 越小,说明残差平方和 越大,模型的拟合效果越差.在线性回归模型中, 越接近于1,回归的效果越好(因为 越接近于1,表示解释变量和预报变量的线性相关性越强).在线性回归模型中, 同时也表示解释变量对预报变量变化的贡献率.2R21niiyy21niiyy2R2R2R2R2R21niiyy人民教育出版社A版 高三|选修2-3探究九活动一 学以致用 例2.某运动员训练次数与运动成绩之间的数据关系如下:次数次数
38、/x3033353739444650成绩成绩/y3034373942464851根据数据分别计算相关系数、残差、相关指数 ,判断能否用线性回归模型,若能求出回归方程并试预测该运动员训练47次以及55次的成绩,若不能说明理由.2R详解:(1)作出该运动员训练次数x与成绩y之间的散点图,如图1所示:由散点图可知,它们之间具有线性相关关系.人民教育出版社A版 高三|选修2-3探究九(2)列表计算:次数次数 成绩成绩 303090090090033341089115611223537122513691295373913691521144339421521176416384446193621162024
39、46482116230422085051250026012550ixiy2ix2iyiix y由上表可求得39.25,40.875,xy82112656,iix82113731,iiy1318081iiiyx所以88118822211()()81.0415.()iiiiiiiiiixxyyx yxybxxxx0.00302aybx 所以回归直线方程为:.00302. 00415. 1xy人民教育出版社A版 高三|选修2-3探究九(3)计算相关系数将上述数据代入818822221180.992704(8)(8)iiiiiiix yxyrrxxyy得查表可知707. 005. 0r而0.05rr故
40、y与x之间存在显著的相关关系.(4)残差分析:作残差图如图2,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适.计算残差的方差得 ,说明预报的精度较高.884113. 02人民教育出版社A版 高三|选修2-3探究九(5)计算相关指数2R2R 计算相关指数 0.9855.说明该运动员的成绩的差异有98.55是由训练次数引起的.(6)做出预报 由上述分析可知,我们可用回归方程 作为该运动员成绩的预报值.1.04150.00302yx将x47和x55分别代入该方程可得y49和y57,故预测运动员训练47次和55次的成绩分别为49和57.人民教育出版社A版 高三|选修2-3探究九
41、点拨:1.解答本类题目应先通过散点图来分析两变量间的关系是否线性相关,然后再利用求回归方程的公式求解回归方程,并利用残差图或相关指数R2来分析函数模型的拟合效果,在此基础上,借助回归方程对实际问题进行分析.2.在使用回归方程进行预报时要注意:(1)回归方程只适用于我们所研究的样本的总体;(2)我们所建立的回归方程一般都有时间性;(3)样本取值的范围会影响回归方程的适用范围;(4)不能期望回归方程得到的预报值就是预报变量的精确值.人民教育出版社A版 高三|选修2-3知识梳理(2)回归分析的基本过程: 画出两个变量的散点图; 判断是否线性相关; 求回归直线方程(利用最小二乘法); 并用回归直线方程进行预报.(1)线性回归方程: , 其中:axby1122211()(),()nniiiiiinniiiixxyyx ynxybxxxnxyabx人民教育出版社A版 高三|选修2-3知识梳理(3)归纳判断模型拟合效果的方法:可以通过变换后的散点图观察两个新变量之间是否存在线性回归方程;通过残差分析比较两种模型的拟合效果.一般情况下,比较两个模型的残差比较困难(某些样本点上一个模型的残差的绝对值比另一
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 汉字真有趣课件照片
- 《Photoshop CC平面广告设计》高职全套教学课件
- Unit6 Plan for Yourself单元测试(无答案)人教版(2024)八年级英语上册
- 汉字多的课件
- 新能源汽车充电基础设施建设规
- 高端家电市场品牌竞争策略研究
- 汉子家园言课件
- 水边玩耍的安全教育
- 消防设施功能测试方案
- 建筑工程施工阶段安全监控方案
- 2025年体育教练员执业能力考试试题及答案解析
- 2025年住培结业考试题库及答案
- 2025年重庆辅警管理知识模拟100题及答案
- 创伤急救基本知识培训课件
- DB42∕T 2151-2023 应急物资储备库建设规范
- 2025年二级建造师继续教育题库及参考答案(完整版)
- 胶水储存管理办法
- 精神患者家属健康教育讲座
- 分包招采培训课件
- 公司全员销售管理办法
- 考试真题及答案解析注册安全工程师
评论
0/150
提交评论