高中数学第三章统计案例3.1第2课时残差分析及回归模型的选择学案新人教A版.docx_第1页
高中数学第三章统计案例3.1第2课时残差分析及回归模型的选择学案新人教A版.docx_第2页
高中数学第三章统计案例3.1第2课时残差分析及回归模型的选择学案新人教A版.docx_第3页
高中数学第三章统计案例3.1第2课时残差分析及回归模型的选择学案新人教A版.docx_第4页
高中数学第三章统计案例3.1第2课时残差分析及回归模型的选择学案新人教A版.docx_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

3.1 第二课时 残差分析及回归模型的选择 一、课前准备1.课时目标(1) 了解残差分析回归效果;(2) 了解相关指数分析回归效果;(3) 了解常见的非线性回归转化为线性回归的方法.2.基础预探1.在线性回归模型中,为模型的未知参数,与之间的误差,通常为随机变量,称为_.它的均值E()0,方差.线性回归模型的完整表达形式为.在此模型中,随机误差的方差越小,通过回归直线预报真实值的精度越高. 2.对于样本点而言,相应于它们的随机误差为,其估计值为,称为相应于点的_.类比样本方差估计总体方差的思想,可以用(2)作为的估计量,其中由公式给出,称为残差平方和.可以用衡量回归直线方程的预报精度.通常越小,预报精度越高. 3.在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据.然后,可以通过残差来判断模型拟合的效果,判断原始数据中是否存在可疑数据.这方面的分析工作称为_.4.用相关指数来刻画回归的效果,其计算公式是:.显然取值越大,意味着残差平方和_,也就是说模型的拟合效果_. 二、学习引领1. 进行回归分析的步骤是什么?(1)确定研究对象,明确是哪两个变量之间的相关关系.(2)画出散点图,观察它们之间的关系是否存在线性关系,也可计算变量间的线性相关系数的值来精确判断它们之间是否存在相关关系.如果不存在线性相关关系,判断散点图是否存在非线性相关关系. (3)若存在相关关系,则由经验确定回归方程的类型:如观察到数据呈线性关系,则选用线性回归方程=bx+a;否则可选择指数模型、对数模型或二次函数模型等.(4)利用残差图或者相关指数对回归效果进行判断2.随机误差的产生及估计的方法(1)在实际中,随机变量除了受随机变量的影响之外,还受其它变量的影响;(2)由于前面相关关系公式中的为截距和斜率的估计值,它们与真实值之间也存在误差.(3)因为随机误差是随机变量,因此可以通过这个随机变量的数字特征来刻画它的一些总体特征.均值是反映随机变量取值平均水平的数字特征,方差是反映随机变量集中于均值程度的数字特征,而随机变量的均值为0,因此可以用方差来衡量随机误差的大小.3.如何利用判断回归效果在线性回归模型中,表示解释变量对于预报变量变化的贡献率. 越接近于1,表示回归的效果越好(因为越接近于1,表示解释变量和预报变量的相关性越强).如果对某组数据可能采取几种不同的回归方程进行回归分析.也可以通过比较几个,选择其值大的模型.4.常见的可线性化的回归模型(1)幂函数曲线y=axb(如图所示), 作变换u=lny ,v=lnx,c=lna,得线性函数u=c+bv.(2)指数函数y=aebx(如图所示) 作变换u=lny, c= lna,得线性函数u=c+bx.(3)倒指数曲线y=a(如图所示).(4)对数曲线y=a+blnx(如图所示) 三、典例导析题型一 相关系数的应用例1 下表为某地近几年机动车辆数与交通事故数的统计资料,请判断交通事故数与机动车辆数是否有线性相关关系?机动车辆数 x/千台95110112120129135150180交通事故数 y/千件 6.27.57.78.58.79.810.213.0思路点拨:先列表计算出相关系数所需数据,代入公式即可求出相关系数r,由此判断交通事故数y与机动车辆数x是否线性相关.解析:将数据列成下表由此可知=128.875 =8.95,进而求得 r=.因为|r|接近1 ,所以可得交通事故数y和机动车辆数x有较强的线性相关关系.规律总结:进行回归分析时, 通常先进行相关性检验, 若能确定两个变量具有线性相关关系, 再去求其线性回归方程, 否则所求的方程无意义.两个变量正(负)相关时, 它们就有相同(反)的变化趋势,即当由小变大时,相应的有由小(大)变大(小)的趋势.变式训练:某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系?从这个工业部门内随机抽取了10个企业作样本,有如下资料.见下表.产量x (千克)40424855657988100120140生产费用y(千元)150140160170150162185165190185完成下列要求:(1)计算x与y的相关系数;(2)对这两个变量之间是否线性相关进行相关性检验。题型二 残差分析某城区为研究城镇居民月家庭人均生活费支出和月人均收人的相关关系.随机抽取10户进行调查.其结果如下:月人均收人 x(元) 3003904205205707007608008501080月人均生活费 y (元)255324335360450520580600630750 试预测人均月收人为1100元和人均月收入为1200元的两个家庭的月人均生活费.思路导析:列表计算出相关系数所需数据,代入公式即可求出相关系数r,初步判断两个变量之间是否具备相关性,然后做出残差图判断选用的模型是否合适.解析:作出散点分布图,由图可知月人均生活费与人均收人之间具有线性相关关系.由题意可知:,计算相关系数可得 r=0.99316,因为|r|接近1 ,所以可得两个变量有较强的线性相关关系.代入公式可知=0.6599 , =-=58.751.故回归直线方程为=0.6599x+58.751.作残差如图所示,由图可知,残差点比较均匀地分布在水平的带状区域中,说明选用的模型比较合适.计算相关指数R2=0.986 3,说明城镇居民的月人均生活费的差异有98.63是由人均收人引起的. 由以上分析可知.我们可以利用回归方程=0.6599x-58.751来作月生活费的预报值. 将x=1100代人得,=784.64(元); 将x=1200代人得,=850.63(元).故预测月人均收人分别为1100元和l200元的两家庭的月人均生活费分别为784.64元和850.63元归律总结:如果作出的残差图中的残差点比较均匀地分布在水平的带状区域中,带状区域宽度越窄,说明模型拟合程度越高,回归方程的预报精度越高.若利用相关指数R2来刻画拟合效果的好坏,R2的取值越接近1,说明残差的平方和越小,即说明模型的拟合效果越好.变式训练:在一段时间内,某种商品的价格x(元)与需求量y(件)之间的数据为价格x(元)1416182022需求量y(件)5650434137求出y对x的回归直线方程,并说明拟合效果的好坏.题型三:非线性回归分析例3 现代经济学证明,工厂生产产品的成本与其产量有关,产量越大,其成本越低.某饰品工艺厂在生产某种民族特色艺术品时,得到了每件饰品的成本费y(元)与产量x(百件)之间的如下数据:x 1 23 5 10y 10.15 5.52 4.08 2.85 2.11x 20 30 50 100 200y 1.62 1.41 1.30 1.21 1.15检验每件饰品的成本费y与产量x之间是否具有线性相关关系,若有,求出y对x的回归方程;若没有,你能求出y与x的一个关系式吗?思路导析:通过散点图观察两个变量具备怎样的相关关系,根据相关关系的特征选择合适的模型,将非线性相关的关系通过置换变为线性相关关系,然后求出成本与产量之间的关系.解析:画出x和y的散点图,如图.图中的点的分布不在一条直线附近,故每件饰品的成本费y与产量x间不具有线性相关关系,又图中的点的分布近似于反比例函数中的一支,故可把置换为u,检验y与u之间的相关关系,则有u,从而u与y的数据为u10.50.330.20.10.050.030.020.010.005yi10.155.524.082.852.111.621.411.301.211.15然后作相关性检验.经计算得r=0.9998,因为|r|接近于1,所以可以认为两个变量y与u之间具有较强线性相关关系;由公式得=1.125, =8.973,所以=1.125+8.973u,最后回代u=,可得.答:y对x的回归方程为.方法规律:非线性回归问题要先根据已知的数据画出散点图,并把散点图与已经学习过的各种函数,如幂函数、指数函数、对数函数、二次函数等作比较,挑选出跟这些散点拟合最好的函数,然后再采用变量的置换,把问题转化为线性回归分析问题解决.变式训练:在兰新化工厂生产某种化学药品的生产车间内,技术人员测得如下表所示的6组数据,其中表示化学反应进行的时间,表示未转化物质的量.12345625.420.316.213.3(1)设与之间具有关系,试根据测量数据估计和的值.(2)估计化学反应进行到时未转化的物质的量.四、随堂练习1.变量x、y的散点图如图所示,那么x、y之间的样本相关系数r的最接近的值为( ) A.1 B.0.5 C.0 D.0.52.为了考察两个变量和之间的线性相关性.甲、乙两位同学各自独立地做10次和15次试验,并且利用线性回归方程,求得回归直线分别为.已知两个人在试验中发现对变量的观测数据的平均值都是,对变量的观测数据的平均值都为,那么下列说法正确的是()A. 相交点为(,); B.相交,相交点不一定是(,);C. 必关于点(,)对称; D. 必定重合.3.对于相关系数,下列说法中正确的是( )A.越大,相关程度越大B.越小,相关程度越大C.越大,相关程度越小;越小,相关程度越大D.且越接近,相关程度越大;越接近,相关程度越小4.如图所示,有5组数据(x,y),去掉_组数据后,剩下的4组数据的线性相关系数最大. 5. 已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的方程是_。6. 某产品的广告费用支出与销售额(单位:百万元)之间有如下统计数据:245683040605070请对上述变量、进行相关性检验.五、课后作业1. 某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是 ( )A. B. C. D. 2.对两个变量x与y进行回归分析,分别选择了4个不同模型,它们的相关系数r如下,其中拟合效果最好的模型是( )A模型1的相关系数r为098B模型2的相关系数r为080C模型3的相关系数r为050D模型4的相关系数r为0253.线性相关的四个样本点的中心是,则4.已知一系列样本点的回归直线方程为,若,则 5.某矿脉中设有9个样本点,某种金属的含量与样本点到原点的距离有如下表的测量值:234578101518106.42108.20109.58109.50110.00109.93110.49110.90111.00请按建立对的回归方程,并预测当样本点到原点的距离时,该种金属的含量.6.假定小麦基本苗数与成熟期有效穗之间存在相关关系,今测得5组数据如下:15.025.830.036.644.439.442.942.943.149.2(1)求与之间的回归方程,对于基本苗数56.7预报有效穗.(2)计算各组残差,并计算残差平方和.(3)求,并说明残差变量对有效穗的影响占百分之几?参考答案3.1 第二课时 选择回归模型 2.基础预探1.随机误差 2.残差 3. 残差分析 4. 越小 越好三、典例导析例1 变式训练解析:由题意可知:,. r=.因为|r|接近1,所以可得两个变量有较强的线性相关关系.例2 变式训练解析:由题意可知:,代入公式可知=-2.35, =-=87.7 ,故所求回归直线方程为=-2.35x+87.7.列出残差表为:1.2-0.1-2.40.3110.64.6-2.4-4.4-8.4所以,代入公式可知R2=1-0.964.因为0.964接近于1,所以该模型的拟合效果好. 例3 变式训练解析:(1)在的两边取自然对数,可以得到.设,则,则由已知数据可以得到下表:12345625.420.316.213.33.6843.4723.2353.0112.7852.588由公式计算得, 线性回归方程为,即,所以,根据测量数据估计,.(2)由(1)知与之间的关系为,当时,=.所以估计化学反应进行到时未转化物质的量为.四、随堂练习1. 答案:C解析:从散点图可以看出,x与y没有线性相关关系,因而r的值接近于0.2答案:A解析:设回归直线方程为,则,即 ,可得出.所以点(,)在回归直线上,所以直线一定有公共点(,).3.答案:D解析:由两个变量的相关系数公式可知,相关程度的强弱与的接近程度有关,越接近,相关程度越大;越接近,相关程度越小.4.答案:D解析:当各点分布在一条直线附近时,相关系数最大,由图中可知,A、B、C、E四点分布在一条直线附近,而D点远离这条直线,故去掉D点后,相关性最强,相关系数最大.5.解析:设回归直线方程为,依题意可知,又样本点的中心(4,5)在直线上,即即,所以回归直线的方程为.6.解:由题意可以列表如下:i12345xi24658yi3040506070xi yi60160300300560由上代入公式可得,因为|r|接近于1,说明广告费用和销售额之间具有显著线性关系.五、课后作业1. 答案:A解:因为销量与价格负相关,由函数关系考虑为减函数可排除B、D,根据回归直线方程中的统计学意义知不能为负数,再排除C选项,所以选A.2.答案:A 解析:r越接近于1,拟合效果越好。3.答案:,解析:由,4.答案:解析:因为.5.解析:对作一个变换,将其转化成线性问题.为此,令,则得线性关系式,化归到线性回归方程.将上表中的数据作相应的变换,得下表:0.50.330.250.20.1430.1250.10.0670.0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论