2018_2019年高中数学第三章统计案例3.1回归分析的基本思想及其初步应用学案.docx_第1页
2018_2019年高中数学第三章统计案例3.1回归分析的基本思想及其初步应用学案.docx_第2页
2018_2019年高中数学第三章统计案例3.1回归分析的基本思想及其初步应用学案.docx_第3页
2018_2019年高中数学第三章统计案例3.1回归分析的基本思想及其初步应用学案.docx_第4页
2018_2019年高中数学第三章统计案例3.1回归分析的基本思想及其初步应用学案.docx_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

31回归分析的基本思想及其初步应用 教材研读预习教材P8088,思考以下问题1什么是回归分析?2什么是线性回归模型?要点梳理1回归分析(1)回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法(2)回归方程的相关计算对于两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn)设其回归直线方程为x,其中,是待定参数,由最小二乘法得,.(3)线性回归模型线性回归模型,其中a,b为模型的未知参数,通常e为随机变量,称为随机误差x称为解释变量,y称为预报变量2线性回归分析(1)残差:对于样本点(xi,yi)(i1,2,n)的随机误差的估计值iyii称为相应于点(xi,yi)的残差,(yii)2称为残差平方和(2)残差图:利用图形来分析残差特性,作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形称为残差图(3)R21越接近1,表示回归的效果越好自我诊断判断(正确的打“”,错误的打“”)1残差平方和越小,线性回归方程的拟合效果越好()2在画两个变量的散点图时,预报变量在x轴上,解释变量在y轴上()3R2越小,线性回归方程的拟合效果越好()答案1.2.3.思考:求线性回归方程的步骤是什么?提示:列表表示xi,yi,xiyi,x;计算,iyi;代入公式计算,的值;写出线性回归方程 某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据x681012y2356(1)请画出上表数据的散点图;(要求:点要描粗)(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程x;(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力思路导引先画散点图,再求回归系数,写出方程解(1)如图:(2)iyi6283105126158,9,4,6282102122344,0.7, 40.792.3,故线性回归方程为0.7x2.3.(3)由(2)中线性回归方程当x9时,0.792.34,预测记忆力为9的同学的判断力约为4.求线性回归方程的三个步骤(1)画散点图:由样本点是否呈条状分布来判断两个量是否具有线性相关关系(2)求回归系数:若存在线性相关关系,则求回归系数(3)写方程:写出线性回归方程,并利用线性回归方程进行预测说明【温馨提示】对回归直线的四点说明(1)回归直线过点(,)(2)回归直线的截距a和斜率b都是通过样本估计而得的,存在着误差,这种误差可能导致预报结果的偏差(3)线性回归方程yabx中的b表示x增加1个单位时,y的平均变化量为b,而a表示y不随x的变化而变化的部分(4)可以利用线性回归方程yabx预报在x取某个值时,y的估计值跟踪训练(链接教材P81例1)某种产品的广告费用支出x与销售额y(单位:百万元)之间有如下的对应数据:x/百万元24568y/百万元3040605070(1)画出散点图;(2)求线性回归方程;(3)试预测广告费用支出为10百万元时的销售额解(1)散点图如图所示:(2)列出下表,并用科学计算器进行有关计算:i12345合计xi2456825yi3040605070250xiyi601603003005601380x416253664145所以,5,50,x145,xiyi1380.于是可得6.5,506.5517.5.所以所求的线性回归方程为6.5x17.5.(3)根据(2)中求得的线性回归方程,当广告费用支出为10百万元时,6.51017.582.5(百万元),即广告费用支出为10百万元时,销售额大约为82.5百万元题型二线性回归分析思考:如何用残差图、残差平方和、相关指数R2分析模型拟合效果?提示:残差图的带状区域的宽度越窄,模型拟合精度越高;残差平方和越小,模型拟合效果越好;R2越接近于1,模型拟合效果越好 假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5组数据如下:x15.025.830.036.644.4y39.442.942.943.149.2(1)以x为解释变量,y为预报变量,作出散点图;(2)求y与x之间的回归方程,对于基本苗数56.7预报有效穗;(3)计算各组残差,并计算残差平方和;(4)求R2,并说明残差变量对有效穗的影响占百分之几?解(1)散点图如下(2)由(1)中散点图看出,样本点大致分布在一条直线的附近,有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系设回归方程为x,30.36,43.5,x5101.56,y9511.43.1320.66,2921.7296,xiyi6746.76.则0.29,34.70.故所求的回归直线方程为0.29x34.70.当x56.7时,0.2956.734.7051.143.估计成熟期有效穗为51.143.(3)由于ixi,可以算得iyii分别为10.35,20.718,30.5,42.214,51.624,残差平方和:8.43.(4)(yi)250.18,故R210.832.所以解释变量小麦基本苗数对总效应约贡献了83.2%,残差变量贡献了约183.2%16.8%.(1)利用残差分析研究两个变量间的关系时,首先要根据散点图来判断它们是否线性相关,是否可以用线性回归模型来拟合数据,然后通过残差1,2,n来判断模型拟合的效果(2)若残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合度越高,回归方程预报精确度越高跟踪训练为研究质量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同质量的6个物体进行测量,数据如表所示:x51015202530y7.258.128.959.9010.911.8(1)作出散点图并求线性回归方程(2)求出R2.(3)进行残差分析解(1)作出散点图如图所示:(51015202530)17.5.(7.258.128.959.9010.911.8)9.487,x2275,xiyi1076.2,计算得,0.183,6.285,所求回归直线方程为6.2850.183x.(2)列表如下:yii0.050.0050.080.0450.040.025yi2.241.370.540.411.412.31所以(yii)20.01318,(yi)214.6784.所以,R210.9991.所以回归模型的拟合效果较好(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与质量具有线性关系 (链接教材P86例2)某地区六年来轻工业产品利润总额y与年次x的试验数据如下表所示:年次x123456利润总额y11.3511.8512.4413.0713.5914.41由经验知,年次x与利润总额y(单位:亿元)近似有如下关系:yabxe0.其中a,b均为正数,求y关于x的回归方程思路导引解答此题可根据散点图选择恰当的拟合函数,而本题已经给出,只需将其转化为线性函数,利用最小二乘法求得回归直线方程,再将其还原为非线性回归方程即可解对yabxe0两边取自然对数,得lnylnae0xlnb,令zlny,则z与x的数据如下表:x123456z2.432.472.522.572.612.67由zlnae0xlnb及最小二乘法公式,得lnb0.0477,lnae02.378,即2.3780.0477x,故10.81.05x.非线性回归问题的处理方法一般地,有些非线性回归模型通过变换可以转化为线性回归模型,即借助于线性回归模型研究呈非线性回归关系的两个变量之间的关系:(1)如果散点图中的点分布在一个直线状带形区域,可以选用线性回归模型来建模;(2)如果散点图中的点分布在一个曲线状带形区域,要先对变量作适当的变换,再利用线性回归模型来建模(3)非线性回归方程的求法:根据原始数据(x,y)作出散点图;根据散点图,选择恰当的拟合函数;作恰当的变换,将其转化成线性函数,求线性回归方程;在的基础上通过相应的变换,即可得非线性回归方程(4)非线性相关问题常见的几种线性变换:在实际问题中,常常要根据一批实验数据绘出曲线,当曲线类型不具备线性相关关系时,可以根据散点分布的形状与已知函数的图象进行比较,确定曲线的类型,再作变量替换,将曲线改为直线下面是几种容易通过变量替换转化为直线的函数模型:ya,令yy,x,则有yabx;yaxb,令ylny,xlnx,alna,则有yabx;yaebx,令ylny,xx,alna,则有yabx;yae,令ylny,x,alna,则有yabx;yablnx,令yy,xlnx,则有yabx;ybx2a,令yy,xx2,则有ybxa.跟踪训练某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值(xi)2(wi)2(xi)(yi)(wi)(yi)46.65636.8289.81.61469108.8表中wi,wi.(1)根据散点图判断,yabx与ycd哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程(3)已知这种产品的年利润z与x,y的关系为z0.2yx.根据(2)的结果回答下列问题:年宣传费x49时,年销售量及年利润的预报值是多少?年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),(un,vn),其回归线vu的斜率和截距的最小二乘估计分别为:,.解(1)由散点图的变化趋势可以判断,ycd适宜作为年销售量y关于年宣传费x的回归方程类型(2)令w,先建立y关于w的线性回归方程由于68,563686.8100.6,所以y关于w的线性回归方程为100.668w,因此y关于x的回归方程为100.668.(3)由(2)知,当x49时,年销售量y的预报值100.668576.6,年利润z的预报值576.60.24966.32.根据(2)的结果知,年利润z的预报值0.2(100.668)xx13.620.12.所以当6.8,即x46.24时,取得最大值故年宣传费为46.24千元时,年利润的预报值最大1.本节课的重点是线性回归方程的求法及线性回归分析,难点是残差分析和非线性回归分析2本节课要重点掌握的规律方法(1)求线性回归方程,见典例1;(2)线性回归分析

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论