2018_2019学年高中数学第三章统计案例3.1回归分析的基本思想及其初步应用学案新人教A版.docx_第1页
2018_2019学年高中数学第三章统计案例3.1回归分析的基本思想及其初步应用学案新人教A版.docx_第2页
2018_2019学年高中数学第三章统计案例3.1回归分析的基本思想及其初步应用学案新人教A版.docx_第3页
2018_2019学年高中数学第三章统计案例3.1回归分析的基本思想及其初步应用学案新人教A版.docx_第4页
2018_2019学年高中数学第三章统计案例3.1回归分析的基本思想及其初步应用学案新人教A版.docx_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

31回归分析的基本思想及其初步应用1.了解随机误差、残差、残差图的概念2.会通过分析残差判断线性回归模型的拟合效果3掌握建立线性回归模型的步骤1回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,回归分析的基本步骤是画出两个变量的散点图,求回归直线方程,并用回归直线方程进行预报2线性回归模型(1)在线性回归直线方程x中,其中xi,yi,(x,y)称为样本点的中心,回归直线过样本点的中心(2)线性回归模型ybxae,其中e称为随机误差,自变量x称为解释变量,因变量y称为预报变量注意(1)非确定性关系:线性回归模型ybxae与确定性函数yabx相比,它表示y与x之间是统计相关关系(非确定性关系),其中的随机误差e提供了选择模型的准则以及在模型合理的情况下探求最佳估计值a,b的工具(2)线性回归方程x中,的意义是:以为基数,x每增加1个单位,y相应地平均增加个单位3刻画回归效果的方式方式方法计算公式刻画效果R2R21R2越接近于1,表示回归的效果越好残差图i称为相应于点(xi,yi)的残差,iyii残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,其中这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高残差平方和 (yii)2残差平方和越小,模型的拟合效果越好 判断正误(正确的打“”,错误的打“”)(1)求线性回归方程前可以不进行相关性检验()(2)在残差图中,纵坐标为残差,横坐标可以选为样本编号()(3)利用线性回归方程求出的值是准确值()答案:(1)(2)(3) 变量x与y之间的回归方程表示()Ax与y之间的函数关系Bx与y之间的不确定性关系Cx与y之间的真实关系形式Dx与y之间的真实关系达到最大限度的吻合答案:D 在两个变量y与x的回归模型中,分别选择了4个不同的模型,它们的相关指数R2如下,其中拟合效果最好的模型是()A模型1的相关指数R2为0.98B模型2的相关指数R2为0.80C模型3的相关指数R2为0.50D模型4的相关指数R2为0.25答案:A 已知线性回归方程0.75x0.7,则x11时,y的估计值为_答案:8.95探究点1线性回归方程在某种产品表面进行腐蚀刻线试验,得到腐蚀深度y与腐蚀时间x之间的一组观察值如下表.x(s)5101520304050607090120y(m)610101316171923252946(1)画出散点图;(2)求y对x的线性回归方程;(3)利用线性回归方程预测时间为100 s时腐蚀深度为多少【解】(1)散点图如图所示(2)从散点图中,我们可以看出y对x的样本点分布在一条直线附近,因而求回归直线方程有意义x(51015120),y(6101046),yx0.3045.36.故腐蚀深度对腐蚀时间的线性回归方程为y0.304x5.36.(3)根据(2)求得的线性回归方程,当腐蚀时间为100 s时,5.360.30410035.76(m),即腐蚀时间为100 s时腐蚀深度大约为35.76 m. 求线性回归方程的三个步骤(1)画散点图:由样本点是否呈条状分布来判断两个量是否具有线性相关关系(2)求回归系数:若存在线性相关关系,则求回归系数(3)写方程:写出线性回归方程,并利用线性回归方程进行预测说明 炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系如果已测得炉料熔化完毕时钢水的含碳量x与冶炼时间y(从炼料熔化完毕到出钢的时间)的数据(xi,yi)(i1,2,10)并已计算出1 589,i1 720,故冶炼时间y对钢水的含碳量x的回归直线方程为1.267x30.47.探究点2线性回归分析假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5组数据如下:x15.025.830.036.644.4y39.442.942.943.149.2(1)以x为解释变量,y为预报变量,作出散点图;(2)求y与x之间的回归方程,对于基本苗数56.7预报有效穗;(3)计算各组残差,并计算残差平方和;(4)求相关指数R2,并说明残差变量对有效穗的影响占百分之几?【解】(1)散点图如下(2)由图看出,样本点呈条状分布,有比较好的线性相关关系,因此可以用回归方程刻画它们之间的关系设回归方程为x,30.36,43.5, (1)该类题属于线性回归问题,解答本题应先通过散点图来分析两变量间的关系是否线性相关,然后再利用求回归方程的公式求解回归方程,并利用残差图或相关指数R2来分析函数模型的拟合效果,在此基础上,借助回归方程对实际问题进行分析(2)刻画回归效果的三种方法残差图法:残差点比较均匀地落在水平的带状区域内说明选用的模型比较合适;残差平方和法:残差平方和(yii)2越小,模型的拟合效果越好; 关于x与y有如下数据:x24568y3040605070由(2)可得yii与yi的关系如下表:yii15893yi201010020由于R0.845,R0.82,0.8450.82,所以RR.所以(1)的拟合效果好于(2)的拟合效果探究点3非线性回归分析某地今年上半年患某种传染病的人数y(人)与月份x(月)之间满足函数关系,模型为yaebx,确定这个函数解析式月份x/月123456人数y/人526168747883【解】设uln y,cln a,得x,则u与x的数据关系如下表:x123456uln y3.954.114.224.3044.356 74.418 8非线性回归方程的步骤(1)确定变量,作出散点图(2)根据散点图,选择恰当的拟合函数(3)变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程(4)分析拟合效果:通过计算相关指数或画残差图来判断拟合效果(5)根据相应的变换,写出非线性回归方程某种书每册的成本费y(元)与印刷册数x(千册)有关,经统计得到数据如下:x(千册)123510203050100200y(元)10.155.524.082.852.111.621.411.301.211.15检验每册书的成本费y(元)与印刷册数的倒数之间是否具有线性相关关系,如有,求出y对x的回归方程,并画出其图形解:首先作变量置换u,题目中所给的数据变成如下表所示的10对数据ui10.50.330.20.10.050.030.020.010.005yi10.155.524.082.852.111.621.411.301.211.15然后作相关性检测经计算得r0.999 80.75,从而认为u与y之间具有线性相关关系,由公式得1.125,8.973,所以1.1258.973u,最后回代u,可得1.125.这就是题目要求的y对x的回归方程回归方程的图形如图所示,它是经过平移的反比例函数图象的一个分支1关于回归分析,下列说法错误的是()A回归分析是研究两个具有相关关系的变量的方法B散点图中,解释变量在x轴,预报变量在y轴C回归模型中一定存在随机误差D散点图能明确反映变量间的关系解析:选D.用散点图反映两个变量间的关系时,存在误差2下列关于统计的说法:将一组数据中的每个数据都加上或减去同一个常数,方差恒不变;回归方程x必经过点(x,y);线性回归模型中,随机误差eyii;设回归方程为5x3,若变量x增加1个单位,则y平均增加5个单位其中正确的为_(写出全部正确说法的序号)解析:正确;正确;线性回归模型中,随机误差的估计值应为iyii,故错误;若变量x增加1个单位,则y平均减少5个单位,故错误答案:3某商场经营一批进价是30元/台的小商品,在市场试销中发现,此商品的销售单价x(x取整数)(元)与日销售量y(台)之间有如下关系:x35404550y56412811(1)画出散点图,并判断y与x是否具有线性相关关系;(2)求日销售量y对销售单价x的线性回归方程(方程的斜率保留一个有效数字);(3)设经营此商品的日销售利润为P元,根据(2)写出P关于x的函数关系式,并预测当销售单价x为多少元时,才能获得最大日销售利润解:(1)散点图如图所示,从图中可以看出这些点大致分布在一条直线附近,因此两个变量具有线性相关关系(2)因为(35404550)42.5, (3)依题意有P(161.53x)(x30)3x2251.5x4 84534 845.所以当x42时,P有最大值,约为426元故预测当销售单价为42元时,能获得最大日销售利润 知识结构深化拓展线性回归模型的模拟效果(1)残差图法:观察残差图,如果残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高(2)残差的平方和法:一般情况下,比较两个模型的残差比较困难(某些样本点上一个模型的残差的绝对值比另一个模型的小,而另一些样本点的情况则相反),故通过比较两个模型的残差的平方和的大小来判断模型的拟合效果残差平方和越小的模型,拟合的效果越好(3)R2法:R2的值越大,说明残差平方和越小,也就是说模型拟合的效果越好注意r的绝对值越大说明变量间的相关性越强,通常认为r的绝对值大于等于0.75时就是有较强的相关性,同样R2也是如此,R2越大拟合效果越好. A基础达标1废品率x%和每吨生铁成本y(元)之间的回归直线方程为2563x,表明()A废品率每增加1%,生铁成本增加259元B废品率每增加1%,生铁成本增加3元C废品率每增加1%,生铁成本平均每吨增加3元D废品率不变,生铁成本为256元解析:选C.回归方程的系数表示x每增加一个单位,平均增加,当x为1时,废品率应为1%,故当废品率增加1%时,生铁成本平均每吨增加3元2已知某产品连续4个月的广告费用为xi(i1,2,3,4)千元,销售额为yi(i1,2,3,4)万元,经过对这些数据的处理,得到如下数据信息:x1x2x3x418,y1y2y3y414;广告费用x和销售额y之间具有较强的线性相关关系;回归直线方程x中,0.8(用最小二乘法求得),那么当广告费用为6千元时,可预测销售额约为()A3.5万元B4.7万元C4.9万元 D6.5万元解析:选B.依题意得x4.5,y3.5,由回归直线必过样本点中心得3.50.84.50.1,所以回归直线方程为0.8x0.1.当x6时,0.860.14.7.3某化工厂为预测某产品的回收率y,需要研究它和原料有效成分含量之间的相关关系,现取了8对观测值,计算得的线性回归方程是()A.11.472.62xB.11.472.62xC.2.6211.47xD.11.472.62x解析:选A.由题中数据得x6.5,y28.5,yx28.52.626.511.47,所以y与x的线性回归方程是2.62x11.47.故选A.4若某地财政收入x与支出y满足线性回归方程ybxae(单位:亿元),其中b0.8,a2,|e|0.5.如果今年该地区财政收入10亿元,则年支出预计不会超过()A10亿元 B9亿元C10.5亿元 D9.5 亿元解析:选C.代入数据y10e,因为|e|0.5,所以9.5y10.5,故不会超过10.5亿元5某种产品的广告费支出x与销售额y(单位:万元)之间的关系如下表:x24568y3040605070y与x的线性回归方程为6.5x17.5,当广告支出5万元时,随机误差的效应(残差)为_解析:因为y与x的线性回归方程为6.5x17.5,当x5时,50,当广告支出5万元时,由表格得:y60,故随机误差的效应(残差)为605010.答案:106若一组观测值(x1,y1),(x2,y2),(xn,yn)之间满足yibxiaei(i1,2,n),且ei恒为0,则R2为_解析:由ei恒为0,知yii,即yii0,故R21101.答案:17某个服装店经营某种服装,在某周内获纯利y(元)与该周每天销售这种服装件数x之间的一组数据关系见表:x3456789y66697381899091已知x280,xiyi3 487.(1)求x,y;(2)已知纯利y与每天销售件数x线性相关,试求出其回归方程解:(1)x6,y.(2)因为y与x有线性相关关系,所以4.75,64.7551.36.故回归方程为4.75 x51.36.8已知某校5个学生的数学和物理成绩如下表:学生的编号i12345数学xi8075706560物理yi7066686462(1)假设在对这5名学生成绩进行统计时,把这5名学生的物理成绩搞乱了,数学成绩没出现问题,问:恰有2名学生的物理成绩是自己的实际分数的概率是多少?(2)通过大量事实证明发现,一个学生的数学成绩和物理成绩具有很强的线性相关关系,在上述表格是正确的前提下,用x表示数学成绩,用y表示物理成绩,求y与x的回归方程;(3)利用残差分析回归方程的拟合效果,若残差和在(0.1,0.1)范围内,则称回归方程为“优拟方程”,问:该回归方程是否为“优拟方程”?参考数据和公式:x,其中解:(1)记事件A为“恰有2名学生的物理成绩是自己的实际成绩”,则P(A).(2)因为x70,y66,iyi112.3B能力提升9.假设关于某设备的使用年限x和所支出的维修费用y(万元)有如表的统计资料:使用年限x23456维修费用y2.23.85.56.57.010(选做题)某地区不同身高的未成年男性的体重平均值如表所示:身高x(cm)60708090100110体重y(kg)6.137.909.9912.1515.0217.50身高x(cm)120130140150160170体重y(kg)20.9226.8631.1138.8547.2555.05(1)试建立y与x之间的回归方程;(2)如果体重超过相同身高男性体重平均值的1.2倍为偏胖,低于0.8倍为偏瘦,那么这个地区一名身高175

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论