高中数学第一章统计案例1.1回归分析的基本思想及其初步应用学案新人教A版.docx_第1页
高中数学第一章统计案例1.1回归分析的基本思想及其初步应用学案新人教A版.docx_第2页
高中数学第一章统计案例1.1回归分析的基本思想及其初步应用学案新人教A版.docx_第3页
高中数学第一章统计案例1.1回归分析的基本思想及其初步应用学案新人教A版.docx_第4页
高中数学第一章统计案例1.1回归分析的基本思想及其初步应用学案新人教A版.docx_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1.1回归分析的基本思想及其初步应用1了解回归分析的思想和方法(重点)2掌握相关系数的计算和判断线性相关的方法(重点)3了解常见的非线性回归模型转化为线性回归模型的方法(难点)基础初探教材整理1线性回归模型阅读教材P2P4“探究”以上内容,完成下列问题1在线性回归方程x中,.其中i,i,(,)称为样本点的中心,回归直线过样本点的中心2线性回归模型ybxae,其中a和b为模型的未知参数,e称为随机误差3随机误差产生的原因主要有以下几种:(1)所用的确定性函数不恰当引起的误差;(2)忽略了某些因素的影响;(3)存在观测误差设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系根据一组样本数据(xi,yi)(i1,2,n),用最小二乘法建立的回归方程为0.85x85.71,则下列结论中正确的是_(填序号)(1)y与x具有正的线性相关关系;(2)回归直线过样本点的中心(,);(3)若该大学某女生身高增加1 cm,则其体重约增加0.85 kg;(4)若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg.【解析】回归方程中x的系数为0.850,因此y与x具有正的线性相关关系,(1)正确;由回归方程系数的意义可知回归直线过样本点的中心(,),(2)正确;依据回归方程中的含义可知,x每变化1个单位,相应变化约0.85个单位,(3)正确;用回归方程对总体进行估计不能得到肯定结论,故(4)不正确【答案】(1)(2)(3)教材整理2刻画回归效果的方式阅读教材P4“探究”以下至P6“例2”以上内容,完成下列问题残差对于样本点(xi,yi)(i1,2,n)的随机误差的估计值iyii,称为相应于点(xi,yi)的残差残差图利用图形来分析残差特性,作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图续表残差图法残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型的拟合精度越高残差平方和残差平方和为,残差平方和越小,模型的拟合效果越好相关指数R2R21,R2表示解释变量对于预报变量变化的贡献率,R2越接近于1,表示回归的效果越好甲、乙、丙、丁4位同学各自对A、B两变量做回归分析,分别得到散点图与残差平方和(yii)2如表所示:甲乙丙丁散点图残差平方和115106124103_(填“甲”“乙”“丙”“丁”)同学的试验结果体现拟合A、B两变量关系的模型拟合精度高【解析】根据线性相关的知识,散点图中各样本点条状分布越均匀,同时保持残差平方和越小(对于已经获取的样本数据,R2表达式中(yi)2为确定的数,则残差平方和越小,R2越大),由回归分析建立的线性回归模型的拟合效果就越好,由试验结果知丁要好些【答案】丁小组合作型回归分析的有关概念(1)有下列说法:线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的数学方法;利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;通过回归方程x,可以估计和观测变量的取值和变化趋势;因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验其中正确命题的个数是()A1B2 C3D4(2)如果某地的财政收入x与支出y满足线性回归方程xe(单位:亿元),其中0.8,2,|e|0.5,如果今年该地区财政收入10亿元,则今年支出预计不会超过_亿. 【导学号:81092000】【自主解答】(1)反映的是最小二乘法思想,故正确反映的是画散点图的作用,也正确解释的是回归方程x的作用,故也正确是不正确的,在求回归方程之前必须进行相关性检验,以体现两变量的关系(2)由题意可得:0.8x2e,当x10时,0.8102e10e,又|e|0.5,9.510.5.故今年支出预计不会超过10.5亿【答案】(1)C(2)10.51在分析两个变量的相关关系时,可根据样本数据散点图确定两个变量之间是否存在相关关系,然后利用最小二乘法求出回归直线方程2由线性回归方程给出的是一个预报值而非精确值3随机误差的主要来源(1)线性回归模型与真实情况引起的误差;(2)忽略了一些因素的影响产生的误差;(3)观测与计算产生的误差4残差分析是回归分析的一种方法再练一题1下列有关线性回归的说法,不正确的是_(填序号)自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系;在平面直角坐标系中用描点的方法得到表示具有相关关系的两个量的一组数据的图形叫做散点图;线性回归方程最能代表观测值x,y之间的关系;任何一组观测值都能得到具有代表意义的回归直线方程【解析】只有具有线性相关的两个观测值才能得到具有代表意义的回归直线方程【答案】线性回归分析为研究重量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同重量的6个物体进行测量,数据如下表所示:x51015202530y7.258.128.959.9010.911.8(1)作出散点图并求线性回归方程;(2)求出R2;(3)进行残差分析【精彩点拨】【自主解答】(1)散点图如图(51015202530)17.5,(7.258.128.959.9010.911.8)9.487,2 275,iyi1 076.2,计算得,0.183,6.285,所求回归直线方程为0.183x6.285.(2)列表如下:yii0.050.0050.080.0450.040.025yi2.241.370.540.411.412.31所以(yii)20.013 18,(yi)214.678 4.所以,R210.999 1,回归模型的拟合效果较好(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与拉力成线性关系“相关指数R2、残差图”在回归分析中的作用1相关指数R2是用来刻画回归效果的,由R21可知,R2越大,意味着残差平方和越小,也就是说模型的拟合效果就越好2残差图也是用来刻画回归效果的,判断依据是残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合精度越高,回归方程预报的精度也越高再练一题2已知某种商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:x1416182022y1210753求y对x的回归直线方程,并说明回归模型拟合效果的好坏. 【导学号:81092001】【解】(1416182022)18,(1210753)7.4,1421621822022221 660,iyi14121610187205223620,所以1.15.7.41.151828.1,所以所求回归直线方程是1.15x28.1.列出残差表:yii00.30.40.10.2yi4.62.60.42.44.4所以,(yii)20.3,(yi)253.2,R210.994,所以回归模型的拟合效果很好探究共研型非线性回归分析探究1在研究两个变量的相关关系时,观察散点图样本点集中于某一条指数曲线ycax(a0且a1,c0,a,c为常数)的周围,如何进行适当变换化为线性关系?【提示】对ycax两边取自然对数ln yln(cax),即ln yln cxln a,令原方程变为yln cxln a,然后按线性回归模型求出ln a,ln c即可探究2已知x和y之间的一组数据,则下列四个函数中,模拟效果最好的为哪一个?x123y35.9912.01y32x1; ylog2x;y4x; yx2.【提示】观察散点图中样本点的分布规律可判断样本点分布在曲线y32x1附近所以模拟效果最好的为.某地区不同身高的未成年男性的体重平均值如下表:身高x(cm)60708090100110体重y(kg)6.137.909.9912.1515.0217.50身高x(cm)120130140150160170体重y(kg)20.9226.8631.1138.8547.2555.05(1)试建立y与x之间的回归方程;(2)如果一名在校男生身高为168 cm,预测他的体重约为多少?【精彩点拨】先由散点图确定相应的拟合模型,再通过对数变换将非线性相关转化为线性相关的两个变量来求解【自主解答】(1)根据表中的数据画出散点图,如下:由图看出,这些点分布在某条指数型函数曲线yc1ec2x的周围,于是令zln y,列表如下:x60708090100110z1.812.072.302.502.712.86x120130140150160170z3.043.293.443.663.864.01作出散点图,如下:由表中数据可求得z与x之间的回归直线方程为0.6930.020x,则有e0.6930.020x.(2)由(1)知,当x168时,e0.6930.02016857.57,所以在校男生身高为168 cm,预测他的体重约为57.57 kg.两个变量不具有线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型,如yc1ec2x,我们可以通过对数变换把指数关系变为线性关系,令zln y,则变换后样本点应该分布在直线zbxa(aln c1,bc2)的周围. 再练一题3在一次抽样调查中测得样本的5个样本点,数据如下表:x0.250.5124y1612521试建立y与x之间的回归方程【解】作出变量y与x之间的散点图如图所示由图可知变量y与x近似地呈反比例函数关系设y,令t,则ykt.由y与x的数据表可得y与t的数据表:t4210.50.25y1612521作出y与t的散点图如图所示由图可知y与t呈近似的线性相关关系又1.55,7.2,iyi94.25,21.312 5,4.134 4,7.24.134 41.550.8,4.134 4t0.8.所以y与x的回归方程是0.8.1下列结论正确的是()函数关系是一种确定性关系;相关关系是一种非确定性关系;回归分析是对具有函数关系的两个变量进行统计分析的一种方法;回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法ABCD【解析】函数关系和相关关系的区别是前者是确定性关系,后者是非确定性关系,故正确;回归分析是对具有相关关系的两个变量进行统计分析的一种方法,故错误,正确【答案】C2下表是x和y之间的一组数据,则y关于x的线性回归方程必过点()x1234y1357A.(2,3)B(1.5,4)C(2.5,4)D(2.5,5)【解析】线性回归方程必过样本点的中心(,),即(2.5,4),故选C.【答案】C3在两个变量y与x的回归模型中,分别选择了4个不同的模型它们的相关指数R2如下,其中拟合效果最好的模型是()A模型1的相关指数R2为0.98B模型2的相关指数R2为0.80C模型3的相关指数R2为0.50D模型4的相关指数R2为0.25【解析】相关指数R2越接近于1,则该模型的拟合效果就越好,精度越高【答案】A4对具有线性相关关系的变量x和y,由测得的一组数据求得回归直线的斜率为6.5,且恒过(2,3)点,则这条回归直线的方程为_. 【导学号:81092002】【解析】由题意知2,3,6.5,所以36.5210,即回归直线的方程为106.5x.【答案】106.5x5某零售店近五个月的销售额和利润额资料如下表: 月份ABCDE销售额x(千万元)35679利润额y(百万元)23345(1)画出散点图观察散点图,说明两个变量有怎样的相关关系;(2)用最小二乘法求利润额y关于销售额x的线性回归方程;(3)当销售额为4(千万元)时,利用(2)的结论估计该零售店的利润额(百万元)【解】(1)散点图如下两个变量呈正线性相关关系(2)设线性回归方程是x.由题中的数据可知3.4,6.所以.3.460.4.所以利润额y关于销售额x的线性回归方程为0.5x0.4.(3)由(2)知,当x4时,0.540.42.4,所以当销售额为4千万元时,可以估计该店的利润额为2.4百万元学业分层测评(建议用时:45分钟)学业达标一、选择题1在画两个变量的散点图时,下面叙述正确的是()A预报变量在x轴上,解释变量在y轴上B解释变量在x轴上,预报变量在y轴上C可以选择两个变量中任意一个变量在x轴上D可以选择两个变量中任意一个变量在y轴上【解析】结合线性回归模型ybxae可知,解释变量在x轴上,预报变量在y轴上,故选B.【答案】B2在回归分析中,相关指数R2的值越大,说明残差平方和()A越大B越小C可能大也可能小D以上均错【解析】R21,当R2越大时,(yii)2越小,即残差平方和越小,故选B.【答案】B3已知x和y之间的一组数据x0123y1357则y与x的线性回归方程x必过点()A(2,2)B.C(1,2)D.【解析】(0123),(1357)4,回归方程x必过点.【答案】D4已知人的年龄x与人体脂肪含量的百分数y的回归方程为0.577x0.448,如果某人36岁,那么这个人的脂肪含量() 【导学号:81092003】A一定是20.3%B在20.3%附近的可能性比较大C无任何参考数据D以上解释都无道理【解析】将x36代入回归方程得0.577360.44820.3.由回归分析的意义知,这个人的脂肪含量在20.3%附近的可能性较大,故选B.【答案】B5若一函数模型为yax2bxc(a0),为将y转化为t的线性回归方程,则需作变换t()Ax2B(xa)2C.2D以上都不对【解析】y关于t的线性回归方程,实际上就是y关于t的一次函数,又因为ya2,所以可知选项C正确【答案】C二、填空题6在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi)(i1,2,n)都在直线yx1上,则这组样本数据的样本相关系数为_【解析】根据样本相关系数的定义可知,当所有样本点都在直线上时,相关系数为1.【答案】17已知方程0.85x82.71是根据女大学生的身高预报她的体重的回归方程,其中x的单位是cm,的单位是kg,那么针对某个体(160,53)的残差是_【解析】把x160代入0.85x82.71,得0.8516082.7153.29,所以残差y5353.290.29.【答案】0.298调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:0.254x0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加_万元【解析】以x1代x,得0.254(x1)0.321,与0.254x0.321相减可得,年饮食支出平均增加0.254万元【答案】0.254三、解答题9关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料:x23456y2.23.85.56.57.0如由资料可知y对x呈线性相关关系试求:(1)线性回归方程:(2)估计使用年限为10年时,维修费用是多少?【解】(1)4,5,90,iyi112.3,1.23.于是 51.2340.08.所以线性回归方程为1.23x0.08.(2)当x10时,1.23100.0812.38(万元),即估计使用10年时维修费用是12.38万元10关于x与y有如下数据:x24568y3040605070为了对x,y两个变量进行统计分析,现有以下两种线性模型:甲模型6.5x17.5,乙模型7x17,试比较哪一个模型拟合的效果更好【解】R110.845,R110.82,因为84.5%82%,所以甲模型拟合效果更好能力提升1某学生四次模拟考试时,其英语作文的减分情况如下表: 考试次数x1234所减分数y4.5432.5 显然所减分数y与模拟考试次数x之间有较好的线性相关关系,则其线性回归方程为()Ay0.7x5.25By0.6x5.25Cy0.7x6.25Dy0.7x5.25 【解析】由题意可知,所减分数y与模拟考试次数x之间为负相关,所以排除A.考试次数的平均数为(1234)2.5,所减分数的平均数为(4.5432.5)3.5.即直线应该过点(2.5,3.5),代入验证可知直线y0.7x5.25成立,选D.【答案】D2已知x与y之间的几组数据如下表:x123456y021334假设根据上表数据所得线性回归直线方程为.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论