2019版高考数学复习算法初步第66讲变量间的相关关系与统计案例学案.docx_第1页
2019版高考数学复习算法初步第66讲变量间的相关关系与统计案例学案.docx_第2页
2019版高考数学复习算法初步第66讲变量间的相关关系与统计案例学案.docx_第3页
2019版高考数学复习算法初步第66讲变量间的相关关系与统计案例学案.docx_第4页
2019版高考数学复习算法初步第66讲变量间的相关关系与统计案例学案.docx_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第66讲变量间的相关关系与统计案例考纲要求考情分析命题趋势1.会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系2了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程3了解常见的统计方法,并能应用这些方法解决一些实际问题4了解独立性检验(只要求22列联表)的基本思想、方法及其简单应用5了解回归分析的基本思想、方法及其简单应用.2017全国卷,192016全国卷,182015全国卷,32015福建卷,41.散点图与相关关系、线性回归方程与独立性检验在实际生活中的应用2有关统计内容及方法主要以选择题、填空题的形式呈现,属容易题;抽样方法和各种统计图表与概率的有关内容相结合或与统计案例相结合也会出现在解答题中,属中档题.分值:512分1相关关系与回归方程(1)相关关系的分类正相关:从散点图上看,点散布在从_左下角_到_右上角_的区域内负相关:从散点图上看,点散布在从_左上角_到_右下角_的区域内(2)线性相关关系从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫_回归直线_(3)回归方程最小二乘法:使得样本数据的点到回归直线的_距离的平方和_最小的方法叫最小二乘法回归方程:两个具有线性相关关系的变量的一组数据为(x1,y1),(x2,y2),(xn,yn),其回归方程为x,其中其中(,)称为样本点的中心(4)样本相关系数r,用它来衡量两个变量间的线性相关关系的强弱当r0时,表明两个变量_正相关_;当r0时,表明两个变量_负相关_;r的绝对值越接近1,表明两个变量的线性相关性_越强_;r的绝对值越接近0,表明两个变量的线性相关性_越弱_,通常当0.75时,认为两个变量有很强的线性相关关系2独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量(2)列联表:列出两个分类变量的频数表,称为列联表假设有两个分类变量X和Y,它们的可能取值分别为和,其样本频数列联表(称为22列联表)如下.y1y2总计x1ababx2cdcd总计acbdabcdK2(其中n_abcd_为样本容量),则利用独立性检验判断表来判断“X与Y的关系”1思维辨析(在括号内打“”或打“”)(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系()(2)利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系去表示()(3)通过回归方程x可以估计和观测变量的取值和变化趋势()(4)任何一组数据都对应着一个回归直线方程()(5)事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越大()2观察下列各图:其中两个变量x,y具有相关关系的图是(C)ABCD解析 由散点图知具有相关关系3已知x,y的取值如下表,从散点图可以看出y与x线性相关,且回归方程为0.95x,则(B)x0134y2.24.34.86.7A3.25B2.6C2.2D0解析 由已知得2,4.5,因为回归方程经过点(,),所以a4.50.9522.6.4若回归直线方程为21.5,则变量x增加一个单位,y(C)A平均增加1.5个单位B平均增加2个单位C平均减少1.5个单位D平均减少2个单位解析 因为回归直线方程为 21.5x,所以1.5,则变量x增加一个单位,y平均减少1.5个单位5在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是 (C)A若K2的观测值为k6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病B从独立性检验可知,有99%的把握认为吸烟与患肺病有关时,我们说某人吸烟,那么他有99%的可能患有肺病C若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误D以上三种说法都不正确解析 根据独立性检验的思想知C项正确一相关关系的判断判定两个变量正、负相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关(2)相关系数:r0时,正相关;r0时,正相关;0时,负相关(4)相关关系的直观判断方法就是作出散点图,若散点图呈带状且区域较窄,说明两个变量有一定的线性相关性,若呈曲线型也是有相关性,若呈图形区域且分布较乱则不具备相关性【例1】 (1)为研究语文成绩和英语成绩之间是否具有线性相关关系,统计某班学生的两科成绩得到如图所示的散点图(x轴、y轴的单位长度相同),用回归直线方程x近似地刻画其相关关系,根据图形,以下结论最有可能成立的是(B)A线性相关关系较强,的值为1.25B线性相关关系较强,的值为0.83C线性相关关系较强,的值为0.87D线性相关关系较弱,无研究价值(2)已知变量x和y满足关系y0.1x1,变量y与z正相关,下列结论中正确的是(C)Ax与y正相关,x与z负相关Bx与y正相关,x与z正相关Cx与y负相关,x与z负相关Dx与y负相关,x与z正相关解析 (1)由散点图可以看出两个变量所构成的点在一条直线附近,所以线性相关关系较强,且应为正相关,所以回归直线方程的斜率应为正数,且从散点图观察,回归直线方程的斜率应该比yx的斜率要小一些,故选B(2)因为y0.1x1,x的系数为负,故x与y负相关;而y与z正相关,故x与z负相关二线性回归分析(1)正确理解计算,的公式并能准确的计算出结果是求线性回归方程的关键(2)回归直线方程x必过样本点中心(,)(3)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计和预测【例2】 某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响对近8年的年宣传费xi和年销售量yi(i1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值(xi)2(i)2(xi)(yi)(i)(yi)46.65636.8289.81.61.469108.8其中i,i.(1)根据散点图判断yabx与ycd哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z0.2yx.根据(2)的结果回答下列问题:年宣传费x49时,年销售量及年利润的预报值是多少?年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),(un,vn),其回归直线vu的斜率和截距的最小二乘估计分别为,.解析 (1)由散点图可以判断ycd适宜作为年销售量y关于年宣传费x的回归方程类型(2)令w,先建立y关于w的线性回归方程由于68,563686.8100.6,所以y关于w的线性回归方程为100.668w,因此y关于x的回归方程为100.668.(3)由(2)知,当x49时,年销售量y的预报值100.668576.6,年利润z的预报值576.60.24966.32.根据(2)的结果知,年利润z的预报值0.2(100.668)xx13.620.12.所以当6.8,即x46.24时,取得最大值故年宣传费为46.24千元时,年利润的预报值最大三独立性检验(1)独立性检验的关键是正确列出22列联表,并计算出K2的值(2)弄清判断两变量有关的把握性与犯错误概率的关系,根据题目要求作出正确的回答【例3】 为了调查某高中学生每天的睡眠时间,现随机对20名男生和20名女生进行问卷调查,结果如下:女生:睡眠时间/小时4,5)5,6)6,7)7,8)8,9)人数24842男生:睡眠时间/小时4,5)5,6)6,7)7,8)8,9)人数15653(1)从这20名男生中随机选出3人,求恰有一人睡眠时间不足7小时的概率;(2)完成下面22列联表,并回答是否有90%的把握认为“睡眠时间与性别有关”?睡眠时间少于7小时睡眠时间不少于7小时合计男生女生合计P(K2k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828解析 (1)设所求事件概率为P,则P.(2)睡眠时间少于7小时睡眠时间不少于7小时合计男生12820女生14620合计261440K20.4402.706.所以没有90%的把握认为“睡眠时间与性别有关”1下列四个散点图中,变量x与y之间具有负的线性相关关系的是(D)解析 观察散点图可知,只有D项的散点图表示的是变量x与y之间具有负的线性相关关系2为研究变量x和y的线性相关性,甲、乙二人分别做了研究,利用回归分析的方法得到回归直线l1和l2,两人计算得相同,也相同,则下列结论正确的是(C)Al1与l2重合Bl1与l2一定平行Cl1与l2相交于点(,)D无法判断l1和l2是否相交解析 因为回归直线经过样本点的中心(,),故两直线都经过点(,),而,相同不能得到,一定相同,故选C3某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下.零件的个数x/个2345加工的时间y/小时2.5344.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x的线性回归方程x;(3)试预测加工10个零件需要多少小时?解析 (1)散点图如图(2)由表中数据得iyi52.5,3.5,3.5,54,0.7,1.05,0.7x1.05.(3)将x10代入线性回归方程,得0.7101.058.05,故预测加工10个零件约需要8.05小时4某校数学课外兴趣小组为研究数学成绩是否与性别有关,先统计本校高三年级每个学生一学期数学成绩平均分(采用百分制),剔除平均分在40分以下的学生后,共有男生300名,女生200名现采用分层抽样的方法,从中抽取了100名学生,按性别分为两组,并将两组学生成绩分为6组,得到如下所示频数分布表.分数段40,50)50,60)60,70)70,80)80,90)90,100)男39181569女64510132(1)估计男、女生各自的平均分(同一组数据用该组区间中点值作代表),从计算结果看,数学成绩与性别是否有关;(2)规定80分以上为优分(含80分),请你根据已知条件作出22列联表,并判断是否有90%以上的把握认为“数学成绩与性别有关”.优分非优分总计男生女生总计100解析 (1)男450.05550.15650.3750.25850.1950.1571.5,女450.15550.1650.125750.25850.325950.0571.5,从男、女生各自的平均分来看,并不能判断数学成绩与性别有关(2)由频数分布表可知:由抽取的100名学生中,“男生组”中的优分有15人,“女生组”中的优分有15人,据此可得22列联表如下.优分非优分总计男生154560女生152540总计3070100可得K21.79,因为1.792.706,所以没有90%以上的把握认为“数学成绩与性别有关”易错点数据较大,难求真值,忽略样本中心点的特点错因分析:数据位数较大,计算容易出错;x与yaxb容易混淆为了避免这些容易发生的错误可将一些数据进行处理【例1】 某地最近十年粮食需求量逐年上升,下表是部分统计数据.年份20062008201020122014需求量/万吨236246257276286(1)利用所给数据求年需求量与年份之间的线性回归方程x;(2)利用(1)中所求出的线性回归方程预测该地2016年的粮食需求量解析 (1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来求线性回归方程,先将数据处理如下.年份2 01042024需求257211101929对处理的数据,容易算得0,3.2,6.5,3.2.由上述计算结果,知所求线性回归方程为2576.5(x2 010)3.2,即6.5(x2 010)260.2.(2)利用所求得的线性回归方程,可预测2016年的粮食需求量大约为6.5(2 016 2 010)260.2 6.56260.2299.2(万吨)【跟踪训练1】 某种书每册的成本费y(元)与印刷册数x(千册)有关,经统计得到数据如下.x201052y1.52.02.75.4(1)经观测每册书的成本费y与印刷册数的倒数之间具有明显的线性相关关系,求出y对x的回归方程;(2)试比较(1)中的回归方程与回归模型y哪一个拟合效果更好参考数据:0.707,0.447.解析 (1)设t,则t0.050.10.20.5y1.52.02.75.4(0.050.10.20.5)0.212 5,(1.52.02.75.4)2.9,由最小二乘法得8.615,b2.98.6150.212 51.069,8.615t1.069,即线性回归方程为1.069.(2)由回归方程1.069和回归方程y,得以下表格.xi201052yi1.52.02.75.41.0691.51.9312.7925.377y1.5652.2123.1294.949对于回归方程1.069,yi2020.06920.09220.02320.014;对于回归方程y,yi20.06520.21220.42920.45120.437,0.0140.437,回归方程1.069比回归模型y的拟合效果更好课时达标第66讲解密考纲本节内容在高考中,三种题型均有考查,文字量比较大,但题目较容易一、选择题1为了了解某保温产品的用电量y(kWh)与气温()之间的关系,随机统计了4次用电量与相应的气温,并制作了对照表.气温x/1813101用电量y/kWh24343864由表中数据,得到线性回归方程2x(R),由此请估计出用电量72 kWh时气温的度数为(D)A10B8C4D6解析 由题意可得10,40,所以24021060.所以2x60,当72时,有2x6072,解得x6,故选D2对具有线性相关关系的变量x,y有一组观测数据(xi,yi)(i1,2,8)其回归直线方程是x,且x1x2x3x82(y1y2y3y8)6,则实数的值是(B)ABCD解析 依题意可知样本中心点为,则,解得,故选B3在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi)(i1,2,n)都在直线yx1上,则这组样本数据的样本相关系数为(D)A1B0CD1解析 由题设可知这组样本中的数据完全正相关,又都在yx1上,故相关系数为1,故选D4(2018辽宁大连双基测试)对于下列表格所示五个散点,已知求得的线性回归方程为0.8x155,则实数m的值为(A)x196197200203204y1367mA8B8.2C8.4D8.5解析 200,将样本中心点代入0.8x155,可得m8,故选A5如表提供了某厂节能降耗技术改造后在生产A产品过程中记录的产量x(吨)与相应的生产能耗y(吨)的几组对应数据,根据表提供的数据,求出y关于x的线性回归方程为0.7x0.35,则下列结论错误的是(B)x3456y2.5t44.5A产品的生产能耗与产量呈正相关Bt的取值必定是3.15C回归直线一定过(4.5,3.5)DA产品每多生产1吨,则相应的生产能耗约增加0.7吨解析 由题意,4.5,因为0.7x0.35,所以 0.74.50.353.5,所以t43.52.544.53,故选B6(2018福建泉州模拟)已知某产品连续4个月的广告费xi(千元)与销售额yi(万元),经过对这些数据的处理,得到如下数据信息:i18,i14;广告费用x和销售额y之间具有较强的线性相关关系;回归直线方程为x中的0.8(用最小二乘法求得)那么广告费用为6千元时,可预测销售额约为(B)A3.5万元B4.7万元C4.9万元D6.5万元解析 因为i18,i14,所以,因为回归直线方程为x中的0.8,所以0.8,所以,所以0.8x.故x6时,可预测销售额约为4.7万元,故选B二、填空题7已知x,y的取值如下表.x2345y2.23.85.56.5从散点图分析,y与x线性相关,且回归方程为1.46x,则实数的值为_0.61_.解析 3.5,4.5,回归方程必过样本的中心点(,)把(3.5,4.5)代入回归方程,计算得0.61.8高三某班学生每周用于物理学习的时间x(单位:小时)与物理成绩y(单位:分)之间有如下关系.x24152319161120161713y92799789644783687159根据上表可得回归方程的斜率为3.53,则回归直线在y轴上的截距为_13.5_(精确到0.1)解析 由已知可得17.4,74.9,设回归直线方程为3.53x,则74.93.5317.4,解得13.5.9以下四个命题:从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;两个随机变量相关性越强,则相关系数的绝对值越接近于1;在回归直线方程0.2x12中,当解释变量x每增加一个单位时,预报变量平均增加0.2个单位;对分类变量X与Y,它们的随机变量K2的观测值k来说,k越小,“X与Y有关系”的把握程度越大其中所有正确的是_(填序号)解析 是系统抽样;对于,随机变量K2的观测值k越小,说明两个变量有关系的把握程度越小三、解答题10下表是高三某位文科生连续5次月考的历史、政治的成绩,结果统计如下.月份91011121历史成绩x/分7981838587政治成绩y/分7779798283(1)求该生5次月考历史成绩的平均分和政治成绩的方差;(2)一般来说,学生的历史成绩与政治成绩有较强的线性相关关系,根据上表提供的数据,求两个变量x,y的线性回归方程x.附:,.解析 (1)(7981838587)83,(7779798283)80,s(7780)2(7980)2(7980)2(8280)2(8380)24.8.(2)(xi)(yi)30,(xi)240,0.75,17.75,则所求的线性回归方程为0.75x17.75.11(2018河北石家庄调研)某学校高中毕业班有男生900人,女生600人,学校为了对高三学生数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论