2022高考数学一轮复习第十章算法初步统计与统计案例10.4变量间的相关关系统计案例学案文含解析新人教A版202104121168.docx

2022高考数学一轮复习第十章算法初步统计与统计案例学案文含解析打包4套新人教A版

收藏

压缩包内文档预览:
预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图
编号:157486424    类型:共享资源    大小:1.13MB    格式:ZIP    上传时间:2021-10-23 上传人:活*** IP属地:宁夏
18
积分
关 键 词:
文本
资源描述:
2022高考数学一轮复习第十章算法初步统计与统计案例学案文含解析打包4套新人教a版,文本
内容简介:
10.4变量间的相关关系、统计案例必备知识预案自诊知识梳理1.变量间的相关关系(1)定义:常见的两变量之间的关系有两类:一类是函数关系,另一类是.当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.与函数关系不同,相关关系是一种.(2)散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图,它可直观地判断两个变量的关系是否可以用线性关系表示.若这些散点分布在从左下角到右上角的区域,则称两个变量;若这些散点分布在从左上角到右下角的区域,则称两个变量.(3)线性相关关系、回归直线:如果散点图中点的分布从整体上看大致在,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(4)非线性相关:若散点图上所有点看上去都在附近波动,则称此相关为非线性相关.此时,可以用来拟合.(5)不相关:如果所有的点在散点图中,那么称变量间是不相关的.2.两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有,这条直线叫做.(2)回归方程y=bx+a是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn)的回归方程,其中a,b是待定系数.b=ni=1(xi-x)(yi-y)ni=1(xi-x)2=ni=1xiyi-nxyni=1xi2-nx2,a=y-bx.(3)通过求q=ni=1(yi-bxi-a)2的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.(4)相关系数r=i=1n(xi-x)(yi-y)i=1n(xi-x)2i=1n(yi-y)2.当r0时,表明两个变量正相关;当r0时,表明两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常当|r|大于0.75时,认为两个变量有很强的线性相关性.(5)回归分析模型拟合效果的判断r2=1-i=1n(yi-yi)2ni=1(yi-y)2,r2越接近于1,表示回归效果越好.3.独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.(2)22列联表:假设有两个分类变量x和y,它们的值域分别为x1,x2和y1,y2,其样本频数列联表(称22列联表)为:xy总计y1y2x1aba+bx2cdc+d总计a+cb+da+b+c+dk2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)(其中n=a+b+c+d为样本容量).(3)用k2的大小可以决定是否拒绝原来的统计假设h0,若k2值较大,就拒绝h0,即拒绝事件a与b无关.考点自诊1.判断下列结论是否正确,正确的画“”,错误的画“”.(1)样本相关关系与函数关系都是一种确定性的关系,也是一种因果关系.()(2)利用散点图可以直观判断两个变量是否具有线性相关关系.()(3)事件x,y关系越密切,则由观测数据计算得到的k2越大.()(4)回归直线y=bx+a至少经过点(x1,y1),(x2,y2),(xn,yn)中的一个点.()(5)两个变量的样本相关系数的绝对值越接近于1,它们的线性相关程度越强.()2.某市食品研究部门为了解一种酒品的储藏年份与芳香度之间的相关关系,在市场上收集了一部分不同年份的该酒品,并测定了其芳香度如下表.年份x014568芳香度y1.31.85.67.49.3由最小二乘法得到回归方程y=1.03x+1.13,但不小心在检测后滴到表格上一滴检测液,污损了一个数据,请你推测该数据为()a.6.8b.6.28c.6.5d.6.13.通过随机询问50名性别不同的大学生是否爱好某项运动,得到如下的列联表,性别爱好不爱好合计男生20525女生101525合计302050由k2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)得k2=50(2015-105)2302025258.333.参照附表,得到的正确结论是()p(k2k0)0.0100.0050.001k06.6357.87910.828a.有99.5%以上的把握认为“爱好该项运动与性别有关”b.有99.5%以上的把握认为“爱好该项运动与性别无关”c.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”d.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”4.(2020全国1,文5)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,20)得到下面的散点图:由此散点图,在10 至40 之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()a.y=a+bxb.y=a+bx2c.y=a+bexd.y=a+bln x5.已知下列命题:回归直线y=bx+a恒过样本点的中心(x,y),且至少过一个样本点;两个变量相关性越强,则相关系数r就越接近于1;将一组数据的每个数据都加一个相同的常数后,方差不变;在回归方程y=2-0.5x中,当解释变量x增加一个单位时,预报变量y平均减少0.5;在线性回归模型中,r2表示解释变量x对于预报变量y的贡献率,r2越接近于1,表示回归效果越好;对分类变量x与y,它们的随机变量k2的观测值k来说,k越小,“x与y有关系”的把握程度越大;两个模型中残差平方和越小的模型拟合的效果越好.则正确命题是.(把你认为正确的结论都写在横线上)关键能力学案突破考点相关关系的判断【例1】(1)对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是()a.r2r40r3r1b.r4r20r1r3c.r4r20r3r1d.r2r40r10时,正相关;当r0时,正相关;当b0时,负相关.对点训练1(1)相关变量x,y的散点图如图所示,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性回归方程y=b1x+a1,相关系数为r1;方案二:剔除点(10,21),根据剩下数据得到线性回归方程:y=b2x+a2,相关系数为r2.则()a.0r1r21b.0r2r11c.-1r1r20d.-1r2r10(2)某市国庆节7天假期的楼房认购量(单位:套)与成交量(单位:套)的折线图如图所示,小明同学根据折线图对这7天的认购量与成交量作出如下判断:日成交量的中位数是16;日成交量超过日平均成交量的有2天;认购量与日期正相关;10月7日认购量的增量大于10月7日成交量的增量.上述判断中错误的个数为()a.1b.2c.3d.4考点回归分析(多考向探究)考向1线性回归方程及应用【例2】(2020陕西宝鸡质检)某地随着经济的发展,居民收入逐年增长,下表是该地一建设银行连续五年的储蓄存款(年底余额),如下表1:表1年份x20152016201720182019储蓄存款y/千亿元567810为了研究计算的方便,工作人员将上表的数据进行了处理,t=x-2 014,z=y-5得到下表2:表2时间代号t12345z01235(1)求z关于t的线性回归方程;(2)通过(1)中的方程,求出y关于x的回归方程;(3)用所求回归方程预测到2022年年底,该地储蓄存款额可达多少?附:对于线性回归方程y=bx+a,其中b=i=1nxiyi-nxyi=1nxi2-nx2,a=y-bx解题心得回归分析问题的类型及解题方法(1)求回归方程根据散点图判断两变量是否线性相关,如不是,应通过换元构造线性相关.利用公式,求出回归系数b.待定系数法:利用回归直线过(x,y)求系数a.(2)利用回归方程进行预测,把线性回归方程看作一次函数,求函数值.对点训练2下表是某市一主干路口监控设备所抓拍的5个月内驾驶员违章行为统计数据:月份x12345违章驾驶员人数/y1201051009085(1)请利用所给数据求违章人数y与月份x之间的回归方程;(2)预测该路口9月份的违章驾驶员人数.参考公式:b=i=1nxiyi-nxyi=1nxi2-nx2=i=1n(xi-x)(yi-y)i=1n(xi-x)2,a=y-bx,参考数据:i=15xiyi=1 415.考向2非线性回归方程【例3】(2020山东青岛高三模拟)近期,某公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引了越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x表示活动推出的天数,y表示每天使用扫码支付的人次(单位:十人次),统计数据如下表所示:x1234567y/十人次611213466101196根据以上数据,绘制了如图所示的散点图.(1)根据散点图判断,在推广期内,y=a+bx与y=cdx(c,d均为大于零的常数)哪一个适宜作为扫码支付的人次y关于活动推出天数x的回归方程类型;(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表1中的数据,建立y关于x的回归方程,并预测活动推出第8天使用扫码支付的人次.参考数据:yvi=17xiyii=17xivi100.5462.141.542 53550.123.47其中vi=lg yi,v=17i=17vi参考公式:对于一组数据(u1,v1),(u2,v2),(un,vn),其回归方程v=+u中,=i=1nuivi-nuvi=1nui2-nu2,=v-u解题心得1.根据样本画出散点图.观察散点图中散点的分布,从整体看,如果散点没有在某一条直线附近,称这两个变量具有相关性,但不是线性相关,即这两个变量非线性相关.2.借助于散点图,与已学过的函数(如指数函数、对数函数、幂函数等)的图象相比较,找到合适的函数模型.3.通过变量转换,把非线性回归问题化成线性回归问题,并求出线性回归方程.4.再利用变量代换,可得非线性回归方程.对点训练3(2020山东淄博高三一模)根据国家统计局数据,1978年至2018年我国gdp总量从0.37万亿元跃升至90万亿元,实际增长了243倍多,综合国力大幅提升.将年份1978,1988,1998,2008,2018分别用1,2,3,4,5代替,并表示为t;y表示全国gdp总量,表中zi=ln yi(i=1,2,3,4,5),z=15i=15zi.tyzi=15(ti-t)2i=15(ti-t)(yi-y)i=15(ti-t)(zi-z)326.4741.90310209.7614.05(1)根据数据及统计图表,判断y=bt+a与y=cedt(其中e=2.718为自然对数的底数)哪一个更适宜作为全国gdp总量y关于t的回归方程类型(给出判断即可,不必说明理由),并求出y关于t的回归方程.(2)使用参考数据,估计2020年的全国gdp总量.附:线性回归方程y=bx+a中斜率和截距的最小二乘法估计公式分别为b=i=1n(xi-x)(yi-y)i=1n(xi-x)2,a=y-bx.n45678en的近似值551484031 0972 981考点独立性检验【例4】(2020海南三亚模拟)自2017年起,部分省、市陆续实施了新高考,某省采用了“3+3”的选科模式,即考试除必考的语文、数学、外语三科外,再从物理、化学、生物、历史、地理、思想政治六个学科中,任意选取三科参加高考,为了调查新高考中考生的选科情况,某地区调查小组进行了一次调查,研究考生选择化学与选择物理是否有关系.已知在调查数据中,选物理的考生与不选物理的考生人数相同,其中选物理且选化学的人数占选物理人数的35,在不选物理的考生中,选化学与不选化学的人数比为14.(1)若在此次调查中,选物理未选化学的考生有100人,试完成下面的列联表.选科情况选化学不选化学合计选物理不选物理合计(2)根据第(1)问的数据,能否有99%把握认为选择化学与选择物理有关系?(3)若研究得到在犯错误概率不超过0.01的前提下,认为选化学与选物理有关系,则选物理又选化学的人数至少有多少?(单位:千人;精确到0.001)附:k2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).p(k2k0)0.0500.0100.001k03.8416.63510.828解题心得1.2个明确(1)明确两类主体;(2)明确研究的两个问题2个关键(1)准确画出22列联表;(2)准确求解k23个步骤(1)根据样本数据制成22列联表;(2)根据公式k2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),计算k2的观测值;(3)查表比较k2与临界值的大小关系,作统计判断2.用k2的值可以决定是否拒绝原来的统计假设h0,若k2值较大,就拒绝h0,即拒绝事件a与事件b无关;换一种说法,计算随机变量的观测值k越大,说明“两个变量有关系”的可能性越大,根据临界表判断k2大于的临界值,然后下结论.对点训练4每年六、七月份,我国长江中下游地区进入持续25天左右的梅雨季节,如图是江南q镇20092018年梅雨季节的降雨量(单位:mm)的频率分布直方图,试用样本频率估计总体概率,解答下列问题:(1)请用样本平均数估计q镇明年梅雨季节的降雨量.(2)q镇的杨梅种植户老李在犯愁,他过去种植的甲品种杨梅,亩产量受降雨量的影响较大(把握超过八成).而乙品种杨梅20092018年的亩产量(单位:kg/亩)与降雨量的发生频数(单位:年)如22列联表所示(部分数据缺失).请你帮助老李排解忧愁,他来年应该种植哪个品种的杨梅受降雨量影响更小?(完善列联表,并说明理由)亩产量降雨量合计200,400)100,200)400,5007.879,由上表知7.879对应0.005,所以,有99.5%以上的把握认为“爱好该项运动与性别有关”,或在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别有关”,故选a.4.d结合题中散点图,由图像的大致走向判断,此函数应该是对数函数模型,故应该选用的函数模型为y=a+blnx.5.对于,回归直线y=bx+a恒过样本点的中心(x,y),可以不过任一个样本点,故错误;对于,两个变量相关性越强,则相关系数r的绝对值就越接近于1,故错误;对于,将一组数据的每个数据都加一个相同的常数后,由方差的性质可得方差不变,故正确;对于,在回归方程y=2-0.5x中,当解释变量x每增加一个单位时,预报变量y平均减少0.5个单位,故正确;对于,在线性回归模型中,r2表示解释变量x对于预报变量y的贡献率,r2越接近于1,表示回归效果越好,故正确;对于,对分类变量x与y,它们的随机变量k2的观测值k来说,k越大,“x与y有关系”的把握程度越大,故错误;对于,可用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,故正确.其中正确的为.关键能力学案突破例1(1)a(2)b(1)题中图1和图3是正相关,相关系数大于0;图2和图4是负相关,相关系数小于0;图1和图2的点相对更加集中,所以相关性要强,所以r1接近于1,r2接近于-1,由此可得r2r4r3r1,故选a.(2)因为相关系数的绝对
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
提示  人人文库网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
关于本文
本文标题:2022高考数学一轮复习第十章算法初步统计与统计案例学案文含解析打包4套新人教A版
链接地址:https://www.renrendoc.com/paper/157486424.html

官方联系方式

2:不支持迅雷下载,请使用浏览器下载   
3:不支持QQ浏览器下载,请用其他浏览器   
4:下载后的文档和图纸-无水印   
5:文档经过压缩,下载后原文更清晰   
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

网站客服QQ:2881952447     

copyright@ 2020-2025  renrendoc.com 人人文库版权所有   联系电话:400-852-1180

备案号:蜀ICP备2022000484号-2       经营许可证: 川B2-20220663       公网安备川公网安备: 51019002004831号

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知人人文库网,我们立即给予删除!