高中三年级数学《变量间的相关关系、统计案例》_第1页
高中三年级数学《变量间的相关关系、统计案例》_第2页
高中三年级数学《变量间的相关关系、统计案例》_第3页
高中三年级数学《变量间的相关关系、统计案例》_第4页
高中三年级数学《变量间的相关关系、统计案例》_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

高考总复习主讲人:10.4变量间的相关关系、统计案例必备知识

预案自诊关键能力

学案突破目录01单击添加目录项标题02单击添加目录项标题添加章节标题PARTONE1.变量间的相关关系(1)定义:常见的两变量之间的关系有两类:一类是函数关系,另一类是

.当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.与函数关系不同,相关关系是一种

.

(2)散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图,它可直观地判断两个变量的关系是否可以用线性关系表示.若这些散点分布在从左下角到右上角的区域,则称两个变量

;若这些散点分布在从左上角到右下角的区域,则称两个变量

.

相关关系非确定性关系正相关负相关【知识梳理】(3)线性相关关系、回归直线:如果散点图中点的分布从整体上看大致在

,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.

(4)非线性相关:若散点图上所有点看上去都在_______________________附近波动,则称此相关为非线性相关.此时,可以用

来拟合.

(5)不相关:如果所有的点在散点图中

,那么称变量间是不相关的.

一条直线附近某条曲线(不是一条直线)一条曲线没有显示任何关系

2.两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有

,这条直线叫做

.

线性相关关系回归直线当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常当|r|大于0.75时,认为两个变量有很强的线性相关性.(5)回归分析模型拟合效果的判断3.独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.(2)2×2列联表:假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为:XY总

计y1y2x1aba+bx2cdc+d总计a+cb+da+b+c+d(3)用K2的大小可以决定是否拒绝原来的统计假设H0,若K2值较大,就拒绝H0,即拒绝事件A与B无关.1.判断下列结论是否正确,正确的画“√”,错误的画“×”.(1)样本相关关系与函数关系都是一种确定性的关系,也是一种因果关系.(

)(2)利用散点图可以直观判断两个变量是否具有线性相关关系.(

)(3)事件X,Y关系越密切,则由观测数据计算得到的K2越大.(

)(5)两个变量的样本相关系数的绝对值越接近于1,它们的线性相关程度越强.(

)×√√×√【考点自诊】2.某市市食品研究部门为了解一种酒品的储藏年份与芳香度之间的相关关系,在市场上收集了一部分不同年份的该酒品,并测定了其芳香度如下表.由最小二乘法得到回归方程

=1.03x+1.13,但不小心在检测后滴到表格上一滴检测液,污损了一个数据,请你推测该数据为(

)A.6.8 B.6.28 C.6.5 D.6.1年份x014568芳香度y1.31.85.6

7.49.3答案D性别爱好不爱好合计男生20525女生101525合计302050P(K2≥k0)0.0100.0050.001k06.6357.87910.8283.通过随机询问50名性别不同的大学生是否爱好某项运动,得到如下的列联表,A.有99.5%以上的把握认为“爱好该项运动与性别有关”B.有99.5%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”答案A

解析因为8.333>7.879,由上表知7.879对应0.005,所以,有99.5%以上的把握认为“爱好该项运动与性别有关”,或在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别有关”,故选A.4.(2020全国1,理5)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是(

)A.y=a+bx

B.y=a+bx2C.y=a+bex D.y=a+blnx答案D

解析结合题中散点图,由图像的大致走向判断,此函数应该是对数函数模型,故应该选用的函数模型为y=a+blnx.5.(2019黑龙江牡丹江一中一模)已知下列命题:②两个变量相关性越强,则相关系数r就越接近于1;③将一组数据的每个数据都加一个相同的常数后,方差不变;④在回归方程

=2-0.5x中,当解释变量x增加一个单位时,预报变量

平均减少0.5;⑤在线性回归模型中,相关指数R2表示解释变量x对于预报变量y的贡献率,R2越接近于1,表示回归效果越好;⑥对分类变量X与Y,它们的随机变量K2的观测值k来说,k越小,“X与Y有关系”的把握程度越大;⑦两个模型中残差平方和越小的模型拟合的效果越好.则正确命题是

.(把你认为正确的结论都写在横线上)

答案③④⑤⑦

对于②,两个数据的每个数据都加一个相同的常数后,由方差的性质可得方差不变,故变量相关性越强,则相关系数r的绝对值就越接近于1,故②错误;对于③,将一组③正确;对于⑤,在线性回归模型中,R2表示解释变量x对于预报变量y的贡献率,R2越接近于1,表示回归效果越好,故⑤正确;对于⑥,对分类变量X与Y,它们的随机变量K2的观测值k来说,k越大,“X与Y有关系”的把握程度越大,故⑥错误;对于⑦,可用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,故⑦正确.其中正确的为③④⑤⑦.关键能力学案突破PARTTWO考点1相关关系的判断【例1】(1)对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是(

)A.r2<r4<0<r3<r1

B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1

D.r2<r4<0<r1<r3(2)右图是具有相关关系的两个变量的一组数据的散点图和回归直线,若去掉一个点使得余下的5个点所对应的数据的相关系数最大,则应当去掉的点是(

)A.DB.EC.FD.A答案(1)A

(2)B

解析(1)题中图1和图3是正相关,相关系数大于0;图2和图4是负相关,相关系数小于0;图1和图2的点相对更加集中,所以相关性要强,所以r1接近于1,r2接近于-1,由此可得r2<r4<r3<r1,故选A.(2)因为相关系数的绝对值越大,越接近于1,则说明两个变量的相关性越强.因为点E到直线的距离最远,所以去掉点E,余下的5个点所对应的数据的相关系数最大,故选B.解题心得判断相关关系的方法(1)散点图法:如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.(2)相关系数法:利用相关系数判定,当|r|越趋近于1,相关性就越强.当r>0时,正相关;当r<0时,负相关.A.0<r1<r2<1 B.0<r2<r1<1C.-1<r1<r2<0 D.-1<r2<r1<0(2)某市国庆节7天假期的楼房认购量(单位:套)与成交量(单位:套)的折线图如图所示,小明同学根据折线图对这7天的认购量与成交量作出如下判断:①日成交量的中位数是16;②日成交量超过日平均成交量的有2天;③认购量与日期正相关;④10月7日认购量的增量大于10月7日成交量的增量.上述判断中错误的个数为(

)A.1 B.2

C.3

D.4答案(1)D

(2)C

解析(1)由散点图得负相关,所以r1,r2<0,因为剔除点(10,21)后,剩下点数据更具有线性相关性,|r2|更接近1,所以-1<r2<r1<0.选D.(2)将成交量数据按由大到小顺序排列,中位数为26,所以①错;平均成交量为≈42.7,超过42.7的只有一天,所以②错;由图中可以看出,数据点并不是从左下分布至右上,所以③错;10月7日认购量增量为276-112=164,成交量增量为166-38=128,所以④对,故选C.考点2回归分析 (多考向探究)考向1

线性回归方程及应用【例2】

(2020陕西宝鸡质检)某地随着经济的发展,居民收入逐年增长,下表是该地一建设银行连续五年的储蓄存款(年底余额),如下表1:表1年份x20152016201720182019储蓄存款y/千亿元567810为了研究计算的方便,工作人员将上表的数据进行了处理,t=x-2014,z=y-5得到下表2:表2时间代号t12345z01235(1)求z关于t的线性回归方程;(2)通过(1)中的方程,求出y关于x的回归方程;(3)用所求回归方程预测到2022年年底,该地储蓄存款额可达多少?解题心得回归分析问题的类型及解题方法(1)求回归方程①根据散点图判断两变量是否线性相关,如不是,应通过换元构造线性相关.(2)利用回归方程进行预测,把线性回归方程看作一次函数,求函数值.对点训练2下表是某市一主干路口监控设备所抓拍的5个月内驾驶员违章行为统计数据:月份12345违章驾驶员人数1201051009085(1)请利用所给数据求违章人数y与月份x之间的回归方程;(2)预测该路口9月份的违章驾驶员人数.考向2

非线性回归方程【例3】(2020山东青岛高三模拟)近期,某公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引了越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x表示活动推出的天数,y表示每天使用扫码支付的人次(单位:十人次),统计数据如下表所示:x1234567y/十人次611213466101196根据以上数据,绘制了如图所示的散点图.(1)根据散点图判断,在推广期内,y=a+bx与y=c·dx(c,d均为大于零的常数)哪一个适宜作为扫码支付的人次y关于活动推出天数x的回归方程类型;(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表1中的数据,建立y关于x的回归方程,并预测活动推出第8天使用扫码支付的人次.参考数据:解题心得1.根据样本画出散点图.观察散点图中散点的分布,从整体看,如果散点没有在某一条直线附近,称这两个变量具有相关性,但不是线性相关,即这两个变量非线性相关.2.借助于散点图,与已学过的函数(如指数函数、对数函数、幂函数等)的图象相比较,找到合适的函数模型.3.通过变量转换,把非线性回归问题化成线性回归问题,并求出线性回归方程.4.再利用变量代换,可得非线性回归方程.对点训练3(2020山东淄博高三一模)根据国家统计局数据,1978年至2018年我国GDP总量从0.37万亿元跃升至90万亿元,实际增长了243倍多,综合国力大幅提升.将年份1978,1988,1998,2008,2018分别用1,2,3,4,5代替,并表示为t;y表示全国GDP总量,表中zi=lnyi(i=1,2,3,4,5),n45678en的近似值5514840310972981考点3相关系数及其应用【例4】某基地蔬菜大棚采用无土栽培方式种植各类蔬菜.根据过去50周的资料显示,该基地周光照量X(单位:小时)都在30小时以上,其中不足50小时的有5周,不低于50小时且不超过70小时的有35周,超过70小时的有10周.根据统计,该基地的西红柿增加量y(单位:千克)与使用某种液体肥料的质量x(单位:千克)之间的关系如图所示.(1)依据上图,是否可用线性回归模型拟合y与x的关系?请计算相关系数r并加以说明(精确到0.01).(若|r|>0.75,则线性相关程度很高,可用线性回归模型拟合)(2)蔬菜大棚对光照要求较大,某光照控制仪商家为该基地提供了部分光照控制仪,但每周光照控制仪运行台数受周光照量X限制,并有如下关系:周光照量X/小时30<X<5050≤X≤70X>70光照控制仪运行台数321若某台光照控制仪运行,则该台光照控制仪周利润为3000元;若某台光照控制仪未运行,则该台光照控制仪周亏损1000元.以频率作为概率,商家欲使周总利润的均值达到最大,应安装光照控制仪多少台?(2)记商家周总利润为Y元,由条件可知至少需安装1台,最多安装3台光照控制仪.①安装1台光照控制仪可获得周总利润3000元.②安装2台光照控制仪的情形:当X>70时,只有1台光照控制仪运行,此时周总利润Y=3000-1000=2000(元),Y20006000P0.20.8所以E(Y)=2000×0.2+6000×0.8=5200.Y100050009000P0.20.70.1所以E(Y)=1000×0.2+5000×0.7+9000×0.1=4600.综上可知,为使商家周总利润的均值达到最大,应该安装2台光照控制仪.对点训练4艾滋病是一种危害性极大的传染病,由感染艾滋病病毒(HIV病毒)引起,它把人体免疫系统中最重要的CD4细胞作为主要攻击目标,使人体丧失免疫功能.下表是近八年来我国艾滋病病毒感染人数统计表:年份20112012201320142015201620172018年份代码x12345678感染者人数y/万人34.338.343.353.857.765.471.885(1)请根据该统计表,画出这八年我国艾滋病病毒感染人数的折线图;(2)请用相关系数说明:能用线性回归模型拟合y与x的关系;(3)建立y关于x的回归方程(系数精确到0.01),并估计2019年我国艾滋病病毒感染人数.解(1)我国艾滋病病毒感染人数的折线图如图所示.考点4独立性检验【例5】(2020海南三亚模拟)自2017年起,部分省、市陆续实施了新高考,某省采用了“3+3”的选科模式,即考试除必考的语文、数学、外语三科外,再从物理、化学、生物、历史、地理、思想政治六个学科中,任意选取三科参加高考,为了调查新高考中考生的选科情况,某地区调查小组进行了一次调查,研究考生选择化学与选择物理是否有关系.已知在调查数据中,选物理的考生与不选物理的考生人数相同,其中选物理且选化学的人数占选物理人数的,在不选物理的考生中,选化学与不选化学的人数比为1∶4.选科情况选化学不选化学合计选物理

不选物理

合计

(2)根据第(1)问的数据,能否有99%把握认为选择化学与选择物理有关系?(3)若研究得到在犯错误概率不超过0.01的前提下,认为选化学与选物理有关系,则选物理又选化学的人数至少有多少?(单位:千人;精确到0.001)P(K2≥k0)0.0500.0100.001k03.8416.63510.828(1)若在此次调查中,选物理未选化学的考生有100人,试完成下面的列联表.选科情况选化学不选化学合计选物理150100250不选物理50200250合计200300500解(1)列联表如下:(3)设选物理又选化学的有x千人,则列联表如下:解题心得1.2个明确(1)明确两类主体;(2)明确研究的两个问题2个关键(1)准确画出2×2列联表;(2)准确求解K23个步骤(1)根据样本数据制成2×2列联表;(2)根据公式

,计算K2的观测值;(3)查表比较K2与临界值的大小关系,作统计判断2.用K2的值可以决定是否拒绝原来的统计假设H0,若K2值较大,就拒绝H0,即拒绝事件A与事件B无关;换一种说法,计算随机变量的观测值k越大,说明“两个变量有关系”的可能性越大,根据临界表判

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论