202X届高考数学总复习第十一章算法初步统计统计案例11_4变量间的相关关系、统计案例课件文新人教A版_第1页
202X届高考数学总复习第十一章算法初步统计统计案例11_4变量间的相关关系、统计案例课件文新人教A版_第2页
202X届高考数学总复习第十一章算法初步统计统计案例11_4变量间的相关关系、统计案例课件文新人教A版_第3页
202X届高考数学总复习第十一章算法初步统计统计案例11_4变量间的相关关系、统计案例课件文新人教A版_第4页
202X届高考数学总复习第十一章算法初步统计统计案例11_4变量间的相关关系、统计案例课件文新人教A版_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第第4讲变量间的相关关系、统计案例讲变量间的相关关系、统计案例1两个变量的线性相关两个变量的线性相关(1)正相关正相关在散点图中,点散布在从在散点图中,点散布在从_到到_的区域的区域,对于两个变量的这种相关关系,我们将它称为正相关,对于两个变量的这种相关关系,我们将它称为正相关(2)负相关负相关在散点图中,点散布在从在散点图中,点散布在从_到到_的区域的区域,两个变量的这种相关关系称为负相关,两个变量的这种相关关系称为负相关左下角左下角右上角右上角左上角左上角右下角右下角(3)线性相关关系、回归直线线性相关关系、回归直线如 果 散 点 图 中 点 的 分 布 从 整 体 上 看 大 致 在如

2、果 散 点 图 中 点 的 分 布 从 整 体 上 看 大 致 在_,就称这两个变量之间具有线性相关,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线关系,这条直线叫做回归直线2回归方程回归方程(1)最小二乘法最小二乘法求 回 归 直 线 , 使 得 样 本 数 据 的 点 到 它 的求 回 归 直 线 , 使 得 样 本 数 据 的 点 到 它 的_的方法叫做最小二乘法的方法叫做最小二乘法一条直线附近一条直线附近距离的平方和最小距离的平方和最小3回归分析回归分析(1)定义:对具有定义:对具有_的两个变量进行统的两个变量进行统计分析的一种常用方法计分析的一种常用方法(2)样本点的中心样

3、本点的中心对于一组具有线性相关关系的数据对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn),其中,其中(x,y)称为样本点的中心称为样本点的中心相关关系相关关系(3)相关系数相关系数当当r0时,表明两个变量时,表明两个变量_;当当r0时,表明两个变量时,表明两个变量_r的绝对值越接近于的绝对值越接近于1,表明两个变量的线性相关性,表明两个变量的线性相关性_r的绝对值越接近于的绝对值越接近于0,表明两个变量之间,表明两个变量之间_通常通常|r|大于大于_时,认为时,认为两个变量有很强的线性相关性两个变量有很强的线性相关性正相关正相关负相关负相关越强越强几乎不存在线性相关

4、关系几乎不存在线性相关关系0.754独立性检验独立性检验(1)分类变量:变量的不同分类变量:变量的不同“值值”表示个体所属的表示个体所属的_,像这类变量称为分类变量,像这类变量称为分类变量(2)列联表:列出两个分类变量的列联表:列出两个分类变量的_,称为列,称为列联表假设有两个分类变量联表假设有两个分类变量X和和Y,它们的可能取值分别为,它们的可能取值分别为x1,x2和和y1,y2,其样本频数列联表,其样本频数列联表(称为称为22列联表列联表)为为不同类别不同类别频数表频数表22列联表列联表y1y2总计x1ababx2cdcd总计acbdabcd(3)独立性检验独立性检验利用随机变量利用随机变

5、量_来判断来判断“两个分类变量两个分类变量_”的方法称为独立性检验的方法称为独立性检验K2有关系有关系题组一常识题题组一常识题1(教材改编教材改编)已知具有线性相关关系的两个变量已知具有线性相关关系的两个变量x,y之之间的一组数据如下:间的一组数据如下:x01234y2.24.34.54.8t【答案】【答案】 6.72(教材改编教材改编)利用独立性检验来判断两个分类变量利用独立性检验来判断两个分类变量X和和Y是否有关系,通过查阅下表来确定是否有关系,通过查阅下表来确定“X和和Y有关系有关系”的可的可信度为了调查用电脑时间与视力下降是否有关系,现从信度为了调查用电脑时间与视力下降是否有关系,现从

6、某地居民中抽取某地居民中抽取100位居民进行调查经过计算得位居民进行调查经过计算得K23.855,那么就有,那么就有_%的把握认为用电脑时间的把握认为用电脑时间与视力下降有关系与视力下降有关系. P(K2k0)0.050.0250.0100.0050.001k03.8415.0246.6357.87910.828【解析】【解析】 根据表格发现根据表格发现3.8553.841,3.841对应的是对应的是0.05,所以根据独立性检验原理可知有,所以根据独立性检验原理可知有95%的把握认为用的把握认为用电脑时间与视力下降有关系电脑时间与视力下降有关系【答案】【答案】 95题组二常错题题组二常错题索引

7、:易混淆相关关系与函数关系;误认为样本点必索引:易混淆相关关系与函数关系;误认为样本点必在回归直线上;利用回归方程分析问题时,误认为所得的在回归直线上;利用回归方程分析问题时,误认为所得的数据是准确值;在独立性检验中,有关系并不等于绝对发数据是准确值;在独立性检验中,有关系并不等于绝对发生生3在一次对人体脂肪含量和年龄关系的研究中,研究在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据,并制成如图所示的人体脂肪含人员获得了一组样本数据,并制成如图所示的人体脂肪含量 与 年 龄 关 系 的 散 点 图 , 下 列 结 论 中 正 确 的 是量 与 年 龄 关 系 的 散 点 图

8、, 下 列 结 论 中 正 确 的 是_(填序号填序号)人体脂肪含量与年龄正相关,且脂肪含量的中位数等人体脂肪含量与年龄正相关,且脂肪含量的中位数等于于20%;人体脂肪含量与年龄正相关,且脂肪含量的中位数小人体脂肪含量与年龄正相关,且脂肪含量的中位数小于于20%;人体脂肪含量与年龄负相关,且脂肪含量的中位数等人体脂肪含量与年龄负相关,且脂肪含量的中位数等于于20%;人体脂肪含量与年龄负相关,且脂肪含量的中位数小人体脂肪含量与年龄负相关,且脂肪含量的中位数小于于20%.【解析】【解析】 散点图呈现上升趋势,故人体脂肪含量与年散点图呈现上升趋势,故人体脂肪含量与年龄正相关因为中间两个数据介于龄正相

9、关因为中间两个数据介于15%到到20%之间,所以之间,所以脂肪含量的中位数小于脂肪含量的中位数小于20%.【答案】【答案】 y与与x呈正相关;呈正相关;回归直线过样本点的中心回归直线过样本点的中心(x,y);若该大学某女生的身高增加若该大学某女生的身高增加1 cm,则其体重约增加,则其体重约增加0.85 kg;若该大学某女生身高为若该大学某女生身高为170 cm,则可断定其体重必为,则可断定其体重必为58.79 kg.5对长期吸烟与患肺癌这两个分类变量的计算中,得对长期吸烟与患肺癌这两个分类变量的计算中,得出出K2的值大于的值大于3.841,且查表可知,且查表可知P(K23.841)0.05,

10、则,则下列说法正确的是下列说法正确的是_(填序号填序号) 我们有我们有95%的把握认为的把握认为“长期吸烟与患肺癌有关系长期吸烟与患肺癌有关系”,那么在,那么在100个长期吸烟的人中必有个长期吸烟的人中必有95人患肺癌;人患肺癌;从独立性检验的原理可知有从独立性检验的原理可知有95%的把握认为的把握认为“长期吸长期吸烟与患肺癌有关系烟与患肺癌有关系”,即某一个人如果长期吸烟,那么他,即某一个人如果长期吸烟,那么他有有95%的可能患肺癌;的可能患肺癌;从独立性检验的原理可知有超过从独立性检验的原理可知有超过95%的把握认为的把握认为“长长期吸烟与患肺癌有关系期吸烟与患肺癌有关系”,是指有不超过,

11、是指有不超过5%的可能性使的可能性使得推断出现错误;得推断出现错误;以上三种说法都不正确以上三种说法都不正确【解析】【解析】 对于对于,我们有,我们有95%的把握认为的把握认为“长期吸烟长期吸烟与患肺癌有关系与患肺癌有关系”,不能代表在,不能代表在100个长期吸烟的人中必个长期吸烟的人中必有有95人患肺癌,人患肺癌,错误;错误;对于对于,不能确定某一个人如果长期吸烟,那么他有,不能确定某一个人如果长期吸烟,那么他有95%的可能患肺癌,的可能患肺癌,错误;错误;对于对于,我们有,我们有95%的把握认为的把握认为“长期吸烟与患肺癌有长期吸烟与患肺癌有关系关系”,即指有不超过,即指有不超过5%的可能

12、性使得推断出现错误,的可能性使得推断出现错误,正确;易知正确;易知错误错误【答案】【答案】 (2)对四组数据进行统计,获得如图所示的散点图,关对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是于其相关系数的比较,正确的是()Ar2r40r3r1Br4r20r1r3Cr4r20r3r1Dr2r40r1r3【反思归纳】【反思归纳】跟踪训练跟踪训练1 下列四个散点图中,变量下列四个散点图中,变量x与与y之间具有负的之间具有负的线性相关关系的是线性相关关系的是()【解析】【解析】 观察散点图可知,只有观察散点图可知,只有D选项的散点图表示选项的散点图表示的是变量的是变量x与与y之

13、间具有负的线性相关关系之间具有负的线性相关关系【答案】【答案】 D跟踪训练跟踪训练2 4名同学根据各自的样本数据研究变量名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得线性回归方程,分别得到以下四之间的相关关系,并求得线性回归方程,分别得到以下四个结论:个结论:考点二回归分析考点二回归分析【例【例2】 如图是我国如图是我国2012年至年至2018年生活垃圾无害化处年生活垃圾无害化处理量理量(单位:亿吨单位:亿吨)的折线图的折线图注:年份代码注:年份代码17分别对应年份分别对应年份20122018.(1)由折线图看出,可用线性回归模型拟合由折线图看出,可用线性回归模型拟合y与与t的关

14、系,的关系,请用相关系数加以说明请用相关系数加以说明(2)建立建立y关于关于t的回归方程的回归方程(系数精确到系数精确到0.01),预测,预测2020年我国生活垃圾无害化处理量年我国生活垃圾无害化处理量【解析】【解析】【反思归纳】【反思归纳】天数x/天34567繁殖个数y/千个2.5344.5c跟踪训练跟踪训练4 (2019邯郸质检邯郸质检)已知某企业近已知某企业近3年的前年的前7个月个月的月利润的月利润(单位:百万元单位:百万元)如下面的折线图所示:如下面的折线图所示:(1)试问这试问这3年的前年的前7个月中哪个月的平均利润最高?个月中哪个月的平均利润最高?(2)通过计算判断这通过计算判断这

15、3年的前年的前7个月的总利润的发展趋个月的总利润的发展趋势势(3)试以第试以第3年的前年的前4个月的数据个月的数据(如下表如下表),用线性回,用线性回归的拟合模式估测第归的拟合模式估测第3年年8月份的利润月份的利润.月份x1234利润y(单位:百万元)4466【解析】【解析】 (1)由折线图可知由折线图可知5月和月和6月的平均利润最高月的平均利润最高(2)第第1年前年前7个月的总利润为个月的总利润为123567428(百万元百万元),第,第2年前年前7个月的总利润为个月的总利润为255455531(百万元百万元),第,第3年前年前7个月的总利润为个月的总利润为446676841(百万元百万元)

16、,这这3年的前年的前7个月的总利润呈上升趋个月的总利润呈上升趋势势考点三独立性检验考点三独立性检验【例【例3】 海水养殖场进行某水产品的新、旧网箱养殖方海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了法的产量对比,收获时各随机抽取了100个网箱,测量各个网箱,测量各箱水产品的产量箱水产品的产量(单位:单位:kg),其频率分布直方图如下:,其频率分布直方图如下:(1)(1)设两种养殖方法的箱产量相互独立,记设两种养殖方法的箱产量相互独立,记A表示事件表示事件:“旧养殖法的箱产量低于旧养殖法的箱产量低于50 kg, 新养殖法的箱产量不低新养殖法的箱产量不低于于50 kg”,

17、估计,估计A的概率的概率(2)填写下面列联表,并根据列联表判断是否有填写下面列联表,并根据列联表判断是否有99%的的把握认为箱产量与养殖方法有关:把握认为箱产量与养殖方法有关:箱产量50 kg箱产量50 kg 旧养殖法新养殖法(3)根据箱产量的频率分布直方图,求新养殖法箱产量根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值的中位数的估计值(精确到精确到0.01)附:附:P(K2k)0.0500.0100.001k3.8416.63510.828【解析】【解析】 (1)记记B表示事件表示事件“旧养殖法的箱产量低于旧养殖法的箱产量低于50 kg”,C表示事件表示事件“新养殖法的箱产量不

18、低于新养殖法的箱产量不低于50 kg”,由题意知由题意知P(A)P(BC)P(B)P(C),旧养殖法的箱产量低于旧养殖法的箱产量低于50 kg的频率为的频率为(0.0120.0140.0240.0340.040)50.62,故故P(B)的估计值为的估计值为0.62.新养殖法的箱产量不低于新养殖法的箱产量不低于50 kg的频率为的频率为(0.0680.0460.0100.008)50.66,故,故P(C)的估计值为的估计值为0.66,因此,事件因此,事件A的概率估计值为的概率估计值为0.620.660.409 2.(2)根据箱产量的频率分布直方图得列联表根据箱产量的频率分布直方图得列联表箱产量5

19、0 kg箱产量50 kg旧养殖法6238新养殖法3466【反思归纳】【反思归纳】跟踪训练跟踪训练5 (2019九江统考九江统考)某校数学课外兴趣小组为某校数学课外兴趣小组为研究数学成绩是否与性别有关,先统计本校高三年级每研究数学成绩是否与性别有关,先统计本校高三年级每个学生一学期数学成绩平均分个学生一学期数学成绩平均分(采用百分制采用百分制),剔除平均,剔除平均分在分在30分以下的学生后,共有男生分以下的学生后,共有男生300名,女生名,女生200名名现采用分层抽样的方法,从中抽取了现采用分层抽样的方法,从中抽取了100名学生,按性名学生,按性别分为两组,并将两组学生成绩分为别分为两组,并将两组学生成绩分为6组,得到如下所组,得到如下所示频数分布表示频数分布表分数段 40,5

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论