(全国通用版)2019版高考数学大一轮复习 第十章 统计与统计案例、概率 第3节 变量间的相关关系与统计案例课件 文 新人教A版_第1页
(全国通用版)2019版高考数学大一轮复习 第十章 统计与统计案例、概率 第3节 变量间的相关关系与统计案例课件 文 新人教A版_第2页
(全国通用版)2019版高考数学大一轮复习 第十章 统计与统计案例、概率 第3节 变量间的相关关系与统计案例课件 文 新人教A版_第3页
(全国通用版)2019版高考数学大一轮复习 第十章 统计与统计案例、概率 第3节 变量间的相关关系与统计案例课件 文 新人教A版_第4页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第第3节变量间的相关关系与统计案例节变量间的相关关系与统计案例 最新考纲1.会作两个有关联变量的数据的散点图,会利用 散点图认识变量间的相关关系;2.了解最小二乘法的思想, 能根据给出的线性回归方程系数公式建立线性回归方程(线性 回归方程系数公式不要求记忆);3.了解独立性检验(只要求 22列联表)的基本思想、方法及其简单应用;4.了解回归分 析的基本思想、方法及其简单应用. 1.相关关系与回归分析 回归分析是对具有相关关系的两个变量进行统计分析的一种 常用方法;判断相关性的常用统计图是: ;统计量有相关系数与相关指数. (1)在散点图中,点散布在从到的区 域,对于两个变量的这种相关关系,我们

2、将它称为正相关. (2)在散点图中,点散布在从到的区 域,两个变量的这种相关关系称为负相关. (3)如果散点图中点的分布从整体上看大致在 附 近,称两个变量具有线性相关关系. 知知 识识 梳梳 理理 散点图 左下角右上角 左上角右下角 一条直线 2.线性回归方程 距离的平方和 斜率 3.回归分析 (1)定义:对具有的两个变量进行统计分析的 一种常用方法. (2)样本点的中心:对于一组具有线性相关关系的数据(x1,y1), (x2,y2),(xn,yn),其中称为样本点的中心. 相关关系 (3)相关系数 当r0时,表明两个变量; 当r0时,表明两个变量. r的绝对值越接近于1,表明两个变量的线性

3、相关性 . r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关 关系.通常|r|大于时,认为两个变量有很强的线性相关性. (4)相关指数:R2.其中 是 残差平方和,其值越小,则R2越大(接近1),模型的拟合效果 越好. 正相关 负相关 越强 0.75 4.独立性检验 (1)利用随机变量K2来判断“两个分类变量”的方 法称为独立性检验. (2)列联表:列出的两个分类变量的频数表,称为列联表.假设 有两个分类变量X和Y,它们的可能取值分别为x1,x2和y1, y2,其样本频数列联表(22列联表)为 则随机变量K2 ,其中n 为样本容量. y1y2总计 x1ab x2cdcd 总计 ac a

4、bc d 有关系 a+b b+d abcd 1.思考辨析(在括号内打“”或“”) (1)“名师出高徒”可以解释为教师的教学水平与学生的水平成 正相关关系.() (2)通过回归直线方程 可以估计预报变量的取值和 变化趋势.() (3)因为由任何一组观测值都可以求得一个线性回归方程, 所以没有必要进行相关性检验.() (4)事件X,Y关系越密切,则由观测数据计算得到的K2的观 测值越大.() 答案(1)(2)(3)(4) 诊诊 断断 自自 测测 2.(必修3P90例题改编)某研究机构对高三学生的记忆力x和判断 力y进行统计分析,所得数据如表: 答案C x68 10 12 y2356 3.两个变量y

5、与x的回归模型中,分别选择了4个不同模型,它 们的相关指数R2如下,其中拟合效果最好的模型是() A.模型1的相关指数R2为0.98 B.模型2的相关指数R2为0.80 C.模型3的相关指数R2为0.50 D.模型4的相关指数R2为0.25 解析在两个变量y与x的回归模型中,它们的相关指数R2越 近于1,模拟效果越好,在四个选项中A的相关指数最大, 所以拟合效果最好的是模型1. 答案A 4.(2015全国卷)根据下面给出的2004年至2013年我国二氧化 硫年排放量(单位:万吨)柱形图,以下结论不正确的是() A.逐年比较,2008年减少二氧化硫排放量的效果最显著 B.2007年我国治理二氧化

6、硫排放显现成效 C.2006年以来我国二氧化硫年排放量呈减少趋势 D.2006年以来我国二氧化硫年排放量与年份正相关 解析对于A选项,由图知从2007年到2008年二氧化硫排放量 下降得最多,故A正确.对于B选项,由图知,由2006年到2007 年矩形高度明显下降,因此B正确.对于C选项,由图知从2006 年以后除2011年稍有上升外,其余年份都是逐年下降的,所 以C正确.由图知2006年以来我国二氧化硫年排放量与年份负 相关,D不正确. 答案D 5.为了判断高中三年级学生是否选修文科与性别的关系,现随 机抽取50名学生,得到如下22列联表: 理科 文科 男1310 女720 解析K2的观测值

7、k4.844,这表明小概率事件发生.根据假 设检验的基本原理,应该断定“是否选修文科与性别之间有 关系”成立,并且这种判断出错的可能性约为5%. 答案5% 考点一相关关系的判断考点一相关关系的判断 【例1】 (1)已知变量x和y近似满足关系式y0.1x1,变量y 与z正相关.下列结论中正确的是() A.x与y正相关,x与z负相关 B.x与y正相关,x与z正相关 C.x与y负相关,x与z负相关 D.x与y负相关,x与z正相关 (2)甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性 做试验,并用回归分析方法分别求得相关系数r与残差平方和 m如下表: 则哪位同学的试验结果体现A,B两变量有更强的

8、线性相关性( ) A.甲 B.乙 C.丙 D.丁 甲乙丙丁 r0.82 0.78 0.69 0.85 m106115124103 解析(1)由y0.1x1,知x与y负相关,即y随x的增大而减 小,又y与z正相关,所以z随y的增大而增大,减小而减小,所 以z随x的增大而减小,x与z负相关. (2)在验证两个变量之间的线性相关关系时,相关系数的绝对 值越接近于1,相关性越强,在四个选项中只有丁的相关系数 最大;残差平方和越小,相关性越强,只有丁的残差平方和 最小,综上可知丁的试验结果体现了A,B两变量有更强的线 性相关性. 答案(1)C(2)D 【训练1】 (1)某公司在2018年上半年的收入x(

9、单位:万元)与 月支出y(单位:万元)的统计资料如下表所示: 根据统计资料,则() A.月收入的中位数是15,x与y有正线性相关关系 B.月收入的中位数是17,x与y有负线性相关关系 C.月收入的中位数是16,x与y有正线性相关关系 D.月收入的中位数是16,x与y有负线性相关关系 月份 1月 份 2月 份 3月 份 4月 份 5月 份 6月 份 收入 x 12.314.515.017.019.820.6 支出 y 5.635.755.825.896.116.18 (2)x和y的散点图如图所示,则下列说法中所有正确命题的序 号为_. 答案(1)C(2) 考点二线性回归方程及应用考点二线性回归方

10、程及应用 【例2】 (2015全国卷)某公司为确定下一年度投入某种产品 的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位: t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年 销售量yi(i1,2,8)数据作了初步处理,得到下面的散 点图及一些统计量的值. 故年宣传费为46.24千元时,年利润的预报值最大. 【训练2】 (2018日照调研)某地随着经济的发展,居民收入逐 年增长,下表是该地一建设银行连续五年的储蓄存款(年底 余额),如下表1: 为了研究计算的方便,工作人员将上表的数据进行了处理,t x2 012,zy5得到下表2: 年份x 201 3 201 4 201

11、5 201 6 201 7 储蓄存款y(千 亿元) 567810 表1 时间代号t12345 z01235 表2 所以预测到2022年年底,该地储蓄存款额可达15.6千亿元. 考点三独立性检验考点三独立性检验 【例3】 (2017全国卷)海水养殖场进行某水产品的新、旧网 箱养殖方法的产量对比,收获时各随机抽取了100个网箱, 测量各箱水产品的产量(单位:kg),其频率分布直方图如下: (1)记A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率; (2)填写下面列联表,并根据列联表判断是否有99%的把握认 为箱产量与养殖方法有关; (3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣

12、 进行比较. 附: 箱产量6.635,故有99%的把握认为箱产量与养殖方法有 关. 箱产量50 kg 箱产量50 kg 旧养殖 法 6238 新养殖 法 3466 (3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或 中位数)在50 kg到55 kg之间,旧养殖法的箱产量平均值(或中位 数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧 养殖法的箱产量分布集中程度高.因此,可以认为新养殖法的箱 产量较高且稳定,从而新养殖法优于旧养殖法. 【训练3】 (2018合肥质检)某校在高一年级学生中,对自然 科学类、社会科学类校本选修课程的选课意向进行调查. 现 从高一年级学生中随机抽取180名学生,其中男生105名;在 这180名学生中选择社会科学类的男生、女生均为45名. (1)试问:从高一年级学生中随机抽取1人,抽到男生的概率 约为多少? (2)根据抽取的180名学生的调查结果,完成下面的22列联 表.并判断能否在犯错误的概率不超过0.025的前提下认为科 类的选择与性别有关? 选择自然科 学类 选择社会科 学类 合计 男生 女生 合计 P(K2 k0) 0.50 0 0.40 0 0.250 0.150 0.100 0.050 0.0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论