(全国通用版)201X版高考数学大一轮复习第十章统计与统计案例第3节变量的相关性理新人教B版_第1页
(全国通用版)201X版高考数学大一轮复习第十章统计与统计案例第3节变量的相关性理新人教B版_第2页
(全国通用版)201X版高考数学大一轮复习第十章统计与统计案例第3节变量的相关性理新人教B版_第3页
(全国通用版)201X版高考数学大一轮复习第十章统计与统计案例第3节变量的相关性理新人教B版_第4页
(全国通用版)201X版高考数学大一轮复习第十章统计与统计案例第3节变量的相关性理新人教B版_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第3节变量的相关性,最新考纲1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系;2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆);3.了解独立性检验(只要求22列联表)的基本思想、方法及其简单应用;4.了解回归分析的基本思想、方法及其简单应用,知 识 梳 理,1.变量间的相关关系,1)常见的两变量之间的关系有两类:一类是函数关系,另一类是 ;与函数关系不同, 是一种非确定性关系. (2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为 ,点散布在左上角到右下角的区域内,两个变量的相关关系为

2、,相关关系,相关关系,正相关,负相关,2.回归分析,相关关系,回归直线方程,一条直线,中心,3)相关系数 计算相关系数r,r有以下性质:|r|_1,并且|r|越接近1,线性相关程度_;|r|越接近0,线性相关程度_; _,表明有95%的把握认为变量x与y之间具有线性相关关系,回归直线方程有意义;否则寻找回归直线方程毫无意义,越强,越弱,r|r0.05,3独立性检验 (1)22列联表,其中n1n11n12,n2n21n22,n1_,n2_,n_,n11n21,n12n22,n11n21n12n22,2)2统计量 2_. (3)两个临界值:3.841与6.635 当_时,有95%的把握说事件A与B

3、有关; 当_时,有99%的把握说事件A与B有关; 当_时,认为事件A与B是无关的,23.841,26.635,23.841,答案(1)(2)(3)(4,诊 断 自 测,2.(教材例题改编)某研究机构对高三学生的记忆力x和判断力y进行统计分析,所得数据如表,答案C,3.两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果最好的模型是() A.模型1的相关指数R2为0.98 B.模型2的相关指数R2为0.80 C.模型3的相关指数R2为0.50 D.模型4的相关指数R2为0.25 解析在两个变量y与x的回归模型中,它们的相关指数R2越近于1,模拟效果越好,在四个

4、选项中A的相关指数最大,所以拟合效果最好的是模型1. 答案A,4.(2015全国卷)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论不正确的是(,A.逐年比较,2008年减少二氧化硫排放量的效果最显著 B.2007年我国治理二氧化硫排放显现成效 C.2006年以来我国二氧化硫年排放量呈减少趋势 D.2006年以来我国二氧化硫年排放量与年份正相关 解析对于A选项,由图知从2007年到2008年二氧化硫排放量下降得最多,故A正确.对于B选项,由图知,由2006年到2007年矩形高度明显下降,因此B正确.对于C选项,由图知从2006年以后除2011年稍有上升外,

5、其余年份都是逐年下降的,所以C正确.由图知2006年以来我国二氧化硫年排放量与年份负相关,D不正确. 答案D,5.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下22列联表,解析24.8443.841,有95%的把握认为选修文科与性别有关系. 答案95,考点一相关关系的判断 【例1】 (1)已知变量x和y近似满足关系式y0.1x1,变量y与z正相关.下列结论中正确的是() A.x与y正相关,x与z负相关 B.x与y正相关,x与z正相关 C.x与y负相关,x与z负相关 D.x与y负相关,x与z正相关,2)甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并

6、用回归分析方法分别求得相关系数r与残差平方和m如下表,则哪位同学的试验结果体现A,B两变量有更强的线性相关性() A.甲 B.乙 C.丙 D.丁,解析(1)由y0.1x1,知x与y负相关,即y随x的增大而减小,又y与z正相关,所以z随y的增大而增大,减小而减小,所以z随x的增大而减小,x与z负相关. (2)在验证两个变量之间的线性相关关系时,相关系数的绝对值越接近于1,相关性越强,在四个选项中只有丁的相关系数最大;残差平方和越小,相关性越强,只有丁的残差平方和最小,综上可知丁的试验结果体现了A,B两变量有更强的线性相关性. 答案(1)C(2)D,训练1】 (1)某公司在2018年上半年的收入x

7、(单位:万元)与月支出y(单位:万元)的统计资料如下表所示,根据统计资料,则() A.月收入的中位数是15,x与y有正线性相关关系 B.月收入的中位数是17,x与y有负线性相关关系 C.月收入的中位数是16,x与y有正线性相关关系 D.月收入的中位数是16,x与y有负线性相关关系,2)x和y的散点图如图所示,则下列说法中所有正确命题的序号为_,答案(1)C(2,考点二线性回归方程及应用 【例2】 (2015全国卷)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i1,2,8)数

8、据作了初步处理,得到下面的散点图及一些统计量的值,训练2】 (2018日照调研)某地随着经济的发展,居民收入逐年增长,下表是该地一建设银行连续五年的储蓄存款(年底余额),如下表1,表1,为了研究计算的方便,工作人员将上表的数据进行了处理,tx2 012,zy5得到下表2,表2 (1)求z关于t的线性回归方程; (2)通过(1)中的方程,求出y关于x的回归方程; (3)用所求回归方程预测到2022年年底,该地储蓄存款额可达多少,考点三独立性检验,例3】 某高校共有学生15 000人,其中男生10 500人,女生4 500人.为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集了30

9、0位学生每周平均体育运动时间的样本数据(单位:小时). (1)应收集多少位女生的样本数据? (2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:0,2,(2,4,(4,6,(6,8,(8,10,(10,12.估计该校学生每周平均体育运动时间超过4小时的概率,3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关,又因为样本数据中有210份是关于男生的,90份是关于女生的,所以每周平均体育运动时间与性别列联表如下,训练3】 (2018潍坊质检)某校在高一年级学生中,对自然科学类、社会科学类校本选修课程的选课意向进行调查. 现从高一年级学生中随机抽取180名学生,其中男生105名;在这180名学生中选择社会科学类的男生

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论