高考数学大一轮复习 第十章 统计与统计案例 10.3 变量间的相关关系、统计案例课件 文 北师大版_第1页
高考数学大一轮复习 第十章 统计与统计案例 10.3 变量间的相关关系、统计案例课件 文 北师大版_第2页
高考数学大一轮复习 第十章 统计与统计案例 10.3 变量间的相关关系、统计案例课件 文 北师大版_第3页
高考数学大一轮复习 第十章 统计与统计案例 10.3 变量间的相关关系、统计案例课件 文 北师大版_第4页
高考数学大一轮复习 第十章 统计与统计案例 10.3 变量间的相关关系、统计案例课件 文 北师大版_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、10.3变量间的相关关系、统计案例,基础知识自主学习,课时作业,题型分类深度剖析,内容索引,基础知识自主学习,1.相关性,知识梳理,(1)通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的 . (2)从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这样近似的过程称为 . (3)若两个变量x和y的散点图中,所有点看上去都在一条直线附近波动,则称变量间是 的,若所有点看上去都在某条曲线(不是一条直线)附近波动,则称此相关是 的.如果所有的点在散点图中没有显示任何关系,则称变量间是 的.,散点图,

2、曲线拟合,线性相关,非线性相关,不相关,2.线性回归方程,(1)最小二乘法 如果有n个点(x1,y1),(x2,y2),(xn,yn),可以用y1(abx1)2y2(abx2)2yn(abxn)2来刻画这些点与直线yabx的接近程度,使得上式达到最小值的直线yabx就是所要求的直线,这种方法称为最小二乘法.,(2)线性回归方程 方程ybxa是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn)的线性回归方程,其中a,b是待定参数.,3.回归分析,(1)定义:对具有 的两个变量进行统计分析的一种常用方法. (2)样本点的中心 对于一组具有线性相关关系的数据(x1,y

3、1),(x2,y2),(xn,yn)中,( )称为样本点的中心.,相关关系,(3)相关系数,当r0时,表明两个变量 ; 当r0时,表明两个变量 ; 当r0时,表明两个变量 . |r|值越接近于1,表明两个变量之间的线性相关程度 . |r|值越接近于0,表明两个变量之间的线性相关程度越低.,正相关,负相关,线性不相关,越高,4.独立性检验,构造一个统计量,2 .,利用统计量2来判断“两个分类变量有关系”的方法称为独立性检验. 当22.706时,没有充分的证据判定变量a,b有关联,可以认为变量a,b是没有关联的; 当22.706时,有90%的把握判定变量a,b有关联; 当23.841时,有95%的

4、把握判定变量a,b有关联; 当26.635时,有99%的把握判定变量a,b有关联.,判断下列结论是否正确(请在括号中打“”或“”) (1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.() (2)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.() (3)只有两个变量有相关关系,所得到的回归模型才有预测价值.(),(4)某同学研究卖出的热饮杯数y与气温x()之间的关系,得回归方程y2.352x147.767,则气温为2时,一定可卖出143杯热饮.() (5)事件x,y关系越密切,则由观测数据计算得到的2越大.() (6)由独立性检验可知,有99%的把握认为物理成绩优

5、秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀.(),考点自测,1.(2015湖北)已知变量x和y满足关系y0.1x1,变量y与z正相关.下列结论中正确的是 a.x与y正相关,x与z负相关 b.x与y正相关,x与z正相关 c.x与y负相关,x与z负相关 d.x与y负相关,x与z正相关,答案,解析,因为y0.1x1,0.10), 所以z0.1bxba,0.1b0,所以x与z负相关.故选c.,2.(教材改编)下面是22列联表:,答案,解析,a.94,72 b.52,50 c.52,74 d.74,52,a2173,a52.又a22b,b74.,则表中a,b的值分别为,a.y0.4x

6、2.3 b.y2x2.4 c.y2x9.5 d.y0.3x4.4,答案,解析,因为变量x和y正相关,则回归直线的斜率为正,故可以排除选项c和d. 因为样本点的中心在回归直线上,把点(3,3.5)分别代入选项a和b中 的直线方程进行检验,可以排除b,故选a.,4.(2016西安模拟)某产品在某零售摊位的零售价x(单位:元)与每天的销售量y(单位:个)的统计资料如下表所示:,答案,解析,由上表可得线性回归方程ybxa中的b4,据此模型预测零售价为15元时,每天的销售量为 a.51个 b.50个 c.49个 d.48个,a109,10915449,故选c.,5.(2016玉溪一中月考)利用独立性检验

7、来判断两个分类变量x和y是否有关系,通过查阅下表来确定“x和y有关系”的可信度.为了调查用电脑时间与视力下降是否有关系,现从某地网民中抽取100位居民进行调查.经过计算得23.855,那么就有_%的把握认为用电脑时间与视力下降有关系.,答案,解析,根据表格发现3.8553.841,3.841对应的是0.05,所以根据独立性检验原理可知有95%的把握认为用电脑时间与视力下降有关系.,95,题型分类深度剖析,题型一相关关系的判断,例1(1)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得线性回归方程,分别得到以下四个结论:,y与x负相关且y2.347x6.423; y与x负相关且y3

8、.476x5.648; y与x正相关且y5.437x8.493; y与x正相关且y4.326x4.578. 其中一定不正确的结论的序号是 a. b.c. d.,答案,解析,由线性回归方程ybxa知当b0时,y与x正相关, 当b0时,y与x负相关, 一定错误.,(2)x和y的散点图如图所示,则下列说法中所有正确命题的序号为_.,答案,解析,显然正确; 由散点图知,用yc1 拟合的效果比用ybxa拟合的效果要好,故正确; x,y之间能建立线性回归方程,只不过预报精度不高,故不正确.,判定两个变量正、负相关性的方法 (1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,

9、两个变量负相关. (2)相关系数:r0时,正相关;r0时,正相关;b0时,负相关.,思维升华,跟踪训练1(1)在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi)(i1,2,n)都在直线y x1上,则这组样本数据的样本相关系数为,所有点均在直线上,则样本相关系数最大,即为1,故选d.,答案,解析,(2)变量x与y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量u与v相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1

10、).r1表示变量y与x之间的线性相关系数,r2表示变量v与u之间的线性相关系数,则 a.r2r10 b.0r2r1 c.r20r1 d.r2r1,对于变量y与x而言,y随x的增大而增大,故y与x正相关,即r10;对于变量v与u而言,v随u的增大而减小,故v与u负相关,即r20,故选c.,答案,解析,题型二线性回归分析,例2(2016全国丙卷)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.,(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;,注:年份代码17分别对应年份20082014.,解答,由折线图中数据和附注中参考数据得,因为y与t的

11、相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.,40.1749.322.89,,(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.,附注:,解答,所以预测2016年我国生活垃圾无害化处理量将约为1.82亿吨.,线性回归分析问题的类型及解题方法 (1)求线性回归方程 利用公式,求出回归系数b,a. 待定系数法:利用回归直线过样本点的中心求系数. (2)利用回归方程进行预测,把线性回归方程看作一次函数,求函数值. (3)利用回归直线判断正、负相关;决定正相关还是负相关的是系数b. (4)回归方程的拟合效果,

12、可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.,思维升华,跟踪训练2(2015课标全国)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值.,解答,(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;,解答,(3)已知这种产品的年利润z与x,y的关系为z0.2yx.根据(2)的结果回答下列问题: 年宣传费x49时,年销售量及年利润的预报值是多少?,解答,由(2)知,当x49时,,年宣传

13、费x为何值时,年利润的预报值最大?,解答,根据(2)的结果知,年利润z的预报值,故年宣传费为46.24千元时,年利润的预报值最大.,题型三独立性检验,例3(2016福建厦门三中模拟)某大型企业人力资源部为了研究企业员工工作的积极性和对待企业改革的态度的关系,随机抽取了100名员工进行调查,其中支持企业改革的调查者中,工作积极的有46人,工作一般的有35人,而不太赞成企业改革的调查者中,工作积极的有4人,工作一般的有15人.,(1)根据以上数据建立一个22列联表;,解答,根据题设条件,得22列联表如下:,(2)对于人力资源部的研究项目,根据以上数据是否可以认为企业的全体员工对待企业改革的态度与其

14、工作积极性有关系?,解答,提出假设:企业的全体员工对待企业改革的态度与其工作积极性无关.,根据(1)中的数据,可以求得,(1)比较几个分类变量有关联的可能性大小的方法 通过计算2的大小判断:2越大,两变量有关联的可能性越大. 通过计算|adbc|的大小判断:|adbc|越大,两变量有关联的可能性越大. (2)独立性检验的一般步骤 根据样本数据制成22列联表.,思维升华,比较2与临界值的大小关系,作出统计推断.,跟踪训练3(2016衡阳联考)2016年9月20日是第28个全国爱牙日,为了迎接此节日,某地区卫生部门成立了调查小组,调查“常吃零食与患龋齿的关系”,对该地区小学六年级800名学生进行检

15、查,按患龋齿和不患龋齿分类,并汇总数据:不常吃零食且不患龋齿的学生有60名,常吃零食但不患龋齿的学生有100名,不常吃零食但患龋齿的学生有140名. (1)能否在犯错误的概率不超过0.001的前提下,认为该地区学生常吃零食与患龋齿有关系?,解答,由题意可得22列联表如下:,根据22列联表中数据,得,能在犯错误的概率不超过0.001的前提下,认为该地区学生常吃零食与患龋齿有关系.,(2)4名卫生部门的工作人员随机分成两组,每组2人,一组负责数据收集,另一组负责数据处理,求工作人员甲分到收集数据组,工作人员乙分到处理数据组的概率.,解答,设其他工作人员为丙和丁,4人分组的所有情况如下表.,典例(1

16、2分)某地最近十年粮食需求量逐年上升,下表是部分统计数据:,思想方法指导,规范解答,求线性回归方程的方法技巧,思想与方法系列21,(1)利用所给数据求年需求量与年份之间的线性回归方程ybxa; (2)利用(1)中所求出的线性回归方程预测该地2016年的粮食需求量.,回归分析是处理变量相关关系的一种数学方法. 主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式; (2)根据一组统计数据,预测变量的取值及判断变量取值的变化趋势;(3)求出线性回归方程.,返回,解(1)由所给数据看出,年需求量与年份之间近似直线上升,下面来求线性回归方程,先将数据处理如下表.,由上述计

17、算结果,知所求线性回归方程为,(2)利用所求得的线性回归方程, 可预测2016年的粮食需求量大约为6.5(20162010)260.26.56260.2299.2(万吨). 12分,返回,y2576.5(x2010)3.2,,即y6.5(x2010)260.2. 8分,课时作业,1,2,3,4,5,6,7,8,9,10,答案,解析,2.(2016.湖南师大附中月考)已知x,y的取值如下表:,1,2,3,4,5,6,7,8,9,10,答案,解析,从所得散点图中分析可知:y与x线性相关,且y0.95xa,则x13时,y等于 a.1.45 b.13.8 c.13 d.12.8,1,2,3,4,5,6

18、,7,8,9,10,y与x线性相关,且y0.95xa,,5.250.954a,a1.45,,从而当x13时,有y13.8.故选b.,3.(2017泰安质检)为了普及环保知识,增强环保意识,某大学从理工类专业的a班和文史类专业的b班各抽取20名同学参加环保知识测试.统计得到成绩与专业的列联表:,1,2,3,4,5,6,7,8,9,10,附:参考公式及数据:,(2)独立性检验的临界值表:,1,2,3,4,5,6,7,8,9,10,则下列说法正确的是 a.有99%的把握认为环保知识测试成绩与专业有关 b.有99%的把握认为环保知识测试成绩与专业无关 c.有95%的把握认为环保知识测试成绩与专业有关

19、d.有95%的把握认为环保知识测试成绩与专业无关,答案,解析,3.84126.635,所以有95%的把握认为环保知识测试成绩与专业有关.,1,2,3,4,5,6,7,8,9,10,4.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i1,2,n),用最小二乘法建立的回归方程为y0.85x85.71,则下列结论中不正确的是,答案,解析,1,2,3,4,5,6,7,8,9,10,1,2,3,4,5,6,7,8,9,10,0.850,y与x正相关,a正确;,y0.85(x1)85.71(0.85x85.71)0.85,,c正确.故选d.,5.

20、有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:,附:,1,2,3,4,5,6,7,8,9,10,a.列联表中c的值为30,b的值为35 b.列联表中c的值为15,b的值为50 c.根据列联表中的数据,若按97.5%的可靠性要求,能认为“成绩与 班级有关系” d.根据列联表中的数据,若按97.5%的可靠性要求,不能认为“成绩 与班级有关系”,答案,解析,1,2,3,4,5,6,7,8,9,10,由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c20,b45,选项a、b错误.,根据列联表中的数据,,因此有97.5%的把握认

21、为“成绩与班级有关系”.,1,2,3,4,5,6,7,8,9,10,a.充分不必要条件 b.必要不充分条件 c.充要条件 d.既不充分也不必要条件,1,2,3,4,5,6,7,8,9,10,答案,解析,7.以下四个命题,其中正确的序号是_. 从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样; 两个随机变量相关性越强,则相关系数的绝对值越接近于1; 在线性回归方程y0.2x12中,当解释变量x每增加一个单位时,预报变量y平均增加0.2个单位; 对分类变量x与y的统计量2来说,2越小,“x与y有关系”的把握程度越大.,答案,解析,是系统抽样;对于

22、,统计量2越小,说明两个相关变量有关系的把握程度越小.,1,2,3,4,5,6,7,8,9,10,1,2,3,4,5,6,7,8,9,10,答案,解析,9.(2016.江西南昌二中模拟)为了研究某种细菌随时间x变化的繁殖个数y,收集数据如下:,1,2,3,4,5,6,7,8,9,10,(1)用天数作解释变量,繁殖个数作预报变量,作出这些数据的散点图,根据散点图判断yabx与yc1 哪一个作为繁殖个数y关于时间x变化的回归方程类型为最佳;(给出判断即可,不必说明理由),解答,1,2,3,4,5,6,7,8,9,10,画散点图如下.,由散点图看出样本点分布在一条类似指数函数图像的周围,于是先选择yc1 .,(2)根据(1)中判断的最佳类型及表中的数据,建立y关于x的回归方程.,解答,1,2,3,4,5,6,7,8,9,10,对yc1 两边取对数,得ln yc2xln c1.,得z0.691x1.112,所以ye0.691

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论