




已阅读5页,还剩71页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
11.3 变量间的相关关系、统计案例,基础知识 自主学习,课时作业,题型分类 深度剖析,内容索引,基础知识 自主学习,1.两个变量的线性相关,知识梳理,(1)正相关 在散点图中,点散布在从 到 的区域,对于两个变量的这种相关关系,我们将它称为正相关. (2)负相关 在散点图中,点散布在从 到 的区域,两个变量的这种相关关系称为负相关. (3)线性相关关系、回归直线 如果散点图中点的分布从整体上看大致在 ,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.,左下角,右上角,左上角,右下角,一条直线附近,2.回归方程,(1)最小二乘法 求回归直线,使得样本数据的点到它的 的方法叫做最小二乘法. (2)回归方程 是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn)的回归方程,其中 , 是待定参数.,距离的平方和最小,3.回归分析,(1)定义:对具有 的两个变量进行统计分析的一种常用方法. (2)样本点的中心 对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn),其中 称为样本点的中心. (3)相关系数 当r0时,表明两个变量 ; 当r0时,表明两个变量 .,相关关系,正相关,负相关,r的绝对值越接近于1,表明两个变量的线性相关性 . r的绝对值越接近于0,表明两个变量之间 .通常|r|大于 时,认为两个变量有很强的线性相关性.,越强,几乎不存在线性相关关系,0.75,4.独立性检验,(1)分类变量:变量的不同“值”表示个体所属的 ,像这类变量称为分类变量. (2)列联表:列出两个分类变量的 ,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为,不同类别,频数表,22列联表,构造一个随机变量K2 ,其中n 为样本容量.,abcd,(3)独立性检验 利用随机变量 来判断“两个分类变量 ”的方法称为独立性检验.,K2,有关系,判断下列结论是否正确(请在括号中打“”或“”) (1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.( ) (2)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.( ) (3)只有两个变量有相关关系,所得到的回归模型才有预测价值.( ),(4)某同学研究卖出的热饮杯数y与气温x()之间的关系,得回归方程 2.352x147.767,则气温为2时,一定可卖出143杯热饮.( ) (5)事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越大.( ) (6)由独立性检验可知,有99%的把握认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀.( ),考点自测,1.(2015湖北)已知变量x和y满足关系 0.1x1,变量y与z正相关.下列结论中正确的是 A.x与y正相关,x与z负相关 B.x与y正相关,x与z正相关 C.x与y负相关,x与z负相关 D.x与y负相关,x与z正相关,答案,解析,所以x与y负相关.又y与z正相关,,所以x与z负相关. 故选C.,2.(教材改编)下面是22列联表:则表中a,b的值分别为,答案,解析,A.94,72 B.52,50 C.52,74 D.74,52,a2173,a52.又a22b,b74.,3.(2016河南八市质检)为了研究某大型超市当天销售额与开业天数的关系,随机抽取了5天,其当天销售额与开业天数的数据如下表所示:,答案,解析,A.67 B.68 C.68.3 D.71,根据上表提供的数据,求得y关于x的线性回归方程为0.67x54.9,由于表中有一个数据模糊看不清,请你推断出该数据的值为,4.(2017湖南三校联考)某产品在某零售摊位的零售价x(单位:元)与每天的销售量y(单位:个)的统计资料如下表所示:,答案,解析,由上表可得线性回归方程 ,据此模型预测零售价为15元时,每天的销售量为 A.51个 B.50个 C.49个 D.48个,5.(2016玉溪一中月考)利用独立性检验来判断两个分类变量X和Y是否有关系,通过查阅下表来确定“X和Y有关系”的可信度.为了调查用电脑时间与视力下降是否有关系,现从某地网民中抽取100位居民进行调查.经过计算得K23.855,那么就有_%的把握认为用电脑时间与视力下降有关系.,答案,解析,根据表格发现3.8553.841,3.841对应的是0.05,所以根据独立性检验原理可知有95%的把握认为用电脑时间与视力下降有关系.,95,题型分类 深度剖析,题型一 相关关系的判断,例1 (1)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得线性回归方程,分别得到以下四个结论:,其中一定不正确的结论的序号是,答案,解析,A. B. C. D.,一定错误.,(2)x和y的散点图如图所示,则下列说法中所有正确命题的序号为_.,答案,解析,x,y是负相关关系;,x、y之间不能建立线性回归方程.,显然正确;,判定两个变量正、负相关性的方法 (1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关. (2)相关系数:r0时,正相关;r0时,负相关.,思维升华,跟踪训练1 (1)在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi)(i1,2,n)都在直线y x1上,则这组样本数据的样本相关系数为 A.1 B.0 C. D.1,所有点均在直线上,则样本相关系数最大,即为1,故选D.,答案,解析,(2)变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则 A.r2r10 B.0r2r1 C.r20r1 D.r2r1,对于变量Y与X而言,Y随X的增大而增大,故Y与X正相关,即r10;对于变量V与U而言,V随U的增大而减小,故V与U负相关,即r20,故选C.,答案,解析,题型二 线性回归分析,例2 (2016全国丙卷)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.,(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;,注:年份代码17分别对应年份20082014.,解答,由折线图中数据和附注中参考数据得,因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高, 从而可以用线性回归模型拟合y与t的关系.,(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.,附注:,解答,所以预测2016年我国生活垃圾无害化处理量将约为1.82亿吨.,线性回归分析问题的类型及解题方法 (1)求线性回归方程 利用公式,求出回归系数 待定系数法:利用回归直线过样本点的中心求系数. (2)利用回归方程进行预测,把线性回归方程看作一次函数,求函数值. (3)利用回归直线判断正、负相关;决定正相关还是负相关的是系数 . (4)回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.,思维升华,跟踪训练2 (2015课标全国)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值.,解答,(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;,解答,(3)已知这种产品的年利润z与x,y的关系为z0.2yx.根据(2)的结果回答下列问题: 年宣传费x49时,年销售量及年利润的预报值是多少?,解答,年宣传费x为何值时,年利润的预报值最大?,解答,根据(2)的结果知,年利润z的预报值,故年宣传费为46.24千元时,年利润的预报值最大.,题型三 独立性检验,例3 (2016福建厦门三中模拟)某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革的关系,随机抽取了100名员工进行调查,其中支持企业改革的调查者中,工作积极的有46人,工作一般的有35人,而不太赞成企业改革的调查者中,工作积极的有4人,工作一般的有15人. (1)根据以上数据建立一个22列联表;,解答,根据题设条件,得22列联表如下:,(2)对于人力资源部的研究项目,根据以上数据是否可以认为企业的全体员工对待企业改革的态度与其工作积极性有关系?,解答,提出假设:企业的全体员工对待企业改革的态度与其工作积极性无关.,根据(1)中的数据,可以求得,所以有99%的把握认为抽样员工对待企业改革的态度与工作积极性有关,,从而认为企业的全体员工对待企业改革的态度与其工作积极性有关.,(1)比较几个分类变量有关联的可能性大小的方法 通过计算K2的大小判断:K2越大,两变量有关联的可能性越大. 通过计算|adbc|的大小判断:|adbc|越大,两变量有关联的可能性越大. (2)独立性检验的一般步骤 根据样本数据制成22列联表.,思维升华,比较k与临界值的大小关系,作统计推断.,跟踪训练3 (2017衡阳联考)2016年9月20日是第28个全国爱牙日,为了迎接此节日,某地区卫生部门成立了调查小组,调查“常吃零食与患龋齿的关系”,对该地区小学六年级800名学生进行检查,按患龋齿和不患龋齿分类,并汇总数据:不常吃零食且不患龋齿的学生有60名,常吃零食但不患龋齿的学生有100名,不常吃零食但患龋齿的学生有140名. (1)能否在犯错误的概率不超过0.001的前提下,认为该地区学生常吃零食与患龋齿有关系?,解答,由题意可得22列联表如下:,根据22列联表中数据,得K2的观测值为,能在犯错误的概率不超过0.001的前提下,认为该地区学生常吃零食与患龋齿有关系.,(2)4名卫生部门的工作人员随机分成两组,每组2人,一组负责数据收集,另一组负责数据处理,求工作人员甲分到收集数据组,工作人员乙分到处理数据组的概率.,解答,设其他工作人员为丙和丁,4人分组的所有情况如下表.,由表可知,分组的情况共有6种,工作人员甲负责收集数据且工作人员乙负责处理数据的有2种,,典例 (12分)某地最近十年粮食需求量逐年上升,下表是部分统计数据:,思想方法指导,规范解答,求线性回归方程的方法技巧,思想与方法系列24,(1)利用所给数据求年需求量与年份之间的线性回归方程 ; (2)利用(1)中所求出的线性回归方程预测该地2016年的粮食需求量.,回归分析是处理变量相关关系的一种数学方法. 主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式; (2)根据一组观测值,预测变量的取值及判断变量取值的变化趋势; (3)求出线性回归方程。,返回,解 (1)由所给数据看出,年需求量与年份之间近似直线上升,下面来求线性回归方程,先将数据处理如下表.,由上述计算结果,知所求线性回归方程为,(2)利用所求得的线性回归方程, 可预测2016年的粮食需求量大约为 6.5(20162010)260.26.56260.2299.2(万吨). 12分,返回,课时作业,1.(2016衡水质检)具有线性相关关系的变量x,y满足一组数据如下表所示.若y与x的线性回归方程为 ,则m的值是,1,2,3,4,5,6,7,8,9,10,答案,解析,2.(2017武汉质检)根据如下样本数据,1,2,3,4,5,6,7,8,9,10,答案,解析,作出散点图如下:,1,2,3,4,5,6,7,8,9,10,3.(2017泰安月考)为了普及环保知识,增强环保意识,某大学从理工类专业的A班和文史类专业的B班各抽取20名同学参加环保知识测试.统计得到成绩与专业的列联表:,1,2,3,4,5,6,7,8,9,10,附:参考公式及数据:,(2)独立性检验的临界值表:,1,2,3,4,5,6,7,8,9,10,则下列说法正确的是 A.有99%的把握认为环保知识测试成绩与专业有关 B.有99%的把握认为环保知识测试成绩与专业无关 C.有95%的把握认为环保知识测试成绩与专业有关 D.有95%的把握认为环保知识测试成绩与专业无关,答案,解析,3.841K26.635,所以有95%的把握认为环保知识测试成绩与专业有关.,1,2,3,4,5,6,7,8,9,10,4.已知x与y之间的几组数据如下表:,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为ybxa,则以下结论正确的是,答案,解析,1,2,3,4,5,6,7,8,9,10,b2,a2,,1,2,3,4,5,6,7,8,9,10,5.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:,附:,1,2,3,4,5,6,7,8,9,10,A.列联表中c的值为30,b的值为35 B.列联表中c的值为15,b的值为50 C.根据列联表中的数据,若按97.5%的可靠性要求,能认为“成绩与 班级有关系” D.根据列联表中的数据,若按97.5%的可靠性要求,不能认为“成绩 与班级有关系”,答案,解析,1,2,3,4,5,6,7,8,9,10,由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75, 所以c20,b45,选项A、B错误.,根据列联表中的数据,,因此有97.5%的把握认为“成绩与班级有关系”.,1,2,3,4,5,6,7,8,9,10,6.(2016合肥二模)某市居民20102014年家庭年平均收入x(单位:万元)与年平均支出y(单位:万元)的统计资料如下表所示:,根据统计资料,居民家庭年平均收入的中位数是_,家庭年平均收入与年平均支出有_相关关系.(填“正”或“负”),中位数是13.由相关性知识,根据统计资料可以看出,当年平均收入增多时,年平均支出也增多,因此两者之间具有正相关关系.,答案,解析,13,正,1,2,3,4,5,6,7,8,9,10,7.以下四个命题,其中正确的序号是_. 从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样; 两个随机变量相关性越强,则相关系数的绝对值越接近于1; 在线性回归方程 0.2x12中,当解释变量x每增加一个单位时,预报变量 平均增加0.2个单位; 对分类变量X与Y的随机变量K2的观测值k来说,k越小,“X与Y有关系”的把握程度越大.,答案,解析,是系统抽样;对于,随机变量K2的观测值k越小,说明两个相关变量有关系的把握程度越小.,1,2,3,4,5,6,7,8,9,10,8.(2016长春模拟)在一次考试中,5名学生的数学和物理成绩如下表:(已知学生的数学和物理成绩具有线性相关关系),现已知其线性回归方程为 ,则根据此线性回归方程估计数学
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 设计公司前台管理制度
- 设计招标文件管理制度
- 诊所医疗感染管理制度
- 诊所隐患台账管理制度
- 货场租赁使用管理制度
- 2025年中国工业大语言模型行业市场全景分析及前景机遇研判报告
- 货物抵协议书范本
- 个人分账协议书范本大全
- 惩治老婆协议书范本
- 员工持干股协议书范本
- 经空气传播疾病医院感染预防与控制规范课件
- 冠心病合并糖尿病血脂管理
- GB/T 43492-2023预制保温球墨铸铁管、管件和附件
- PDCA循环在我院静脉用药调配中心用药错误管理中的应用静配中心质量持续改进案例
- 精神病患者攻击行为预防
- 《议程设置理论》课件
- 二单元税率利率复习课
- GB/Z 43281-2023即时检验(POCT)设备监督员和操作员指南
- 农药经营56学时培训模拟试题
- 衣柜全屋定制家具施工方案
- 广州市近5年中考语文作文真题及模拟题汇编(含参考例文)
评论
0/150
提交评论