2018版高考数学一轮复习统计与概率11.3变量间的相关关系统计案例理.docx_第1页
2018版高考数学一轮复习统计与概率11.3变量间的相关关系统计案例理.docx_第2页
2018版高考数学一轮复习统计与概率11.3变量间的相关关系统计案例理.docx_第3页
2018版高考数学一轮复习统计与概率11.3变量间的相关关系统计案例理.docx_第4页
2018版高考数学一轮复习统计与概率11.3变量间的相关关系统计案例理.docx_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十一章 统计与概率 11.3 变量间的相关关系、统计案例 理1两个变量的线性相关(1)正相关在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关(2)负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关(3)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线2回归方程(1)最小二乘法求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法(2)回归方程方程 x 是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn)的回归方程,其中 , 是待定参数3回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法(2)样本点的中心对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn),其中(,)称为样本点的中心(3)相关系数当r0时,表明两个变量正相关;当r0时,表明两个变量负相关r的绝对值越接近于1,表明两个变量的线性相关性越强r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系通常|r|大于0.75时,认为两个变量有很强的线性相关性4独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量(2)列联表:列出两个分类变量的频数表,称为列联表假设有两个分类变量X和Y,它们的可能取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为22列联表y1y2总计x1ababx2cdcd总计acbdabcd构造一个随机变量K2,其中nabcd为样本容量(3)独立性检验利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验【思考辨析】判断下列结论是否正确(请在括号中打“”或“”)(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系()(2)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系()(3)只有两个变量有相关关系,所得到的回归模型才有预测价值()(4)某同学研究卖出的热饮杯数y与气温x()之间的关系,得回归方程2.352x147.767,则气温为2时,一定可卖出143杯热饮()(5)事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越大()(6)由独立性检验可知,有99%的把握认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀()1(2015湖北)已知变量x和y满足关系 0.1x1,变量y与z正相关下列结论中正确的是()Ax与y正相关,x与z负相关Bx与y正相关,x与z正相关Cx与y负相关,x与z负相关Dx与y负相关,x与z正相关答案C解析因为 0.1x1,0.10),所以 0.1 x ,0.1 3.841,3.841对应的是0.05,所以根据独立性检验原理可知有95%的把握认为用电脑时间与视力下降有关系.题型一相关关系的判断例1(1)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得线性回归方程,分别得到以下四个结论:y与x负相关且2.347x6.423;y与x负相关且3.476x5.648;y与x正相关且5.437x8.493;y与x正相关且4.326x4.578.其中一定不正确的结论的序号是()A BC D(2)x和y的散点图如图所示,则下列说法中所有正确命题的序号为_x,y是负相关关系;在该相关关系中,若用yc1 拟合时的相关系数的平方为r,用x拟合时的相关系数的平方为r,则rr;x、y之间不能建立线性回归方程答案(1)D(2)解析(1)由线性回归方程x知当0时,y与x正相关,当0时,正相关;r0时,正相关; 6.635,所以有99%的把握认为抽样员工对待企业改革的态度与工作积极性有关,从而认为企业的全体员工对待企业改革的态度与其工作积极性有关思维升华(1)比较几个分类变量有关联的可能性大小的方法通过计算K2的大小判断:K2越大,两变量有关联的可能性越大通过计算|adbc|的大小判断:|adbc|越大,两变量有关联的可能性越大(2)独立性检验的一般步骤根据样本数据制成22列联表根据公式K2计算K2的观测值k.比较k与临界值的大小关系,作统计推断(2017衡阳联考)2016年9月20日是第28个全国爱牙日,为了迎接此节日,某地区卫生部门成立了调查小组,调查“常吃零食与患龋齿的关系”,对该地区小学六年级800名学生进行检查,按患龋齿和不患龋齿分类,并汇总数据:不常吃零食且不患龋齿的学生有60名,常吃零食但不患龋齿的学生有100名,不常吃零食但患龋齿的学生有140名(1)能否在犯错误的概率不超过0.001的前提下,认为该地区学生常吃零食与患龋齿有关系?(2)4名卫生部门的工作人员随机分成两组,每组2人,一组负责数据收集,另一组负责数据处理,求工作人员甲分到收集数据组,工作人员乙分到处理数据组的概率附:K2P(K2k0)0.0100.0050.001k06.6357.87910.828解(1)由题意可得22列联表如下:不常吃零食常吃零食总计不患龋齿60100160患龋齿140500640总计200600800根据22列联表中数据,得K2的观测值为k16.66710.828.能在犯错误的概率不超过0.001的前提下,认为该地区学生常吃零食与患龋齿有关系(2)设其他工作人员为丙和丁,4人分组的所有情况如下表.小组123456收集数据甲乙甲丙甲丁乙丙乙丁丙丁处理数据丙丁乙丁乙丙甲丁甲丙甲乙由表可知,分组的情况共有6种,工作人员甲负责收集数据且工作人员乙负责处理数据的有2种,故工作人员甲分到收集数据组,工作人员乙分到处理数据组的概率为P.24求线性回归方程的方法技巧典例(12分)某地最近十年粮食需求量逐年上升,下表是部分统计数据:年份20062008201020122014需求量/万吨236246257276286(1)利用所给数据求年需求量与年份之间的线性回归方程x;(2)利用(1)中所求出的线性回归方程预测该地2016年的粮食需求量思想方法指导回归分析是处理变量相关关系的一种数学方法主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观测值,预测变量的取值及判断变量取值的变化趋势;(3)求出线性回归方程规范解答解(1)由所给数据看出,年需求量与年份之间近似直线上升,下面来求线性回归方程,先将数据处理如下表.年份201042024需求257211101929对处理的数据,容易算得0,3.2,4分6.5, 3.2.6分由上述计算结果,知所求线性回归方程为2576.5(x2010)3.2,即6.5(x2010)260.2.8分(2)利用所求得的线性回归方程,可预测2016年的粮食需求量大约为6.5(20162010)260.26.56260.2299.2(万吨)12分1(2016衡水质检)具有线性相关关系的变量x,y满足一组数据如下表所示若y与x的线性回归方程为3x,则m的值是()x0123y11m8A.4 B. C5 D6答案A解析由已知得,2,又因为点(,)在直线3x上,所以23,得m4.2(2017武汉质检)根据如下样本数据x345678y4.02.50.50.52.03.0得到的回归方程为x,则()A.0,0 B.0,0C.0 D.0,0答案B解析作出散点图如下:观察图象可知,回归直线x的斜率0.故0,0.3(2017泰安月考)为了普及环保知识,增强环保意识,某大学从理工类专业的A班和文史类专业的B班各抽取20名同学参加环保知识测试统计得到成绩与专业的列联表:优秀非优秀总计A班14620B班71320总计211940附:参考公式及数据:(1)统计量:K2(nabcd)(2)独立性检验的临界值表:P(K2k0)0.0500.010k03.8416.635则下列说法正确的是()A有99%的把握认为环保知识测试成绩与专业有关B有99%的把握认为环保知识测试成绩与专业无关C有95%的把握认为环保知识测试成绩与专业有关D有95%的把握认为环保知识测试成绩与专业无关答案C解析因为K24.912,3841K2b, a B. b, aC. a D. b, a答案C解析b2,a2,由公式 ,求得 , , a.5有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:优秀非优秀总计甲班10b乙班c30合计附:P(K2k0)0.050.0250.0100.005k03.8415.0246.6357.879已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是()A列联表中c的值为30,b的值为35B列联表中c的值为15,b的值为50C根据列联表中的数据,若按97.5%的可靠性要求,能认为“成绩与班级有关系”D根据列联表中的数据,若按97.5%的可靠性要求,不能认为“成绩与班级有关系”答案C解析由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c20,b45,选项A、B错误根据列联表中的数据,得到K26.1095.024,因此有97.5%的把握认为“成绩与班级有关系”6(2016合肥二模)某市居民20102014年家庭年平均收入x(单位:万元)与年平均支出y(单位:万元)的统计资料如下表所示:年份20102011201220132014收入x11.512.11313.315支出y6.88.89.81012根据统计资料,居民家庭年平均收入的中位数是_,家庭年平均收入与年平均支出有_相关关系(填“正”或“负”)答案13正解析中位数是13.由相关性知识,根据统计资料可以看出,当年平均收入增多时,年平均支出也增多,因此两者之间具有正相关关系7以下四个命题,其中正确的序号是_从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;两个随机变量相关性越强,则相关系数的绝对值越接近于1;在线性回归方程 0.2x12中,当解释变量x每增加一个单位时,预报变量 平均增加0.2个单位;对分类变量X与Y的随机变量K2的观测值k来说,k越小,“X与Y有关系”的把握程度越大答案解析是系统抽样;对于,随机变量K2的观测值k越小,说明两个相关变量有关系的把握程度越小8(2016长春模拟)在一次考试中,5名学生的数学和物理成绩如下表:(已知学生的数学和物理成绩具有线性相关关系)学生的编号i12345数学成绩x8075706560物理成绩y7066686462现已知其线性回归方程为 0.36x ,则根据此线性回归方程估计数学得90分的同学的物理成绩为_(四舍五入到整数)答案73解析70,66,所以660.3670 , 40.8,即线性回归方程为 0.36x40.8.当x90时, 0.369040.873.273.9某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在29.94,30.06)的零件为优质品从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:甲厂:分组29.86,29.90)29.90,29.94)29.94,29.98)29.98,30.02)30.02,30.06)30.06,30.10)30.10,30.14频数12638618292614乙厂:分组29.86,29.90)29.90,29.94)29.94,29.98)29.98,30.02)30.02,30.06)30.06,30.10)30.10,30.14频数297185159766218(1)试分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填下面22列联表,问是否有99%的把握认为“两个分厂生产的零件的质量有差异”?甲厂乙厂合计优质品非优质品合计附P(K2k0)0.050.01k03.8416.635解(1)甲厂抽查的500件产品中有360件优质品,从而估计甲厂生产的零件的优质品率为100%72%;乙厂抽查的500件产品中有320件优质品,从而估计乙厂生产的零件的优质品率为100%64%.(2)完成的22列联表如下:甲厂乙厂合计优质品360320680非优质品140180320合计5005001 000由表中数据计算得K2的观测值k7.3536.635,所以有99%的把握认为“两个分厂生产的零件的质量有差异”10某百货公司16月份的销售量x与利润y的统计数据如下表:月份123456销售量x(万件)1011131286利润y

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论