(通用版)高三数学二轮复习 第1部分 专题3 突破点8 回归分析、独立性检验 理.doc_第1页
(通用版)高三数学二轮复习 第1部分 专题3 突破点8 回归分析、独立性检验 理.doc_第2页
(通用版)高三数学二轮复习 第1部分 专题3 突破点8 回归分析、独立性检验 理.doc_第3页
(通用版)高三数学二轮复习 第1部分 专题3 突破点8 回归分析、独立性检验 理.doc_第4页
(通用版)高三数学二轮复习 第1部分 专题3 突破点8 回归分析、独立性检验 理.doc_第5页
免费预览已结束,剩余4页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

突破点8回归分析、独立性检验提炼1变量的相关性(1)正相关:在散点图中,点散布在从左下角到右上角的区域(2)负相关:在散点图中,点散布在从左上角到右下角的区域(3)相关系数r:当r0时,两变量正相关;当r0时,两变量负相关;当|r|1且|r|越接近于1,相关程度越高,当|r|1且|r|越接近于0,相关程度越低.提炼2线性回归方程方程x称为线性回归方程,其中,.(,)称为样本中心点.提炼3独立性检验(1)确定分类变量,获取样本频数,得到列联表(2)求观测值:k.(3)根据临界值表,作出正确判断如果kk,就推断“x与y有关系”,这种推断犯错误的概率不超过,否则就认为在犯错误的概率不超过的前提下不能推断“x与y有关系”回访1变量的相关性1(2015全国卷)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()图81a逐年比较,2008年减少二氧化硫排放量的效果最显著b2007年我国治理二氧化硫排放显现成效c2006年以来我国二氧化硫年排放量呈减少趋势d2006年以来我国二氧化硫年排放量与年份正相关d对于a选项,由图知从2007年到2008年二氧化硫排放量下降得最多,故a正确对于b选项,由图知,由2006年到2007年矩形高度明显下降,因此b正确对于c选项,由图知从2006年以后除2011年稍有上升外,其余年份都是逐年下降的,所以c正确由图知2006年以来我国二氧化硫年排放量与年份负相关,故选d.2(2012全国卷)在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi)(i1,2,n)都在直线yx1上,则这组样本数据的样本相关系数为()a1b0c.d1d样本点都在直线上时,其数据的估计值与真实值是相等的,即yii,代入相关系数公式r1.3(2015全国卷)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响对近8年的年宣传费xi和年销售量yi(i1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值图82 (xi)2 (wi)2 (xi)(yi) (wi)(yi)46.65636.8289.81.61 469108.8表中wi,wwi.(1)根据散点图判断,yabx与ycd哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z0.2yx.根据(2)的结果回答下列问题:年宣传费x49时,年销售量及年利润的预报值是多少?年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),(un,vn),其回归直线vu的斜率和截距的最小二乘估计分别为,.解(1)由散点图可以判断,ycd适宜作为年销售量y关于年宣传费x的回归方程类型.2分(2)令w,先建立y关于w的线性回归方程由于68, 563686.8100.6,4分所以y关于w的线性回归方程为100.668w,因此y关于x的回归方程为100.668.6分(3)由(2)知,当x49时,年销售量y的预报值100.668576.6,年利润z的预报值576.60.24966.32.8分根据(2)的结果知,年利润z的预报值0.2(100.668)xx13.620.12.10分所以当6.8,即x46.24时,取得最大值故年宣传费为46.24千元时,年利润的预报值最大.12分回访2独立性检验4(2012辽宁高考)电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:图83将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”(1)根据已知条件完成下面的22列联表,并据此资料你是否认为“体育迷”与性别有关?非体育迷体育迷合计男女1055合计(2)将上述调查所得到的频率视为概率现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为x.若每次抽取的结果是相互独立的,求x的分布列,期望e(x)和方差d(x)附:k2,p(k2k)0.050.01k3.8416.635解(1)由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而22列联表如下:非体育迷体育迷合计男301545女451055合计75251002分将22列联表中的数据代入公式计算,得k3.030.因为3.0305.024,2分所以有97.5%的把握认为视觉和空间能力与性别有关.3分(2)设甲、乙解答一道几何题的时间分别为x,y分钟,则表示的平面区域如图所示设事件a为“乙比甲先做完此道题”,则xy满足的区域如图中阴影部分所示.5分由几何概型可得p(a),即乙比甲先解答完的概率为.7分(3)由题可知,在选择做几何题的8名女生中任意抽取2人的方法有c28种,其中丙、丁2人没有一个人被抽到的有c15种;恰有一人被抽到的有cc12种;2人都被抽到的有c1种所以x的可能取值为0,1,2,p(x0),8分p(x1),9分p(x2).10分x的分布列为:x012p11分e(x)012.12分求解独立性检验问题时要注意:一是22列联表中的数据与公式中各个字母的对应,不能混淆;二是注意计算得到k之后的结论变式训练2(名师押题)2016年1月1日起全国统一实施全面二孩政策为了解适龄民众对放开生育二孩政策的态度,某市选取70后和80后作为调查对象,随机调查了100人,得到数据如下表:生二孩不生二孩总计70后30154580后451055总计7525100(1)以这100人的样本数据估计该市的总体数据,且以频率估计概率,若从该市70后公民中随机抽取3人,记其中生二孩的人数为x,求随机变量x的分布列和数学期望;(2)根据调查数据,是否有90%以上的把握认为“生二孩与年龄有关”,并说明理由参考数据:p(k2k0)0.150.100.050.0250.0100.005k02.0722.7063.8415.0246.6357.879参考公式:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论