高考数学二轮复习 第1部分 重点强化专题 专题3 概率与统计 突破点8 独立性检验与回归分析学案 文_第1页
高考数学二轮复习 第1部分 重点强化专题 专题3 概率与统计 突破点8 独立性检验与回归分析学案 文_第2页
高考数学二轮复习 第1部分 重点强化专题 专题3 概率与统计 突破点8 独立性检验与回归分析学案 文_第3页
高考数学二轮复习 第1部分 重点强化专题 专题3 概率与统计 突破点8 独立性检验与回归分析学案 文_第4页
高考数学二轮复习 第1部分 重点强化专题 专题3 概率与统计 突破点8 独立性检验与回归分析学案 文_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

突破点8独立性检验与回归分析核心知识提炼提炼1 变量的相关性(1)正相关:在散点图中,点散布在从左下角到右上角的区域(2)负相关:在散点图中,点散布在从左上角到右下角的区域(3)相关系数r:当r0时,两变量正相关;当r0时,两变量负相关;当|r|1且|r|越接近于1,相关程度越高,当|r|1且|r|越接近于0,相关程度越低提炼2 线性回归方程方程x称为线性回归方程,其中,.回归直线恒过样本中心(,)提炼3 独立性检验(1)确定分类变量,获取样本频数,得到22列联表(2)求观测值:k.(3)根据临界值表,作出正确判断如果kk,就推断“X与Y有关系”,这种推断犯错误的概率不超过,否则就认为在犯错误的概率不超过的前提下不能推断“X与Y有关系”高考真题回访回访1变量的相关性1(2015全国卷)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()图81A逐年比较,2008年减少二氧化硫排放量的效果最显著B2007年我国治理二氧化硫排放显现成效C2006年以来我国二氧化硫年排放量呈减少趋势D2006年以来我国二氧化硫年排放量与年份正相关D对于A选项,由图知从2007年到2008年二氧化硫排放量下降得最多,故A正确对于B选项,由图知,由2006年到2007年矩形高度明显下降,因此B正确对于C选项,由图知从2006年以后除2011年稍有上升外,其余年份都是逐年下降的,所以C正确由图知2006年以来我国二氧化硫年排放量与年份负相关,故选D.2(2012全国卷)在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi)(i1,2,n)都在直线yx1上,则这组样本数据的样本相关系数为()A1B0C.D1D样本点都在直线上时,其数据的估计值与真实值是相等的,即yii,代入相关系数公式r1.3(2017全国卷)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm)下面是检验员在一天内依次抽取的16个零件的尺寸:抽取次序12345678零件尺寸9.9510.129.969.9610.019.929.9810.04抽取次序910111213141516零件尺寸10.269.9110.1310.029.2210.0410.059.95(1)求(xi,i)(i1,2,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小)(2)一天内抽检零件中,如果出现了尺寸在(3s,3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查()从这一天抽检的结果看,是否需对当天的生产过程进行检查?()在(3s,3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差(精确到0.01)附:样本(xi,yi)(i1,2,n)的相关系数r解 (1)由样本数据得(xi,i)(i1,2,16)的相关系数r0.182分由于|r|0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小4分(2)()由于9.97,s0.212,因此由样本数据可以看出抽取的第13个零件的尺寸在(3s,3s)以外,因此需对当天的生产过程进行检查6分()剔除离群值,即第13个数据,剩下数据的平均数为(169.979.22)10.02,这条生产线当天生产的零件尺寸的均值的估计值为10.028分x160.2122169.9721 591.134,10分剔除第13个数据,剩下数据的样本方差为(1 591.1349.2221510.022)0.008,这条生产线当天生产的零件尺寸的标准差的估计值为0.0912分回访2独立性检验4(2017全国卷)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下: 图82(1)记A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;箱产量50 kg箱产量50 kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较附:P(K2k0)0.0500.0100.001k03.8416.63510.828K2.解 (1)旧养殖法的箱产量低于50 kg的频率为(0.0120.0140.0240.0340.040)50.62.因此,事件A的概率估计值为0.62.3分(2)根据箱产量的频率分布直方图得列联表箱产量50 kg箱产量50 kg旧养殖法6238新养殖法34665分K2的观测值k15.705.由于15.7056.635,故有99%的把握认为箱产量与养殖方法有关8分(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法12分热点题型1回归分析题型分析:高考命题常以实际生活为背景,重在考查回归分析中散点图的作用、回归方程的求法和应用,难度中等【例1】在一次抽样调查中测得样本的5组数据,得到一个变量y关于x的回归方程模型,其对应的数值如下表:x0.250.5124y1612521(1)试作出散点图,根据散点图判断,yabx与ym哪一个适宜作为变量y关于x的回归方程模型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立变量y关于x的回归方程;(3)根据(2)中所求的变量y关于x的回归方程预测:当x3时,对应的y值为多少?(保留四位有效数字)解 (1)作出变量y与x之间的散点图,如图所示,2分由图可知变量y与x近似地呈反比例函数关系,那么ym适宜作为变量y关于x的回归方程模型4分(2)由(1)知ym适宜作为变量y关于x的回归方程模型,令t,则yktm,由y与x的数据表可得y与t的数据表如下:t4210.50.25y16125216分作出y与t的散点图,如图所示8分由图可知y与t近似地呈线性相关关系又1.55,7.2,iyi94.25,21.312 5,所以k4.134 4,mk7.24.134 41.550.8,所以y4.134 4t0.8,所以y关于x的回归方程为y0.810分(3)由(2)得y关于x的回归方程是y0.8,当x3时,可得y0.82.17812分方法指津1正确理解计算,的公式和准确的计算,是求线性回归方程的关键其中回归直线必过样本中心(,)2在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值变式训练1二手车经销商小王对其所经营的A型号二手汽车的使用年数x与销售价格y(单位:万元/辆)进行整理,得到如下数据:使用年数x234567售价y201286.44.43zln y3.002.482.081.861.481.10下面是z关于x的折线图:图83(1)由折线图可以看出,可以用线性回归模型拟合z与x的关系,请用相关系数加以说明;(2)求y关于x的回归方程,并预测某辆A型号二手车当使用年数为9年时售价约为多少;(,小数点后保留两位数字)(3)基于成本的考虑,该型号二手车的售价不得低于7 118元,请根据(2)求出的回归方程预测在收购该型号二手车时车辆的使用年数不得超过多少年参考公式:, ,r.参考数据:xiyi187.4,xizi47.64,x139,4.18,13.96,1.53,ln 1.460.38,ln 0.711 80.34. 解 (1)由题意,知(234567)4.5,1分(3.002.482.081.861.481.10)2,2分又xizi47.64,4.18,1.53,r0.99,z与x的相关系数大约为0.99,说明z与x的线性相关程度很高4分(2)0.36,5分 20.364.53.62,z与x的线性回归方程是0.36x3.62,6分又zln y,y关于x的回归方程是e0.36x3.62.7分令x9,得e0.3693.62e0.38,ln 1.460.38,1.46,即预测某辆A型号二手车当使用年数为9年时售价约为1.46万元8分(3)当0.711 8,即e0.36x3.620.711 8eln 0.711 8e0.34时,则有0.36x3.620.34,解得x11,因此,预测在收购该型号二手车时车辆的使用年数不得超过11年12分热点题型2独立性检验题型分析:尽管全国卷在近几年未在该点命题,但其极易与分层抽样、古典概型等知识交汇,是潜在的命题点之一,需引起足够的重视【例2】(2017长沙二模)某学校的特长班有50名学生,其中有体育生20名,艺术生30名,在学校组织的一次体检中,该班所有学生进行了心率测试,心率全部介于50次/分到75次/分之间,现将数据分成五组,第一组50,55),第二组55,60),第五组70,75,按上述分组方法得到的频率分布直方图如图84所示,已知图中从左到右的前三组的频率之比为a410.图84(1)求a的值,并求这50名学生心率的平均值;(2)因为学习专业的原因,体育生常年进行系统的身体锻炼,艺术生则很少进行系统的身体锻炼,若从第一组和第二组的学生中随机抽取1名,该学生是体育生的概率为0.8,请将下面的列联表补充完整,并判断是否有99.5%的把握认为心率小于60次/分与常年进行系统的身体锻炼有关?说明你的理由心率小于60次/分心率不小于60次/分合计体育生20艺术生30合计50参考数据:P(K2k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828参考公式:K2,其中nabcd.解 (1)因为第二组数据的频率为0.03250.16,故第二组的频数为0.16508,所以第一组的频数为2a,第三组的频数为20,第四组的频数为16,第五组的频数为4.所以2a502016842,故a1.3分所以这50名学生的心率平均值为52.557.562.567.572.563.7.5分(2)由(1)知,第一组和第二组的学生(即心率小于60次/分的学生)共10名,其中体育生有100.88(名),故列联表补充如下:心率小于60次/分心率不小于60次/分合计体育生81220艺术生22830合计104050所以K28.3337.879,故有99.5%的把握认为心率小于60次/分与常年进行系统的身体锻炼有关12分方法指津求解独立性检验问题时要注意:一是22列联表中的数据与公式中各个字母的对应,不能混淆;二是注意计算得到K2之后的结论变式训练2(2017兰州三模)随着手机的发展,“微信”逐渐成为人们交流的一种形式某机构对“使用微信交流”的态度进行调查,随机抽取了50人,他们年龄的频数分布及对“使用微信交流”赞成人数如下表年龄(单位:岁)15,25)25,35)35,45)45,55)55,65)65,75频数510151055赞成人数51012721(1)若以“年龄45岁为分界点”,由以上统计数据完成下面22列联表,并判断是否有99%的把握认为“使用微信交流”的态度与人的年龄有关;年龄不低于45岁的人数年龄低于45岁的人数合计赞成不赞成合计(2)若从年龄在55,65)的被调查人中随机选取2人进行追踪调查,求2人中至少有1人不赞成“使用微信交流”的概率. 参考数据:P(K2k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828K2,其中nabcd. 解 (1)22列联表如下:年龄不低于45岁的人数年龄低于45岁的人数合计赞成102737不赞成10313合计203050K29.986.635.所以有99%的把握认为“使用微信交流”的态度与人的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论