高三数学二轮复习 第1部分 专题3 突破点8 回归分析、独立性检验 理-人教高三数学试题_第1页
高三数学二轮复习 第1部分 专题3 突破点8 回归分析、独立性检验 理-人教高三数学试题_第2页
高三数学二轮复习 第1部分 专题3 突破点8 回归分析、独立性检验 理-人教高三数学试题_第3页
高三数学二轮复习 第1部分 专题3 突破点8 回归分析、独立性检验 理-人教高三数学试题_第4页
高三数学二轮复习 第1部分 专题3 突破点8 回归分析、独立性检验 理-人教高三数学试题_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

突破点8回归分析、独立性检验提炼1变量的相关性(1)正相关:在散点图中,点散布在从左下角到右上角的区域.(2)负相关:在散点图中,点散布在从左上角到右下角的区域.(3)相关系数r:当r>0时,两变量正相关;当r<0时,两变量负相关;当|r|≤1且|r|越接近于1,相关程度越高,当|r|≤1且|r|越接近于0,相关程度越低.提炼2线性回归方程方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))称为线性回归方程,其中eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,x)iyi-n\o(x,\s\up6(-))\o(y,\s\up6(-)),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-)).(eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-)))称为样本中心点.提炼3独立性检验(1)确定分类变量,获取样本频数,得到列联表.(2)求观测值:k=eq\f(nad-bc2,a+bc+da+cb+d).(3)根据临界值表,作出正确判断.如果k≥kα,就推断“X与Y有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”.回访1变量的相关性1.(2015·全国卷Ⅱ)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()图8­1A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关D对于A选项,由图知从2007年到2008年二氧化硫排放量下降得最多,故A正确.对于B选项,由图知,由2006年到2007年矩形高度明显下降,因此B正确.对于C选项,由图知从2006年以后除2011年稍有上升外,其余年份都是逐年下降的,所以C正确.由图知2006年以来我国二氧化硫年排放量与年份负相关,故选D.]2.(2012·全国卷)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=eq\f(1,2)x+1上,则这组样本数据的样本相关系数为()A.-1 B.0C.eq\f(1,2) D.1D样本点都在直线上时,其数据的估计值与真实值是相等的,即yi=eq\o(y,\s\up6(^))i,代入相关系数公式r=eq\r(1-\f(\i\su(i=1,n,)yi-\o(y,\s\up6(^))i2,\i\su(i=1,n,)yi-\x\to(y)2))=1.]3.(2015·全国卷Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.图8­2eq\x\to(x)eq\x\to(y)eq\x\to(w)eq\o(∑,\s\up6(8))eq\o(,\s\do4(i=1))(xi-eq\x\to(x))2eq\o(∑,\s\up6(8))eq\o(,\s\do4(i=1))(wi-eq\x\to(w))2eq\o(∑,\s\up6(8))eq\o(,\s\do4(i=1))(xi-eq\x\to(x))(yi-eq\x\to(y))eq\o(∑,\s\up6(8))eq\o(,\s\do4(i=1))(wi-eq\x\to(w))(yi-eq\x\to(y))46.65636.8289.81.61469108.8表中wi=eq\r(xi),w]=eq\f(1,8)eq\o(∑,\s\up6(8))eq\o(,\s\do4(i=1))wi.(1)根据散点图判断,y=a+bx与y=c+deq\r(x)哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:①年宣传费x=49时,年销售量及年利润的预报值是多少?②年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为eq\o(β,\s\up6(^))=eq\f(\o(∑,\s\up6(n))\o(,\s\do4(i=1))ui-\x\to(u)vi-\x\to(v),\o(∑,\s\up6(n))\o(,\s\do4(i=1))ui-\x\to(u)2),eq\o(α,\s\up6(^))=eq\x\to(v)-eq\o(β,\s\up6(^))eq\a\vs4\al(\x\to(u)).解](1)由散点图可以判断,y=c+deq\r(x)适宜作为年销售量y关于年宣传费x的回归方程类型.2分(2)令w=eq\r(x),先建立y关于w的线性回归方程.由于eq\o(d,\s\up6(^))=eq\f(\i\su(i=1,8,)wi-\x\to(w)yi-\x\to(y),\i\su(i=1,8,)wi-\x\to(w)2)=eq\f(108.8,1.6)=68,eq\o(c,\s\up6(^))=eq\x\to(y)-eq\o(d,\s\up6(^))eq\x\to(w)=563-68×6.8=100.6,4分所以y关于w的线性回归方程为eq\o(y,\s\up6(^))=100.6+68w,因此y关于x的回归方程为eq\o(y,\s\up6(^))=100.6+68eq\r(x).6分(3)①由(2)知,当x=49时,年销售量y的预报值eq\o(y,\s\up6(^))=100.6+68eq\r(49)=576.6,年利润z的预报值eq\o(z,\s\up6(^))=576.6×0.2-49=66.32.8分②根据(2)的结果知,年利润z的预报值eq\o(z,\s\up6(^))=0.2(100.6+68eq\r(x))-x=-x+13.6eq\r(x)+20.12.10分所以当eq\r(x)=eq\f(13.6,2)=6.8,即x=46.24时,eq\o(z,\s\up6(^))取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.12分回访2独立性检验4.(2012·辽宁高考)电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:图8­3将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.(1)根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?非体育迷体育迷合计男女1055合计(2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X.若每次抽取的结果是相互独立的,求X的分布列,期望E(X)和方差D(X).附:K2=eq\f(nn11n22-n12n212,n1+n2+n+1n+2),P(K2≥k)0.050.01k3.8416.635解](1)由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而2×2列联表如下:非体育迷体育迷合计男301545女451055合计75251002分将2×2列联表中的数据代入公式计算,得k=eq\f(nn11n22-n12n212,n1+n2+n+1n+2)=eq\f(100×30×10-45×152,75×25×45×55)=eq\f(100,33)≈3.030.因为3.030<3.841,所以没有理由认为“体育迷”与性别有关.6分(2)由频率分布直方图知抽到“体育迷”的频率为0.25,将频率视为概率,即从观众中抽取一名“体育迷”的概率为eq\f(1,4).8分由题意知X~Beq\b\lc\(\rc\)(\a\vs4\al\co1(3,\f(1,4))),从而X的分布列为X0123Peq\f(27,64)eq\f(27,64)eq\f(9,64)eq\f(1,64)10分E(X)=np=3×eq\f(1,4)=eq\f(3,4),D(X)=np(1-p)=3×eq\f(1,4)×eq\f(3,4)=eq\f(9,16).12分热点题型1回归分析题型分析:高考命题常以实际生活为背景,重在考查回归分析中散点图的作用、回归方程的求法和应用,难度中等.在一次抽样调查中测得样本的5组数据,得到一个变量y关于x的回归方程模型,其对应的数值如下表:x0.250.5124y1612521(1)试作出散点图,根据散点图判断,y=a+bx与y=eq\f(k,x)+m哪一个适宜作为变量y关于x的回归方程模型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立变量y关于x的回归方程;(3)根据(2)中所求的变量y关于x的回归方程预测:当x=3时,对应的y值为多少?(保留四位有效数字)解](1)作出变量y与x之间的散点图,如图所示,2分由图可知变量y与x近似地呈反比例函数关系,那么y=eq\f(k,x)+m适宜作为变量y关于x的回归方程模型.4分(2)由(1)知y=eq\f(k,x)+m适宜作为变量y关于x的回归方程模型,令t=eq\f(1,x),则y=kt+m,由y与x的数据表可得y与t的数据表如下:t4210.50.25y1612521……………6分作出y与t的散点图,如图所示.8分由图可知y与t近似地呈线性相关关系.又eq\o(t,\s\up6(-))=1.55,eq\o(y,\s\up6(-))=7.2,eq\i\su(i=1,5,t)iyi=94.25,eq\i\su(i=1,5,t)eq\o\al(2,i)=21.3125,所以k=eq\f(\i\su(i=1,5,t)iyi-5\o(t,\s\up6(-))\o(y,\s\up6(-)),\i\su(i=1,5,t)\o\al(2,i)-5\x\to(t)2)=eq\f(94.25-5×1.55×7.2,21.3125-5×1.552)≈4.1344,m=eq\o(y,\s\up6(-))-keq\o(t,\s\up6(-))=7.2-4.1344×1.55≈0.8,所以y=4.1344t+0.8,所以y关于x的回归方程为y=eq\f(4.1344,x)+0.8.10分(3)由(2)得y关于x的回归方程是y=eq\f(4.1344,x)+0.8,当x=3时,可得y=eq\f(4.1344,3)+0.8≈2.178.12分1.正确理解计算eq\o(b,\s\up6(^)),eq\o(a,\s\up6(^))的公式和准确的计算,是求线性回归方程的关键.其中线性回归方程必过样本中心点(eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-))).2.在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.变式训练1](2016·石家庄二模)为了解某地区某种农产品的年产量x(单位:吨)对价格y(单位:千元/吨)和年利润z的影响,对近五年该农产品的年产量和价格统计如下表:x12345y7.06.55.53.82.2(1)求y关于x的线性回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^));(2)若每吨该农产品的成本为2千元,假设该农产品可全部卖出,预测当年产量为多少时,年利润z取到最大值?(保留两位小数)参考公式:eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,)xi-\o(x,\s\up6(-))yi-\o(y,\s\up6(-)),\i\su(i=1,n,)xi-\o(x,\s\up6(-))2)=eq\f(\i\su(i=1,n,x)iyi-n\o(x,\s\up6(-))\o(y,\s\up6(-)),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-)).解](1)eq\o(x,\s\up6(-))=3,eq\o(y,\s\up6(-))=5,2分eq\i\su(i=1,5,x)i=15,eq\i\su(i=1,5,y)i=25,eq\i\su(i=1,5,x)iyi=62.7,eq\i\su(i=1,5,x)eq\o\al(2,i)=55,解得eq\o(b,\s\up6(^))=-1.23,eq\o(a,\s\up6(^))=8.69,4分所以eq\o(y,\s\up6(^))=8.69-1.23x.6分(2)年利润z=x(8.69-1.23x)-2x=-1.23x2+6.69x,10分所以当x=2.72,即年产量为2.72吨时,年利润z取得最大值.12分热点题型2独立性检验题型分析:尽管全国卷Ⅰ近几年未在该点命题,但其极易与分层抽样、概率统计等知识交汇,是潜在的命题点之一,须引起足够的重视.(2016·山西四校第二次联考)心理学家分析发现视觉和空间能力与性别有关,某数学兴趣小组为了验证这个结论,从兴趣小组中按分层抽样的方法抽取50名同学(男30,女20),给所有同学几何题和代数题各一题,让各位同学自由选择一道题进行解答.选题情况如下表:(单位:人)几何题代数题总计男同学22830女同学81220总计302050(1)能否据此判断有97.5%的把握认为视觉和空间能力与性别有关?(2)经过多次测试后,甲每次解答一道几何题所用的时间在5~7分钟,乙每次解答一道几何题所用的时间在6~8分钟,现甲、乙各解同一道几何题,求乙比甲先解答完的概率;(3)现从选择做几何题的8名女生中任意抽取2人对她们的答题情况进行全程研究,记丙、丁2名女生被抽到的人数为X,求X的分布列及数学期望E(X).附表及公式:P(K2≥k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828K2=eq\f(nad-bc2,a+bc+da+cb+d),n=a+b+c+d.解题指导]计算keq\o(→,\s\up7(查表))下结论eq\o(→,\s\up7(几何概型))求概率eq\o(→,\s\up7(超几何分布))求X的分布列及E(X).解](1)由表中数据得k=eq\f(50×22×12-8×82,30×20×30×20)=eq\f(50,9)≈5.556>5.024,2分所以有97.5%的把握认为视觉和空间能力与性别有关.3分(2)设甲、乙解答一道几何题的时间分别为x,y分钟,则eq\b\lc\{\rc\(\a\vs4\al\co1(5≤x≤7,,6≤y≤8))表示的平面区域如图所示.设事件A为“乙比甲先做完此道题”,则x>y满足的区域如图中阴影部分所示.5分由几何概型可得P(A)=eq\f(\f(1,2)×1×1,2×2)=eq\f(1,8),即乙比甲先解答完的概率为eq\f(1,8).7分(3)由题可知,在选择做几何题的8名女生中任意抽取2人的方法有Ceq\o\al(2,8)=28种,其中丙、丁2人没有一个人被抽到的有Ceq\o\al(2,6)=15种;恰有一人被抽到的有Ceq\o\al(1,2)·Ceq\o\al(1,6)=12种;2人都被抽到的有Ceq\o\al(2,2)=1种.所以X的可能取值为0,1,2,P(X=0)=eq\f(15,28),8分P(X=1)=eq\f(12,28)=eq\f(3,7),9分P(X=2)=eq\f(1,28).10分X的分布列为:X012Peq\f(15,28)eq\f(3,7)eq\f(1,28)11分E(X)=0×eq\f(15,28)+1×eq\f(3,7)+2×eq\f(1,28)=eq\f(1,2).12分求解独立性检验问题时要注意:一是2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论