2019届高考数学考点四概率与统计考查角度1统计案例突破训练文.docx_第1页
2019届高考数学考点四概率与统计考查角度1统计案例突破训练文.docx_第2页
2019届高考数学考点四概率与统计考查角度1统计案例突破训练文.docx_第3页
2019届高考数学考点四概率与统计考查角度1统计案例突破训练文.docx_第4页
2019届高考数学考点四概率与统计考查角度1统计案例突破训练文.docx_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

考查角度1统计案例分类透析一统计图表与数字特征分析例1 从某食品厂生产的面包中抽取100个,测量这些面包的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组75,85)85,95)95,105)105,115)115,125频数82237285(1)在相应位置上画出这些数据的频率分布直方图;(2)估计这种面包质量指标值的平均数X(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该食品厂生产的这种面包符合“质量指标值不低于85的面包至少要占全部面包90%的规定”?分析 (1)根据题设中的数据,可画出频率分布直方图;(2)利用平均数的计算公式,可求得平均数X;(3)计算质量指标值不低于85的面包所占比例的估计值,再做出判断.解析 (1)画图.(2)质量指标值的样本平均数为x-=800.08+900.22+1000.37+1100.28+1200.05=100.所以这种面包质量指标值的平均数的估计值为100.(3)质量指标值不低于85的面包所占比例的估计值为0.22+0.37+0.28+0.05=0.92,由于该估计值大于0.9,故可以认为该食品厂生产的这种面包符合“质量指标值不低于85的面包至少要占全部面包90%的规定”.方法技巧 在频率分布直方图中,小矩形的高表示“频率/组距”,而不是频率;利用频率分布直方图求平均数时,平均数是频率分布直方图的“重心”,可以估计为频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.分类透析二线性回归的综合应用例2 某市为了引导居民合理用水,居民生活用水实行二级阶梯式水价计算办法,具体如下:第一阶梯,每户居民月用水量不超过12吨,价格为4元/吨;第二阶梯,每户居民月用水量超过12吨,超过部分的价格为8元/吨.为了了解全市居民月用水量的分布情况,通过抽样获得了100户居民的月用水量(单位:吨),将数据按照0,2,(2,4,(14,16(全市居民月用水量均不超过16吨)分成8组,制成了如图所示的频率分布直方图.(1)求频率分布直方图中字母a的值,并求该组的频率.(2)通过频率分布直方图,估计该市居民每月的用水量的中位数m的值(保留两位小数).(3)图是该市居民张某2018年16月份的月用水费y(元)与月份x的散点图,其拟合的线性回归方程是y=2x+33.若张某2018年17月份水费总支出为312元,试估计张某7月份的用水吨数.分析 (1)根据矩形面积和为1可得结果;(2)利用m左右面积都是12列方程可得结果;(3)根据回归直线过样本点的中心,算出前六个月平均费用,总费用减去前六个月的费用和即可得结果.解析 (1)(0.02+0.04+0.08+a+0.13+0.08+0.03+0.02)2=1,a=0.10.故第四组的频率为0.12=0.2.(2)0.022+0.042+0.082+0.102+(m-8)0.13=0.5, m=8+0.5-0.480.138.15.(3)x-=1+2+3+4+5+66=3.5,且y=2x+33,y-=23.5+33=40.张某7月份的用水费用为312-640=72(元),设张某7月份的用水x吨,124=482.706.所以有90%的把握认为该校教职工是否为“体育达人”与“性别”有关.(2)由题意知抽取的6名“体育达人”中有4名男职工(记作a,b,c,d),2名女职工(记作m,n),则从这6名“体育达人”中任意选取2名有ab,ac,ad,am,an,bc,bd,bm,bn,cd,cm,cn,dm,dn,mn,共15种取法,取出的2名“体育达人”中至少有1名女职工有am,an,bm,bn,cm,cn,dm,dn,mn,共9种取法,所以所求概率P=915=35.方法技巧 独立性检验的方法的解题步骤构造22列联表;计算K2的观测值k;查表确定有多大的把握判定两个变量有关联.1.(2018年全国卷,文18改编)PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,一般情况下PM2.5浓度越大,大气环境质量越差.我国PM2.5的标准是:24小时PM2.5的平均浓度在035g/m3范围内,则空气质量是优,在3575g/m3范围内,则空气质量是良好,在75115g/m3范围内,则空气质量是轻度污染.在115150g/m3范围内,则空气质量是中度污染.甲、乙两座城市2016年底经评估PM2.5的年平均浓度均在80g/m3左右,空气质量是轻度污染,甲、乙两座城市采取不同的环境综合治理方式,通过各个监测站的大数据汇总得到2017年每个月PM2.5的平均浓度数据如下(单位:g/m3).甲城市:83,74,55,62,47,65,58,61,56,50,54,46.乙城市:82,68,61,65,68,68,71,67,82,70,66,72.(1)根据以上统计数据判断2017年哪座城市的大气环境质量总体较好?并说明理由.(2)求两座城市24个PM2.5的平均浓度的中位数,并将两座城市超过和不超过中位数的月份数填入下面的列联表:不超过超过甲城市乙城市(3)根据(2)中的列联表,能否有99%的把握认为甲、乙两座城市的大气环境质量与该城市综合治理的方式有关?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),P(K2k0)0.050.0100.001k03.8416.63510.828解析 (1)甲城市的大气环境质量总体较好.理由如下:x-甲=112(83+74+55+62+47+65+58+61+56+50+54+46)=71112=59.25,x-乙=112(82+68+61+65+68+68+71+67+82+70+66+72)=84012=70,所以x-甲6.635,所以有99%的把握认为甲、乙两座城市的大气环境质量与他们综合治理的方式有关.2.(2018年全国卷,文18改编)一只药用昆虫的产卵数y(单位:个)与一定范围内的温度x(单位:)有关,现收集了该种药用昆虫的6组观测数据如下表所示.温度x/212324272932产卵y/个61120275777经计算得x-=16i=16xi=26,y-=16i=16yi=33,i=16(xi-x-)(yi-y-)=557,i=16(xi-x-)2=84,i=16(yi-y-)2=3930,线性回归模型的残差平方和i=16(yi-yi)2=236.64,e8.06053167,其中xi,yi分别为观测数据中的温度和产卵数,i=1,2,3,4,5,6.(1)若用线性回归模型拟合,求y与x的回归方程y=bx+a(结果准确到0.1).(2)若用非线性回归模型拟合求得y与x的回归方程为y=0.06e0.2303x,且相关指数R2=0.9522.试用(1)中的回归模型相比,用R2说明哪种模型的拟合效果更好.用拟合效果好的模型预测当温度为35时,该种药用昆虫的产卵数(结果取整数).附:一组数据(x1,y1),(x2,y2),(xn,yn),其回归直线y=bx+a的斜率和截距的最小二乘估计分别为b=i=1n(xi-x-)(yi-y-)i=1n(xi-x-)2=i=1nxiyi-nx-y-i=1nxi2-nx-2,a=y-bx-;R2=1-i=1n(yi-yi)2i=1n(yi-y-)2.解析 (1)由题意得,b=i=16(xi-x-)(yi-y-)i=16(xi-x-)2=557846.6,所以a=33-5578426=-139.4,所以y关于x的线性回归方程为y=6.6x-139.4.(2)由所给数据求得的线性回归方程为y=6.6x-139.4,相关指数为R2=1-i=16(yi-yi)2i=16(yi-y-)2=1-236.6439300.9398.因为0.9398120,所以推荐该超市选择乙商家长期销售.1.(2018安徽淮南二模)2018年春,为响应中国大豆参与世界贸易的竞争,某市农科院积极研究,加大优良品种的培育工作.其中一项基础工作就是研究昼夜温差大小与大豆发芽率之间的关系.为此科研人员分别记录了5天中每天100粒大豆的发芽数,得如下数据表格:日期4月4日4月5日4月6日4月7日4月8日温差x()101113128发芽数y(粒)2326322616科研人员确定研究方案如下:从5组数据中选3组数据求线性回归方程,再用求得的回归方程对剩下的2组数据进行检验.(1)求剩下的2组数据恰是不相邻的2天数据的概率;(2)若选取的是4月5日、6日、7日三天的数据,据此求y关于x的线性回归方程y=bx+a;(3)若由线性回归方程得到的估计数据与实际数据的误差绝对值均不超过1粒,则认为得到的线性回归方程是可靠的,请检验(2)中回归方程是否可靠.附:b=i=1n(xi-x-)(yi-y-)i=1n(xi-x-)2=i=1nxiyi-nx-y-i=1nxi2-nx-2,a=y-bx-.解析 (1)剩下的2组数据的情况有(4日,5日),(4日,6日),(4日,7日),(4日,8日),(5日,6日),(5日,7日),(5日,8日),(6日,7日),(6日,8日),(7日,8日),共10种,恰好是不相邻的2天数据的情况有(4日,6日),(4日,7日),(4日,8日),(5日,7日),(5日,8日),(6日,8日),共6种,所以恰好是不相邻的2天数据的概率是610=35.(2)由数据得i=13xiyi=1126+1332+1226=1014,x-=13(11+13+12)=12,y-=13(26+32+26)=28,3x-y-=31228=1008,i=1nxiyi-nx-y-=i=13xiyi-3x-y-=1014-1008=6,i=13xi2=112+132+122=434,3x-2=3122=432,i=1nxi2-nx-2=i=13xi2-3x-2=434-432=2,b=i=13xiyi-3x-y-i=13xi2-3x-2=62=3,a=y-bx-=28-312=-8,故y关于x的线性回归方程为y=3x-8.(3)当x=10时,y=310-8=22,|22-23|1;当x=8时,y=38-8=16,|16-16|1.故得到的线性回归方程是可靠的.2.(2018云南保山统考)某校进行文科、理科数学成绩对比,某次考试后,各随机抽取100名同学的数学考试成绩进行统计,其频率分布表如下.分组频数频率135,15080.08120,135)170.17105,120)400.490,105)210.2175,90)120.1260,75)20.02总计1001理科分组频数频率135,15040.04120,135)180.18105,120)370.3790,105)310.3175,90)70.0760,75)30.03总计1001文科(1)根据数学成绩的频率分布表,求理科数学成绩的中位数的估计值;(2)请填写下面的列联表,并根据列联表判断是否有90%的把握认为数学成绩与文理科有关.数学成绩120分数学成绩120分合计理科文科合计200附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+bc+d.P(K2k0)0.100.050.0250.0100.001k02.7063.8415.0246.63510.828

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论