(全国通用)2020版高考数学二轮复习专题六概率与统计第2讲统计、统计案例练习理.docx_第1页
(全国通用)2020版高考数学二轮复习专题六概率与统计第2讲统计、统计案例练习理.docx_第2页
(全国通用)2020版高考数学二轮复习专题六概率与统计第2讲统计、统计案例练习理.docx_第3页
(全国通用)2020版高考数学二轮复习专题六概率与统计第2讲统计、统计案例练习理.docx_第4页
(全国通用)2020版高考数学二轮复习专题六概率与统计第2讲统计、统计案例练习理.docx_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第2讲统计、统计案例考情研析1.以选择题、填空题的形式考查随机抽样、样本的数字特征、统计图表、回归方程、独立性检验等2.概率与统计的交汇问题是高考的热点,以解答题形式出现,难度中等.核心知识回顾1.三种抽样方法的特点简单随机抽样:操作简便、适当,总体个数较少分层抽样:按比例抽样系统抽样:等距抽样2必记公式数据x1,x2,x3,xn的数字特征公式:(1)平均数:.(2)方差:s2(x1)2(x2)2(xn)2(3)标准差:s .3重要性质及结论(1)频率分布直方图的三个结论小长方形的面积组距频率;各小长方形的面积之和等于1;小长方形的高,所有小长方形高的和为.(2)回归直线方程:一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn)其回归方程x ,其过样本点中心(,).(3)独立性检验K2(其中nabcd为样本容量)热点考向探究考向1 抽样方法例1(1)从编号为001,002,500的500个产品中用系统抽样的方法抽取一个样本,已知样本中编号最小的两个编号分别为007,032,则样本中最大的编号应该为()A480B481 C482D483答案C解析样本中编号最小的两个编号分别为007,032,样本数据组距为32725,则样本容量为20,则对应的号码数x725(n1),当n20时,x取得最大值,此时x72519482.故选C.(2)(2019广州普通高中高三综合测试)某公司生产A,B,C三种不同型号的轿车,产量之比依次为234,为检验该公司的产品质量,用分层抽样的方法抽取一个容量为n的样本,若样本中A种型号的轿车比B种型号的轿车少8辆,则n()A96B72 C48D36答案B解析由题意,得nn8,n72.选B.系统抽样与分层抽样的求解方法(1)系统抽样的最基本特征是“等距性”,每组内所抽取的号码需要依据第一组抽取的号码和组距唯一确定每组抽取样本的号码依次构成一个以第一组抽取的号码m为首项,组距d为公差的等差数列an,第k组抽取样本的号码akm(k1)d.(2)分层抽样的关键是根据样本特征的差异进行分层,实质是等比例抽样,求解此类问题需先求出抽样比样本容量与总体容量的比,则各层所抽取的样本容量等于该层个体总数与抽样比的乘积在每层抽样时,应采用简单随机抽样或系统抽样进行1(2019云南省第二次高三统一检测)某中学高一年级有学生1200人,高二年级有学生900人,高三年级有学生1500人,现按年级为标准,用分层抽样的方法从这三个年级学生中抽取一个容量为720的样本进行某项研究,则应从高三年级学生中抽取学生()A200人B300人 C320人D350人答案B解析由分层抽样可得高三抽取的学生人数为720300.故选B.2采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入1,450的人做问卷A,编号落入451,750的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷B的人数为_答案10解析由题意得系统抽样的抽样间隔为30,又因为第一组内抽取的号码为9,则由451930k750(kN*),得14k24,所以做问卷B的人数为10.考向2 用样本估计总体例2(1)甲、乙两名学生在5次数学考试中的成绩统计如茎叶图所示,若甲,乙分别表示甲、乙两人的平均成绩,则下列结论正确的是()A.甲乙,乙比甲稳定B.甲乙,甲比乙稳定C.甲乙,乙比甲稳定D.甲乙因为s(12)2(4)222529254,s(5)2(5)2(4)24210236.4,所以ss,故乙比甲稳定故选A.(2)(2019皖南八校高三第三次联考)从某地区年龄在2555岁的人员中,随机抽出100人,了解他们对今年两会的热点问题的看法,绘制出频率分布直方图如图所示,则下列说法正确的是()A抽出的100人中,年龄在4045岁的人数大约为20B抽出的100人中,年龄在3545岁的人数大约为30C抽出的100人中,年龄在4050岁的人数大约为40D抽出的100人中,年龄在3550岁的人数大约为50答案A解析根据频率分布直方图的性质得(0.010.050.06a0.020.02)51,解得a0.04,所以抽出的100人中,年龄在4045岁的人数大约为0.04510020,所以A正确;年龄在3545岁的人数大约为(0.060.04)510050,所以B不正确;年龄在4050岁的人数大约为(0.040.02)510030,所以C不正确;年龄在3550岁的人数大约为(0.060.040.02)510060,所以D不正确故选A.(1)频率分布直方图中每个小矩形的面积为对应的频率,不要混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错(2)由于茎叶图完全反映了所有的原始数据,解决由茎叶图给出的统计图表题时,就要充分使用这个图表提供的数据进行相关的计算或者是对某些问题作出判断1(2019福建省高三模拟)为比较甲、乙两名高二学生的数学素养,对课程标准中规定的数学六大素养进行指标测验(指标值满分为5分,分值高者为优),根据测验情况绘制了如图所示的六大素养指标雷达图,则下面叙述正确的是()A乙的数据分析素养优于甲B乙的数学建模素养优于数学抽象素养C甲的六大素养整体水平优于乙D甲的六大素养中数据分析最差答案C解析根据雷达图得到如下数据所示由数据可知选C.2(2019江西省吉安一中、九江一中、新余一中等八所重点中学高三4月联考)某地区某村的前三年的经济收入分别为100,200,300万元,其统计数据的中位数为x,平均数为y;经过今年政府新农村建设后,该村经济收入在上年基础上翻番,则在这4年里收入的统计数据中,下列说法正确的是()A中位数为x,平均数为1.5yB中位数为1.25x,平均数为yC中位数为1.25x,平均数为1.5yD中位数为1.5x,平均数为2y答案C解析依题意,前三年中位数x200,平均数y200,第四年收入为600万元,故中位数为2501.25x,平均数为3001.5y.故选C.考向3 回归分析与独立性检验角度1回归分析在实际中的应用例3某市地产数据研究所的数据显示,2016年该市新建住宅销售均价走势如下图所示,3月至7月房价上涨过快,政府从8月开始采取宏观调控措施,10月份开始房价得到很好的抑制(1)地产数据研究所发现,3月至7月的各月均价y(万元/平方米)与月份x之间具有较强的线性相关关系,试建立y关于x的回归方程;政府若不调控,依此相关关系预测第12月份该市新建住宅销售均价;(2)地产数据研究所在2016年的12个月中,随机抽取三个月的数据作样本分析,若关注所抽三个月份的所属季度,记所属季度的个数为X,求X的分布列和数学期望参考数据:xi25,yi5.36, (xi)(yi)0.64;回归方程x中斜率和截距的最小二乘法估计公式分别为:, .解(1)月份x34567均价y0.950.981.111.121.20计算可得5,1.072, (xi)210,所以0.064, 1.0720.06450.752.所以从3月份至7月份y关于x的回归方程为0.064x0.752.将2016年的12月份x12代入回归方程,得0.064120.7521.52,所以预测12月份该市新建住宅的销售均价约为1.52万元/平方米(2)根据题意,X的可能取值为1,2,3.P(X1),P(X3),P(X2)1P(X1)P(X3),所以X的分布列为X123P因此,X的数学期望E(X)123.在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值(2019太原市高三模拟)近年来随着互联网的高速发展,旧货交易市场也得以快速发展某网络旧货交易平台对2018年某种机械设备的线上交易进行了统计,得到如图所示的频率分布直方图和散点图现把直方图中各组的频率视为概率,用x(单位:年)表示该设备的使用时间,y(单位:万元)表示其相应的平均交易价格(1)已知2018年在此网络旧货交易平台成交的该种机械设备为100台,现从这100台设备中,按分层抽样抽取使用时间x(12,20的4台设备,再从这4台设备中随机抽取2台,求这2台设备的使用时间都在(12,16的概率;(2)由散点图分析后,可用yebxa作为此网络旧货交易平台上该种机械设备的平均交易价格y关于其使用时间x的回归方程iyiizi5.58.71.9301.479.75385表中zln y,i.根据上述相关数据,求y关于x的回归方程;根据上述回归方程,求当使用时间x15时,该种机械设备的平均交易价格的预报值(精确到0.01)附:对于一组数据(u1,v1),(u2,v2),(un,vn),其回归直线vu的斜率和截距的最小二乘估计分别为, .参考数据:e0.551.733,e0.950.3867,e1.850.1572.解(1)由图1中频率分布直方图可知,从2018年成交的该种机械设备中使用时间x(12,16的台数为10040.0312,使用时间x(16,20的台数为10040.014,按分层抽样所抽取4台中,使用时间x(12,16的设备有3台,分别记为A,B,C;使用时间x(16,20的设备有1台,记为d,从这4台设备中随机抽取2台的结果为(A,B),(A,C),(A,d),(B,C),(B,d),(C,d),共有6种等可能出现的结果,其中这2台设备的使用时间x都在(12,16的结果为(A,B),(A,C),(B,C),共有3种,所求事件的概率为.(2)由题意得zln yln ebxabxa,0.3, 1.90.35.53.55,z关于x的线性回归方程为z0.3x3.55,y关于x的回归方程为ye0.3x3.55.由知,当使用时间x15时,ye0.3153.550.39,故该种机械设备的平均交易价格的预报值为0.39万元角度2独立性检验在实际中的应用例4现如今,“网购”一词不再新鲜,越来越多的人已经接受并喜欢了这种购物方式,但随之也出现了商品质量不能保证与信誉不好等问题,因此,相关管理部门制定了针对商品质量与服务的评价体系,现从评价系统中选出成功交易200例,并对其评价进行统计:对商品的好评率为0.6,对服务的好评率为0.75,其中对商品和服务都做出好评的交易为80次(1)依据题中的数据完成下表,并通过计算说明,能否有99.9%的把握认为“商品好评与服务好评”有关;对服务好评对服务不满意合计对商品好评对商品不满意合计(2)若将频率视为概率,某人在该购物平台上进行了5次购物,设对商品和服务全好评的次数为随机变量X,求X的分布列(概率用算式表示)、数学期望和方差参考数据:P(K2k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828解(1)22列联表对服务好评对服务不满意合计对商品好评8040120对商品不满意701080合计15050200K211.11110.828.有99.9%的把握认为“商品好评与服务好评”有关(2)由题意可知,对商品和服务全好评的概率为.X的取值为0,1,2,3,4,5.且XB.P(X0)5,P(X1)C14,P(X2)C23,P(X3)C32,P(X4)C4,P(X5)C5,分布列为X012345PXB,E(X)52.D(X)5.独立性检验的关键(1)根据22列联表准确计算K2,若22列联表没有列出来,要先列出此表(2)K2的观测值k越大,对应假设事件H0成立的概率越小,H0不成立的概率越大(2019西安地区陕师大附中、西安高级中学等八校联考)西安市自2017年5月启动对“车不让人行为”处罚以来,斑马线前机动车抢行不文明行为得以根本改变,斑马线前礼让行人也成为了一张新的西安“名片”但作为交通重要参与者的行人,闯红灯通行却频有发生,带来了较大的交通安全隐患及机动车通畅率降低,交警部门在某十字路口根据以往的检测数据,得到行人闯红灯的概率约为0.4,并从穿越该路口的行人中随机抽取了200人进行调查,对是否存在闯红灯情况得到22列联表如下:30岁以下30岁以上合计闯红灯60未闯红灯80合计200近期,为了整顿“行人闯红灯”这一项不文明及违法行为,交警部门在该十字路口试行了对闯红灯行人进行经济处罚,并从试行经济处罚后穿越该路口行人中随机抽取了200人进行调查,得到下表:处罚金额x(单位:元)5101520闯红灯的人数y5040200将统计数据所得频率代替概率,完成下列问题(1)将22列联表填写完整(不需写出填写过程),并根据表中数据分析,在未试行对闯红灯行人进行经济处罚前,是否有99.9%的把握认为闯红灯与年龄有关;(2)当处罚金额为10元时,行人闯红灯的概率会比不进行处罚降低多少;(3)结合调查结果,谈谈如何治理行人闯红灯现象参考公式:K2,其中nabcd.参考数据:P(K2k0)0.250.150.100.050.0250.0100.0050.001k01.1322.0722.7063.8415.0246.6357.87910.828解(1)30岁以下30岁以上合计闯红灯206080未闯红灯8040120合计100100200K233.33310.828.有99.9%的把握认为闯红灯与年龄有关(2)未进行处罚前,行人闯红灯的概率为0.4,进行处罚10元后,行人闯红灯的概率为0.2,降低了0.2.(3)根据调查数据显示,行人闯红灯与年龄有明显关系,可以针对30岁以上人群开展“道路安全”宣传教育;由于处罚可以明显降低行人闯红灯的概率,可以进行适当处罚来降低行人闯红灯的概率真题押题真题模拟1(2019益阳市高三模拟)如图所示的三个统计图分别是随机抽查甲、乙、丙三地的若干个家庭教育年投入(万元),记A表示众数,B表示中位数,C表示平均数,则根据图表提供的信息,下面的结论正确的是()AA甲A乙A丙,B甲B乙B丙BB丙B甲B乙,C甲C乙C丙CA丙A甲A乙,C丙C甲C乙DA丙A甲A乙,B丙B甲B乙答案C解析由甲地的条形图可知,家庭教育年投入的中位数为10,众数为10,平均数为10.32;由乙地的折线图可知,家庭教育年投入的中位数为10,众数为10,平均数为9.7;由丙地的扇形图可知,家庭教育年投入的中位数为12,众数为12,平均数为12.4.结合选项可知C正确故选C.2(2019全国卷)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A中位数B平均数 C方差D极差答案A解析中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,不变的是中位数,平均数、方差、极差均受影响故选A.3(2019郴州市高三第三次质量检测)新闻出版业不断推进供给侧结构性改革,深入推动优化升级和融合发展,持续提高优质出版产品供给,实现了行业的良性发展下面是2012年至2016年我国新闻出版业和数字出版业营收增长情况:给出下列四个结论:2012年至2016年我国新闻出版业和数字出版业营收均逐年增加2016年我国数字出版业营收超过2012年我国数字出版业营收的2倍2016年我国新闻出版业营收超过2012年我国新闻出版业营收的1.5倍2016年我国数字出版业营收占新闻出版业营收的比例未超过三分之一其中所有正确结论的编号为()AB CD答案C解析根据图示数据可知正确;对于:1935.52387123595.8,不正确;对于:23595.878655720.9,正确故选C.4(2019江苏高考)已知一组数据6,7,8,8,9,10,则该组数据的方差是_答案解析这组数据的平均数为8,故方差为s2(68)2(78)2(88)2(88)2(98)2(108)2.5(2019全国卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液每只小鼠给服的溶液体积相同、摩尔浓度相同经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表)解(1)由已知得0.70a0.200.15,故a0.35,b10.050.150.700.10.(2)甲离子残留百分比的平均值的估计值为20.1530.2040.3050.2060.1070.054.05.乙离子残留百分比的平均值的估计值为30.0540.1050.1560.3570.2080.156.00.6(2019湖北武汉高三第二次质量检测)光伏发电是利用太阳能电池及相关设备将太阳光能直接转化为电能近几年在国内出台的光伏发电补贴政策的引导下,某地光伏发电装机量急剧上涨,如下表:某位同学分别用两种模型:bx2a,dxc进行拟合,得到相应的回归方程并进行残差分析,残差图如下(注:残差等于yii):经过计算得(xi)(yi)72.8,(xi)242,(ti)(yi)686.8,(ti)23570,其中tix,i.(1)根据残差图,比较模型,的拟合效果,应该选择哪个模型?并简要说明理由;(2)根据(1)的判断结果及表中数据建立y关于x的回归方程,并预测该地区2020年新增光伏装机量是多少?(在计算回归系数时精确到0.01)附:回归直线的斜率和截距的最小二乘估计公式分别为, .解(1)选择模型.理由如下:根据残差图可以看出,模型的估计值和真实值比较相近,模型的残差值相对较大一些,所以模型的拟合效果相对较好(2)由(1)可知,y关于x的回归方程为x2,令tx2,则t.由所给数据可得i(1491625364964)25.5.i(0.40.81.63.15.17.19.712.2)5,0.19, 50.1925.50.16,所以y关于x的回归方程为0.19x20.16,当x10时,0.191020.1619.16,故预测该地区2020年新增光伏装机量为19.16兆瓦金版押题7某市环保部门对该市市民进行了一次垃圾分类知识的网络问卷调查,每位市民仅有一次参加机会,通过随机抽样,得到参与问卷调查的100人的得分(满分:100分)数据,统计结果如表所示组别40,50)50,60)60,70)70,80)80,90)90,100男235151812女051010713(1)若规定问卷得分不低于70分的市民称为“环保关注者”,请完成下列22列联表,并判断能否在犯错误的概率不超过0.05的前提下,认为是否为“环保关注者”与性别有关?非“环保关注者”是“环保关注者”合计男女合计(2)若问卷得分不低于80分的人称为“环保达人”现在从本次调查的“环保达人”中利用分层抽样的方法随机抽取5名市民参与环保知识问答,再从这5名市民中抽取2人参与座谈会,求抽取的2名市民中,既有男“环保达人”又有女“环保达人”的概率附表及公式:K2,nabcd.P(K2k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828解(1)由图中表格可得22列联表如下,非“环保关注者”是“环保关注者”合计男104555女153045合计2575100将22列联表中的数据代入公式计算得K2的观测值k3.03s,所以参加比赛的最佳人选为乙三、解答题9为了解一种植物果实的情况,随机抽取一批该植物果实样本测量重量(单位:克),按照27.5,32.5),32.5,37.5),37.5,42.5),42.5,47.5),47.5,52.5分为5组,其频率分布直方图如图所示(1)求图中a的值;(2)估计这种植物果实重量的平均数和方差s2(同一组中的数据用该组区间的中点值作代表);(3)已知这种植物果实重量不低于32.5克的即为优质果实,用样本估计总体若从这种植物果实中随机抽取3个,其中优质果实的个数为X,求X的分布列和数学期望E(X)解(1)组距d5,由5(0.020.040.075a0.015)1得a0.05.(2)各组中点值和相应的频率依次为中点值3035404550频率0.10.20.3750.250.075300.1350.2400.375450.25500.07540,s2(10)20.1(5)20.2020.375520.251020.07528.75.(3)由已知,这种植物果实的优质率p0.9,且X服从二项分布B(3,0.9),X0,1,2,3,P(Xk)C0.9k0.13k,X的分布列为X0123P0.0010.0270.2430.729E(X)np2.7.10(2019聊城市高三一模)某小学为了了解四年级学生的家庭作业用时情况,从本校四年级随机抽取了一批学生进行调查,并绘制了学生作业用时的频率分布直方图,如图所示(1)估算这批学生的作业平均用时情况;(2)作业用时不能完全反映学生学业负担情况,这与学生自身的学习习惯有

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论