(新高考)高考数学二轮复习讲义08《统计与统计案例》(解析版)_第1页
(新高考)高考数学二轮复习讲义08《统计与统计案例》(解析版)_第2页
(新高考)高考数学二轮复习讲义08《统计与统计案例》(解析版)_第3页
(新高考)高考数学二轮复习讲义08《统计与统计案例》(解析版)_第4页
(新高考)高考数学二轮复习讲义08《统计与统计案例》(解析版)_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

08统计与统计案例核心考点读高考设问知考法命题解读抽样方法【2013年新课标1】为了解某地区的中小学生视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是( )以空间几何体为载体考查空间角是高考命题的重点,常与空间线面关系的证明相结合,热点为二面角的求解,均以解答题的形式进行考查,难度主要体现在建立空间直角坐标系和准确计算上.【2019新课标Ⅰ】某学校为了解1000名新生的身体素质,将这些学生编号为1,2,…,1000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是()【2018新课标Ⅲ】某公司有大量客户,且不同龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.用样本估计总体【2020·新高考海南卷】我国新冠肺炎疫情防控进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是()【2019新课标Ⅱ卷】演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()【2018新课标Ⅰ卷】某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如图所示的饼图:则下面结论中不正确的是()【2019新课标Ⅲ卷】试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).回归分析在实际问题中的应用【2020新课标Ⅰ卷】某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()【2020新课标Ⅱ】为调查该地区某种野生动物数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据SKIPIF1<0SKIPIF1<0,其中SKIPIF1<0和SKIPIF1<0分别表示第SKIPIF1<0个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本SKIPIF1<0SKIPIF1<0的相关系数(精确到0.01);独立性检验【2020·新高考山东、海南卷】为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:(1)略;(2)根据所给数据,完成下面的2×2列联表:(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关?核心考点一抽样方法抽样方法包括简单随机抽样、系统抽样、分层抽样,三种抽样方法都是等概率抽样,体现了抽样的公平性,但又各有其特点和适用范围.1.【2013年新课标1】为了解某地区的中小学生视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是( )A、简单随机抽样 B、按性别分层抽样QUOTE C、按学段分层抽样 D、系统抽样【解析】因该地区小学、初中、高中三个学段学生的视力情况有较大差异,故最合理的抽样方法是按学段分层抽样,故选C.2.【2019新课标Ⅰ】某学校为了解1000名新生的身体素质,将这些学生编号为1,2,…,1000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是()A.8号学生 B.200号学生C.616号学生 D.815号学生【解析】由已知将1000名学生分成100个组,每组10名学生,用系统抽样,46号学生被抽到,所以第一组抽到6号,且每组抽到的学生号构成等差数列SKIPIF1<0,公差SKIPIF1<0,所以SKIPIF1<0SKIPIF1<0,若SKIPIF1<0,解得SKIPIF1<0,不合题意;若SKIPIF1<0,解得SKIPIF1<0,不合题意;若SKIPIF1<0,则SKIPIF1<0,符合题意;若SKIPIF1<0,则SKIPIF1<0,不合题意.故选C.3.【2018新课标Ⅲ】某公司有大量客户,且不同龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.【解析】因为不同年龄的客户对公司的服务评价有较大差异,所以需按年龄进行分层抽样,才能了解到不同年龄段客户对公司服务的客观评价.故填:分层抽样.1.总体由编号为01,02,…,49,50的50个个体组成,利用下面的随机数表选取6个个体,选取方法是从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,则选出的第4个个体的编号为()附:第6行至第9行的随机数表27486198716441487086288885191620747701111630240429797991968351253211491973064916767787339974673226357900337091601620388277574950A.3 B.19 C.38 D.20【解析】由题意知,编号为01~50的个体才是需要的个体.由随机数表依次可得41,48,28,19,16,20,……故第4个个体的编号为19.故选B.2.在新冠肺炎疫情期间,大多数学生都进行网上上课.我校高一、高二、高三共有学生1800名,为了了解同学们对“钉钉”授课软件的意见,计划采用分层抽样的方法从这1800名学生中抽取一个容量为72的样本.若从高一、高二、高三抽取的人数恰好是从小到大排列的连续偶数,则我校高三年级的人数为()A.800 B.750 C.700 D.650【解析】设从高三年级抽取的学生人数为2x人,则从高二、高一年级抽取的人数分别为2x-2,2x-4.由题意可得2x+(2x-2)+(2x-4)=72,∴x=13.设我校高三年级的学生人数为N,且高三抽取26人,由分层抽样,得eq\f(N,1800)=eq\f(26,72),∴N=650(人).故选D.核心考点二用样本估计总体统计中的四个数据特征:(1)众数:在样本数据中,出现次数最多的那个数据.(2)中位数:在样本数据中,将数据按大小顺序排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.(3)平均数:样本数据的算术平均数,即eq\o(x,\s\up6(-))=eq\f(1,n)(x1+x2+…+xn).(4)方差与标准差.s2=eq\f(1,n)[(x1-eq\o(x,\s\up6(-)))2+(x2-eq\o(x,\s\up6(-)))2+…+(xn-eq\o(x,\s\up6(-)))2],s=eq\r(\f(1,n)[(x1-\o(x,\s\up6(-)))2+(x2-\o(x,\s\up6(-)))2+…+(xn-\o(x,\s\up6(-)))2]).3.直方图的两个结论(1)小长方形的面积=组距×eq\f(频率,组距)=频率.(2)各小长方形的面积之和等于1.1.【2020·新高考海南卷】我国新冠肺炎疫情防控进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是()A.这11天复工指数和复产指数均逐日增加B.这11天期间,复产指数增量大于复工指数的增量C.第3天至第11天复工复产指数均超过80%D.第9天至第11天复产指数增量大于复工指数的增量【解析】由图可知,第1天到第2天复工指数减少,第7天到第8天复工指数减少,第10天到第11天复工指数减少,第8天到第9天复产指数减少,故A错误;由图可知,第一天的复产指数与复工指数的差大于第11天的复产指数与复工指数的差,所以这11天期间,复产指数增量小于复工指数的增量,故B错误;由图可知,第3天至第11天复工复产指数均超过80%,故C正确;由图可知,第9天至第11天复产指数增量大于复工指数的增量,故D正确;故选CD.2.【2020·天津卷】从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为()A.10 B.18 C.20 D.36【解析】因为直径落在区间[5.43,5.47)内的频率为0.02×(6.25+5.00)=0.225,所以个数为0.225×80=18.故选B.3.【2019新课标Ⅲ卷】为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).【解析】(1)由已知得0.70=a+0.20+0.15,故a=0.35,b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.1.【2019新课标Ⅱ卷】演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数 B.平均数C.方差 D.极差【解析】中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,中位数是不变的,平均数、方差、极差均受影响.故选A.2.【2018新课标Ⅰ卷】某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如图所示的饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半【解析】设新农村建设前经济收入为a,则新农村建设后经济收入为2a,则由饼图可得新农村建设前种植收入为0.6a,其他收入为0.04a,养殖收入为0.3a.新农村建设后种植收入为0.74a,其他收入为0.1a,养殖收入为0.6a,养殖收入与第三产业收入的总和为1.16a,所以新农村建设后,种植收入减少是错误的.故选A.3.【2019新课标Ⅱ卷】某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.y的分组[-0.20,0)[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80]企业数22453147①分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;②求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)附:eq\r(74)≈8.602.【解析】①频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为eq\f(14+7,100)=0.21.产值负增长的企业频率为eq\f(2,100)=0.02.所以用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.②100个企业的产值增长率平均数为eq\o(y,\s\up6(-))=eq\f(1,100)×(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,s2=eq\f(1,100)eq\o(∑,\s\up6(5),\s\do4(i=1))ni(yi-eq\o(y,\s\up6(-)))2=eq\f(1,100)×[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]=0.0296,s=eq\r(0.0296)=0.02×eq\r(74)≈0.17.所以,这类企业产值增长率的平均数与标准差的估计值分别为0.30,0.17.核心考点三回归分析在实际问题中的应用回归直线eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))经过样本点的中心(eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-))),若x取某一个值代入回归直线方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))中,可求出y的估计值.1.求回归直线方程的关键及实际应用:(1)关键:正确理解eq\o(b,\s\up6(^)),eq\o(a,\s\up6(^))的计算公式和准确地计算.(2)实际应用:在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.2.相关系数:(1)当r>0时,表明两个变量正相关;当r<0时,两个变量负相关.(2)当|r|>0.75时,认为两个变量具有较强的线性相关关系.1.【2020新课标Ⅰ卷】某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()A.y=a+bx B.y=a+bx2C.y=a+bex D.y=a+blnx【解析】由散点图可以看出,这些点大致分布在对数型函数的图象附近.故选D.2.【2020新课标Ⅱ】某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据SKIPIF1<0SKIPIF1<0,其中SKIPIF1<0和SKIPIF1<0分别表示第SKIPIF1<0个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本SKIPIF1<0SKIPIF1<0的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附相关系数:SKIPIF1<0,SKIPIF1<0.【解析】(1)样区野生动物平均数为SKIPIF1<0,地块数为200,该地区这种野生动物的估计值为SKIPIF1<0.(2)样本SKIPIF1<0SKIPIF1<0的相关系数为:SKIPIF1<0.(3)由(2)知各样区的这种野生动物的数量与植物覆盖面积有很强的正相关性,由于各地块间植物覆盖面积差异很大,从俄各地块间这种野生动物的数量差异很大,采用分层抽样的方法较好地保持了样本结构与总体结构得以执行,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.1.【2012新课标文】在一组样本数据SKIPIF1<0,SKIPIF1<0,……,SKIPIF1<0(SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,……,SKIPIF1<0不全相等)的散点图中,若所有样本点SKIPIF1<0SKIPIF1<0都在直线SKIPIF1<0上,则这组样本数据的样本相关系数为()A.−1B.0C.eq\f(1,2)D.1【解析】因为所有的点都在直线上,这组样本数据完全正相关,故其相关系数为1,故选D.2.【2015新课标1】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费SKIPIF1<0(单位:千元)对年销售量SKIPIF1<0(单位:t)和年利润SKIPIF1<0(单位:千元)的影响,对近8年的年宣传费SKIPIF1<0和年销售量SKIPIF1<0(SKIPIF1<0=1,2,······,8)数据作了初步处理,得到下面的散点图及一些统计量的值.SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<046.65636.8289.81.61469108.8表中SKIPIF1<0,SKIPIF1<0=SKIPIF1<0SKIPIF1<0.(Ⅰ)根据散点图判断,SKIPIF1<0与SKIPIF1<0哪一个适宜作为年销售量SKIPIF1<0关于年宣传费SKIPIF1<0的回归方程类型?(给出判断即可,不必说明理由)(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立SKIPIF1<0关于SKIPIF1<0的回归方程;(Ⅲ)已知这种产品的年利率SKIPIF1<0与SKIPIF1<0、SKIPIF1<0的关系为SKIPIF1<0.根据(Ⅱ)的结果回答下列问题:(ⅰ)年宣传费SKIPIF1<0=49时,年销售量及年利润的预报值是多少?(ⅱ)年宣传费SKIPIF1<0为何值时,年利率的预报值最大?附:对于一组数据SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,其回归线SKIPIF1<0的斜率和截距的最小二乘估计分别为SKIPIF1<0,SKIPIF1<0.【解析】(Ⅰ)由散点图可以判断,SKIPIF1<0适宜作为年销售量SKIPIF1<0关于年宣传费SKIPIF1<0的回归方程类型.(Ⅱ)令SKIPIF1<0,先建立SKIPIF1<0关于SKIPIF1<0的线性回归方程,由于SKIPIF1<0.SKIPIF1<0,所以SKIPIF1<0关于SKIPIF1<0的线性回归方程为SKIPIF1<0,因此SKIPIF1<0关于SKIPIF1<0的回归方程为SKIPIF1<0.(Ⅲ)(ⅰ)由(Ⅱ)知,当SKIPIF1<0时,年销售量SKIPIF1<0的预报值SKIPIF1<0年利润SKIPIF1<0的预报值SKIPIF1<0.(ⅱ)根据(Ⅱ)得结果知,年利润SKIPIF1<0的预报值SKIPIF1<0.所以当SKIPIF1<0,即SKIPIF1<0时,SKIPIF1<0取得最大值.故年宣传费为SKIPIF1<0千元时,年利润的预报值最大.核心考点四独立性检验1.独立性检验:对于取值分别是{x1,x2}和{y1,y2}的分类变量X和Y,其样本频数列联表是:y1y2总计x1aba+bx2cdc+d总计a+cb+dn则K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))(其中n=a+b+c+d为样本容量).2.独立性检验的一般步骤(1)根据样本数据列成2×2列联表;(2)根据公式K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),计算K2的值;(3)查表比较K2与临界值的大小关系,作统计判断.2.K2的观测值k越大,对应假设事件H0成立(两类变量相互独立)的概率越小,H0不成立的概率越大.1.某省二线城市地铁正式开工建设,地铁时代的到来能否缓解该市的交通拥堵状况呢?某社团进行社会调查,得到的数据如下表:男性市民女性市民认为能缓解交通拥堵4830认为不能缓解交通拥堵1220则下列结论正确的是()附:K2=eq\f(n(ad-bc)2,(a+b)(a+c)(b+d)(c+d))P(K2≥k0)0.050.0100.0050.001k03.8416.6357.87910.828A.有95%的把握认为“对能否缓解交通拥堵的认识与性别有关”B.有95%的把握认为“对能否缓解交通拥堵的认识与性别无关”C.有99%的把握认为“对能否缓解交通拥堵的认识与性别有关”D.有99%的把握认为“对能否缓解交通拥堵的认识与性别无关”【解析】由2×2列联表,可求K2的观测值,k=eq\f((48+30+12+20)(20×48-12×30)2,(48+30)(48+12)(12+20)(30+20))≈5.288>3.841.由统计表P(K2≥3.841)=0.05,∴有95%的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论