




免费预览已结束,剩余14页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
11.2随机抽样、用样本估计总体最新考纲考情考向分析1.理解随机抽样的必要性和重要性,会用简单随机抽样方法从总体中抽取样本,了解分层抽样和系统抽样的方法.2.了解分布的意义和作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.3.理解样本数据标准差的意义和作用,会计算数据标准差.4.能从样本数据中提取基本的数字特征(如平均数,标准差),并作出合理的解释.5.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.6.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.1.在抽样方法中,系统抽样、分层抽样是考查的重点.2.考查平均数、方差的计算及茎叶图与频率分布直方图的简单应用.3.题型以选择题、填空题为主,出现解答题时常与概率结合.1随机抽样(1)简单随机抽样:一般地,设一个总体含有n个个体,从中逐个不放回地抽取n个个体作为样本(nn),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样(2)系统抽样:当总体中的个体数目较多时,可将总体分成均衡的几个部分,然后按照事先定出的规则,从每一部分抽取一个个体得到所需要的样本,这种抽样方法叫做系统抽样(3)分层抽样:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样2用样本的频率分布估计总体分布(1)在频率分布直方图中,纵轴表示频率/组距,数据落在各小组内的频率用各小长方形的面积表示各小长方形的面积总和等于1.(2)频率分布折线图和总体密度曲线频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线(3)茎叶图茎是指中间的一列数,叶是从茎的旁边生长出来的数3用样本的数字特征估计总体的数字特征(1)众数:一组数据中出现次数最多的数(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数(3)平均数:,反映了一组数据的平均水平(4)标准差:是样本数据到平均数的一种平均距离,s.(5)方差:s2(x1)2(x2)2(xn)2(xn是样本数据,n是样本容量,是样本平均数)概念方法微思考1三种抽样方法有什么共同点和联系?提示(1)抽样过程中每个个体被抽取的机会均等(2)系统抽样中在起始部分抽样时采用简单随机抽样;分层抽样中各层抽样时采用简单随机抽样或系统抽样2平均数、标准差与方差反映了数据的哪些特征?提示平均数反映了数据取值的平均水平,标准差、方差反映了数据对平均数的波动情况,即标准差、方差越大,数据的离散程度越大,越不稳定;反之离散程度越小,越稳定题组一思考辨析1判断下列结论是否正确(请在括号中打“”或“”)(1)简单随机抽样每个个体被抽到的机会不一样,与先后有关()(2)系统抽样在第1段抽样时采用简单随机抽样()(3)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论()(4)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数()题组二教材改编2某公司有员工500人,其中不到35岁的有125人,3549岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为()a33,34,33b25,56,19c20,40,30d30,50,20答案b解析设在不到35岁的员工抽取x人,则,所以x25,同理可得这三个年龄段抽取人数分别为25,56,19.3.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是()a91.5和91.5b91.5和92c91和91.5d92和92答案a解析这组数据由小到大排列为87,89,90,91,92,93,94,96,中位数是91.5,平均数91.5.4如图是100位居民月均用水量的频率分布直方图,则月均用水量在2,2.5)范围内的居民有_人答案25解析0.50.510025.题组三易错自纠5从编号为150的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()a5,10,15,20,25b3,13,23,33,43c1,2,3,4,5d2,4,6,16,32答案b解析间隔距离为10,故可能的编号是3,13,23,33,43.6若数据x1,x2,x3,xn的平均数5,方差s22,则数据3x11,3x21,3x31,3xn1的平均数和方差分别为_答案16,18解析x1,x2,x3,xn的平均数为5,5,135116,x1,x2,x3,xn的方差为2,3x11,3x21,3x31,3xn1的方差是32218.抽样方法1用简单随机抽样的方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是()a.,b.,c.,d.,答案a解析方法一在抽样过程中,个体a每一次被抽中的概率是相等的,因为总体容量为10,故个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性均为.故选a.方法二第一次被抽到,显然为;第二次被抽到,首先第一次不能被抽到,第二次抽才被抽到可能性为.故选a.2(2019海口调研)某校三个年级共有24个班,学校为了了解同学们的心理状况,将每个班编号,依次为1到24,现用系统抽样法,抽取4个班进行调查,若抽到的最小编号为3,则抽取的最大编号为()a15b18c21d22答案c解析由已知得间隔数为k6,则抽取的最大编号为3(41)621.3(2019安徽毛坦厂中学模拟)某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种,10种,30种,20种,现从中抽取一个容量为20的样本进行食品安全检测,若采用分层抽样的方法抽取样本,则抽取的植物油类与果疏类食品种数之和是_答案6解析本题主要考查对分层抽样的理解抽样比为,则抽取的植物油类种数是102,抽取的果蔬类食品种数是204,所以抽取的植物油类与果蔬类食品种数之和是246.思维升华 (1)简单随机抽样是系统抽样和分层抽样的基础,是一种等概率的抽样,由定义应抓住以下特点:它要求总体个数较少;它是从总体中逐个抽取的;它是一种不放回抽样(2)系统抽样又称等距抽样,号码序列一确定,样本即确定了,但要求总体中不能含有一定的周期性,否则其样本的代表性是不可靠的,甚至会导致明显的偏向(3)分层抽样适用于总体中个体差异较大的情况(4)抽样方法经常交叉使用,比如系统抽样中的第一均衡部分,可采用简单随机抽样,分层抽样中,若每层中个体数量仍很大时,则可辅之以系统抽样统计图表及应用命题点1扇形图例1(2018全国)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()a新农村建设后,种植收入减少b新农村建设后,其他收入增加了一倍以上c新农村建设后,养殖收入增加了一倍d新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案a解析设新农村建设前,农村的经济收入为a,则新农村建设后,农村的经济收入为2a.新农村建设前后,各项收入的对比如下表:新农村建设前新农村建设后新农村建设后变化情况结论种植收入60%a37%2a74%a增加a错其他收入4%a5%2a10%a增加了一倍以上b对养殖收入30%a30%2a60%a增加了一倍c对养殖收入第三产业收入(30%6%)a36%a(30%28%)2a116%a超过经济收入2a的一半d对故选a.命题点2折线图例2(2017全国)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图根据该折线图,下列结论错误的是()a月接待游客量逐月增加b年接待游客量逐年增加c各年的月接待游客量高峰期大致在7,8月d各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳答案a解析对于选项a,由图易知月接待游客量每年7,8月份明显高于12月份,故a错;对于选项b,观察折线图的变化趋势可知年接待游客量逐年增加,故b正确;对于选项c,d,由图可知显然正确故选a.命题点3茎叶图例3如图所示的茎叶图记录了甲,乙两组各5名工人某日的产量数据(单位:件)若这两组数据的中位数相等,且平均数也相等,则x和y的值分别为()a3,5b5,5c3,7d5,7答案a解析甲组数据的中位数为65,由甲,乙两组数据的中位数相等,得y5.又甲、乙两组数据的平均数相等,(5665627470x)(5961676578),x3.故选a.命题点4频率分布直方图例4(2019南昌调研)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图(1)直方图中x的值为_;(2)在这些用户中,月用电量落在区间100,250)内的户数为_答案(1)0.0044(2)70解析(1)由频率分布直方图知数据落在200,250)内的频率为1(0.00240.00360.00600.00240.0012)500.22,于是x0.0044.(2)因为数据落在100,250)内的频率为(0.00360.00600.0044)500.7,所以所求户数为0.710070.思维升华 (1)通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系(2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势(3)由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示其缺点是当样本容量较大时,作图较烦琐(4)准确理解频率分布直方图的数据特点:频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆频率分布直方图中各小长方形的面积之和为1,这是解题的关键,常利用频率分布直方图估计总体分布跟踪训练(1)(2019洛阳模拟)已知某地区中小学生人数和近视情况分别如图和图所示为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()a200,20b100,20c200,10d100,10答案a解析由图得样本容量为(350020004500)2%100002%200,抽取的高中生人数为20002%40(人),则近视人数为400.520(人),故选a.(2)(2019昆明质检)“搜索指数”是网民通过搜索引擎,以每天搜索关键词的次数为基础所得到的统计指标搜索指数越大,表示网民搜索该关键词的次数越多,对该关键词相关的信息关注度也越高如图是2017年9月到2018年2月这半年来,某个关键词的搜索指数变化的统计图根据该统计图判断,下列结论正确的是()a这半年来,网民对该关键词相关的信息关注度呈周期性变化b这半年来,网民对该关键词相关的信息关注度不断减弱c从该关键词的搜索指数来看,2017年10月的方差小于11月的方差d从该关键词的搜索指数来看,2017年12月的平均值大于2018年1月的平均值答案d解析由统计图可知,这半年来,该关键词的搜索指数变化的周期性并不显著,排除a;由统计图可知,这半年来,该关键词的搜索指数的整体减弱趋势不显著,排除b;由统计图可知,2017年10月该关键词的搜索指数波动较大,11月的波动较小,所以2017年10月的方差大于11月的方差,排除c;由统计图可知,2017年12月该关键词的搜索指数大多高于10000,该月平均值大于10000,2018年1月该关键词的搜索指数大多低于10000,该月平均值小于10000,选d.(3)(2020成都模拟)如图是某赛季甲、乙两名篮球运动员9场比赛所得分数的茎叶图,则下列说法错误的是()a甲所得分数的极差为22b乙所得分数的中位数为18c两人所得分数的众数相等d甲所得分数的平均数低于乙所得分数的平均数答案d解析甲所得分数的极差为331122,a正确;乙所得分数的中位数为18,b正确;甲所得分数的众数为22,乙所得分数的众数为22,c正确,故选d.(4)(2019昆明模拟)为了解学生“阳光体育”活动的情况,随机统计了n名学生的“阳光体育”活动时间(单位:分钟),所得数据都在区间10,110内,其频率分布直方图如图所示已知活动时间在10,35)内的频数为80,则n的值为()a700b800c850d900答案b解析根据频率分布直方图,知组距为25,所以活动时间在10,35)内的频率为0.1,因为活动时间在10,35)内的频数为80,所以n800.用样本的数字特征估计总体的数字特征1(2019全国)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()a中位数b平均数c方差d极差答案a解析记9个原始评分分别为a,b,c,d,e,f,g,h,i(按从小到大的顺序排列),易知e为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位数,故选a.2某项测试成绩满分为10分,现随机抽取30名学生参加测试,得分情况如图所示,假设得分值的中位数为me,平均数为,众数为m0,则()amem0bmem0cmem0dm0me5.5,所以m0mes,甲更稳定,故最佳人选应是甲思维升华 (1)用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似值实际应用时,需先计算样本数据的平均数,分析平均水平,再计算方差(标准差)分析稳定情况(2)若给出图形,一方面可以由图形得到相应的样本数据,再计算平均数、方差(标准差);另一方面,可以从图形直观分析样本数据的分布情况,大致判断平均数的范围,并利用数据的波动性大小比较方差(标准差)的大小.1某工厂平均每天生产某种机器零件10000件,要求产品检验员每天抽取50件零件,检查其质量状况,采用系统抽样方法抽取,将零件编号为0000,0001,0002,9999,若抽取的第一组中的号码为0010,则第三组抽取的号码为()a0210b0410c0610d0810答案b解析将零件分成50段,分段间隔为200,因此,第三组抽取的号码为001022000410,故选b.2某中学有高中生3500人,初中生1500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为()a100b150c200d250答案a解析方法一由题意可得,解得n100.方法二由题意,得抽样比为,总体容量为350015005000,故n5000100.3(2020临川一中模拟)如图为某省高考数学(理)卷近三年难易程度的对比图(图中数据为分值)根据对比图,给出正面三个结论:近三年容易题分值逐年增加;近三年中档题分值所占比例最高的年份是2017年;2018年的容易题与中档题的分值之和占总分的90%以上其中正确结论的个数为()a0b1c2d3答案c解析根据对比图得,2016年,2017年,2018年容易题分值分别为40,55,96,逐年增加,正确;近三年中档题分值所占比例最高的年份是2016年,错误;2018年的容易题与中档题的分值之和为9642138,0.9290%,正确故选c.4(2019全国)西游记三国演义水浒传和红楼梦是中国古典文学瑰宝,并称为中国古典小说四大名著某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过西游记或红楼梦的学生共有90位,阅读过红楼梦的学生共有80位,阅读过西游记且阅读过红楼梦的学生共有60位,则该校阅读过西游记的学生人数与该校学生总数比值的估计值为()a0.5b0.6c0.7d0.8答案c解析根据题意阅读过红楼梦西游记的人数用韦恩图表示如下:所以该校阅读过西游记的学生人数与该校学生总数比值的估计值为0.7.5.如图是某样本数据的茎叶图,则该样本的中位数、众数、极差分别是()a323432b334535c344532d333635答案b解析从茎叶图中知共16个数据,按照从小到大排序后中间的两个数据为32,34,所以这组数据的中位数为33;45出现的次数最多,所以这组数据的众数为45;最大值是47,最小值是12,故极差是35.6(2020惠州调研)某高校调查了320名学生每周的自习时间(单位:小时)制成了下图所示的频率分布直方图,其中自习时间的范围是17.5,30,样本数据分组为17.5,20,(20,22.5,(22.5,25,(25,27.5,(27.5,30根据频率分布直方图,这320名学生中每周的自习时间不足22.5小时的人数是()a70b72c248d200答案b解析由频率分布直方图可得,320名学生中每周的自习时间不足22.5小时的人数是320(0.020.07)2.572(人)故选b.7若数据x1,x2,xn的平均数为,方差为s2,则2x13,2x23,2xn3的平均数和方差分别为()a.和s2b23和4s2c23和s2d23和4s212s9答案b解析方法一平均数为(2x132x232xn3)2(x1x2xn)3n23;方差为(2x13)(23)2(2x23)(23)2(2xn3)(23)24(x1)24(x2)24(xn)24s2.方法二原数据乘以2加上3得到一组新数据,则由平均数、方差的性质可知得到的新数据的平均数和方差分别是23和4s2.8(2019揭阳模拟)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为()a9b10c11d13答案b解析不妨设样本数据x1,x2,x3,x4,x5,且x1x2x3x4x5,则由样本方差为4,知(x17)2(x27)2(x37)2(x47)2(x57)220.若5个整数平方和为20,则这5个整数的平方只能在0,1,4,9,16中任取(每个数量最多出现2次),当这5个整数的平方中最大的数为16时,分析可知,总不满足和为20;当这5个整数的平方中最大的数为9时,0,1,1,9,9这组数据满足要求,此时对应的样本数据为x14,x26,x37,x48,x510;当这5个整数的平方中最大的数不超过4时,总不满足要求,因此不存在满足条件的另一组数据,故选b.9(2019江苏)已知一组数据6,7,8,8,9,10,则该组数据的方差是_答案解析数据6,7,8,8,9,10的平均数是8,则方差是.10(2019衡水中学调研)衡水中学高三(2)班现有64名学生,随机编号为0,1,2,63,依编号顺序平均分成8组,组号依次为1,2,3,8.现用系统抽样方法抽取一个容量为8的样本,若在第一组中随机抽取的号码为5,则在第6组中抽取的号码为_答案45解析分组间隔为8,在第一组中随机抽取的号码为5,在第6组中抽取的号码为55845.11为了了解一批产品的长度(单位:毫米)情况,现抽取容量为400的样本进行检测,如图是检测结果的频率分布直方图,根据产品标准,单件产品长度在区间25,30)的为一等品,在区间20,25)和30,35)的为二等品,其余均为三等品,则样本中三等品的件数为_答案100解析由题意得,三等品的长度在区间10,15),15,20)和35,40内,根据频率分布直方图可得三等品的频率为(0.01250.02500.0125)50.25,样本中三等品的件数为4000.25100.12(2019济宁模拟)中国诗词大会的播出引发了全民的读书热,某小学语文老师在班里开展了一次诗词默写比赛,班里40名学生得分数据的茎叶图如图若规定得分不小于85分的学生得到“诗词达人”的称号,低于85分且不小于70分的学生得到“诗词能手”的称号,其他学生得到“诗词爱好者”的称号,根据该次比赛的成绩按照称号的不同进行分层抽样抽选10名学生,则抽选的学生中获得“诗词达人”称号的人数为_答案2解析由茎叶图可得,获“诗词达人”称号的学生有8人,设抽取的学生中获得“诗词达人”称号的人数为n,则,解得n2.13(2019榆林模拟)为了反映各行业对仓储物流业务需求变化的情况,以及重要商品库存变化的动向,中国物流与采购联合会和中储发展股份有限公司通过联合调查,制定了中国仓储指数由2017年1月至2018年7月的调查数据得出的中国仓储指数,绘制出如下折线图根据该折线图,下列结论正确的是()a2017年各月的仓储指数最大值是在3月份b2018年1月至7月的仓储指数的中位数为55c2018年1月与4月的仓储指数的平均数为52d2017年1月至4月的仓储指数相对于2018年1月至4月,波动性更大答案d解析2017年各月的仓储指数最大值是在11月份,所以a错误;由图可知,2018年1月至7月的仓储指数的中位数约为53,所以b错误;2018年1月与4月的仓储指数的平均数为53,所以c错误;由图可知,2017年1月至4月的仓储指数比2018年1月至4月的仓储指数波动更大,故选d.14(2019西安质检)采用系统抽样方法从1000人中抽取50人做问卷调查,为此将他们随机编号为1,2,1000,适当分组后在第一组采用简单随机抽样的方法抽到的号码为8.抽到的50人中,编号落入区间1,400的人做问卷a,编号落入区间401,750的人做问卷b,其余的人做问卷c,则抽到的人中,做问卷c的人数为()a12b13c14d15答案a解析10005020,故
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年广东省安全员(A证)第四批(主要负责人)证考试练习题库(含答案)
- 2025年中小学生卫生知识大赛试题(附含答案)
- 2024年广西公务员考试真题及答案
- 北京育儿知识培训班课件
- 2025年继续教育公需课必修课考试题库附含参考答案
- (健康档案老年人慢性病)模拟试卷含答案
- 水域安全事故应急救援培训课件
- 北京医院看病知识培训课件
- 2025新版体育与健康新课标测试题(含答案)
- 标准化基础知识培训教材课件
- 2025年秋季新学期教学工作会议上校长讲话:扎根课堂、走近学生、做实教学-每一节课都值得全力以赴
- 2025年度船舶抵押贷款合同范本:航运融资与风险规避手册
- 2025年党建知识应知应会测试题库(附答案)
- 2025劳动合同范本【模板下载】
- 以课程标准为导向:上海市初中信息科技教学设计的探索与实践
- 2025年公共基础知识考试试题(附完整答案)
- 2025年海南省公安厅招聘警务辅助人员考试试题(含答案)
- 北川羌族自治县农业农村局北川羌族自治县测雨雷达建设项目环评报告
- 2025年河北中考生物真题含答案
- 中华诗词大赛1-3年级题库(含答案)
- 2025年山东高考化学试卷真题及答案详解解读(精校打印)
评论
0/150
提交评论