




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第13讲统计(11个知识点+13种题型+强化训练)知识导图知识清单知识点一全面调查与抽样调查及相关概念1.全面调查对每一个调查对象都进行调查的方法,称为全面调查,又称普查.2.总体、个体(1)我们把调查对象的全体称为总体.(2)组成总体的每一个调查对象称为个体.3.抽样调查根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查.4.样本、样本量、样本数据(1)我们把从总体中抽取的那部分个体称为样本.(2)样本中包含的个体数称为样本量.(3)调查样本获得的变量值称为样本的观测数据,简称样本数据.知识点二简单随机抽样的定义1.放回简单随机抽样和不放回简单随机抽样一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1≤n<N)个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.2.简单随机样本通过简单随机抽样获得的样本称为简单随机样本.知识点三常用的简单随机抽样的方法1.常用的简单随机抽样的方法(1)抽签法;(2)随机数法.2.随机数的生成(1)用随机试验生成随机数;(2)用信息技术生成随机数.知识点四总体均值与样本均值总体均值一般地,总体中有N个个体,它们的变量值分别为则称为总体均值,又称总体平均数。如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为其中出现的频数为,则总体均值还可以写成加权平均数的形式样本均值如果从总体中抽取一个容量为n的样本,他们的变量值分别为则称为样本均值,又称样本平均数。3.样本均值与总体均值的关系我们常用样本均值eq\o(y,\s\up6(-))估计总体均值eq\o(Y,\s\up6(-)).1.抽签法的优缺点与操作步骤(1)优点:简单易行.当总体的个数不多时,使总体处于“搅拌均匀”的状态比较容易,这时,每个个体都有均等的机会被抽中,从而能够保证样本的代表性.(2)缺点:仅适用于个体数较少的总体.当总体容量非常大时,费时费力又不方便,况且,如果号签搅拌的不均匀,可能导致抽样不公平.(3)用抽签法从容量为N的总体中抽取一个容量为n的样本的步骤:①编号:给总体中的所有个体编号(号码可以从1到N);②制作号签:将1~N这N个号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作);③均匀搅拌:将号签放在一个不透明的容器里,搅拌均匀;④抽取号码:每次从容器中不放回地抽取一个号签,连续抽取n次;⑤构成样本:从总体中将与抽到的号签上的号码一致的个体抽取,就构成了一个容量为n的样本.2.随机数表法的优缺点及操作步骤(1)优点:简单易行.它很好地解决了当总体中的个体数较多时抽签法制签难的问题.(2)缺点:当总体中的个体数很多,需要的样本量也较大时,用随机数表法抽取样本仍不方便.(3)随机数表法抽取样本的步骤:①编号:对总体的个体进行编号(每个号码位数一致);②选定初始值:在随机数表中任选一个数作为开始;③选号:从选定的数开始按一定的方向读下去,得到的号码若不在编号中,则跳过,若在编号中,则取出,如果得到的号码前面已经取出,也跳过,如此继续下去,直到取满为止;④确定样本:根据选定的号码抽取样本.3.抽签法与随机数法的区别抽签法适用于总体中个体数较少,样本量也较小的抽样,随机数法适用于总体中个体数较多,但样本量较小的抽样.4.用样本估计总体,主要基于以下两点:一是在很多情况下总体的个数往往很多,甚至无限,不能一一加以考察;二是有些从总体中抽取个体的试验常有破坏性,因而抽取的个体不允许太多。知识点五、分层随机抽样的相关概念(1)分层随机抽样的定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.(2)比例分配:在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.2.样本平均数的计算公式在分层随机抽样中,第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n,第1层和第2层样本的平均数分别为eq\x\to(x)和eq\x\to(y),则样本的平均数eq\x\to(ω)=eq\f(m,m+n)eq\o(x,\s\up6(-))+eq\f(n,m+n)eq\o(y,\s\up6(-))=eq\f(M,M+N)eq\o(x,\s\up6(-))+eq\f(N,M+N)eq\o(y,\s\up6(-)).思考1:分层随机抽样的总体具有什么特性?[提示]分层随机抽样的总体按一个或多个变量划分成若干个子总体,并且每一个个体属于且仅属于一个子总体.思考2:简单随机抽样和分层随机抽样有什么区别和联系?[提示]区别:简单随机抽样是从总体中逐个抽取样本;分层随机抽样则首先将总体分成几层,在各层中按比例分配抽取样本.联系:(1)抽样过程中每个个体被抽到的可能性相等;(2)每次抽出个体后不再将它放回,即不放回抽样.知识点六获取数据的基本途径获取数据的基本途径适用类型注意问题通过调查获取数据对于有限总体问题,我们一般通过抽样调查或普查的方法获取数据要充分有效地利用背景信息选择或创建更好的抽样方法,并有效地避免抽样过程中的人为错误通过试验获取数据没有现存的数据可以查询严格控制实验环境,通过精心的设计安排试验,以提高数据质量通过观察获取数据自然现象要通过长久的持续观察获取数据通过查询获得数据众多专家研究过,其收集的数据有所存储必须根据问题背景知识“清洗数据”,去伪存真思考1:利用统计报表和年鉴属于那中获取数据的途径?[提示]属于通过查询获取数据的途径.思考2:要了解一种新型灯管的寿命,能通过观察获取数据吗?[提示]不能,应该通过试验获取数据.知识点七频率分布表与频率分布直方图1.一般地,当总体很大或不便获取时,用样本的频率分布估计总体的频率分布.把反应总体频率分布的表格称为频率分布表.2.把表示样本数据分布规律的图形称为频率分布直方图.3.制作频率分布表与频率分布直方图的一般步骤:(1)求极差,即计算最大值与最小值的差.(2)决定组距与组数.(3)将数据分组.(4)列频率分布表.(5)画频率分布直方图.知识点八、常用的统计图1.条形图条形图能清楚地表示出每个项目的具体数量.2.折线图折线图能够清晰地反映数据的变化趋势或情况.3.扇形图扇形图能直观、生动地反映各部分在总体中所占的比例情况.1.频率分布直方图能够直观、形象地反映样本的分布规律,可以大致估计出总体的分布,但是从频率分布直方图中得不出原始的数据内容,把数据绘制成频率分布直方图后,原有的具体数据信息就被抹掉了.在频率分布直方图中,由于长方形的面积S=组距×eq\f(频率,组距)=频率,所以各个小长方形的面积表示相应各组的频率,这样频率分布直方图就以面积的形式反映了数据在各个小组的频率的大小,各个小长方形的面积总和等于1.2.一般地,样本量越大,这种估计就越精确.总体估计要掌握:(1)“表”(频率分布表);(2)“图”(频率分布直方图).提醒:直方图的纵轴(小长方形的高)一般是频率除以组距的商,横轴一般是数据的大小,小长方形的面积表示频率.知识点九总体百分位数的估计1.第p百分位数的定义一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.2.计算一组n个数据的第p百分位数的步骤第1步,按从小到大排列原始数据.第2步,计算i=n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.3.四分位数25%,50%,75%这三个分位数把一组数据由小到大排列后的数据分成四等份,因此称为四分位数.思考:(1)班级人数为50的班主任老师说“90%的同学能够考取本科院校”,这里的“90%”是百分位数吗?(2)“这次数学测试成绩的第70百分位数是85分”这句话是什么意思?[提示](1)不是.是指能够考取本科院校的同学占同学总数的百分比.(2)有70%的同学数学测试成绩在小于或等于85分.知识点十总体集中趋势的估计1.众数、中位数和平均数的定义(1)众数:一组数据中出现次数最多的数.(2)中位数:一组数据按大小顺序排列后,处于中间位置的数.如果个数是偶数,则取中间两个数据的平均数.(3)平均数:一组数据的和除以数据个数所得到的数.2.众数、中位数和平均数的比较名称优点缺点平均数与中位数相比,平均数反映出样本数据中更多的信息,对样本中的极端值更加敏感任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大中位数不受少数几个极端数据(即排序靠前或靠后的数据)的影响对极端值不敏感众数体现了样本数据的最大集中点众数只能传递数据中的信息的很少一部分,对极端值不敏感3.众数、中位数、平均数与频率分布直方图的关系(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.(3)众数:众数是最高小矩形底边的中点所对应的数据.思考1:中位数一定是样本数据中的一个数吗?[提示]不一定.一组数据按大小顺序排列后,如果有奇数个数据,处于中间位置的数是中位数;如果有偶数个数据,则取中间两个数据的平均数是中位数.思考2:一组数据的众数可以有几个?中位数是否也具有相同的结论?[提示]一组数据的众数可能有一个,也可能有多个,中位数只有唯一一个.知识点十一总体离散程度的估计1.一组数据x1,x2,…,xn的方差和标准差数据x1,x2,…,xn的方差为=,标准差为.2.总体方差和标准差(1)总体方差和标准差:如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体的平均数为eq\x\to(Y),则称S2=为总体方差,S=eq\r(S2)为总体标准差.(2)总体方差的加权形式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=.3.样本方差和标准差如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为eq\x\to(y),则称s2=为样本方差,s=eq\r(s2)为样本标准差.4.标准差的意义标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.5.分层随机抽样的方差设样本容量为n,平均数为eq\x\to(x),其中两层的个体数量分别为n1,n2,两层的平均数分别为eq\o(x,\s\up6(-))1,eq\o(x,\s\up6(-))2,方差分别为seq\o\al(2,1),seq\o\al(2,2),则这个样本的方差为s2=eq\f(n1,n)[seq\o\al(2,1)+(eq\o(x,\s\up6(-))1-eq\o(x,\s\up6(-)))2]+eq\f(n2,n)[seq\o\al(2,2)+(eq\o(x,\s\up6(-))2-eq\o(x,\s\up6(-)))2].知识复习题型一、简单随机抽样特征及适用条件一、单选题1.(2022高三·全国·专题练习)下列抽取样本的方式是简单随机抽样的是(
)A.从无限多个个体中抽取100个个体作为样本B.盒子里共有80个零件,从中逐个不放回地选出5个零件进行质量检验C.从100部中一次性抽取5部进行质量检验D.某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛2.(2324高二上·上海·期末)已知一个总体含有N个个体,要用简单随机抽样方法从中抽取一个个体,则在抽样过程中,每个个体被抽取的概率(
)A.变小 B.变大 C.相等 D.无法确定二、多选题3.(2324高一上·全国·课后作业)对于简单随机抽样,下列说法正确的是(
)A.它要求总体的个体数有限B.它是从总体中按排列顺序逐个地进行抽取C.它是一种不放回抽样D.它是一种等可能抽样,不仅每次从总体中抽取一个个体时,各个个体被抽取的可能性相等,而且在整个抽取过程中,各个个体被抽取的可能性也相等,从而保证了这种抽样方法的公平性三、填空题4.(2223高一下·黑龙江哈尔滨·期末)二战期间盟军的统计学家主要是将缴获的德军坦克序列号作为样本,用样本估计总体的方法得出德军某月生产的坦克总数.假设德军某月生产的坦克总数是N,缴获的该月生产的n辆坦克编号从小到大为,,…,,即最大编号为,且缴获的坦克是从所生产的坦克中随机获取的,因为生产坦克是连续编号的,所以缴获坦克的编号,,…,,,相当于从中随机抽取的n个整数,这n个数将区间分成个小区间,由于N是未知的,除了最右边的区间外,其他n个区间都是已知的.由于这n个数是随机抽取的,所以可以用前n个区间的平均长度估计所有个区间的平均长度,进而得到N的估计值.例如,缴获坦克的编号是3,5,12,18,20,则统计学家利用上述方法估计德军每月生产的坦克数为.
四、解答题5.(2223高一·全国·随堂练习)现在想估计某寒带地区旅游城市一年的游客量,能采用在1月—3月随机抽取10天的游客量作为全年每天游客量的一组样本,合理吗?为什么?如果这种抽样方法不合理,请你设计一个你认为合理的抽样方案.五、判断题6.(2324高一上·全国·课时练习)判断正误(正确的填“正确”,错误的填“错误”)(1)抽签法和随机数法都是不放回抽样.()(2)抽签法抽签时,先抽签的人占便宜.()(3)利用随机数表抽样时,开始位置和读数方向可以任意选择.()(4)对任意抽样调查均可使用随机数法.()题型二、抽签法和随机数表法一、单选题1.(2324高一上·安徽蚌埠·期末)为了解高一新生的体质健康状况,某校将组织高一学生进行体质健康抽测.已知该校高一年级共有800名学生,将他们依次编号,拟利用随机数表随机抽取80名同学参加体质健康测试,随机数表的一部分如下:781665720802631407024369972801983204924349358200362348696938748129763413284142412424198593132322在随机数表中从第2行第4列开始,横向依次读取三个数字,则被抽中的第5个编号是(
)A.036 B.341 C.328 D.6932.(2024·陕西西安·一模)某高校对中文系新生进行体测,利用随机数表对650名学生进行抽样,先将650名学生进行编号,001,002,…,649,650.从中抽取50个样本,下图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第6个样本编号是(
)3221183429
7864540732
5242064438
1223435677
35789056428442125331
3457860736
2530073286
2345788907
23689608043256780843
6789535577
3489948375
2253557832
4577892345A.623 B.328 C.072 D.457二、解答题3.(2023高一·全国·专题练习)某高校共有50名志愿者被选中参加某志愿服务活动,暑假期间,该校欲从这50名志愿者中选取8人组成志愿服务小组,请用抽签法设计抽样方案.4.(2122高一·全国·课时练习)新型冠状病毒疫情暴发后,某医院为了支援前线,要在100名志愿者中选取10人组成医疗小组去参加救治工作,请分别用抽签法和随机数表法设计抽样方案.题型三、简单随机抽样的概率1.(2223高一下·陕西宝鸡·阶段练习)某校在一次期中作业检查中,对高一(6)班61位同学的作业进行抽样调查,先采用抽签法从中剔除一个人,再从余下的60人中随机抽取6人,下列说法正确的是(
)A.这种抽样方法对于被剔除的个体是不公平的,因为他们失去了被抽到的机会B.每个人被抽到的机会不相等C.每个人在整个抽样过程中被抽到的机会相等,因为每个人被剔除的可能性相等,那么,不被剔除的机会也是相等的D.由于采用了两步进行的抽样,所以无法判断每个人被抽的可能性是多少2.(2023高二上·新疆·学业考试)对总数为的一批零件抽取一容量为20的样本,若每个零件被抽取的可能性为20%,则为(
)A.150 B.120 C.100 D.403.(2223高一下·陕西西安·期中)对总数为200的一批零件,抽一个容量为的样本,若每个零件被抽到的可能性为0.25,则为()A.50 B.100C.25 D.120二、填空题4.(2223高一下·广东广州·期末)采用简单随机抽样从含15个个体的总体中抽取一个容量为5的样本,个体前两次末被抽到,第三次被抽到的概率为.三、解答题5.(2122高一·全国·课时练习)从总体容量为500的一批商品中抽取出一个容量为A的样本,若每个商品个体被抽到的可能性为12%,求A的值.6.某单位拟从40名员工中选1人赠送电影票,可采用下面两种选法:选法一:将这40名员工按1至40进行编号,并相应地制作号码为1至40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取1个号签,与这个号签编号一致的员工是幸运人选;选法二:将39个白球与1个红球(除颜色外,其他完全相同)混合放在一个暗箱中搅匀,让40名员工逐一从中不放回地摸取1个球,则摸到红球的员工是幸运人选.试问:(1)这两种选法是否都是抽签法,为什么?(2)这两种选法中每名员工被选中的可能性是否相等?题型四、简单随机抽样估计总体一、单选题1.(2223高一下·安徽阜阳·期末)中国古典数学先后经历了三次发展高潮,即两汉时期、魏晋南北朝时期和宋元时期,并在宋元时期达到顶峰,而南宋时期的数学家秦九韶正是其中的代表人物.作为秦九韶的集大成之作,《数书九章》一书所承载的数学成就非同一般.可以说,但凡是实际生活中需要运用到数学知识的地方,《数书九章》一书皆有所涉及,例如“验米夹谷”问题:今有谷3318石,抽样取谷一把,数得168粒内有秕谷22粒,则粮仓内的秕谷约为(
)A.321石 B.166石 C.434石 D.623石二、多选题2.(2022·湖北·模拟预测)某地区公共部门为了调查本地区中学生的吸烟情况,对随机抽出的编号为1~1000的1000名学生进行了调查.调查中使用了两个问题,问题1:你的编号是否为奇数?问题2:你是否吸烟?被调查者从设计好的随机装置(内有除颜色外完全相同的白球50个,红球50个)中摸出一个小球(摸完放回):摸到白球则如实回答问题1,摸到红球则如实回答问题2,回答“是”的人在一张白纸上画一个“√”,回答“否”的人什么都不用做,由于问题的答案只有“是”和“否”,而且回答的是哪个问题也是别人不知道的,因此被调查者可以毫无顾忌的给出真实的答案.最后统计得出,这1000人中,共有265人回答“是”,则下列表述正确的是(
)A.估计被调查者中约有15人吸烟 B.估计约有15人对问题2的回答为“是”C.估计该地区约有3%的中学生吸烟 D.估计该地区约有1.5%的中学生吸烟三、填空题3.(2324高一上·北京房山·期末)为估计某森林内松鼠的数量,使用以下方法:先随机从森林中捕捉松鼠100只,在每只松鼠的尾巴上作上记号后放回森林.再随机从森林中捕捉50只,若尾巴上有记号的松鼠共有5只,估计此森林内约有松鼠只.四、解答题4.一只装有红豆的袋子中混入了绿豆,怎样获取数据可以估计出袋子中绿豆所占的比率?怎样做可以提高估计结论的准确程度?(假定两种豆子的大小、质量相同)题型五、分层抽样特征及适用条件总体;抽样比,样本总量,各层总数,总体容量的计算一、单选题1.(2024·青海·一模)某中学的高中部共有男生1200人,其中高一年级有男生300人,高二年级有男生400人.现按分层抽样抽出36名男生去参加体能测试,则高三年级被抽到的男生人数为(
)A.9 B.12 C.15 D.182.(2324高二上·内蒙古锡林郭勒盟·期末)树人中学高一年级有712名学生,男生有326名,女生有386名,想抽取样本了解高一年级的平均身高,为减少“极端”样本的出现,你认为比较合适的抽样方法为(
)A.抽签法 B.随机数法 C.分层抽样 D.其他方法3.(2023·湖南岳阳·模拟预测)现有以下两项调查:①从40台刚出厂的大型挖掘机中抽取4台进行质量检测;②在某校800名学生中,型、型、B型和型血的学生依次有人.为了研究血型与色弱的关系,需从中抽取一个容量为40的样本.完成这两项调查最适宜采用的抽样方法分别是(
)A.①②都采用简单随机抽样B.①②都采用分层随机抽样C.①采用简单随机抽样,②采用分层随机抽样D.①采用分层随机抽样,②采用简单随机抽样4.(2024·四川南充·二模)某工厂生产A,B,C三种不同型号的产品,它们的产量之比为2∶3∶5,用分层抽样的方法抽取一个容量为n的样本.若样本中A型号的产品有30件,则样本容量n为(
)A.150 B.180 C.200 D.250二、填空题5.(2324高三下·辽宁·开学考试)据统计,某段时间内由内地前往香港的老、中、青年旅客的比例依次为,现使用分层抽样的方法从这些旅客中随机抽取n人,若青年旅客抽到60人,则.6.(2324高一上·江西景德镇·期末)某校有高级教师90人,中级教师150人,其他教师若干人.为了了解教师的健康状况,从中抽取60人进行体检.已知高级教师中抽取了18人,则从中级教师中抽取的人数是.三、解答题7.(2425高一上·全国·课后作业)某学校开展学生对教师任教满意度的调查活动.首先,通过问卷对全体学生进行普查,然后根据普查结果,抽取一部分学生进行访谈.下表是该学校在普查中对某位教师任教的所有班级(4个班级)的满意度调查结果:班级编号1234满意度/%98979091现在,想从这4个班级中选取一部分学生进行访谈.有4名同学是这样操作的:同学甲从2号班级、4号班级中抽取一部分同学进行访谈.同学乙从1号班级、2号班级中抽取一部分同学进行访谈.同学丙从1号班级、3号班级中抽取一部分同学进行访谈.同学丁从3号班级、4号班级中分别抽取一部分同学进行访谈.你认为哪名同学的调查更合理?8.(2425高一上·全国·课后作业)某地农田分布在山地、丘陵、平原、洼地不同的地形上,要对这个地区的农作物产量进行调查,应当如何抽样?9.(2425高一上·全国·课后作业)某市有大、中、小型的商店共1500家,且这三种类型商店的数量之比为.要调查全市商店的每日零售额情况,要求抽取30家商店进行调查,应当采用怎样的抽样方法?题型六、分层抽样的概率一、单选题1.(2122高二上·海南省直辖县级单位·期末)白沙中学高一、高三、初一学生的人数之比为,从中随机抽取400名学生参加军训结业演练,若每人被抽取的概率都是0.2,则该高一年级的人数为(
)A.1000 B.900 C.800 D.700二、多选题2.某公司生产三种型号的轿车,产量分别为1500辆,6000辆和2000辆为检验该公司的产品质量,公司质监部门要抽取57辆进行检验,则下列说法正确的是(
)A.应采用分层随机抽样抽取B.应采用抽签法抽取C.三种型号的轿车依次应抽取9辆,36辆,12辆D.这三种型号的轿车,每一辆被抽到的概率都是相等的3.对一个容量为的总体抽取容量为的样本,当选取抽签法抽样、随机数法抽样和分层随机抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为,三者关系不可能是(
)A. B. C. D.三、填空题4.(2023高三上·全国·专题练习)在120个零件中有一级品24个、二级品36个、三级品60个,从中抽取一个容量为20的样本,若用简单随机抽样法抽取样本,则总体中每个个体被抽到的可能性为;若按比例分配的分层随机抽样法抽取样本,则总体中每个个体被抽到的可能性为.题型七、设计分层抽样过程一、单选题1.某单位有老年人28人、中年人54人、青年人81人,为了调查他们的身体状况,从中抽取一个容量为36的样本,则最适合抽取样本的方法是A.随机数表法 B.抽签法C.分层抽样 D.先从老年人中剔除1人,再用分层抽样二、填空题2.分层抽样的步骤①将总体按一定标准分层;②计算各层的个体数与总体的个数的;③按各层的个体数占总体的个体数的确定各层应抽取的样本容量;④在每一层进行抽样(可用简单随机抽样).三、解答题3.学校要在高一年级450名同学中随机选取45人参加暑假的夏令营,试完成以下工作:(1)设计一个随机抽样方案;(2)设计一个分层抽样方案,使得选取出男生23名,女生22名;(3)如果全年级有9个班,设计一个分层抽样方案,使得各班随机选取5人.4.(2223高一·全国·课时练习)一个单位的职工有500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁以上的有95人,为了了解这个单位职工与身体状况有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取?题型八、普查与抽查的定义辨析及合理选择一、单选题1.(2324高一上·广西南宁·开学考试)下列调查中,适宜采用全面调查的是(
)A.调查某池墙中现有鱼的数量B.调查某批次汽车的抗撞击能力C.选出某班短跑最快的学生参加全校短跑比赛D.调查市场上某种食品的色素含量是否符合国家标准2.(2324高一上·江西景德镇·期末)下列调查方式中,可用普查的是(
)A.调查某品牌电动车的市场占有率 B.调查2023年杭州亚运会的收视率C.调查某校高三年级的男女同学的比例 D.调查一批玉米种子的发芽率二、多选题3.(2023高一上·全国·专题练习)(多选)下列选项中,是直接获取数据的方法有(
)A.从《中华人民共和国人口统计资料汇编》当中获取的数据 B.试验C.统计调查 D.企业的经营报表数据三、解答题4.(2324高一上·全国·课时练习)为调查某小区平均每户居民的月用水量,下面是2名同学设计的方案:学生甲:我把这个小区用水量调查表放在互联网上,只要登录网站的人就可以看到这张表,他们填的表可以很快地反馈到我的电脑中,这样就可以很快估算出小区平均每户居民的月用水量;学生乙:我给我们居民小区的每一个住户发一张用水量调查表,大概需要一周左右的时间就可以统计出小区平均每户居民的月用水量.请你分析上述2名学生设计的调查方案能够获得平均每户居民的月用水量吗?为什么?题型九、总体与样本一、单选题1.(2324高二上·上海·期末)某校有学生1800人,为了解学生的作业负担,学校向学生家长随机抽取了1000人进行调查,其中70%的家长回答他们孩子每天睡眠时间大致在67小时,28%的家长回答他们孩子回家做作业的时间一般在34小时,下列说明正确的是(
).A.总体是1000 B.个体是每一名学生C.样本是1000名学生 D.样本容量是1000二、多选题2.(2324高一上·陕西汉中·期末)为了了解参加运动会的1000名运动员的年龄情况,从中抽取了10名运动员的年龄进行统计分析.下列说法中正确的有(
)A.1000名运动员的年龄是总体 B.所抽取的10名运动员是一个样本C.样本容量为10 D.每个运动员被抽到的机会相等三、填空题3.(2023高二上·上海·专题练习)从含有6件次品的50件产品中任取4件,观察其中次品数,这个试验的样本空间Ω=.4.(2324高二上·上海长宁·期末)从总体容量为的一批电子元件中抽取一个容量为30的样本,若每个电子元件被抽到的可能性为,则总体容量.四、解答题5.(2223高一·全国·随堂练习)如果想调查左利手们(指生活中从事主要活动惯用左手的人)对社会公共设施的满意程度,需要调查的总体是什么?你计划如何开展这项调查?题型十、总体取值规律的估计一、单选题1.(2324高三下·内蒙古锡林郭勒盟·开学考试)为了积极推进国家乡村振兴战略,某示范村不断自主创新,拓宽村民增收渠道,近年来取得了显著成效.据悉该村2023年经济总收入是2022年的2倍,为了更好地了解该村经济收入变化情况,统计了该村两年的经济收入构成比例,得到如图所示的条形图和饼图.则以下说法错误的是(
)A.2023年“种植收入”和2022年“种植收入”一样多B.2023年“养殖收入”与“第三产业收入”之和比2022年的全年总收入还多C.2023年“外出务工收入”是2022年“外出务工收入”的D.2023年“其他收入”比2022年“其他收入”的2倍还多2.(2324高三上·安徽亳州·期末)如图所示为某企业员工年龄(岁)的频率分布直方图,从左到右依次为第一组、第二组、……、第五组,若第五组的员工有80人,则第二组的员工人数为(
)A.140 B.240 C.280 D.320二、多选题3.(2024高三下·浙江杭州·专题练习)我国于2015年10月宣布实施普遍二孩政策,为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄群体中随机抽取了容量为200的调查样本,其中城镇户籍与农村户籍各100人;男性120人,女性80人,绘制的不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图如图所示,其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述正确的是(
)A.是否倾向选择生育二胎与户籍有关B.是否倾向选择生育二胎与性别无关C.调查样本中倾向选择生育二胎的群体中,男性人数与女性人数相同D.倾向选择不生育二胎的群体中,农村户籍人数多于城镇户籍人数三、填空题4.(2024高三·全国·专题练习)已知统计某校1000名学生的某次数学水平测试成绩得到样本频率分布直方图如图所示,则直方图中实数a的值是.5.(2324高三下·北京海淀·开学考试)某直播间从参与购物的人群中随机选出200人,并将这200人按年龄分组,得到的频率分布直方图如图所示,则在这200人中年龄在的人数,直方图中.四、解答题6.(2324高二下·上海奉贤·阶段练习)某城市100户居民的月平均用电量(单位:度),以分组的频率分布直方图如图:(1)求直方图中的值,并说明在这100户居民中,月平均用电量不低于220度的有多少户?(2)在月平均用电量为的四组居民中,用分层抽样的方法抽取11户居民,则在月平均用电量为的居民中应抽取多少户?7.(2024·四川成都·二模)2024年1月,某市的高二调研考试首次采用了“”新高考模式.该模式下,计算学生个人总成绩时,“”的学科均以原始分记入,再选的“2”个学科(学生在政治、地理、化学、生物中选修的2科)以赋分成绩记入.赋分成绩的具体算法是:先将该市某再选科目原始成绩按从高到低划分为五个等级,各等级人数所占比例分别约为.依照转换公式,将五个等级的原始分分别转换到五个分数区间,并对所得分数的小数点后一位进行“四舍五入”,最后得到保留为整数的转换分成绩,并作为赋分成绩.具体等级比例和赋分区间如下表:等级比例赋分区间已知该市本次高二调研考试化学科目考试满分为100分.(1)已知转换公式符合一次函数模型,若学生甲、乙在本次考试中化学的原始成绩分别为84,78,转换分成绩为78,71,试估算该市本次化学原始成绩B等级中的最高分.(2)现从该市本次高二调研考试的化学成绩中随机选取100名学生的原始成绩进行分析,其频率分布直方图如图所示,求出图中的值,并用样本估计总体的方法,估计该市本次化学原始成绩等级中的最低分.题型十一、总体百分位数的估计一、单选题1.(2324高二下·广东广州·阶段练习)《“健康中国2030”规划纲要》提出,健康是促进人类全面发展的必然要求,是经济社会发展的基础条件,实现国民健康长寿,是国家富强、民族振兴的重要标志,也是全国各族人民的共同愿望,为普及健康知识,某公益组织为社区居民组织了一场健康知识公益讲座,为了解讲座效果,随机抽取了10位居民在讲座后进行健康知识问卷(百分制),这十位居民的得分情况如下表所示:答题居民序号12345678910得分72836576889065909576则下列说法正确的是(
)A.该10位居民的答卷得分的极差为32B.该10位居民的答卷得分的中位数为79.5C.该10位居民的答卷得分的下四分位数为65D.该10位居民的答卷得分的平均数为792.(2324高三下·河南·阶段练习)高二年级进行消防知识竞赛,统计所有参赛同学的成绩,成绩都在内,估计所有参赛同学成绩的第75百分位数为(
)
A.65 B.75 C.85 D.95二、多选题3.(2324高二下·湖南长沙·开学考试)某学校组织了一次劳动技能大赛,共有100名学生参赛,经过评判,这100名参赛者的得分都在内,得分60分以下为不及格,其得分的频率分布直方图如图所示(按得分分成,,,,这五组),则下列结论正确的是(
)A.直方图中B.此次比赛得分及格的共有60人C.以频率为概率,从这100名参赛者中随机选取1人,其得分在,的概率为0.75D.这100名参赛者得分的第80百分位数为75三、填空题4.(2324高二下·江苏宿迁·阶段练习)一组数据,,,,,,,,,,,的第百分位数是.5.(2324高二下·四川成都·阶段练习)样本数据13,12,6,7,14,7,10,13的分位数为.四、解答题6.(2324高二下·重庆·阶段练习)随机抽取100名男学生,测得他们的身高(单位:cm),按照区间,,,,分组,得到样本身高的频率分布直方图如图所示(1)求这100名男学生身高在170cm及以上的学生人数;(2)估计该校100名学生身高的75%分位数.题型十二、总体集中趋势的估计一、单选题1.(2024·辽宁葫芦岛·一模)从某班所有同学中随机抽取10人,获得他们某学年参加社区服务次数的数据如下:4,4,4,7,7,8,8,9,9,10,这组数据的众数是(
)A.9 B.8 C.7 D.42.(2324高三上·浙江绍兴·期末)平均数、中位数和众数都是刻画一组数据的集中趋势的信息,它们的大小关系和数据分布的形态有关.在下图分布形态中,分别对应这组数据的平均数、中位数和众数,则下列关系正确的是(
)A. B.C. D.3.(2024·陕西西安·二模)某教育机构为调查中小学生每日完成作业的时间,收集了某位学生100天每天完成作业的时间,并绘制了如图所示的频率分布直方图(每个区间均为左闭右开),根据此直方图得出了下列结论,其中正确的是(
)A.估计该学生每日完成作业的时间在2小时至2.5小时的有50天B.估计该学生每日完成作业时间超过3小时的概率为0.3C.估计该学生每日完成作业时间的平均数为2.75小时D.估计该学生每日完成作业时间的中位数与平均数相等二、多选题4.(2024·黑龙江吉林·二模)社区卫生服务中心(站)是我国医疗卫生服务和公共卫生应急管理体系的网底,是政府履行提供基本卫生服务职能的平台.社区卫生服务中心(站)可促进社区居民的基本需求(如疫苗接种、基本诊疗等)就近在社区得到解决,图中记录的是从2010年起十二年间我国社区卫生服务中心(站)的个数,根据此图可得关于这十二年间卫生服务中心(站)个数的结论正确的是(
)A.逐年增多 B.中位数为34324C.每年相对于前一年的增量连续增大 D.从2013年到2021年的增幅约6%三、填空题5.(2324高一下·江西·阶段练习)2024年3月1日,某蛋糕店共有10位顾客预订生日蛋糕,他们的年龄按预订的顺序依次是6,12,54,30,8,10,18,24,30,32,则这10位顾客年龄的中位数是.6.(2024·陕西咸阳·二模)已知总体的各个个体的值由小到大依次为2,4,4,6,a,b,12,14,18,20,且总体的平均值为10.则的最小值为.四、解答题7.(2324高一下·辽宁朝阳·开学考试)对某校高三年级学生参加社区服务的次数进行统计,随机抽取M名学生,得到这M名学生参加社区服务的次数,根据此数据作出如下频率分布表和频率分布直方图.分组频数频率100.2024nmp20.04合计M1(1)求出表中M,p及图中a的值;(2)若该校有高三学生300人,试估计该校高三学生参加社区服务的次数在区间内的人数;(3)估计该校高三学生参加社区服务次数的众数、中位数及平均数.(保留一位小数)题型十三、总体离散程度的估计一、单选题1.(2024·广东韶关·二模)已知一组数据:12,16,22,24,25,31,33,35,45,若去掉12和45,将剩下的数据与原数据相比,则(
)A.极差不变 B.平均数不变 C.方差不变 D.上四分位数不变二、多选题2.(2024·吉林延边·一模)今年第5号台风“杜苏芮”于7月28日9时55分在福建晋江登陆,为1949年以来登陆福建的第二强台风,登陆后强度迅速减弱并一路北上影响黄淮、华北,给华北、黄淮等地带来较大范围的特大暴雨.华中地区某市受此次台风影响,最高气温同比有所下降,测得七天的最高气温分别是28,26,25,27,29,27,25(单位:℃),则(
)A.该组数据的极差为4B.该组数据的众数为27C.该组数据的中位数为27D.该组数据的第70百分位数为283.(2024·广东汕头·一模)某次数学考试后,为分析学生的学习情况,某校从某年级中随机抽取了名学生的成绩,整理得到如图所示的频率分布直方图.为进一步分析高分学生的成绩分布情况,计算得到这名学生中,成绩位于内的学生成绩方差为,成绩位于内的同学成绩方差为.则(
)参考公式:样本划分为层,各层的容量、平均数和方差分别为:、、;、、.记样本平均数为,样本方差为,.A.B.估计该年级学生成绩的中位数约为C.估计该年级成绩在分及以上的学生成绩的平均数为D.估计该年级成绩在分及以上的学生成绩的方差为4.(2024·辽宁·一模)下图是样本甲与样本乙的频率分布直方图,下列说法判断正确的是(
)
A.样本乙的极差一定大于样本甲的极差B.样本乙的众数一定大于样本甲的众数C.样本甲的方差一定大于样本乙的方差D.样本甲的中位数一定小于样本乙的中位数三、填空题5.(2024·河南新乡·二模)若一组数据,,,,的平均数为3,方差为,则,,,,,9这6个数的平均数为,方差为.四、解答题6.(2425高一上·全国·课后作业)某赛季篮球运动员甲每场比赛的得分(单位:分)情况如表.比赛场次12345678910111213得分12243115362550353144394136求在该赛季比赛中,这名运动员得分情况的平均数、中位数、众数、极差、方差和标准差.7.(2425高一上·全国·课后作业)有甲、乙两名射击运动员,10次射击成绩(单位:环)如表.次数12345678910甲77898910999乙89781071010710现要从两名运动员中选拔一人参加比赛,根据两名运动员的运动成绩,如何进行选拔?8.(2425高一上·全国·课后作业)在1996年美国亚特兰大奥运会上,中国香港帆板运动员李丽珊,以惊人的耐力和斗志,勇夺金牌,实现了中国香港体育史上奥运金牌零的突破.这枚金牌能在比赛过程中预测出来吗?在帆板比赛中,成绩以低分为优胜,共赛11场,并以最佳的9场成绩计算最终的名次.此次比赛前7场比赛结束后,排名前5位的选手积分如表.排名运动员比赛场次总分12345678910111李丽珊(中国香港)3222427222简度(新西兰)23611055323贺根(挪威)7844318354威尔逊(英国)55145564445李科(中国)4135927646根据前7场的比赛结果,能否预测谁将获得最后的胜利?强化训练一、单选题1.(2024高一下·全国·专题练习)高一某班有30位同学,他们依次编号为01,02,…,29,30,现利用下面的随机数表选取6位同学组建“文明校园督查组”.选取方法是从随机数表第1行第5列的数字开始,由左到右依次选取两个数字,则选出来的第6位同学的编号为(
)41792
71635
86089
32157
95620
92109
2914574955
82835
98378
83513
47870
20799
32122A.29 B.21 C.14 D.092.(2024·内蒙古呼和浩特·一模)已知样本数据的平均数为、方差为,若样本数据,的平均数为,方差为,则(
)A. B. C. D.3.(2324高一下·辽宁本溪·开学考试)去年4月,国内猪肉,鸡蛋,鲜果、禽肉、粮食,食用油、鲜菜价格同比(与前年同期相比)的变化情况如图所示,则下列说法正确的是(
)A.猪肉、鸡蛋、鲜果、禽肉、粮食、食用油这6种食品中,食用油价格同比涨幅最小B.猪肉价格同比涨幅超过禽肉价格同比涨幅的5倍C.前年4月鲜菜价格要比去年4月低D.这7种食品价格同比涨幅的平均值超过7%4.(2024·福建·模拟预测)某单位共有A、B两部门,1月份进行服务满意度问卷调查,得到两部门服务满意度得分的频率分布条形图如下.设A、B两部门的服务满意度得分的第75百分位数分别为,,方差分别为,,则()A., B.,C., D.,5.(2324高二下·湖南长沙·开学考试)某中学高二1班共有50名同学,其中男生30名,女生20名,采用按比例分层随机抽样方法,从全班学生中抽取20人测量其身高(单位:).已知在抽取的样本中,男生的平均身高为,女生的平均身高为,由此估计该班全体学生的平均身高约为(
)A. B. C. D.6.(2024·湖南邵阳·二模)一组数据:的第30百分位数为(
)A.30 B.31 C.25 D.207.(2122高三·云南昆明·阶段练习)根据气象学上的标准,连续5天的日平均气温低于即为入冬,将连续5天的日平均温度的记录数据(记录数据都是自然数)作为一组样本,现有4组样本①、②、③、④,依次计算得到结果如下:①平均数;②平均数且极差小于或等于3;③平均数且标准差;④众数等于5且极差小于或等于4.则4组样本中一定符合入冬指标的共有(
)A.1组 B.2组 C.3组 D.4组8.(2324高二上·安徽·开学考试)某校积极开展“戏曲进校园”活动,为了解该校各班参加戏曲兴趣小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本标准差为2,且样本数据互不相等,则该样本数据的极差为(
)A.3 B.4 C.5 D.6二、多选题9.(2024·山东潍坊·一模)某科技攻关青年团队有人,他们年龄分布的茎叶图如图所示,已知这人年龄的极差为,则(
)A. B.人年龄的平均数为C.人年龄的分位数为 D.人年龄的方差为10.(2024·云
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论