版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
专题11统计【清单01】分层随机抽样1、分层随机抽样的概念一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.2、分层随机抽样的平均数计算在分层随机抽样中,以层数是2为例,如果第1层和第2层包含的个体数分别为和,抽取的样本量分别为和,第1层和第2层的样本平均数分别为,,样本平均数位,则.我们可以采用样本平均数估计总体平均数【清单02】样本的数字特征1、众数、中位数、平均数(1)众数:一组数据中出现次数最多的数叫众数,众数反应一组数据的多数水平.(2)中位数:将一组数据按大小顺序依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数,中位数反应一组数据的中间水平.(3)平均数:个样本数据的平均数为,反应一组数据的平均水平,公式变形:.2、标准差和方差(1)标准差:标准差是样本数据到平均数的一种平均距离,一般用表示.假设样本数据是,表示这组数据的平均数,则标准差.(2)方差:方差就是标准差的平方,即.显然,在刻画样本数据的分散程度上,方差与标准差是一样的.在解决实际问题时,多采用标准差.(3)数据特征标准差、方差描述了一组数据围绕平均数波动程度的大小.标准差、方差越大,则数据的离散程度越大;标准差、方差越小,数据的离散程度越小.反之亦可由离散程度的大小推算标准差、方差的大小.【清单03】频率分布直方图1、频率、频数、样本容量的计算方法①eq\f(频率,组距)×组距=频率.②eq\f(频数,样本容量)=频率,eq\f(频数,频率)=样本容量,样本容量×频率=频数.③频率分布直方图中各个小方形的面积总和等于.2、频率分布直方图中数字特征的计算(1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的.设中位数为,利用左(右)侧矩形面积之和等于,即可求出.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和,即有,其中为每个小长方形底边的中点,为每个小长方形的面积.【清单04】百分位数1、定义一组数据的第百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.2、计算一组个数据的的第百分位数的步骤(1)按从小到大排列原始数据.(2)计算.(3)若不是整数而大于的比邻整数,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.3、四分位数我们之前学过的中位数,相当于是第百分位数.在实际应用中,除了中位数外,常用的分位数还有第百分位数,第百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.【考点题型一】获取数据的途径【例1】.从某市参加升学考试的学生中随机抽查1000名学生的数学成绩进行统计分析,在这个问题中,下列说法正确的是(
)A.该市参加升学考试的全体学生是总体B.1000名学生的数学成绩是样本C.1000名学生是样本容量D.1000名学生中的每一名学生是个体【变式1-1】.在以下调查中,适合用普查的是(
) A.调查一批小包装饼干的卫生是否达标B.调查一批袋装牛奶的质量C.调查一个班级的学生每天完成家庭作业所需要的时间D.调查一批绳索的抗拉强度是否达到要求【变式1-2】.为了了解参加中考的50000名学生的视力情况,抽查了1000名学生的视力进行统计分析.下列四个判断中正确的是(
).A.50000名学生是总体B.1000名学生的视力是总体的一个样本C.每名学生是总体的一个个体D.上述调查是普查【变式1-3】.下列调查适合作普查的是(
).A.了解大学生的主要工作方向B.了解市民对废电池的处理情况C.日光灯管厂要检测一批灯管的使用寿命D.对与新冠检测阳性者同一车厢的乘客进行医学检查【变式1-4】.(多选)下列调查中,适宜采用抽样调查的是(
)A.调查某市小学生每天的运动时间B.某公司初步发现一位职员患有甲肝,对此公司职员进行检查C.农业科技人员调查某块地今年麦穗的单穗平均质量D.调查某快餐店中全部8位店员的生活质量情况【考点题型二】随机简单抽样【例2】.(1)随着老龄化时代的到来,某社区为了探讨社区养老模式,在社区内对2400名老年人、2400名中年人、2100名青年人用分层抽样方法随机发放了调查问卷345份,则在老年人中发放的调查问卷份数是(
)A.110 B.115 C.120 D.125(2).高一某班有30位同学,他们依次编号为01,02,…,29,30,现利用下面的随机数表选取6位同学组建“文明校园督查组”.选取方法是从随机数表第1行第5列的数字开始,由左到右依次选取两个数字,则选出来的第6位同学的编号为(
)41792
71635
86089
32157
95620
92109
2914574955
82835
98378
83513
47870
20799
32122A.29 B.21 C.14 D.09【变式2-1】.①某班数学期中考试有14人在120分以上,35人在90~119分,7人不及格,现从中抽出8人研讨进一步改进教与学;②高一某班级春节聚会,要产生两位“幸运者”.上述两件事,合适的抽样方法分别为(
)A.分层抽样,简单随机抽样 B.简单随机抽样,分层抽样C.简单随机抽样,简单随机抽样 D.分层抽样,分层抽样【变式2-2】.为了解学生们的视力状况,某学校决定采用分层抽样的方法,从高一、高二、高三三个年级共抽取100人进行调查.已知高三年级有200人,高二年级有240人,高一年级有360人,则高三年级抽取的人数为(
)A.20 B.25 C.30 D.45【变式2-3】.某校高三年级有810名学生,其中男生有450名,女生有360名,按比例分层随机抽样的方法抽取一个容量为72的样本,则抽取男生和女生的人数分别为()A.40,32 B.42,30 C.44,28 D.46,26【变式2-4】.某实验室的笼子中有40只小白鼠,将其进行编号,分别为00,01,02,…,39,现从中抽取一个容量为10的样本进行试验,选取方法是从下面的随机数表的第1行第15列和第16列数字开始由左向右依次选取2个数字,直到取足样本,则抽取样本的第6个号码为(
)90
84
60
79
80
24
36
59
87
38
82
07
53
89
35
96
35
23
79
18
05
98
9007
35
46
40
62
98
80
54
97
20
56
95
15
74
80
08
32
16
46
70
50
80
67A.05 B.40 C.35 D.23【考点题型三】用样本估计总体分布【例3】.某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:,并整理得到如下频率分布直方图.
(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.【变式3-1】.小王为了了解现在人们的网购途径,随机对1000名市民进行走访调查,统计结果如图所示,下列表述错误的是(
)A.B.这1000名市民中,不在淘宝网购物的人数为545人C.这1000名市民中,通过其他方式购物的人数超过100人D.这1000名市民中,在京东商城购物的人数比在唯品会购物的人数多165人【变式3-2】.年3月,树人中学组织三个年级的学生进行党史知识竞赛.经统计,得到前名学生分布的饼状图(如图)和前名中高一学生排名分布的频率条形图(如图),则下列命题错误的是(
)
A.成绩前名的人中,高一人数比高二人数多30人B.成绩第1-名的人中,高一人数不超过一半C.成绩第1-50名的50人中,高三最多有32人D.成绩第51-名的50人中,高二人数比高一的多【变式3-3】.某校高三共有200人参加体育测试,根据规则,82分以上的考生成绩等级为,则估计获得的考生人数约为(
)A.100 B.75 C.50 D.25【变式3-4】.某校名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:,,,,.(1).求图中的值;(2).根据频率分布直方图,估计这名学生语文成绩的平均分;(3).若这名学生语文成绩某些分数段的人数()与数学成绩相应分数段的人数()之比如下表所示,求数学成绩在之外的人数.分数段【考点题型四】用样本估计总体数字特征【例4】.在学校举办的教师优质课评比比赛中,八位评委打出八个完全不同的分数后,去掉一个最高分,去掉一个最低分,再用剩余的六个分数计算平均数,作为讲课教师的最后得分.那么剩余的六个分数与最初的八个分数相比较,一定不变的数字特征是(
)A.平均数 B.方差 C.极差 D.中位数【变式4-1】.2024年度最具幸福感城市调查推选活动于9月16日正式启动,在100个地级及以上的候选城市名单中,成都市入选.“幸福感指数”是指某个人主观地评价他对自己目前生活状态满意程度的指标,常用区间内的一个数来表示,该数越接近10表示满意度越高,现随机抽取10位成都市居民,他们的幸福感指数分别为4,5,6,7,7,7,8,8,9,9,则下列说法错误的是(
)A.该组数据的第60百分位数为7.5 B.该组数据的极差为5C.该组数据的平均数为7.5 D.该组数据的中位数为7【变式4-2】.2024年度最具幸福感城市调查推选活动于9月16日正式启动,在100个地级及以上的候选城市名单中,成都市入选.“幸福感指数”是指某个人主观地评价他对自己目前生活状态满意程度的指标,常用区间内的一个数来表示,该数越接近10表示满意度越高,现随机抽取10位成都市居民,他们的幸福感指数分别为4,5,6,7,7,7,8,8,9,9,则下列说法错误的是(
)A.该组数据的第60百分位数为7.5 B.该组数据的极差为5C.该组数据的平均数为7.5 D.该组数据的中位数为7【变式4-3】.已知样本数据为:,,,,,,,,,.去掉一个最大值和一个最小值后的数据与原来的数据相比,下列数字特征的值一定不变的是(
)A.平均数 B.众数 C.极差 D.中位数【变式4-4】.若样本的平均数为10,方差为20,则样本的平均数和方差分别为(
)A.20,35 B.20,40 C.15,75 D.15,80【变式4-5】.下表是某地区2024年3月1日至10日每天中午12时的气温统计表,则下列关于这10天中气温的说法错误的是(
)日期12345678910气温(℃)2101820161262612A.众数为2和6和12 B.70%分位数为16C.平均数小于中位数 D.极差为18【变式4-6】.数据1,2,3,4,5,6,7,8,9,10的第75百分位数为(
)A.7 B.7.5 C.8 D.8.5【考点题型五】频率分布直方图数字特征【例5】.文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),,[90,100]得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值及样本成绩的第75百分位数;(2)求样本成绩的众数,中位数和平均数;(3)已知落在的平均成绩是54,方差是7,落在的平均成绩为66,方差是4,求两组成绩合并后的平均数和方差.【变式5-1】.某校组织50名学生参加庆祝中华人民共和国成立75周年知识竞赛,经统计这50名学生的成绩都在区间内,按分数分成5组:,得到如图所示的频率分布直方图(不完整),根据图中数据,下列结论错误的是(
)A.成绩在上的人数最少B.成绩不低于80分的学生所占比例为C.50名学生成绩的极差为50D.50名学生成绩的平均分小于中位数【变式5-2】.为了了解某小区2000户居民月用水量使用情况,通过随机抽样获得了100户居民的月用水量.下图是调查结果的频率分布直方图.(1)根据频率直方图估计某小区2000户居民月用水量使用大于3的户数;(2)利用频率分布直方图估计该样本的众数和中位数(保留到0.01).【变式5-3】.从高三抽出50名学生参加数学竞赛,由成绩得到如下的频率分布直方图.由于一些数据丢失,试利用频率分布直方图求:(1)这50名学生成绩的众数与中位数;(2)这50名学生的平均成绩..【变式5-4】.2024年10月13日,成都市将举办马拉松比赛,其中志愿者的服务工作是马拉松成功举办的重要保障.成都市文体广电旅游局承办了志愿者选拔的面试工作.现随机抽取了100名候选者的面试成绩,并分成五组:第一组,第二组,第三组,第四组,第五组,绘制成如图所示的频率分布直方图.(1)求a的值;(2)估计这100名候选者面试成绩的平均数和第百分位数;(3)现从以上各组中用分层随机抽样的方法选取人,担任本市的宣传者.若本市宣传者中第二组面试者的面试成绩的平均数和方差分别为和,第四组面试者的面试成绩的平均数和方差分别为和,请据此估计这次第二组和第四组所有面试者的面试成绩的方差.(附:设两组数据的样本量、样本平均数和样本方差分别为:,记两组数据总体的样本平均数为,则总体样本方差)【变式5-5】.文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:得到如图所示的频率分布直方图.(1)求频率分布直方图中a的值;(2)求样本成绩的第75百分位数;(3)已知落在的平均成绩是56,方差是7,落在的平均成绩为65,方差是4,求两组成绩的总平均数和总方差1.已知甲组数据由这个数据构成,记这组数据的平均数为,方差为;乙组数据由,这数据构成,记这组数据的平均数为,方差为,则(
)A., B.,C., D.,2.(多选)下列抽样实验中,不适宜用抽签法的是(
)A.从某场生产的3000件产品中抽取600件进行质量检验B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检测C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验D.从某厂生产的3000件产品中抽取10件进行质量检测3.(多选)某保险公司为客户定制了5个险种:甲,一年期短险;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险.各种保险按相关约定进行参保与理赔.该保险公司对5个险种参保客户进行抽样调查,得出如图所示的统计图,以下四个选项中,说法正确的有(
)A.54周岁以上客户人数最多 B.18-29周岁客户参保总费用最少C.丁险种更受客户青睐 D.30周岁以上的客户约占参保客户的80%4.(多选)某班有50名学生,某次数学考试的成绩经计算得到的平均分数为80分,标准差为s,后来发现记录有误,甲同学得90分误记为60分,乙同学得70分误记为100分,更正后重新计算得到的平均分数为,标准差为,则下列说法正确的是(
)A. B. C. D.5.(多选)若数据的平均数为2,方差为3,则(
)A.数据,,,的平均数为20 B.C.数据,,,的标准差为 D.6.,两班共100人,现采取分层随机抽样的方法抽取10人的样本进行问卷调查,若样本中有4人来自班,则班的人数为.7.福利彩票“双色球”中红色球由编号为01,02,…,33的33个个体组成,某彩民利用下面的随机数表(下表是随机数表的第一行和第二行)选取6个红色球,选取方法是从随机数表中第1行的第6列和第7列数字开始,由左到右依次选取两个数字,则选出来的第3个红色球的编号为.8.数据:7.2,8.3,8.5,8.5,8.7,8.8,9.0,9.2的第40百分位数是.9.一组数据:12,8,6,15,12,10,8,17,20,12的分位数是.10.某企业共有3200名职工,其中,中年、青年、老年职工的比例为5:3:2,从所有职工中抽取一个样本容量为400的样本.(1)应采用哪种抽样方法更合理?(2)中年、青年、老年职工应分别抽取多少人?11.“疫苗犹豫”,即尽管疫苗可及,却迟迟未接种或拒绝接种疫苗的现象.成人接种新冠疫苗的犹豫,主要原因是对感染新冠肺炎的风险缺乏了解,心存侥幸,认为即使不接种也未必会感染,对感染的后果也认识不足.现从某小区未接种的人群中随机选出100人,并将这100人按年龄分组:第1组,第2组,第3组,第4组,第5组,得到的频率分布直方图如图所示.(1)求出样本的平均数(同一组数据用该区间的中点值作代表)和中位数(精确到小数点后一位);(2)现先从第1,2组中用分层抽样的方法抽取5人,再从这5人中随机抽取3人进行问卷调查,求第2组中抽到2人的概率.12.为了了解某工厂生产的产品情况,从该工厂生产的产品随机抽取了一个容量为20的样本,测量它们的尺寸(单位:),数据分为,,,,,,七组,其频率分布直方图如图所示.(1)求上图中的值;(2)根据频率分布直方图,求200件样本尺寸在内的样本数;(3)记产品尺寸在内为等品,每件可获利5元;产品尺寸在内为不合格品,每件亏损2元;其余的为合格品,每件可获利3元.若该机器一个月共生产3000件产品.以样本的频率代替总体在各组的频率,若单月利润未能达到11000元,则需要对该工厂设备实施升级改造.试判断是否需要对该工厂设备实施升级改造.13.山西运城王过酥梨是国家农产品地理标志保护产品,王过酥梨含有多种对人体有益的钙、铁、磷等微量营养元素,食后清火润肺,止咳化痰,能起到祛病养生之效,一致被人们作为逢年过节走亲访友,馈赠待客及日常生活的必备佳品.某水果批发商小李从事酥梨批发多年,他把去年年底客户采购酥梨在内的数量x(单位:箱)绘制成下表:采购数x(单位:箱)客户数51015155(1)根据表中的数据,补充完整这些数据的频率分布直方图,并估计采购数在168箱以上(含168箱)的客户数;(2)若去年年底采购在内的酥梨数量约占小李去年年底酥梨总销售量的,估算小李去年年底总销售量(同一组中的数据用该组区间的中点值作代表);(3)在(2)的条件下,由于酥梨受到人们的青睐,小李做了一份市场调查以决定今年年底是否在网上出售酥梨,若没有在网上出售酥梨,则按去年的价格出售,每箱利润为14元,预计销售量与去年持平;若计划在网上出售酥梨,则需把每箱售价下调1至5元(网上、网下均下调),且每下调m元销售量可增加箱,试预计小李在今年年底销售酥梨总利润Y(单位:元)的最大值.14.某工厂对200个电子元件的使用寿命进行检查,按照使用寿命(单位:h),可以把这批电子元件分成第一组,第二组,第三组,第四组,第五组,第六组.由于工作中不慎将部分数据丢失,现有以下部分图表:使用寿命频数3020频率0.20.4(1)求图2中A的值;(2)补全图2频率分布直方图,并求图2中阴影部分的面积;(3)为了某次展销会,用分层抽样的方法在寿命位于内的产品中抽取5个作为样本,那么在内应抽取多少个?15.东风家具店为了解顾客购买额度(单位:元)情况,调查了10000名顾客,并根据所得数据画出了样本频率分布直方图(如图),每个分组包括左端点,不包括右端点,如第一组表示购买额度在内.
(1)为了分析顾客购买额度与年龄的关系,按购买额度从这10000人中用分层随机抽样的方法抽出100人作进一步分析,则购买额度在内的应抽取多少名?(2)根据频率分布直方图估计样本数据的平均数(同一组中的数据用该组区间的中点值作代表).16.对某校高一学生参加志愿服务次数进行统计,随机抽取名学生作为样本,得到这名学生参加志愿服务的次数,根据此数据作出了频数与频率的统计表和频率分布直方图.分组频数频率150.32540.08合计1(1)请补全表格,并求出图中的值;(2)若该校高一年级学生有400人,试估计该校高一年级学生参加志愿服务的次数在区间上的人数;(3)试估计该校高一年级学生参加志愿服务次数的中位数和平均数(每组次数用中间值代替).17.某地红心猕猴桃因富含维生素C及K,等多种矿物质和18种氨基酸,被誉为“维C之王”,某收购商为了了解某种植基地的红心猕猴桃品质,从该基地随机摘下100个猕猴桃进行测重,其重量分布在区间内(单位:克),根据样本数据作出频率分布直方图如图所示.(1)根据频率分布直方图,分别求出样本数据的平均数和分位数;(2)已知该基地大约还有8000个猕猴桃,该收购商准备收购这批猕猴桃,提出了以下两种收购方案:方案一:所有猕猴桃均以20元每千克收购;方案二:小于90克的猕猴桃以10元每千克收购,不小于90克的猕猴桃以30元每千克收购;请你就这两种方案,通过计算为该猕猴桃基地选择最佳的出售方案.(同一组中的数据用该组区间的中点值代表,视频率为概率)18.某中学名学生参加全市高中数学竞赛,根据男女学生人数比例,使用分层随机抽样的方法从中随机抽取了名学生,记录他们的分数,将数据分成组:,并整理得到如下频率分布直方图:(1)根据频率分布直方图求出分数大于的频率与频数;(2)根据频率分布直方图求样本中分位数;(3)已知样本中男生与女生的比例是,男生样本的均值为,方差为,女生样本的均值为,方差为,请计算样本的均值与方差.19.2024年5月22日至5月28日是第二届全国城市生活垃圾分类宣传周,本次宣传周的主题为“践行新时尚分类志愿行”.阜阳三中高一年级举行了一次“垃圾分类知识竞赛”,为了了解本次竞赛成绩情况,从中抽取了部分学生的成绩x(单位:分,得分取正整数,满分为100分)作为样本进行统计将成绩进行整理后,分为五组(,,,,),其中第1组频数的平方等于第2组、第4组频数之积,请根据下面尚未完成的频率分布直方图(如图所示)解决下列问题:(1)求a,b的值;(2)若根据这次成绩,学校准备淘汰80%的同学,仅留20%的同学进入下一轮竞赛请问晋级分数线划为多少合理?(3)某老师在此次竞赛成绩中抽取了10名学生的分数:,,,…,,已知这10个分数的平均数,标准差,若剔除其中的95和85这两个分数,求剩余8个分数的平均数与方差.20.为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成两组,每组只,其中组小鼠给服甲离子溶液,组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记为事件:“乙离子残留在体内的百分比不高于”,根据直方图得到的估计值为.(1)求乙离子残留百分比直方图中的值;(2)求甲离子残留百分比的第百分位数;(3)估计乙离子残留百分比的均值.(同一组数据用该组区间的中点值为代表)
专题11统计【清单01】分层随机抽样 1、分层随机抽样的概念一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.2、分层随机抽样的平均数计算在分层随机抽样中,以层数是2为例,如果第1层和第2层包含的个体数分别为和,抽取的样本量分别为和,第1层和第2层的样本平均数分别为,,样本平均数位,则.我们可以采用样本平均数估计总体平均数【清单02】样本的数字特征1、众数、中位数、平均数(1)众数:一组数据中出现次数最多的数叫众数,众数反应一组数据的多数水平.(2)中位数:将一组数据按大小顺序依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数,中位数反应一组数据的中间水平.(3)平均数:个样本数据的平均数为,反应一组数据的平均水平,公式变形:.2、标准差和方差(1)标准差:标准差是样本数据到平均数的一种平均距离,一般用表示.假设样本数据是,表示这组数据的平均数,则标准差.(2)方差:方差就是标准差的平方,即.显然,在刻画样本数据的分散程度上,方差与标准差是一样的.在解决实际问题时,多采用标准差.(3)数据特征标准差、方差描述了一组数据围绕平均数波动程度的大小.标准差、方差越大,则数据的离散程度越大;标准差、方差越小,数据的离散程度越小.反之亦可由离散程度的大小推算标准差、方差的大小.【清单03】频率分布直方图1、频率、频数、样本容量的计算方法①eq\f(频率,组距)×组距=频率.②eq\f(频数,样本容量)=频率,eq\f(频数,频率)=样本容量,样本容量×频率=频数.③频率分布直方图中各个小方形的面积总和等于.2、频率分布直方图中数字特征的计算(1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的.设中位数为,利用左(右)侧矩形面积之和等于,即可求出.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和,即有,其中为每个小长方形底边的中点,为每个小长方形的面积.【清单04】百分位数1、定义一组数据的第百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.2、计算一组个数据的的第百分位数的步骤(1)按从小到大排列原始数据.(2)计算.(3)若不是整数而大于的比邻整数,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.3、四分位数我们之前学过的中位数,相当于是第百分位数.在实际应用中,除了中位数外,常用的分位数还有第百分位数,第百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.【考点题型一】获取数据的途径【例1】.从某市参加升学考试的学生中随机抽查1000名学生的数学成绩进行统计分析,在这个问题中,下列说法正确的是(
)A.该市参加升学考试的全体学生是总体B.1000名学生的数学成绩是样本C.1000名学生是样本容量D.1000名学生中的每一名学生是个体【答案】B【详解】该市参加升学考试的全体学生的数学成绩是总体,故A不正确;1000名学生的数学成绩是样本是正确;1000是样本容量,故C不正确;1000名学生中的每一名学生的数学成绩是个体,故D不正确.故选:B【变式1-1】.在以下调查中,适合用普查的是(
)A.调查一批小包装饼干的卫生是否达标B.调查一批袋装牛奶的质量C.调查一个班级的学生每天完成家庭作业所需要的时间D.调查一批绳索的抗拉强度是否达到要求【答案】C【详解】普查适用总体数量较少以及破坏性不大的情况,显然A、B、D的调查对象不适用,对于C,一个班级的学生人数相对较少,适用普查方式.故选:C【变式1-2】.为了了解参加中考的50000名学生的视力情况,抽查了1000名学生的视力进行统计分析.下列四个判断中正确的是(
).A.50000名学生是总体B.1000名学生的视力是总体的一个样本C.每名学生是总体的一个个体D.上述调查是普查【答案】B【详解】选项A:50000名学生的视力值是总体.判断错误;选项B:1000名学生的视力是总体的一个样本.判断正确;选项C:每名学生的视力值是总体的一个个体.判断错误;选项D:普查是对全体对象逐一进行调查了解,上述调查不是普查,是抽查.判断错误.故选:B【变式1-3】.下列调查适合作普查的是(
).A.了解大学生的主要工作方向B.了解市民对废电池的处理情况C.日光灯管厂要检测一批灯管的使用寿命D.对与新冠检测阳性者同一车厢的乘客进行医学检查【答案】D【详解】了解在校大学生的主要娱乐方式,调查范围广,适合抽样调查,故A不符合题意;了解某市居民对废电池的处理情况,普查的意义不大,故B不符合题意;日光灯管厂要检测一批灯管的使用寿命,具有破坏性,适合抽样调查,故C不符合题意;对与新冠检测阳性者同一车厢的乘客进行医学检查,要求精确度高,适合普查,故D符合题意;故选:D.【变式1-4】.(多选)下列调查中,适宜采用抽样调查的是(
)A.调查某市小学生每天的运动时间B.某公司初步发现一位职员患有甲肝,对此公司职员进行检查C.农业科技人员调查某块地今年麦穗的单穗平均质量D.调查某快餐店中全部8位店员的生活质量情况【答案】AC【详解】A.调查某市小学生每天的运动时间的工作量很大,抽样调查;B.某公司初步发现一位职员患有甲肝,甲肝具有传染性,危害大,对此公司职员进行检查适合普查的方式;C.农业科技人员调查某块地今年麦穗的单穗平均质量适合采用抽样调查;D.调查某快餐店中全部8位店员的生活质量情况适合普查的方式;故选:AC.【考点题型二】随机简单抽样【例2】.(1)随着老龄化时代的到来,某社区为了探讨社区养老模式,在社区内对2400名老年人、2400名中年人、2100名青年人用分层抽样方法随机发放了调查问卷345份,则在老年人中发放的调查问卷份数是(
)A.110 B.115 C.120 D.125【答案】C【详解】设在老年人中发放的调查问卷份数为x,则,解得.所以在老年人中发放的调查问卷份数是.故选:C.(2).高一某班有30位同学,他们依次编号为01,02,…,29,30,现利用下面的随机数表选取6位同学组建“文明校园督查组”.选取方法是从随机数表第1行第5列的数字开始,由左到右依次选取两个数字,则选出来的第6位同学的编号为(
)41792
71635
86089
32157
95620
92109
2914574955
82835
98378
83513
47870
20799
32122A.29 B.21 C.14 D.09【答案】A【详解】从随机数表第1行第5列的数字开始,由左到右依次选取两个数字分别为27,16,35(舍去),86(舍去),08,93(舍去),21,57(舍去),95(舍去),62(舍去),09,21(舍去),09(舍去),29.故最终取得的第6个数字为29.故选:A【变式2-1】.①某班数学期中考试有14人在120分以上,35人在90~119分,7人不及格,现从中抽出8人研讨进一步改进教与学;②高一某班级春节聚会,要产生两位“幸运者”.上述两件事,合适的抽样方法分别为(
)A.分层抽样,简单随机抽样 B.简单随机抽样,分层抽样C.简单随机抽样,简单随机抽样 D.分层抽样,分层抽样【答案】A【详解】①由于学生的成绩是差异比较大的几部分,应用分层抽样.②由于总体与样本容量较小,应用简单随机抽样.故选:A【变式2-2】.为了解学生们的视力状况,某学校决定采用分层抽样的方法,从高一、高二、高三三个年级共抽取100人进行调查.已知高三年级有200人,高二年级有240人,高一年级有360人,则高三年级抽取的人数为(
)A.20 B.25 C.30 D.45【答案】B【详解】依题意,高三年级抽取的人数为.故选:B【变式2-3】.某校高三年级有810名学生,其中男生有450名,女生有360名,按比例分层随机抽样的方法抽取一个容量为72的样本,则抽取男生和女生的人数分别为()A.40,32 B.42,30 C.44,28 D.46,26【答案】A【详解】根据分层抽样原理知,,,所以抽取男生40人,女生32人.故选:A.【变式2-4】.某实验室的笼子中有40只小白鼠,将其进行编号,分别为00,01,02,…,39,现从中抽取一个容量为10的样本进行试验,选取方法是从下面的随机数表的第1行第15列和第16列数字开始由左向右依次选取2个数字,直到取足样本,则抽取样本的第6个号码为(
)90
84
60
79
80
24
36
59
87
38
82
07
53
89
35
96
35
23
79
18
05
98
9007
35
46
40
62
98
80
54
97
20
56
95
15
74
80
08
32
16
46
70
50
80
67A.05 B.40 C.35 D.23【答案】A【详解】重复的号码只能算作一个,抽取样本的号码是38,07,35,23,18,05,20,15,08,32,所以抽取样本的第6个号码为05.故选:A.【考点题型三】不用样本估计总体分布【例3】.某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:,并整理得到如下频率分布直方图.
(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.【答案】(1)0.4(2)20(3)【详解】(1)根据频率分布直方图可知,样本中分数不小于70的频率为,所以样本中分数小于70的频率为,所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.(2)根据题意,样本中分数不小于50的频率为,分数在区间内的人数为,所以总体中分数在区间内的人数估计为.(3)由题意可知,样本中分数不小于70的学生人数为,所以样本中分数不小于70的男生人数为,所以样本中的男生人数为,女生人数为,所以样本中男生和女生人数的比例为,所以根据分层抽样原理,估计总体中男生和女生人数的比例为.【变式3-1】.小王为了了解现在人们的网购途径,随机对1000名市民进行走访调查,统计结果如图所示,下列表述错误的是(
)A.B.这1000名市民中,不在淘宝网购物的人数为545人C.这1000名市民中,通过其他方式购物的人数超过100人D.这1000名市民中,在京东商城购物的人数比在唯品会购物的人数多165人【答案】C【详解】对于A选项:,,A正确;B选项中,由扇形统计图可得不在淘宝网购物的市民的频率为1所以这1000名市民中,不在淘宝网购物的人数为(人),B正确;C选项中,∵,∴通过其他方式购物的市民的频率为,∴通过其他方式购物的市民的人数为(人),∵,所以C错误;D选项中,这1000名市民中,在京东商城购物的人数为(人),这1000名市民中,在唯品会购物的人数为(人)所以这1000名市民中,在京东商城购物的人数比在唯品会购物的人数多,D正确.故选:C.【变式3-2】.年3月,树人中学组织三个年级的学生进行党史知识竞赛.经统计,得到前名学生分布的饼状图(如图)和前名中高一学生排名分布的频率条形图(如图),则下列命题错误的是(
)
A.成绩前名的人中,高一人数比高二人数多30人B.成绩第1-名的人中,高一人数不超过一半C.成绩第1-50名的50人中,高三最多有32人D.成绩第51-名的50人中,高二人数比高一的多【答案】D【详解】由饼状图,成绩前名的人中,高一人数比高二人数多(人).故选项A判断正确;由条形图知,成绩第1-100名的人中,前和后人数相等,因此高一人数为,故选项B判断正确;成绩第1-50名的50人中,高一人数为,因此高三最多有32人.故选项C判断正确;成绩第51-名的50人中,高二人数无法确定,故选项D判断错误.故选:D【变式3-3】.某校高三共有200人参加体育测试,根据规则,82分以上的考生成绩等级为,则估计获得的考生人数约为(
)A.100 B.75 C.50 D.25【答案】C【详解】由频率分布直方图可得82分以上的考生的频率约为,所以获得的考生人数约为人,故选:C.【变式3-4】.某校名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:,,,,.(1).求图中的值;(2).根据频率分布直方图,估计这名学生语文成绩的平均分;(3).若这名学生语文成绩某些分数段的人数()与数学成绩相应分数段的人数()之比如下表所示,求数学成绩在之外的人数.分数段【答案】(1)(2)分(3)【详解】(1)依题意得:,解得:.(2)用每组中间的数据作为该组的平均数估计这100名学生语文成绩的平均分为:(分)(3)数学成绩在的人数为:,数学成绩在的人数为:,数学成绩在的人数为:,数学成绩在的人数为:数学成绩在的人数为:.【考点题型四】用样本估计总体数字特征【例4】.在学校举办的教师优质课评比比赛中,八位评委打出八个完全不同的分数后,去掉一个最高分,去掉一个最低分,再用剩余的六个分数计算平均数,作为讲课教师的最后得分.那么剩余的六个分数与最初的八个分数相比较,一定不变的数字特征是(
)A.平均数 B.方差 C.极差 D.中位数【答案】D【详解】一共8个数据,从小到大排列后分别为,则为中位数,去掉最高分和最低分后为一共有6个数据,则中位数仍然为,故中位数一定不变;其余数据可能改变,不妨设8个分数为,平均数为,极差为,方差为,去掉最高分10和最低分3后,平均数为,极差为,方差为,所以平均值,极差和方差均发生变化.故选:D.【变式4-1】.2024年度最具幸福感城市调查推选活动于9月16日正式启动,在100个地级及以上的候选城市名单中,成都市入选.“幸福感指数”是指某个人主观地评价他对自己目前生活状态满意程度的指标,常用区间内的一个数来表示,该数越接近10表示满意度越高,现随机抽取10位成都市居民,他们的幸福感指数分别为4,5,6,7,7,7,8,8,9,9,则下列说法错误的是(
)A.该组数据的第60百分位数为7.5 B.该组数据的极差为5C.该组数据的平均数为7.5 D.该组数据的中位数为7【答案】C【详解】A选项:,因此该组数据的第60百分位数为,故A正确;B选项:该组数据最大为9,最小为4,因此极差为,故B正确;C选项:该组数据的平均数为,故C错误;D选项:该组数据的中位数为第五个和第六个数据的平均值7,故D正确,故选:C.【变式4-2】.2024年度最具幸福感城市调查推选活动于9月16日正式启动,在100个地级及以上的候选城市名单中,成都市入选.“幸福感指数”是指某个人主观地评价他对自己目前生活状态满意程度的指标,常用区间内的一个数来表示,该数越接近10表示满意度越高,现随机抽取10位成都市居民,他们的幸福感指数分别为4,5,6,7,7,7,8,8,9,9,则下列说法错误的是(
)A.该组数据的第60百分位数为7.5 B.该组数据的极差为5C.该组数据的平均数为7.5 D.该组数据的中位数为7【答案】C【详解】A选项:,因此该组数据的第60百分位数为,故A正确;B选项:该组数据最大为9,最小为4,因此极差为,故B正确;C选项:该组数据的平均数为,故C错误;D选项:该组数据的中位数为第五个和第六个数据的平均值7,故D正确,故选:C.【变式4-3】.已知样本数据为:,,,,,,,,,.去掉一个最大值和一个最小值后的数据与原来的数据相比,下列数字特征的值一定不变的是(
)A.平均数 B.众数 C.极差 D.中位数【答案】D【详解】样本数据为,,,,,,,,,,去掉一个最大值和一个最小值后的数据与原来的数据相比,假设从小到大就是从到,极差和众数可能变化,故BC错;平均数为,可能变,故A错;中位数还是按从小到大排序中间两个数的平均数,即,故D正确;故选:D.【变式4-4】.若样本的平均数为10,方差为20,则样本的平均数和方差分别为(
)A.20,35 B.20,40 C.15,75 D.15,80【答案】D【详解】由题得样本,的平均数为,方差为.故选:D【变式4-5】.下表是某地区2024年3月1日至10日每天中午12时的气温统计表,则下列关于这10天中气温的说法错误的是(
)日期12345678910气温(℃)2101820161262612A.众数为2和6和12 B.70%分位数为16C.平均数小于中位数 D.极差为18【答案】B【详解】对于A:由气温统计表可得众数为2和6和12,故A正确;对于B:把气温由小到大排为2,2,6,6,10,12,12,16,18,20,由,故70%分位数为,故B错误;对于C:平均数为,中位数为,所以平均数小于中位数,故C正确;对于D:极差为,故D正确.故选:B.【变式4-6】.数据1,2,3,4,5,6,7,8,9,10的第75百分位数为(
)A.7 B.7.5 C.8 D.8.5【答案】C【详解】易知,则该组数据的第八个数8为第75百分位数.故选:C【考点题型五】频率分布直方图数字特征【例5】.文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),,[90,100]得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值及样本成绩的第75百分位数;(2)求样本成绩的众数,中位数和平均数;(3)已知落在的平均成绩是54,方差是7,落在的平均成绩为66,方差是4,求两组成绩合并后的平均数和方差.【答案】(1),第75百分位数为84;(2)众数为75,中位数为75,平均数为74;(3)平均数为62,方差为37.【详解】(1)由每组小矩形的面积之和为1,得,解得,成绩在内的频率为,在内的频率为,显然第75百分位数,由,解得,所以第75百分位数为84.(2)由,得样本成绩的众数为75,成绩落在[40,70)内的频率为,成绩落在内的频率为,故中位数在[70,80)内,由,得样本成绩的中位数为75,由.得样本成绩的平均数为74.(3)由频率分布直方图知,成绩在的市民人数为,成绩在的市民人数为,所以,总方差为.【变式5-1】.某校组织50名学生参加庆祝中华人民共和国成立75周年知识竞赛,经统计这50名学生的成绩都在区间内,按分数分成5组:,得到如图所示的频率分布直方图(不完整),根据图中数据,下列结论错误的是(
)A.成绩在上的人数最少B.成绩不低于80分的学生所占比例为C.50名学生成绩的极差为50D.50名学生成绩的平均分小于中位数【答案】C【详解】设这一组的频率为,则由各组频率之和为1,得,解得,各组频率依次为:,对于A,这一组频率最小,即成绩在上的人数最少,A正确;对于B,成绩不低于80分的学生频率为,成绩不低于80分的学生所占比例为,B正确;对于C,极差为数据中最大值与最小值的差,而50名学生的成绩都在区间内,但成绩的最大值不一定是100,最小值也不一定是,则极差小于等于,但不一定等于50,C错误;对于D,根据频率分布直方图,得50名学生成绩的平均数是,而50名学生成绩的中位数为80,因此50名学生成绩的平均分小于中位数,D正确.故选:C【变式5-2】.为了了解某小区2000户居民月用水量使用情况,通过随机抽样获得了100户居民的月用水量.下图是调查结果的频率分布直方图.(1)根据频率直方图估计某小区2000户居民月用水量使用大于3的户数;(2)利用频率分布直方图估计该样本的众数和中位数(保留到0.01).【答案】(1)200(2)2.25;2.02【详解】(1)某小区2000户居民月用水量使用大于3的户数为.(2)由题可知,众数,因为,中位数.【变式5-3】.从高三抽出50名学生参加数学竞赛,由成绩得到如下的频率分布直方图.由于一些数据丢失,试利用频率分布直方图求:(1)这50名学生成绩的众数与中位数;(2)这50名学生的平均成绩.【答案】(1)众数75,中位数.(2)76.2【详解】(1)由众数的概念可知,众数是出现次数最多的数.在直方图中高度最高的小长方形的底边中点的横坐标即为所求,所以众数应为.由于中位数是所有数据中的中间值,故在频率分布直方图中体现的是中位数的左右两边频数应相等,即频率也相等,从而就是小矩形的面积和相等.因此在频率分布直方图中将所有小矩形的面积一分为二的垂直于横轴的直线与横轴交点的横坐标所对应的成绩即为所求.因为,所以前三个小矩形面积的和为0.3.而第四个小矩形面积为,,所以中位数应位于第四个小矩形内.设中位数为x,,解得,故中位数应约为.(2)样本平均值应是频率分布直方图的“重心”,即所有数据的平均值,取每个小矩形底边的中点的横坐标乘以每个小矩形的面积求和即可.所以平均成绩为.【变式5-4】.2024年10月13日,成都市将举办马拉松比赛,其中志愿者的服务工作是马拉松成功举办的重要保障.成都市文体广电旅游局承办了志愿者选拔的面试工作.现随机抽取了100名候选者的面试成绩,并分成五组:第一组,第二组,第三组,第四组,第五组,绘制成如图所示的频率分布直方图.(1)求a的值;(2)估计这100名候选者面试成绩的平均数和第百分位数;(3)现从以上各组中用分层随机抽样的方法选取人,担任本市的宣传者.若本市宣传者中第二组面试者的面试成绩的平均数和方差分别为和,第四组面试者的面试成绩的平均数和方差分别为和,请据此估计这次第二组和第四组所有面试者的面试成绩的方差.(附:设两组数据的样本量、样本平均数和样本方差分别为:,记两组数据总体的样本平均数为,则总体样本方差)【答案】(1)(2),(3)【详解】(1)由图得,解之可得;(2)根据题意知,,,设第百分位数为,所以,,解之可得,故这名候选者面试成绩的平均数为,第80百分位数为.(3)设第二组、第四组所有面试者的面试成绩的平均数、方差分别为,且两组的频率之比为,则第二组和第四组所有面试者的面试成绩的平均数为,第二组和第四组所有面试者的面试成绩的方差为,则第二组和第四组所有面试者的面试成绩的方差为.【变式5-5】.文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:得到如图所示的频率分布直方图.(1)求频率分布直方图中a的值;(2)求样本成绩的第75百分位数;(3)已知落在的平均成绩是56,方差是7,落在的平均成绩为65,方差是4,求两组成绩的总平均数和总方差【答案】(1)0.030(2)84(3)总平均数是62,总方差是23.【详解】(1)每组小矩形的面积之和为1,,;(2)成绩落在内的频率为,落在内的频率为,设第75百分位数为m,由,得,故第75百分位数为84;(3)由频率分布直方图知,成绩在的市民人数为,成绩在的市民人数为,所以;由样本方差计算总体方差公式,得总方差为1.已知甲组数据由这个数据构成,记这组数据的平均数为,方差为;乙组数据由,这数据构成,记这组数据的平均数为,方差为,则(
)A., B.,C., D.,【答案】D【详解】由已知可得,,,,所以ABC错误,D正确.故选:D.2.(多选)下列抽样实验中,不适宜用抽签法的是(
)A.从某场生产的3000件产品中抽取600件进行质量检验B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检测C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验D.从某厂生产的3000件产品中抽取10件进行质量检测【答案】ACD【详解】A、D中个体的总数较大,不适合用抽签法;C中甲、乙两厂生产的两箱产品质量可能差别较大,不适合用抽签法;B中个体的总数和样本容量均较小,且是同厂生产的两箱产品,质量差别不大,适宜用抽签法.故选:ACD.3.(多选)某保险公司为客户定制了5个险种:甲,一年期短险;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险.各种保险按相关约定进行参保与理赔.该保险公司对5个险种参保客户进行抽样调查,得出如图所示的统计图,以下四个选项中,说法正确的有(
)A.54周岁以上客户人数最多 B.18-29周岁客户参保总费用最少C.丁险种更受客户青睐 D.30周岁以上的客户约占参保客户的80%【答案】CD【详解】对于A,由参保人数的扇形统计图可知,54周岁以上客户占8%,人数最少,所以A错误,对于B,由于统计图显示的人均参保费用,人数未知,所以不能确定总费用,所以B错误,对于C,从参保险种比例图可知,丁险种参保比例最高,所以丁险种更受客户青睐,所以C正确,对于D,因为18-29周岁客户约占20%,所以30周岁以上的客户约占参保客户的80%,所以D正确,故选:CD4.(多选)某班有50名学生,某次数学考试的成绩经计算得到的平均分数为80分,标准差为s,后来发现记录有误,甲同学得90分误记为60分,乙同学得70分误记为100分,更正后重新计算得到的平均分数为,标准差为,则下列说法正确的是(
)A. B. C. D.【答案】AD【详解】设更正前甲,乙,的成绩依次为,则,即,可得,则更正后的平均分为,可得,所以更改前后的平均数不变,所以A正确,B错误;由更改前的方差为,即,可得,更改后的数据方差为,可知,所以,故C错误,D正确;故选:AD.5.(多选)若数据的平均数为2,方差为3,则(
)A.数据,,,的平均数为20 B.C.数据,,,的标准差为 D.【答案】BCD【详解】对于A,由平均数公式,得数据,,…,的平均数为,A错误;对于B,,B正确;对于C,由方差公式,得数据,,…,的方差为,标准差为,C正确;对于D,由,得,即,所以,D正确.故选:BCD6.,两班共100人,现采取分层随机抽样的方法抽取10人的样本进行问卷调查,若样本中有4人来自班,则班的人数为.【答案】人【详解】由分层抽样的概念及计算方法,可得(人).故答案为:7.福利彩票“双色球”中红色球由编号为01,02,…,33的33个个体组成,某彩民利用下面的随机数表(下表是随机数表的第一行和第二行)选取6个红色球,选取方法是从随机数表中第1行的第6列和第7列数字开始,由左到右依次选取两个数字,则选出来的第3个红色球的编号为.【答案】05【详解】解:由题意,选取方法是从随机数表第1行的第6列和第7列数字开始,由左到右依次选取两个数字中小于34的编号为:21,32,05,16,故第3个个体的编号为05.故答案为:05.8.数据:7.2,8.3,8.5,8.5,8.7,8.8,9.0,9.2的第40百分位数是.【答案】8.5【详解】因为,故这组数据的第百分位数是.故答案为:.9.一组数据:12,8,6,15,12,10,8,17,20,12的分位数是.【答案】【详解】将这组数据从小到大排列:6,8,8,10,12,12,12,15,17,20,共10个数据,可得,所以这组数据的80%分位数是.故答案为:.10.某企业共有3200名职工,其中,中年、青年、老年职工的比例为5:3:2,从所有职工中抽取一个样本容量为400的样本.(1)应采用哪种抽样方法更合理?(2)中年、青年、老年职工应分别抽取多少人?【答案】(1)分层抽样,理由见解析;(2)抽取的中年、青年、老年职工分别为200人,120人,80人.【详解】(1)因为中、青、老年职工有明显的差异,故采用分层抽样更合理;(2)按照比例抽取中、青、老年职工的人数分别为,,,因此应抽取的中年、青年、老年职工分别为200人,120人,80人.11.“疫苗犹豫”,即尽管疫苗可及,却迟迟未接种或拒绝接种疫苗的现象.成人接种新冠疫苗的犹豫,主要原因是对感染新冠肺炎的风险缺乏了解,心存侥幸,认为即使不接种也未必会感染,对感染的后果也认识不足.现从某小区未接种的人群中随机选出100人,并将这100人按年龄分组:第1组,第2组,第3组,第4组,第5组,得到的频率分布直方图如图所示.(1)求出样本的平均数(同一组数据用该区间的中点值作代表)和中位数(精确到小数点后一位);(2)现先从第1,2组中用分层抽样的方法抽取5人,再从这5人中随机抽取3人进行问卷调查,求第2组中抽到2人的概率.【答案】(1)平均数为44.5;中位数为45.1(2)【详解】(1)由,得.平均数为:,设中位数为,则,得.(2)第1,2组的人数分别为人,人,从第1,2组中用分层抽样的方法抽取5人,则第1,2组抽取的人数分别为2人,3人,分别记为设从5人中随机抽取3人,为:,,,,,,,,,,共10个基本事件,第2组中抽到2人的情况有,,,,,,共6种情况,从而第2组中抽到2人的概率.12.为了了解某工厂生产的产品情况,从该工厂生产的产品随机抽取了一个容量为20的样本,测量它们的尺寸(单位:),数据分为,,,,,,七组,其频率分布直方图如图所示.(1)求上图中的值;(2)根据频率分布直方图,求200件样本尺寸在内的样本数;(3)记产品尺寸在内为等品,每件可获利5元;产品尺寸在内为不合格品,每件亏损2元;其余的为合格品,每件可获利3元.若该机器一个月共生产3000件产品.以样本的频率代替总体在各组的频率,若单月利润未能达到11000元,则需要对该工厂设备实施升级改造.试判断是否需要对该工厂设备实施升级改造.【答案】(1);(2)(件);(3)需要对该工厂设备实施升级改造.【详解】(1)因为,解得;(2)200件样本中尺寸在内的样本数为(件)(3)由题意可得,这批产品中优等品有(件),这批产品中不合格品有件,这批产品中合格品有(件),元.所以该工厂生产的产品一个月所获得的利润为10680元,因为,所以需要对该工厂设备实施升级改造.13.山西运城王过酥梨是国家农产品地理标志保护产品,王过酥梨含有多种对人体有益的钙、铁、磷等微量营养元素,食后清火润肺,止咳化痰,能起到祛病养生之效,一致被人们作为逢年过节走亲访友,馈赠待客及日常生活的必备佳品.某水果批发商小李从事酥梨批发多年,他把去年年底客户采购酥梨在内的数量x(单位:箱)绘制成下表:采购数x(单位:箱)客户数51015155(1)根据表中的数据,补充完整这些数据的频率分布直方图,并估计采购数在168箱以上(含168箱)的客户数;(2)若去年年底采购在内的酥梨数量约占小李去年年底酥梨总销售量的,估算小李去年年底总销售量(同一组中的数据用该组区间的中点值作代表);(3)在(2)的条件下,由于酥梨受到人们的青睐,小李做了一份市场调查以决定今年年底是否在网上出售酥梨,若没有在网上出售酥梨,则按去年的价格出售,每箱利润为14元,预计销售量与去年持平;若计划在网上出售酥梨,则需把每箱售价下调1至5元(网上、网下均下调),且每下调m元销售量可增加箱,试预计小李在今年年底销售酥梨总利润Y(单位:元)的最大值.【答案】(1)见解析(2)(箱)(3)(元)【详解】(1)对应的频率分别为,则对应的频率/组距为,故这些数据的频率分布直方图如下图所示:由直方图可知,采购数在168箱以上(含168箱)的客户数为(人)(2)由题意可知,去年年底客户采购酥梨在内的数量为(箱)则小李去年年底总销售量为(箱)(3)由题意可得当时,(元)14.某工厂对200个电子元件的使用寿命进行检查,按照使用寿命(单位:h),可以把这批电子元件分成第一组,第二组,第三组,第四组,第五组,第六组.由于工作中不慎将部分数据丢失,现有以下部分图表:使用寿命频数3020频率0.20.4(1)求图2中A的值;(2)补全图2频率分布直方图,并求图2中阴影部分的面积;(3)为了某次展销会,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 投资顾问面试考核题及答案详解
- 特殊群体急救资源可及性提升方案
- 深度解析(2026)《GBT 18932.10-2002蜂蜜中溴螨酯、44-二溴二苯甲酮残留量的测定方法 气相色谱质谱法》
- 生产项目管理经理的招聘面试题集
- 劳务输出项目可行性分析报告范文(总投资13000万元)
- 教育顾问面试题集及应对策略
- 深度解析(2026)《GBT 9002-2017音频、视频和视听设备及系统词汇》
- 京东物流策划部面试题及策略性答案
- 会计事务所审计师面试问题及答案
- 关于华能集团对副总经理的考核制度分析
- JT-T-961-2020交通运输行业反恐怖防范基本要求
- MOOC 物理与艺术-南京航空航天大学 中国大学慕课答案
- 银行案件复盘分析报告
- 分析方法转移方案课件
- 无创呼吸机面部压疮预防措施
- 全国高校黄大年式教师团队推荐汇总表
- 员工管理规章制度实施细则
- 社会心理学(西安交通大学)知到章节答案智慧树2023年
- 《安井食品价值链成本控制研究案例(论文)9000字》
- GB/T 4135-2016银锭
- GB/T 33084-2016大型合金结构钢锻件技术条件
评论
0/150
提交评论