




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
9.2用样本估计总体
【知识点】
1.频率分布直方图绘制步骤
①求极差,即一组数据中的最大值与最小值的差.
②决定组距与组数.组距与组数的确定没有固定的标准,一般数据的个数越多,所分组数越多.当样
本容量不超过100时,常分成5〜12组.为方便起见,一般取等长组距,并且组距应力求“取整”.
③将数据分组.
④列频率分布表.计算各小组的频率,第,・组的频率是第卷i组捐频官数.
⑤画频率分布直方图.其中横轴表示分组,纵轴表示磊.磊实际上就是频率分布直方图中各小长方
形的高度,它反映了各组样本观测数据的疏密程度.
2.频率分布直方图意义:各个小长方形的面积表示相应各组的频率,频率分布直方图以面积的形式反
映数据落在各个小组的频率的大小,各小长方形的面积的总和等于1.
3.总体取值规律的估计:我们可以用样本观测数据的频率分布估计总体的取值规律.
4.频率分布直方图的特征:当频率分布直方图的组数少、组距大时,容易从中看出数据整体的分布特点,
但由于无法看出每组内的数据分布情况,损失了较多的原式数据信息;当频率分布直方图的组数多、组距
小时,保留了较多的原始数据信息,但由于小长方形较多,有时图形会变得非常不规则,不容易从中看出
总体数据的分布特点.
5.常见的其他统计图:条形图、扇形图、折线图.
扇形图主要用于直观描述各类数据占总数的比例;
条形图和直方图主要用于直观描述不同类别或分组数据的频数和频率;
折线图主要用于描述数据随时间的变化趋势.
6.各个统计图特点
(1)不同的统计图在表示数据上有不同的特点.如扇形图主要用于直观描述各类数据占总数的比例,条
形图和直方图主要用于直观描述不同类别或分组数据的频数和频率,折线图主要用于描述数据随时间的变
化趋势.
(2)不同的统计图适用的数据类型也不同.如条形图适用于描述离散型的数据,直方图适用于描述连续
性数据.
7.第p百分位数的定义
一般地,一组数据的第P百分位数是这样一个值,它使得这组数据中至少有P%的数据小于或等于这个
值,且至少有(100—P)%的数据大于或等于这个值.
8.计算第p百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算i=nxp%.
第3步,若,•不是整数,而大于i的比邻整数为则第〃百分位数为第j项数据;若i是整数,则第p
百分位数为第i项与第(i+1)项数据的平均数.
9.四分位数
常用的分位数有第25百分位数、第50百分位数、第75百分位数,这三个分位数把一组由小到大排列
后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75
百分位数也称为第三四分位数或上四分位数等.
10.众数、中位数、平均数定义
(1)众数:一组数据中重复出现次数最多的数.
(2)中位数:把一组数据按从小到大的顺序排列,处在中间位置(或中间两个数的平均数)的数叫做这组数
据的中位数.
一1
(3)平均数:如果〃个数Xl,X2,X,,,那么X=1制+及+…+x”)叫做这〃个数的平均数.
11.频率分布直方图中的众数、中位数、平均数
①在频率分布直方图中,众数是最高矩形中点的横坐标;
②中位数左边和右边的直方图的面积应该相等;
③平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
12.方差、标准差的定义
一组数据X”X2,…,X”,用X表示这组数据的平均数,则这组数据的方差为X)2=5)—X
L11=1
2,标准差为X,—T2.
13.总体方差、总体标准差的定义
如果总体中所有个体的变量值分别为妨,%,…,次,总体平均数为—y,则称W=尢1Z(匕-一Y)2
为总体方差,5=料为总体标准差.如果总体的N个变量值中,不同的值共有内个,记为H,丫2,…,
YM其中匕出现的频数为川•=1,2,…,氏),则总体方差为群=三%(匕-7产
i=l
14.样本方差、样本标准差的定义
如果一个样本中个体的变量值分别为力,以,…,为,样本平均数为亍,则称s2=:2(JL亍)2
1=1
为样本方差,S=d?为样本标准差.
15.方差、标准差特征
标准差、方差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,
数据的离散程度越小.在刻画数据的分散程度上,方差和标准差是一样的.但在解决实际问题中,一般多
采用标准差.
【典型例题】
题型一频率分布直方图的绘制与应用
例1.(2021・全国•高一课时练习)通过抽样,我们获得了100位居民某年的月平均用水量(单位:t),如下
表:
3.12.52.02.01.51.01.61.81.91.6
3.42.62.22.21.51.20.20.40.30.4
3.22.72.32.11.61.23.71.50.53.8
3.32.82.32.21.71.33.61.70.64.1
3.22.92.42.31.81.43.51.90.84.3
3.02.92.42.41.91.31.41.80.72.0
2.52.82.32.31.81.31.31.60.92.3
2.62.72.42.11.71.41.21.50.52.4
2.52.62.32.11.61.01.01.70.82.4
2.82.52.22.01.51.01.21.80.62.2
试用频率直方图分析该地居民月平均用水量的分布情况.
【答案】答案见解析
【解析】
【分析】
根据数据计算极差确定组距和组数,再得到频率分布表,画出频率分布直方图,根据直方图得到答案.
【详解】
42
计算极差:4.3-02=4.1;将组距取为0.5,则万|=8.4,取组数为9;
将数据分为:[0,0.5),[0.5,1),[1,1.5),[1.5,2),[2,2.5),[2.5,3),[3,3.5),[3.5,4),[4,4.5],
则得到频率分布表:
分组频数频率
[0,0.5)40.04
[0.5,1)80.08
[1,1.5)150.15
[1.5,2)220.22
[2,2.5)250.25
[2.5,3)140.14
[3,3.5)60.06
[3.5,4)40.04
[4,4.5]20.02
合计1001.00
画出频率分布直方图:
根据频率分布直方图:
用水量在[4,4.5]的居民最少;
多数居民的用水量在1,3)之间;
用水量在[2,2.5)的居民最多.
解题技巧(绘制频率分布直方图的注意事项)
1.在列频率分布表时,极差、组距、组数有如下关系:
(1)若极赢差为整数,则极差就=组数;
(2)若箫不为整数,则黯的整数部分+1=组数.
2.组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,纵使数据的分布规律能较清楚
地呈现出来,组数太多或太少,都会影响我们了解数据的分布情况,若样本容量不超过100,按照数据的多
少常分为5〜12组,一般样本容量越大,所分组数越多.
例2.(2021•全国•高一课时练习)下面是某市9月26日和9月29日市区出现堵车的时刻,试列出这两天的
堵车时刻的频率分布表和频率直方图,并分析该市每天大约在什么时间段是行车高峰期.
8:018:029:309:319:5110:2410:51
9月26
日
11:2115:5216:3017:2917:3018:0418:22
9月2910:311:
8:298:328:339:299:5810:14
日343
18:018:
14:0016:0816:2916:5416:5517:05
809
【答案】答案见解析
【解析】
【分析】
确定组距,由已知条件确定每组的频数、频率、频率/组距可得频率分布表,根据频率分布表作出频率直方
图即可.
【详解】
根据已知数据可得频率分布表如下:
分组频数频率频率/组距
J_
[8:00,9:00)5
66
[j_
[9:00,10:00)5
66
22
[10:00,11:00)
4?5
11
[11:00,12:00)2
15西
[12:00,13:00)000
[13:00,14:00)000
11
[14:00,15:00)1
3030
11
[15:00,16:00)1
3030
[
[16:00,17:00)5
66
11
[17:00,18:00)
3ToTo
22
[18:00,19:00)4
1515
合计3011
作出频率分布直方图如图所示:
山频率分布直方图可以看出大约每天的8:00至心1:00与16:00至打9:00是行车高峰期.
例3.(2021.全国.高一单元测试)某制造商生产一批直径为40mm的乒乓球,现随机抽样检查20个,测得
每个球的直径(单位:mm,保留两位小数)如下:
40.0340.0039.9840.0039.9940.0039.98
40.0139.9839.9940.0039.9939.9540.01
40.0239.9840.0039.9940.0039.96
(1)完成下面的频率分布表,并画出频率分布直方图;
分组频数频率
[39.95,39.97)
[39.97,39.99)
[39.99,40.01)
[40.01,40.03]
合计
(2)假定乒乓球的直径误差不超过0。2mm为合格品.若这批乒乓球的总数为10000,试根据抽样调查结果
估计这批产品的合格个数.
【答案】(1)频率分布表见解析,频率分布直方图见解析;(2)8500.
【解析】
【分析】
(1)根据所给的频数和样本容量,用频数除以样本容量做出每一组数据对应的频率,填入表中,画出对应的
频率分步直方图和频率分布折线图.(2)计算抽样产品在[39.98,40.02]的个数,计算合格率,即可求出这批产
品的合格只数.
【详解】
(1)频率分布表如下:
分组频数频率
[39.95,39.97)20.10
139.97,39.99)40.20
139.99,40.01)100.50
[40.01,40.03]40.20
合计201.00
频率分布直方图如图.
频率
二合格品频率为与x100%=85%.
10000x85%=8500.
故根据抽样调查结果,可以估计这批产品的合格个数为8500.
题型二频率分布直方图中的相关计算问题
例4.(2022.吉林•东北师大附中模拟预测(文))为了了解某工厂生产的产品情况,从该工厂生产的产品随
机抽取了一个容量为20的样本,测量它们的尺寸(单位:mm),数据分为[92,94),[94,96),[96,98),[98,100),
[100,102),[102,104),[104,106]七组,其频率分布直方图如图所示.
⑴求上图中的x值;
(2)根据频率分布直方图,求20()件样本尺寸在[98,100)内的样本数;
⑶记产品尺寸在[98,102)内为A等品,每件可获利5元;产品尺寸在[92,94)内为不合格品,每件亏损2元;
其余的为合格品,每件可获利3元.若该机器一个月共生产3000件产品.以样本的频率代替总体在各组的频
率,若单月利润未能达到11000元,则需要对该工厂设备实施升级改造.试判断是否需要对该工厂设备实施
升级改造.
【答案】(l)x=0.12;
(2)36(件);
(3)需要对该工厂设备实施升级改造.
【解析】
【分析】
(1)根据频率分布直方图中所有小矩形的面积之和为1进行求解即可;
(2)根据频率分布直方图中的数据进行求解即可;
(3)根据题意,结合频率分布直方图中的数据求出单月利润,最后比较大小即可.
(I)
因为(0.02+0.04+0.06+0.07+0.09+0.10+x)x2=l,
解得x=0.12;
(2)
200件样本中尺寸在[98,100)内的样本数为200x0.09x2=36(件)
(3)
由题意可得,这批产品中优等品有3000x(0.18+0.20)=1140(件),
这批产品中不合格品有3000x0.04=120件,
这批产品中合格品有3000-1140-120=17403000-1140-120=1740(件),
1140x5+1740x3-120x2=10680元.
所以该工厂生产的产品一个月所获得的利润为10680元,
因为10680<11000,
所以需要对该工厂设备实施升级改造.
解题技巧(计算规律)
1.因为小长方形的面积=组距><慧=频率,所以各小长方形的面积表示相应各组的频率.这样,频率分布直
方图就以面积的形式反映了数据落在各个小组内的频率大小.
2.在频率分布直方图中,各小长方形的面积之和等于1.
3.而黑芯=样本量.
4.在频率分布直方图中,各长方形的面积之比等于频率之比,各长方形的高度之比也等于频率之比.
例5.(2021•四川•成都市温江区第二中学校高二期末(理))某商品公司随机选取了1000名购物者在某年
度的消费情况进行统计,并根据消费金额(单位:万元)分成6组,制成如下图所示的频率分布直方
图:
(2)在这些购物者中,求消费金额在区间(0.5,0.9]内的购物者的人数.
【答案】⑴。=3
(2)600人
【解析】
【分析】
(I)根据频率分布直方图的性质,各小矩形的面积之和为1,即可求出;
(2)先由频率分布直方图可求出消费金额在区间(050.9]内的频率,再根据频数=频率x样本容量,即可
得到购物者的人数.
(1)
由频率分布直方图及频率和等于1可得:
0.2x0.1+0.8x0.1+1.5x0.1+2x0.1+2.5x0.1+ax0.1=l,解得a=3.
(2)
消费金额在区间(0.5,0.9]内的频率为0.2*0.1+0.8、0.1+2*0.1+3乂0」=0.6,
所以消费金额在区间(050.9]内的购物者的人数为0.6x1000=60()A.
例6.(2021•四川省南充市李渡中学高二阶段练习)对某校高一年级学生参加“社区志愿者”活动次数进行统
计,随机抽取M名学生作为样本,得到这M名学生参加''社区志愿者”活动的次数.据此作出频数和频率统
计表及频率分布直方图如下:
分组频数频率
[10,15)50.25
[15,20)12n
[20,25)mP
[25,30]10.05
合计M1
(1)求出表中M,p及图中4的值;
(2)若该校高一学生有720人,试估计他们参加“社区志愿者”活动的次数在15,20)内的人数.
【答案】(1)M=20,p=0A,a=0.12;(2)432A.
【解析】
【分析】
利用频率=.频的数关系‘求出口'"、
(1)根据频率分布表,〃、”以及。的值;
(2)利用参加“社区志愿者”活动的次数在[15,20)内的频率,求出对应的频数.
【详解】
解:(I)根据频率分布表,得;
•••—=0.25,
M
,样本容量为M=20:
.-./n=20-5-12-l=2,
2
对应的频率为P==0.1,
„=—=0.6;
20
a=0-6=0.12;
20-15
(2)参力n“社区志愿者”活动的次数在[15,20)内的频率为0.6,
.・・估计参加“社区志愿者”活动的次数在口5,20)内的人数为
720x0.6=432(人).
题型三对折线图、扇形图、条形图的识读
例7.(2020.北京.高二学业考试)2007年以前,北京市先后组织实施了多个阶段的大气污染防治行动,针对
燃煤、工业、扬尘排放和机动车排放等采取了数百项治理措施.2008年北京市首次探索区域联防联控,取得了
良好效果.2013年北京市制定实施以防治细颗粒物为重点的《2013-2017年清洁空气行动计划》,治理成效显
著.
上图是2000年至2018年可吸入颗粒物、细颗粒物、二氧化氮、二氧化硫等主要污染物年日均值的折线图.根据
图中信息,下列结论中正确的是()
A.2013年到2018年,空气中可吸入颗粒物的年日均值逐年下降
B.2013年到2018年,空气中细颗粒物的年日均值逐年下降
C.2000年到2018年,空气中二氧化氮的年日均值都低于40微克/立方米
D.2000年到2018年,空气中二氧化硫的年日均值最低的年份是2008年
【答案】B
【解析】
观察折线图,确定数据的变化规律,判断各选项.
【详解】
2014年空气中可吸入颗粒物年II均值比2013年多,A错;
2013年到2018年,空气中细颗粒物的年日均值逐年下降,B正确;
2007年(含2007年)之前空气中二氧化氮的年日均值都高于40微克/立方米,C错;
2000年到2018年,空气中二氧化硫的年日均值最低的年份是2018年,D错.
故选:B.
解题技巧(各类统计图的特点)
条形统计图反映各组数据的频数或频率;
扇形统计图反映各组数据占总数的比例;
折线统计图反映数据随时间的变化趋势.
例8.(2021・全国•高一课时练习)为考查某校高二男生的体重,随机抽取44名高二男生,实测体重数据(单
位:kg)如下:
57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,
55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48
将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.
【答案】见解析
【解析】
【分析】
分析数据的极差,选择合适的组局,让组数在5—8组左右为宜,作出频率分布表,根据频率分布表作出频
率分布直方图.
【详解】
数据的极差为:69-42=27,所以可以4为组距,将数据分为8组,列表如下:
分组频率累计频数频率
[41.5,45.5)T20.0455
[45.5,49.5)正T70.1591
[49.5,53.5)正T80.1818
153.5,57.5)正正正一160.3636
[57.5,61.5)正50.1136
[61.5,65.5)TF40.0909
[65.5,69.5)T20.0455
以此作出频率分布直方图和频率分布折线图,如图所示:
o1s.0
0a9
08
o0.7
0a6
05
o0.4
o0.3
o0.2
01
o.。
样本数据
o.57561655695
例9.(2021.全国•高一单元测试)共享单车入住泉州一周年以来,因其“绿色出行,低碳环保”的理念而备受
人们的喜爱,值此周年之际,某机构为了了解共享单车使用者的年龄段,使用频率、满意度等三个方面的
信息,在全市范围内发放5000份调查问卷,回收到有效问卷3125份,现从中随机抽取80份,分别对使用者
的年龄段、26〜35岁使用者的使用频率、26〜35岁使用者的满意度进行汇总,得到如下三个表格:
表(一)
使用者年龄段25岁以下26岁〜35岁36岁〜45岁45岁以上
人数20401010
表(二)
使用频率°~6次/月7〜14次/月15〜22次/月23〜31次/月
人数510205
表(三)
满意度非常满意(9〜10)满意(8〜9)一般(7〜8)不满意(6〜7)
人数1510105
(1)依据上述表格完成下列三个统计图形:
率使用者年龄段频率条形图
4
-
8
3
-
8
2
-
8
1
-
8
O25岁以下26~35岁36~45岁45岁以上使用者年龄段
使用频率饼图
(2)某城区现有常住人口30万,请用样本估计总体的思想,试估计年龄在26岁〜35岁之间,每月使用共享
单车在7〜14次的人数.
【答案】(1)详见解析;(2)二万人.
4
【解析】
(1)按照三个表格中的数据绘制图形即可;
(2)先根据年龄在26岁〜35岁之间的有40人,占总抽取人数的一半,得某城区30万人口中年龄在26岁〜
35岁之间的约有30xg=15(万人);再根据年龄在26岁〜35岁之间每月使用共享单车在7〜14次之间的有
10人,占总抽取人数的!,得年龄在26岁〜35岁之间,每月使用共享单车在7〜14次之间的约有15x?=?
(万人).
【详解】
⑴
率
频使用者年龄段频率条形图
4
-
8-
3
--
8
2
-
8一
1
-
8一
o25岁以下26~35岁36~45岁45岁以上使用者年龄段
使川频率饼图
图例
IIOF次/月
■7~14次/月
昌15~22次/月
密23~31次/月
人数满意度折线图
⑵由表(一)可知:
年龄在26岁〜35岁之间的有40人,占总抽取人数的一半,用样本估计总体的思想可知,某城区30万人口
中年龄在26岁〜35岁之间的约30xJ=15(万人);
又年龄在26岁〜35岁之间每月使用共享单车在7〜14次之间的有10人,占总抽取人数的7,用样本估计总
体的思想可知,城区年龄在26岁〜35岁之间15万人中每月使用共享单车在7〜14次之间的约仃
(万人),
故年龄在26岁〜35岁之间,每月使用共享单车在7〜14次之间的人数约为v万人.
4
【点睛】
本题考查阅读理解能力和逻辑思维能力,考查频率分布饼形图、条形图和折线图,考查用样本估计总体,
属于中档题.
题型四百分位数在具体数据中的应用
例10.(2022•天津市武清区杨村第一中学高三期末)某射击运动员7次的训练成绩分别为:86,88,90,89,
88,87,85,则这7次成绩的第80百分位数为()
A.88.5B.89C.91D.89.5
【答案】B
【解析】
【分析】
根据百分位数的定义进行求解即可.
【详解】
7次的训练成绩从小到大排列为:85,86,87,88,88,89,90,
7x80%=5.6,所以第80百分位数为从小到大排列的数据中的第6个数据,即89,
故选:B
解题技巧(计算一组n个数据的第p百分位数的步骤)
第1步,按从小到大排列原始数据.
第2步,计算i=nxp%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位
数为第i项与第(i+1)项数据的平均数.
例11.(2022.安徽省蚌埠第三中学高一开学考试)从某城市随机抽取14台自动售货机,对其销售额进行统
计,数据如下:8,8,10,12,22,23,20,23,32,34,31,34,42,43,则这14台自动售货机的销售
额的50%,80%分位数分别是,.
【答案】2334
【解析】
【分析】
根据百分位数的定义计算可得答案.
【详解】
解:因为该组数据从小到大排列为:8,8,10,12,20,22,23,23,31,32,34,34,42,43.
且14x50%=7,笫7个与第8个数的平均值为:(23+23)=23,
所以这14台自动售货机的销售额的50%分位数为23;
乂14x80%=11.2,所以这14台自动售货机的销售额的80%分位数分别是第12项数据,即34,
故答案为:23;34.
例12.(2022・湖南•高一课时练习)下表为某市青少年(12~13岁)立定跳远体能达标表(单位:cm):
百分位5102030405060707580859095
数P,
12
127136147155162169175182186190195201211
岁
男
13
139149161169177184191198202207212219229
岁
12
109117128135141147153159163167171177186
岁
女
13
110119129137143149155161165169173179188
岁
(1)小兰今年12岁就读六年级,她立定跳远的距离是153cm,求她立定跳远的百分等级.
(2)小兰明年就读初中时,她想要立定跳远的成绩位于表中用的位置,问她立定跳远至少要跳多少cm以上.
(3)若立定跳远的成绩达到/算是优良,小军今年13岁,他立定跳远的距离是200cm,请问他的立定跳远
成绩是不是优良?
【答案】⑴50
(2)165cm以上.
⑶不是
【解析】
【分析】
(1)根据表格中的数据得到女生立定跳远距离153cm对应的百分位数为即可求解;
(3)根据表格中的数据可得到女生13岁立定跳远距离百分为数4=165cm,即可求解;
所以她立定跳远至少要跳165cm以上.
(3)由表格中的数据得到13岁男生立定跳远距离百分位数舄$的值,比较即可得到结论.
(1)
解:根据表格中的数据可知,12岁的女生立定跳远距离153cm对应的百分位数为%,
所以小兰立定跳远的百分等级50.
⑵
解:小兰明年13岁,根据表格中的数据可知:13岁立定跳远距离百分为数G=169cm,
所以她立定跳远至少要跳169cm以上.
(3)
由表格中的数据可知:13岁男生立定跳远距离百分位数队=207cm,
因为200<207,所以他的立定跳远成绩不是优良.
题型五百分位数在统计表或统计图中的应用
例13.(2022•辽宁丹东•高一期末)某地区想实行阶梯电价,经调查发现,该地区居民用电量信息如下:
分位数50%分位数70%分位数80%分位数90%分位数
用电量
160176215230
/(kWh)
如果要求约70%的居民用电在第一阶梯内,约20%的居民用电在第二阶梯内,可确定第二阶梯电价的用电
量/(kW.h)范围为()
A.(160,176]B.(176,215]C.(176,230]D.(230,”)
【答案】C
【解析】
【分析】
利用百分位数的含义结合条件即得.
【详解】
•.•约70%的居民用电在第一阶梯内,约20%的居民用电在第二阶梯内,
,由表中数据可得,第二阶梯电价的用电量/(kW,h)范围为(176,230].
故选:C.
解题技巧(频率直方图计算百分位数的规律)
求总体百分位数的估计,首先要从小到大排列数据,频率直方图看作数据均匀分布在直方图上,然后
计算出i=nxp%,当i不是整数要取整,频率直方图要计算出比例值.
例14.(2022.河南焦作.高一期末)某小学制订了一份调查问卷,让学生家长对该校实行“双减”的效果进行
评分,评分都在[40,100]内,将所有数据按[40,50],(50,60],(60,70],(70,80],(80,90],(90,100]进行
分组,整理得到频率分布直方图如下,则这次调查数据的70%分位数为.
.频率
0.030k--------------T—I
0.025卜---------\\
0.020L---------------
0.015H----1-
0.010[
0005r;;n-iTrn
O1405。60708090100评分/务
【答案】80
【解析】
【分析】
利用百分位数的概念以及频率分布直方图求解..
【详解】
因为前4组数据的频率之和为0.05+0.15+0.2+0.3=0.7,
所以70%分位数为80.
故答案为:80
例15.(2022.北京平谷.高二期末)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使
用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),
—,[80,90],并整理得到如下频率分布直方图:
频率A
缈li
0.04-------------------------------------------------------
0.02-----------------------------------------------j--1——।
0.01---------------------------------------
o2030405060708090分数
(1)已知样本中分数在[40,50)的学生有5人,试估计总体中分数小于40的人数;
(2)试估计测评成绩的75%分位数;
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男
生和女生人数的比例.
【答案】⑴20人
(2)78.75
呜
【解析】
【分析】
(1)根据频率分布直方图先求出样本中分数在[40,90)的频率,即可解出;
(2)先根据频率分布直方图判断出75%分位数在[70,80)之间,即可根据分位数公式算出;
(3)根据频率分布直方图知分数不小于70分的人数中男女各占30人,从而可知样本中男生有60人,女
生有40人,即可求出总体中男生和女生人数的比例.
(1)
由频率分布直方图知,分数在[50,90)的频率为(0.01+0.02+0.04+0.02)x10=0.9,在样本中分数在[50,90)
的人数为100x0.9=90(人),在样本中分数在[40,90)的人数为95人,所以分数在[40,90)的人数为
400x0.95=380(A),总体中分数小于40的人数为20人
(2)
测试成绩从低到高排序,占人数75%的人分数在[70,80)之间,所以估计测评成绩的75%分位数为
075-04
70+lOx------=70+8.75=78.75
0.8-0.4
(3)
由频率分布直方图知,分数不小于70分的人数共有60人,由已知男女各占30人,从而样本中男生有60
人,女生有40人,故总体中男生与女生的比例为黑==.
题型六平均数、中位数、众数在具体数据中的应用
例16.(2021山西•高一期末)一组数据共有7个整数,e,2,2,2,10,5,4,且2<加<10,若这组数
据的平均数、中位数、众数中最大与最小数之和是该三数中间数字的两倍,则第三四分位数是.
【答案】5
【解析】
【分析】
根据平均数,中位数,众数的概念和已知条件,列式求解,注意分类讨论,求得m的值,进而得到已知得
7个数,从小到大排列后,利用四舍五入法求得第三四分位数.
【详解】
平均数=--—,众数=2,当4W机<10时,中位数为4,
则有2+g"=8nm=17舍掉;
当2<,”4时,中位数为旭,则有2+'"+"=2/7?=>m=3.
7
该7个数从小到大排列是2,2,2,3,4,5,10,因为数据个数为7,
而且7x75%=5.25,所以这组数据的第三四分位数为5.
解题技巧(众数、中位数、平均数的意义)
(1)样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受
少数几个极端值的影响,但只能表达样本数据中的少量信息,平均数代表了数据更多的信息,但受样本中
每个数据的影响,越极端的数据对平均数的影响也越大.
(2)当一组数据中有不少数据重复出现时,其众数往往更能反映问题,当一组数据中个别数据较大时,
可用中位数描述其集中趋势.
例17.(2021.河南•温县第一高级中学高三阶段练习(文))为了增加学生的锻炼机会,某中学决定每年举办
一次足球和乒乓球比赛,据统计,近10年来,参加足球比赛的学生人数分别为为、演、£、L、占。,它
们的平均数为已知这10年,参加乒乓球比赛的学生人数分别为肛-1、3々-1、3x「l、L、3/7,
它们的平均数以为()
A.3-1B.3y,+1C.必D.3M
【答案】A
【解析】
【分析】
利用平均数公式可求得结果.
【详解】
由已知可得[=+;;•••+/,
由平均数公式可得亢=(3%-1)+(3々-1)+除-1)+…+(3/-1)
=3(%+工2+刍+…+$0)]=37_[
故选:A.
例18.(2022.湖南.高一课时练习)某大学随机抽取30名学生参加环保知识测试,得分(十分制)情况如图
所示,试结合图象分析得分的平均数、众数、中位数之间的大小关系.
【解析】
【分析】
求出中位数,平均数,众数,比较大小即可.
【详解】
由图知
平均数为--------------------------------------------5.97
众数为5,
中位数为手=5.5,
故平均数〉中位数〉众数.
例19.(2022•湖南•高一课时练习)某百货公司连续40天的销售额数据(单位:万元)如下:
41252947383430384340
46364537373645433344
35284634303744263844
42363737493942323635
(1)根据上面的数据进行适当的分组,编制频数分布表,并绘制频率分布直方图;
(2)在绘制的频率分布直方图上指出数据组的中位数、众数、平均数所在区域,并比较它们之间的大小;
(3)试估计该百货公司一年(按365天计算)的销售额.
【答案】(1)见解析
(2)中位数为37,众数为37,平均数为37.85,平均数最大,中位数和众数相等,
(3)13815.25万元
【解析】
【分析】
(1)首先找出该组数据的最大值和最小值,求出它们的差,然后决定组距和组数,找出分点后再列频数分
布表和频数分布直方图,
(2)通过对中位数,众数,平均数的计算进行比较,
(3)用平均数乘以365可求得结果
(1)
这组数的最小值为25,最大值为49,其差为49-25=24,取组距为5,将其分成5组,则分的组为
[25,30),[30,35),[35,40),[40,45),[45,50),
销售额的频率分布表如下:
组段频数频率
[25,30)40.10
130,35)60.15
[35,40)150.375
[40,45)90.225
[45,50)60.15
销售额的频率分布直方图如下:
频率
组
建-A
S0.
085.
一
O..070.一
OS.075.
.060.
06.
OS.5•
S0a50
S5•-
一
0•一
S.04•
S5一
.04・
S0
.03•一
.035一
O.0
02•—丁
O6.5•
O02•
C.010•
5.015/
M一
.oo
253035404550销售额(万元)
(2)
将40个数据从小到大排列依次为
25,26,28,29,30,30,32,33,34,34,35,35,36,36,36,36,37,37,37,37,
37,38,38,38,39,40,41,42,42,43,43,44,44,44,45,45,46,46,47,49,
所以中位数为37,众数为37,
平均数为L(25+26+28+29+2x30+32+33+2x34+2x35+4x36+5x37
40
+3x38+39+40+41+42+2x43+3x44+2x45+2x46+47+49)=37.85,
中位数、众数、平均数都在[35,40),其平均数最大,中位数和众数相等
(3)
由(2)可知平均每天的销售额为37.85万元,
所以该百货公司一年的销售额约为
365x37.85=13815.25万元
题型七在频率分布直方图中求平均数、中位数、众数
例20.(河南省新乡市2021-2022学年高三上学期期末考试数学(文科)试题)《关于落实主体责任强化校
园食品安全管理的指导意见》指出:非寄宿制中小学、幼儿园原则上不得在校内设置食品小卖部、超市,
已经设置的要逐步退出.为了了解学生对校内开设食品小卖部的意见,某校对100名在校生30天内在该校
食品小卖部消费过的天数进行统计,将所得数据按照[0,5)、[5,10)、[10,15)、[15,20)、[20,25)、[25,30]分
成6组,制成如图所示的频率分布直方图.根据此频率分布直方图,下列结论不正确的是()
A.该校学生每月在食品小卖部消费过的天数不低于20的学生比率估计为20%
B.该校学生每月在食品小卖部消费过的天数低于10的学生比率估计为32%
C.估计该校学生每月在食品小卖部消费过的天数的平均值不低于15
D.估计该校学生每月在食品小卖部消费过的天数的中位数介于10至15之间
【答案】C
【解析】
【分析】
利用频率、频数与样本容量之间的关系可判断AB选项;利用频率分布直方图计算平均数可判断C选项;
利用中位数的定义可判断D选项.
【详解】
由图可得,该校学生每月在食品小卖部消费过的天数在[20,30]内的占比为(0.024+0.016)x5=0.2,A正确;
该校学生每月在食品小卖部消费过的天数在[0,10)内的占比为(0.024+0.040)x5=0.32,B正确;
估计该校学生每月在食品小卖部消费过的天数的平均值为
2.5x0.12+7.5x0.2+12.5x0.38+17.5x0.1+22.5x0.12+27.5x0.08=13.2,C错;
该校学生每月在食品小卖部消费过的天数在[0,1。)内的占比为0.32,
该校学生每月在食品小卖部消费过的天数在[0,15)的占比为(0.024+0.040+0.076)x5=0.7,
所以该校学生每月在食品小卖部消费过的天数的中位数介于1()至15之间,D正确;
故选:C.
解题技巧(知频率分布直方图中求平均数、中位数、众数)
(1)众数:频率分布直方图中,最高矩形的底边中点的横坐标.
(2)中位数:
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 医药市场营销的伦理边界与监管
- 医疗信息化对教育领域的启示
- Axure RP 互联网产品原型设计课件 第6章 使用母版和动态面板
- 创新型智慧药房系统在医疗园区的推广与应用
- 传媒公司商家合同范例
- 医疗大数据驱动的公共卫生健康监测
- 医疗教育中的沟通艺术培养卓越医者
- 买房公示合同范例
- 借款附带质押合同范例
- 保洁消毒合同范例
- 海南省临高县2022-2023学年小升初语文试卷(有答案)
- 第六单元“保护环境”(主题阅读)-六年级语文上册阅读理解(统编版)
- 名著《红岩》三年中考真题及典型模拟题训练(原卷版)
- “艾梅乙”感染者消除医疗歧视制度-
- 2024年6月浙江省普通高校招生选考高考信息技术真题及答案
- 热点素材41+2025年央视春晚里的作文素材-备战高考语文作文高分素材运用与范文
- 安全生产指导帮扶工作方案
- 北京市城市管理委员会直属事业单位公开招聘10人高频重点提升(共500题)附带答案详解
- 石化工程质量管理培训
- 审计访谈系列之访谈提纲2021年
- 律师案件评估报告范文
评论
0/150
提交评论