版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
§9.2用样本估计总体
【考试要求】1.会用统计图表对总体进行估计,会求〃个数据的第〃百分位数.2.能用数字特征
估计总体集中趋势和总体离散程度.
【知识梳理】
1.百分位数
一般地,一组数据的第〃百分位数是这样一个值,它使得这组数据中至少有巡的数据小于
或等于这个值,且至少有的数据大于或等于这个侑.
2.平均数、中位数和众数
(1)平均数:X=!(X|+X2+~+X”).
(2)中位数:将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据(当数据个
数是奇数时)或最中间两个数据的还邀(当数据个数是偶数时).
(3)众数:一组数据中出现次数甦的数据(即频数最大值所对应的样本数据).
3.方差和标准差
(1)方差:『=;£(即一X)2或;X2
(2)标准差:s=、J粒(刘一~7¥.
4.总体(样本)方差和总体(样本)标准差
(1)一般式:如果总体中所有个体的变量值分别为匕,匕,…,YN,总体平均数为了,则总
体方差(匕一了)2.
/=1
(2)加权式:如果总体的N个变量值中,不同的值共有如tWN)个,不妨记为H,打,…,匕,
其中匕出现的频数为角=1,2,…,&),则总体方差为心=方玄川匕一下之
LI
【常用结论】
1.若用,物…,X〃的平均数为X,那么〃川+小/心+小…,/Mr+a的平均数为〃?工+〃.
2.数据即,M,…,%与数据X」=xi+a,X2=必+。,…,的」=x”+a的方差相等,即
数据经过平移后方差不变.
3.若为,如…,心的方差为那么的+方,如+力,…,的方差为岛2.
【思考辨析】
判断下列结论是否正确(请在括号中打“J”或“X”)
(1)对一组数据来说,平均数和中位数总是非常接近.(X)
(2)方差与标准差具有相同的单位.(X)
(3)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变.(J)
(4)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.(J)
【教材改编题】
1.若数据Xl,X2,…,X9的方差为2,则数据2月,2x2,…,2X9的方差为()
A.2B.4C.6D.8
答案D
解析根据方差的性质可知,数据内,X2,…,刈的方差,=2,那么数据2X1,…,
的方差为22s2=8.
2.某射击运动员7次的训练成绩分别为86,88,90,89,88,87,85,则这7次成绩的第80百分位
数为()
A.88.5B.89C.91D.89.5
答案B
解析7次的训练成绩从小到大排列为85,86,87,88,88,89,90,
7X80%=5.6,所以第80百分位数为从小到大排列的数据中的第6个数据,即89.
3.某校体育节10名旗手的身高(单位:cm)分别为175J78,176,180,179,175,176.179,180.179,
则中位数为.
答案178.5
解析把10名旗手的身高从小到大排列为175,175,176,176,178,179,179,179,180,180,
1179
则一2—=178.5,所以所求中位数为1785
题型一样本的数字特征和百分位数的估计
例1⑴从某中学抽取10名同学,他们的数学成绩如下:82,85.88,90,92,92,92.96,96,98(单位:
分),则这10名同学数学成绩的众数、第25百分位数分别为()
A.92,85B.92,88
C.95,88D.96,85
答案B
解析数据92出现了3次,出现的次数最多,所以众数是92;这组数据已经按照由小到大
的顺序排列,计算10X25%=2.5,取第三个数,所以第25百分位数是88.
延伸探究本例中,第70百分位数是多少?
92+96
解10X70%=7,第70百分位数是第7项与第8项的平均数,为「一=94.
(2)(多选)(2023•哈尔滨模拟)下面是某城市某日在不同观测点对细颗粒物(PMQ的观测值;
396275268225168166176173
188168141157
若在此组数据中增加一个比现有的最大值大25的数据,下列数字特征发生改变的是()
A.极差B.中位数
C.众数D.平均数
答案ABD
解析根据题意,若在此纽数据中增加一个比现有的最大值大25的数据,即最大值变为396
+25=421,极差为最大值与最小值的差,要发生改变;
加入数据前,中位数为^X(173+176)=174.5,加入数据后,中位数为176,发生改变;
众数为数据中出现次数最多的数,不会改变;
_12x+421_
若加入数据前,平均数为尤,加入数据后,平均数为一百一>x,发生改变.
思维升华计算一组〃个数据第〃百分位数的步骤
跟踪训练1(1)某中学高一年级8名学生某次考试的数学成绩(满分150分)分别为
85,90,93,99,101,103116,130,则这8名学生数学成绩的第75百分位数为()
A.102B.103C.109.5D.116
答案C
解析这组数据已经按照由小到大的数据排列,8X75%=6,则这8名学生数学成绩的第75
百分位数为第6个数与第7个数的平均数,即为I""6=I。".
(2)(多选)冬季奥林匹克运动会,是世界规模最大的冬季综合性运动会.臼1924年起,每四年
举办一届.2022年2月在北京举办了第24届冬季奥林匹克运动会,为了宣传奥运精神,红星
实验学校组织了甲、乙两个社团,利用一周的时间对外进行宣传,将每天宣传的次数绘制成
如图所示的频数分布折线图,则()
A.甲社团宣传次数的众数小于乙社团宣传次数的众数
B.甲社团宣传次数的极差大于乙社团宣传次数的极差
C.甲社团宣传次数的平均数大于乙社团宣传次数的平均数
D.甲社团宣传次数的方差大于乙社团宣传次数的方差
答案ABD
解析观察每天宣传次数的频数分布折线图,
甲社团宣传次数的众数、乙社团宣传次数的众数分别为2,3,A正确;
甲社团宣传次数的极差、乙社团宣传次数的极差分别为3,2,B正确;
—2+2+3+)+5+4+3—
甲社团宣传次数的平均数X1=------'―^-----^=3,乙社团宣传次数的平均数42=
2+2+3+4+3+3+4
=3,C不正确;
7
1Q
甲社团宣传次数的方差4=:yX[3X(2—3>+2X(3-3)2+(5—3产+(4—3月=亍
14
乙社团宣传次数的方差0=:yX[2X(2-3)2+3X(3-3)2+2><(4-3)2]=7,D正确.
题型二总体集中趋势的估计
例2为了讴歌中华民族实现伟大复兴的奋斗历程,增进学生对中国共产党的热爱,某学校
举办了一场党史竞赛活动,共有500名学生参加了此次竞赛活动.为了解本次竞赛活匆的成
绩,从中抽取了50名学生的成绩(成绩均为整数,满分为10()分)进行统计,所有学生的成绩
都不低于60分,将这50名学生的成绩(单位:分)进行分组,第一组[60,70),第二组[70,80),
第三组[80,90),第四组[90,100],得到如图所示的频率分布直力图.
(1)求图中机的值,并估计此次竞赛活动学生成绩的中位数;
(2)根据频率分布直方图,估计此次竞赛活动成绩的平均数.若对成绩不低于平均数的同学进
行奖励,请估计在参赛的500名学生中有多少名学生获奖.
解(1)由频率分布直方图知(0.01+〃?+0.04+0.()2)X10=1,解得机=0.03;
设此次竞赛活动学生成绩的中位数为冲,因为数据落在:60,80)内的频率为0.4,落在[60,90)
内的频率为0.8,
从而可得80Jo<90,由(xo—80)X0.04=0.5—0.4,得加=82.5,
所以估计此次竞赛活动学生成绩的中位数为82.5.
(2)由频率分布直方图及(1)知,
77=65X0.1+73X0.3+8)X0.4+95X0.2=82,
此次竞赛活动学生成绩不低于82的频率为0.2+]()~X0.4=0.52,
则获奖的学生有500X0.52=260(名),
所以估计此次竞赛活动成绩的平均数为82,在参赛的500名学生中有260名学生获奖.
思维升华频率分布直方图中的数字特征
(I)众数:最高矩形的底边中点的横坐标.
(2)中位数:中位数左边和右边的矩形的面枳和应该相等.
(3)平均数:平均数在频率分布直方图中等于各组区间的中点值与对应频率之积的和.
跟踪训练2(2022.哈尔滨模拟)治理沙漠化离不开优质的树苗,现从苗圃中随机地抽测了2(X)
株树苗的高度(单位:cm),得到如图所示的频率分布直方图.
(1)求直方图中〃的值及众数、中位数;
(2)若树苗高度在185cm及以上是可以移栽的合格树苗.从样本中用比例分配的分层随机抽
样方法抽取20株树苗作进一步研究,不合格树苗、合格树苗分别应抽取多少株?
解(l)V(O.OOl5+0.0110+0.0225+0.0300+a+0.0080+0.0020)X10=1,
人皿,185+195
A«=0.0250,众数为-5---=190,
设中位数为%,V(0.0015+0.0110+0.0225)X10=0.350.5,
(0.0015+0.0110+0.0225+0.0300)X10=0.65>0.5,
则185a<195,
0.35+0.0300X(x-185)=0.5,
/.x=190.
故。=0.0250,众数为190,中位数为190.
(2)由题意可知,合格树苗所占频率为(0.0300+0.0250+0.0080+0.0020)X10=0.65,不合
格树苗所占频率为1-0.65=0.35,
所以不合格树苗抽取20X0.35=7(株),合格树苗抽取20X0.65=13(株),
故不合格树苗、合格树苗应分别抽取7株和13株.
题型三总体离散程度的估计
例3(2021.全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项
指标有无提高,用一台旧设备和一台新设备各生产了1()件产品,得到各件产品该项指标数据
如下.
旧设备9.810.310.010.29.99.810.010.110.29.7
新设备10.110.410.110.010.110.310.610.510.410.5
旧设备和新设备生产产品的该项指标的样本平均数分别记为x和),,样本方差分别记为第
和$i.
(1)求x,y,52;
⑵判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果_y-x
2,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有
显著提高).
一1
解(1)由表格中的数据易得X=正又(-0.2+0.3+0+0.2—0.1—0.2+0+0.1+0.2—0.3)+
10.0=10.0,
~=-j^X(O.I+0.4+0.1+0+0.1+0.34-0.6+0.54-0.4+0.5)+10.0=10.3,
X[(9.7-10.0)2+2X(9.8-10.0)2+(9.9-10.0)24-2X(10.0-10.0)2+(10.1一10.0)2+
2X(10.2-l0.0)2+(10.3—10.0)2]=o.O36,
S2=]^X[(1O.O-1O.3)2+3X(1O.I-10,3)24-(10.3-10.3)2+2X(10.4-10.3)2+2X(10.5-
10.3)2+(10.6-10.3)2]=0.04.
⑵由⑴中数据可得丁-~=10.3-10.0=0.3,
而彳+()=、0.0304,
显然有丁一7>2弋寸数成立,所以认为新设备生产产品的该项指标的均值较旧设备有显著
提高.
思维升华总体离散程度的估计
标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)越大,数据的离散
程度越大:标准差(方差)越小,数据的离散程度越小.
跟踪训练3(2022.济宁模拟)甲、乙两名学生参加数学竞赛培训,现分别从他们在培讥期间
参加的若干次预赛成绩中随机抽取8次,记录如下:
甲8281797895889384
乙9295807583809085
(I)求两位学生预赛成绩的平均数和方差;
(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生.参加合适?
请说明理由.
一1
解(l).r印=3X(82+81+79+78+95+88+93+84)=85.
—1
x乙=6X(92+95+80+75+83+80+90+85)=85,
O
播=5X[(82一85)2+(81—85)2+(79—85)2+(78-85)2+(95-85)2+(88-85>+(93—85月+
(84—85月=35.5,
2
虎=!X[(92一85尸+(95一85户+(80-85>+(75一85尸+(83-85)+(80一85尸+(90一85-十
(8585产]=41.
(2)由(1)知x甲=x乙,s1<sl,
甲的成绩较稳定,所以派甲参赛比较合适.
课时精练
D基础保分练
1.为做好疫情防控工作,某校坚持落实“双测温两报告"制度,以下是某宿舍6名学生某日
上午的体温记录:36.3,36.1、36.4,36736.5,36.6(单位:℃),则该组数据的第80百分位数为()
A.36.7B.36.6C.36.5D.36.4
答案B
解析将6名学生该日上午的体温记录从小到大排列为36.1,36.3,36.4,36.5,36.6,36.7,
因为80%X6=4.8,所以该组数据的第80百分位数为366
2.(2022•南京模拟)已知组数据山,也,A3,心,内的平均数为2,方差为则另组数据
3片一2,3也一2,3冷一2,3x4—2,34一2的平均数、方差分别为()
139
-C4-4-
A.2,2B.2,1f2D.2
答案D
解析因为一组数据加,也,13,以,工5的平均数为2,方差为发
所以另一组数据3xi—2,3x2—2,3x3—2,3x4—2,3xs—2的平均数为3X2—2=4,
—9
---
22
3.(多选)成立时间少于10年、估值超过10亿美元且未上市的企业称为独角兽企业.2022年
中国新经济独角兽企业分布较广泛、覆盖居民生活的各个方面.如图为2022年中国新经济独
角兽企业TOP10()的行业分布图,在中国新经济独角兽企业TOP100榜单中,京、沪、黑三
地的企业数量共同占比达到70%.下列说法正确的是()
A.随着智能出行与共享经济观念的普及,汽车交通行、lk备受投资者关注
B.在该TOP100榜单中独角兽企业数最的中位数是3
C.在中国新经济独角兽企业TOP100榜单中,京、沪、粤三地的企业超过82家
D.2022年中国新经济独角兽企业TOP100榜单中,企业服务、汽车交通、先进制造行业的
企业数量共同占比超过30%
答案AD
解析A选项,由图可知,汽车交通行业在独角兽企业TOP100榜单中数量较多,故A选项
正确;
B选项,数据为11,10,10,10,10,9,7,6,4,4,4,4,3,2,2,2,2,则中位数为4,故B选项不正确;
C选项,100X70%=70<82,故C选项不正确;
D选项,企业服务、汽车交通、先进制造行业的企业数量共同占比为100%=
31%>30%,故D选项正确.
4.(多选)习近平总书记强调,要坚持健康第一的教育理念,加强学校体育工作,推动青少年
文化学习和体育锻炼协调发展.某学校对高一年级学生每周在校体育锻炼时长(单位:小时)
进行J'统计,得到如下频率分布表:
分组[2,3)[3,4)14,5)[5,6]
频率0.250.300.200.25
则下列关于高一年级学生每周体育锻炼时长的说法中正确的是()
A.众数约为2.5
B.中位数约为3.83
C.平均数为3.95
D.第80百分位数约为5.2
答案BCD
3+4
解析对于A,根据频率分布表可得,高一年级学生每周体育锻炼时长的众数为\一=3.5,
故A错误;
对于B,设高一年级学生每周体育锻炼时长的中位数为X,贝0.25+千三乂0.30—0.5,解得
x和3.83,故B正确;
对于C,高一年级学生每周体育锻炼时长的平均数为0.25X2.5+0.30X3.5+0.20X4.5+
0.25X5.5=3.95,故C正确:
对于D,因为0.25+0.30+0.20+0.()5=0.80,所以高一年级学生每周体育般炼时长的第80
百分位数约为5+蝶=52,故D正确.
5.(多选)笫24届冬奥会于2022年2月4日在国家体育场鸟巢举行了盛人开幕式.在冬奥会
的志愿者选拔工作中,某高校承办了面试工作,面试成绩满分100分,现随机抽取了80名候
选者的面试成绩并分为五组,绘制成如图所示的频率分布直方图,则下列说法正确的是(每组
数据以区间的中点值为代表)()
A.b的值为0.25
B.候选者面试成绩的中位数约为69.4
C.在被抽取的候选者中,成绩在区间[65,75)之间的候选者有30人
D.估计候选者的面试成绩的平均数约为69.5
答案BD
解析对于A,il(0.005+/74-0.0454-0.024-0.005)X10=1,解得〃=0.025,故A错误;
对于B,设候选者面试成绩的中位数为x,则(0.005+0.025)><10+。-65)X0.045=0.5,解得
469.4,故B正确;
对于C,成绩在区间[65,75)的频率为0.045X10=0.45,故人数为成义0.45=36,故C错误;
对于D,50X0.005X10+60X0.025X10+70X0.045X10+80X0.02X10+90X0.005X10=
69.5,故D正确.
6.(2023・云南师大附中模拟)根据气象学上的标准,连续5天的日平均气温低于10℃即为入
冬,将连续5天的日平均温度的记录数据(记录数据都是自然数)作为一组样本,现有4组样
本①,②,③,④,依次计算得到结果如下:
①平均数;<4;
②平均数;<4且极差小于或等于3;
③平均数:<4且标准差sW4;
④众数等于5且极差小于或等于4.
则4组样本中一定符合入冬指标的共有()
A.1组B.2组C.3组D.4组
答案B
解析①举反例:0,0.0,4,11,其平均数:=3<4.但不符合入冬指标;
②假设有数据大于或等于10,由极差小于或等于3可知,
则此组数据中的最小值为10-3=7,此时数据的平均数必然大于7,与彳<4矛盾,故假设
错误.则此组数据全部小于10.符合入冬指标;
③举反例:1,1,1,1,11,平均数工=3<4,且标准差s=4.但不符合入冬指标;
④在众数等于5且极差小于等于4时,最大数不超过9.符合入冬指标.
7.(2022•福州模拟)电影《长津湖》点燃了人们心中对英雄的崇敬之情,也更加显示出如今和
平生活的来之不易.某影院记录了观看此片的70位观众的年龄,其中年龄位于区间[10,20)
内的有10位,位于区间[20,30)内的有20位,位于区间[30,40)内的有25位,位于区间[40,50]
内的有15位,则这70位观众年龄的众数的估计值为.
答案35
解析由于25>20>15>10,故众数位于区间[30,40)内,所以众数的估计值为双产=35.
8.(2023•沧州模拟)已知某样本数据分别为123,〃,6,若样本平均数7=3,则样本方差?
答案T
解析由题设,得1=-------------=3,可得4=3,所以代立区一工)2=学
i=l
9.(2023・南通模拟)某学校对高•某班的同学进行了身高(单位:cm)调查,将得到的数据进行
适当分组后(除最后一组为闭区间外其余每组为左闭右开区间),画出如图所示的频率分布直
方图.
(1)求m的值;
(2)估计全班同学身高的中位数;
(3)估计全班同学身高的平均数及方差(同一组中的数据用该组区间的中点值作代表).
解(1)由频率分布直方图可得(加+0.010+0.010+0.015+0.040)。10=1,解得加=0.025.
(2)设全班同学身高的中位数为工,由题可知165,175),得0.10+0.15+(x-165)X0.040=
0.5,
解得x=17L25,
故估计全班同学身高的中位数为171.25.
(3)估计全班同学身高的平均数为150X0.10+160X0.15-1-170X0.404-180X0.25+190X0.10
=171,
估计全班同学身高的方爰为(150—171)2X0.10+(160—171)2X0.15+(170-171)2X0.40+
(18()—171)2X0.25+(190—171)2X0.10=119.
10.对参加某次数学竞赛的1000名选手的初赛成绩(满分:100分)作统计,得到如图所示的
频率分布宜方图.
(1)根据直方图完成以下表格:
成绩[50,60)[60,70)[70,80)[80,90)[90,100]
频数
⑵求参赛选手初赛成绩的平均数及方差(同一-组中的数据用该组区间的中点值作代表):
⑶如果从参加初赛的选手中选取380人参加复赛,那么如何确定进入复赛的选手成绩?
解(1)填表如下:
成绩[50,60)[60,70)[70,80)180,90)[90,100]
频数5015035()350100
(2)平均数为55X0.05+65X0.15+75X0.35+85X0.35+95X0.1=78,
2
方差为(55-78/义0.05+(65-78)2X0.15+(75-78)X0.35+(85-781><0.35+(95一
78)2X0.1=101.
(3)进入复赛的选手成绩为80+逆二喘二幽X10=82(分),
所以初赛成绩为82分及以上的选手均可进入复赛.(说明:回答82分以上,或82分及以上
均可)
0综合提升练
H.(2022•天津模拟)某校扑球社的同学为训练动作组织了垫排球比赛,以下为根据排球社50
位同学的垫球个数画的频率分布直方图,所有同学垫球数都在5〜40之间.估计垫球数的样
本数据的第75百分位数是()
A.17.5B.18.75C.27D.28
答案D
解析垫球数在区间[5,25)内的人数占总数的(0.01+0.01+0.04+0.06)X5义100%=60%,
垫球数在区间[5,30)内的人数占总数的(0.01+0.01+0.04—0.06+0.05)X5X100%=85%;
所以第百分位数位于区间)内,且22^
75[25,3025+5X0.85-0.6"
所以估计垫球数的样本数据的第75百分位数是28.
12.(2022・上海模拟)若等差数列{x'}的公差为3,则汨,也,用,…,刈的方差为.
答案60
解析由等差数列{为}的公差为3,可知三=且上告二土二"=5—="3=不
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 养老机构食堂责任制度
- 卫生院岗位责任制度范本
- 军休主体责任制度汇编范本
- 医院配电室岗位责任制度
- 铝材厂污染防治责任制度
- 石楼县粮食责任制度汇编
- 电力安全责任制度范本
- 生产调度工作责任制度
- 文物安保分包责任制度
- 机械厂厂长岗位责任制度
- 《大学物理绪论》课件
- 2024年“新华三杯”全国大学生数字技术大赛备赛试题库(含答案)
- 《金属材料与热处理(第8版)》中职全套教学课件
- 浙江农村信用社招聘-2025杭州富阳农商银行校园招聘社会招聘笔试备考题库及答案解析
- DL∕T 2495-2022 电站减温减压装置选型导则
- DL∕T 1071-2023 电力大件运输规范
- 二轮复习:《七年级下册重要图片解读》
- 管理会计学( 第10版 )课程教学大纲
- 新媒体编创-图文 短视频 直播(微课版)PPT完整全套教学课件
- 新里程大学英语听说教程谭思坦课后部分参考答案
- 1-船舶碰撞应急预案(预案-001)
评论
0/150
提交评论