用样本估计总体(讲义)-2026年高考数学一轮复习原卷版_第1页
用样本估计总体(讲义)-2026年高考数学一轮复习原卷版_第2页
用样本估计总体(讲义)-2026年高考数学一轮复习原卷版_第3页
用样本估计总体(讲义)-2026年高考数学一轮复习原卷版_第4页
用样本估计总体(讲义)-2026年高考数学一轮复习原卷版_第5页
已阅读5页,还剩10页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专题9.2用样本估计总体(举一反三讲义)

【全国通用】

题型归纳

【题型1百分位数的求解】.............................................................................3

【题型2样本的数字特征】.............................................................................4

【题型3总体集中趋势的估计】.........................................................................4

【题型4总体离散程度的估计】.........................................................................6

【题型5分层抽样中的方差问题】.......................................................................7

【题型6其他统计图表中反映的集中趋势与离散程度】..................................................8

1、用样本估计总体

考点要求真题统计考情分析

2023年新高考I卷:第9题,从近几年的高考情况来看,高考对

5分用样本估计总体的考查比较稳定,多以

⑴会用统计图表对总体进行

2023年全国乙卷(文数、理选择题、填空题的形式出现,考查百分

估计,会求〃个数据的第"百

数):第17题,10分位数、平均数、中位数、众数、方差等

分位数

2025年全国二卷:第1题,5知识,难度不大;在解答题中出现时,

⑵能用数字特征估计总体集

分•般会与其他知识结合考查,综合性强,

中趋势和总体离散程度

2025年上海卷:第17题,14难度中等,需要灵活求解,复习时要加

分强对相关知识的理解.

知识梳理

知识点用样本估计总体

1.总体百分位数的估计

(1)8^

一般地,一组数据的第〃百分位数是这样一个值,它使得这组数据中至少有〃%的数据小于•或等于这个值,

且至少有(10()-〃)%的数据大于或等于这个值.

(2)求解步骤

可以通过下面的步骤计算一组〃个数据的第p百分位数:

第I步,按从小到大排列原始数据.

第2步,计算i=〃xp%.

第3步,若i不是整数,而大于i的比邻整数为/,则第〃百分位数为第/项数据;若「•是整数,则第〃百分

1/15

位数为第,.项与第(汁1)项数据的平均数.

2.频率分布直方图的数字特征

⑴众数:众数一般用频率分布表中频率最高的一组的组中值来表示,即在样本数据的频率分布直方图中,

最高小长方形的底边中点的横坐标;

(2)空位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等:

⑶平均数:平均数在频率分布表中等于组中值与对应频率之积的和.

3.总体集中趋势的估计

在初中的学习中我们已经了解到,平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画

了一组数据的集中趋势.具体概念回顾如下:

名称概念

如果有〃个数巾,X2,…,X”,那么!⑶+方+…+2)就是这组数据

平均数

-1

的平均数,用土表示,即2=%(为+/2+…+四).

将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据

中位数(当数据个数是奇数对)或最中间两个数据的平均数(当数据个数是偶

数时)称为这组数据的中位数.

一组数据中出现次数最多的数据(即频数最大值所对应的样本数据)称

众数

为这组数据的众数.

4.总体离散程度的估计

(1)方差和标准差

假设一组数据是而,不,…,X”,用工表示这组数据的平均数,则我们称5s[(为-为这组数据的

n=I

方差.有时为了计算方差的方便,我们还把方差写成:自看2-7的形式

FJ=1

我们对方差开平方,取它的算数平方根1)2,称为这组数据的标准差.

(2)总体(样本)方差和总体标准差

①一般式:如果总体中所有个体的变量值分别为匕,力,…,Y”,总体平均数为匕则总体方差S2==

£>匕一歹)2.

/=|

②加权式:如果总体的N个变量值中,不同的值共有"(AWN)个,不妨记为匕,匕,…,八,其中匕出

现的频数为/泊=1,2,…,%),则总体方差为(匕一歹尸.

总体标准差:s=,尹.

(3)标准差与方差的统计意义

①标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离

散程度越小.

2/15

②在刻画数据的分散程度上,方差与标准差是•样的,但在解决实际问题时,•般多采用标准差.

③标准差(方差)的取值范围为[0,+8).若样本数据都相等,表明数据没有波动幅度,数据没有离散性,则标准

差为0.反之,标准差为0的样本,其中的数据都相笠.

5.频率分布直方图中的统计参数

(1)频率分布直方图中的“众数”

根据众数的意义可知,在频率分布直方图中最高矩形中的某个(些)点的横坐标为这组数据的众数L般用中点

近似代替.

(2)频率分布直方图中的“空位数”

根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,

在频率分布直方图中,中位数左逅和右边的直方图的面积应该相等,由此可估计中位数的值.

(3)频率分布直方图中的“平均数”

平均数是频率分布直方图的“重心”.因为平均数可以表示为数据与它的频率的乘积之和,所以在频率分布直

方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.

【方法技巧与总结】

1.若为K2,…4的平均数为天,那么/叼+凡〃曝+〃,,\%”+〃的平均数为“1+".

2.数据R甩,…现与数据汇=莺+。,4=4十4二,,匕=乙+。的方差相等,即数据经过平移后方差不变.

3.若XIK2,…K"的方差为$2,那么+瓦。0+6,…,+〃的方差为42s2

举一反三

【题型1百分位数的求解】

【例1】(2025•河北秦皇岛•三模)数据16,22,13,14,25,17,18,19,21,10的第70百分位数是()

A.18B.19C.20D.21

【变式1-11(2025•广西・模拟预测)为落实“双碳”目标,某环保组织调研1()个国家2024年度的人均碳排放

强度(单位:吨/人•年),得到数据如下:2,4,5,7,8,9,11,12,13,15.则该组数据的30%分位数

是()

A.6B.7C.8D.9

【变式1-2](2025•甘肃定西•模拟预测)某品牌电动汽车公司为了解车主:使用电动车辅助驾驶功能的情况,

进行了问卷调查,从中抽取了100位车主进行抽样分析,得出这100位车主每人在100次驾驶途中使用辅

助驾驶功能的次数的频率分布直方图,则样本中车主使用辅助驾驶功能次数的40%分位数为()

3/15

A.62B.64C.66D.68

【变式1-3](2025•四川巴中•二模)以下数据为参加数学竞赛决赛的15人的成绩:(单位:分)

82,75,76,88,90,83,85,86,96,87,60,100,89,92,93,则这15人成绩的第80百分位数是()

A.92B.92.5C.93D.91.5

【题型2样本的数字特征】

【例2】(2025•全国二卷•高考真题)样本数据2,8,14,16,20的平均数为()

A.8B.9C.12D.18

【变式2-1】(2025•山东聊城•三模)已知数据x,9,7,9的中位数和平均数相等,那么%的值为()

A.5B.7C.5或9D.7或II

【变式2-2](2025•辽宁•二模)某同学测得连续7天的最低气温(均为整数)分别为-6,1,-2,t,2,1,

5(单位:P),若这组数据的平均数与中位数相等,贝亚二()

A.5B.6C.10D.11

【变式2-3](2025•河北张家口•一模)数据2,3,8,5,4,2的中位数和平均数分别为()

A.3.5和2B.3和4C.4和2D.3.5和4

【题型3总体集中趋势的估计】

【例3】(2025・山西•二模)4正悄然改变着我们的生活.某在线平台利用//技术为学生提供个性化学习路径,

为了解学生对平台的满意程度.随机抽取使用该平台的学生进行打分,将收集到的分数数据按照

[30,40),[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]分组,画出频率分布直方图如图所示,则这些数

据的中位数约为()

本频率/组距

A.85B.8()C.77.5D.75

【变式3-1】(2025•河南郑州•三模)4月23日是“世界读书日”,全社会都参与到阅读中来,形成爱读书,读

好书,善读书的浓厚氛围.某中学共有3000名学生,为了了解学生书籍阅读量情况,该校从全校学生中随

4/15

机抽取200名,统计他们2024年阅读的书籍数量,由此来估计该校学生当年阅读书籍数量的情况,下列估

计中正确的是()

(注:同一组数据用该组区间的中点值作为代表)

上频率/组距

0.10--1—

0.07

0.06

0.015

0.005

->

()48121620本数

A.阅读量的众数估值为8B.阅读量的中位数估值为6.5

C.阅读量的平均数估值为6.76D.阅读量的第70百分位数估值为8.86

【变式3-2](24-25高一下甘肃平凉开学考试)为进一步弘扬中华优秀传统文化,提升诗词爱好者的素养

和创作水平,形成浓厚的国学和诗词学习氛围,2024年9月19日,首届“中华诗韵・风雅平凉”彦军杯诗词

大赛决赛在剧院成功举行.为了解参赛者对此次活动的满意度,某研究性学习小组用问卷调查的方式随机

调杳了几名参赛者,该小组将收集到的参赛者满意度分值数据(满分100分)统计如下表所示:

分数[50,60)[60,70)[70,80)(80,90)[90,100)

频数51020b35

频率0.05a().2()().3()().35

频率/组距

O.o35

O.o30

O.o25

OS.o20

o15

OS.o10

"O05

So60708090100^

(1)分别求防b,几的值,并在图中的出频率分布直方图;

(2)估计n名参赛者满意度分值的众数、平均数和第75百分位数(结果保留整数).

5/15

【变式3-3](2025•内蒙占呼和浩特•一模)为了解甲、乙两种农药在某种绿植表面的残留程度,进行如卜.试

验:将100株同种绿植随机分成小8两组,每组50株,其中A组绿植喷甲农药,3组绿植喷乙农药,每株

绿植所喷的农药体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在绿植表面的百分

比,根据试验数据分别得到如图直方图:

甲农药残留百分比直方图乙农药残留百分比直方图

记C为事件:“乙农药戏用在表面的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.

(1)求乙农药残留百分比直方图中G,b的值;

(2)估计甲农药残留百分比的平均数(同一组中的数据用该组区间的中点值为代表);

(3)估计乙农药残留百分比的中位数.(保留2位小数)

【题型4总体离散程度的估计】

【例4】(2025・山东•三模)某班成立了力、8两个数学兴趣小组,力组10人,8组30人,经过一周的补习

后进行了一次测试,在该测试中,力组平均成绩为130分,方差115,8组平均成绩为110分,方差为215,

则在这次测试中,全班学生的平均成绩和方差为()

A.115分,105B.115分,265

C.120分,105D.120分,265

【变式4-1](2025•广东深圳•二模)下列各组数据中方差最大的一组是()

A.6»6,6,6»6B.5,5,6,7,7

C.4,5,6,7,8D.4,4,6,8,8

【变式4-2](2025砌北,模拟预测)若一组数据修,犯,…,5的平均值元=5,方差$2=32,若删去一个数之

6/15

后,平均值没有改变,方差变为“,则这组数据的个数n=()

A.5B.6C.7D.8

【变式4-3](2025•江西,二模)甲、乙、丙、丁四位同学分别记录了5个正整数数据,根据下面四名同学的

统计结果,可以判断出所有数据一定都不小于20的同学人数是()

甲同学:中位数为22,众数为20

乙同学:中位数为25,平均数为22

丙同学:第40百分位数为22,极差为2

丁同学:有一个数据为30,平均数为24,方差为10.8

A.1B.2C.3D.4

【题型5分层抽样中的方差问题】

【例5】(2025•浙江•模拟预测)为调查中某校学生每天学习的时间,采用样本量比例分配的分层随机抽样,

现抽取高一学生400人,其每天学习时间均值为8小时,方差为0.5,抽取高二学生600人,其每天学习时

间均值为9小时,方差为0.8,抽取高三学生1000人,其每天学习时间均值为10小时,方差为1,则估计

该校学生每天学习时间的方差为()

A.1.25B.1.35C.1.45D.1.55

【变式5-1】(2025・浙江•三模)在对某校高三学生体质健康状况某个项目的调杳中,采用样本量比例分配的

分层随机抽样,如果不知道样本数据,只知道抽取了男生80人,女生120人,其方差分别为15,10,由此

估计样本的方差不可熊为()

A.11B.13C.15D.17

【变式5-2](2025•江西鹰潭•一模)某单位为了解职工体重情况.采用分层随机抽样的方法从800名职工中

抽取了一个容量为80的样本.其中,男性平均体重为64千克,方差为151:女性平均体重为56千克,方

差为159,男女人数之比为5:3,则单位职工体重的方差为()

A.166B.167C.168D.169

【变式5-3】(2025•全国•模拟预测)已知总体划分为3层,通过分层随机抽样,各层抽取的样本容量分别为

%,n2,n3,样本平均数分别为五,莅,西,样本方差分别为sj,s,,若ni:n2:n3=1:2:3,则()

A.而:石:石=1:2:3

B.s;:S2:S3=1:4:9

C.总体样本平均数元=君+2环+3石

7/15

D.当而=石=石时,总体方差s?=+Js:

o3Z

【题型6其他统计图表中反映的集中趋势与离散程度】

【例6】(2025•宁夏银川•模拟预测)为了普及环保知识,增强环保意识,某学校分别从甲、乙两个班各抽取

5位同学参加环保知识测试,得分(十分制)情况如图所示,则下列描述不正确的是()

「频数

3-

2~

0345678910得分

甲组乙组

A.两组数据的平均数都是6分

B.两组数据的中位数都是6分

C.两组数据的极差相等

D.甲组成绩的方差小于乙组成绩的方差

【变式6-1](2025・四川绵阳•三模)某家电公司生产了48两种不同型号的空调,公司统计了某地区2024

年的前6个月这两种型号空调的销售情况,得到销售量的折线统计图如图所示,分析这6个月的销售数据,

下列说法不正确的是()

八万台

——力型号

—8型号

0一月二月三月四月五月六月前

A.力型号空调月销售量的极差比8型号空调月销售量的极差大

B.4型号空调月平均销售量比B型号空调月平均销售量大

C.4型号空调月销售量的上四分位数比B型号空调销售屋的上四分位数大

D.A型号空调月销售量的方差比8型号空调月销售量的方差小

【变式6-2](2025•湖北武汉•模拟预测)某地统计了辖区内从2017年至2024年这8年的新能源汽车和纯电

动汽车的销量(单位:百辆),得到如下折线图:

8/15

百辆木

600

528

…•…新能源一纯电动

现对2021年至2024年这4年的数据进行分析,设新能源汽车的销量数据和纯电动汽车的销量数据的方差

分别为s彳和冬,新能源汽车的销量数据和纯电动汽车的销量数据的年平均增长率分别为pi和P2,则()

A.B.

C.si<s^,px>p2D.s:>s;,pi>p2

【变式6-3](2025・四川成都•一模)中国营养学会把走路称为“最简单、最优良的锻炼方式”,它不仅可以帮

助减肥,还可以增强心肺功能、血管弹性、肌肉力量等,甲、乙两人利用手机记录了去年下半年每个月的走路

里程(单位:公里),现将两人的数据绘制成如图所示的折线图,则下列结论中错误的是()

A.甲走路里程的极差等于II

B.乙走路里程的中位数是27

C.甲下半年每月走路里程的平均数大于乙下半年每月走路里程的平均数

D.甲下半年每月走路里程的标准差大于乙下半年每月走路里程的标准差

过关测试

一、单选题

9/15

1.(2025•河北唐山•模拟预测)数据:1,2,3,4,5,6,7,8,9,1()的30%分位数是()

A.2.5B.3C.3.5D.4

2.(2025•河北保定•三模)一组数据按从小到大排列为2,4,6,m13,14,如果该组数据的中位数与这

组数据的第60百分位数相等,则该组数据的平均数为()

A.7.5B.6C.4.5D.3

3.(2025•海南省直辖县级单位•模拟预测)某中学从高一学生中抽取了50名男生,50名女生调查高一学生

身高的情况.其中50名男生身高的平均数为172.5cm,方差为16,50名女生身高的平均数为162.5cm,方差

为30,那么这100名学生身高的方差为()

A.30B.38C.48D.58

4.(2025•广.东广州•模拟预测)某学校高三学生共有900人,其中男生500人,为获取该校高三学生的身

高信息,现采用按性别比例分配的分层随机抽样的方法,抽取了容量为90的样本.计算得男生样本的身高均

值为170,方差为19,女生样本的身高均值为161,方差为19,则下列说法正确的是()

A.抽取男生的样本量为40

B.估计该校高三学生身高的均值为165

C.抽样时女生甲被抽到的概垄为春

D.估计该校高三学生身高的方差为19

5.(2025•河北邯郸一模)己知力组数据“孙%2,…,和B组数据“以,>2,…(m,nGe[5,+co))

的平均数分别为80,90,方差分别为15,20,若TH=4TI,则由4B这两组数据构成的所有数据的总体方差

为()

A.15B.32C.35D.42

6.(2025•天津和平•二模)某人工智能公司为优化新开发的语言模型,在其模型试用人群中开展满意度问

卷调查,满意度采用计分制(满分100分),统计满意度并绘制成如下频率分布直方图,图中m=2兀,则

A.n=0.015

10/15

B.满意度计分的众数约为75分

C.满意度计分的平均分约为79分

D.满意度计分的第25百分位数约为70分

7.(2025•辽宁大连•模拟预测)已知甲、乙两组数据如下表所示,则下列结论中表述正确的是()

序号12345678910

甲82838182769183888993

乙68808872898895749071

A.甲组数据的极差大于乙组数据的极差

B.甲组数据的方差小于乙组数据的方差

C.甲组数据的中位数大于乙纤数据的中位数

D.甲组数据的平均数小于乙组数据的平均数

8.(2025•全国•模拟预测)为了解某学校学生每周阅读课外书籍的数量,采用样本量比例分配的分层随机

抽样方法.现抽取高一学生20人,其每周阅读课外书籍数量的均值为4本,方差为4;抽取高二学生30人,

其每周阅读课外书籍数量的均值为3本,方差为2.则该学校高一、高二学生每周阅读课外书籍数量的总体

均值和方差分别是()

A.总体平均数为3.4本,总体方差为3.24B.总体平均数为3.5本,总体方差为3.04

C.总体平均数为3.4本,总体方差为3.04D.总体平均数为3.5本,总体方差为3.24

二、多选题

9.(2025•广东广州•模拟预测)一家水果店的店长为了解本店苹果的日销售情况,记录了过去7天苹果的

日销售量(单位:kg),结果如下:95,84,85,99,88,93,86,则这7天苹果FI销售量的()

A.第80百分位数为93B.平均数为90

C.极差为15D.方差为28

10.(2025•陕西西安•一模)某校举办“学党史守初心,践使命担责任''党史知识竞赛,并将2000名师生的

竞赛成绩(满分100分,成绩取整数)整理成如图所示的频率分布直方图,则()

O405060708090100成绩/分数

11/15

A.a=0.005B.估计成绩低于50分的有2()人

C.估计这组数据的众数为75D.估计这组数据的第75百分位数为82

11.(2025•广东广州•模拟预测)北京时间2024年9月22日,全国射击锦标赛(步枪项目)男子10m气步

枪决赛进行.在巴黎奥运会摘得双金的“干饭哥''盛李豪,以251.6环的成绩夺冠,实现了全锦赛三连冠.盛李

豪在预赛就有着非常稳健的发挥,6轮比分分别打出了106.4环、105.4环、105.3环、105.2环、106环和

105.4环的成绩,以633.7环的成绩排名预赛所有参赛选手第1位,则()

A.该组数据的中位数为105.4

B.该组数据的25%分位数为105.2

C.若该组数据去掉一个最高分和一个最低分,则这组数据的平均数不变

D.若该组数据去掉一个最高分和一个最低分,则这组数据的方差变小

三、填空题

12.(2025・海南•模拟预测)样本数据20,19,17,16,22,24,26的下四分位数是.

13.(2025・陕西・模拟预测)己知一组数据按从小到大的顺序排列为2,4,6,若该组数据的第60百

分位数与这组数据的中位数相等,则实数a的值为.

14.(2025•河南•三模)在对某中学高三年级学生体重(单位:kg)的调查中,按男、女生人数比例用分层

随机抽样的方法抽取部分学生进行测量,已知抽取的男生有50人,其体重的平均数和方差分别为54,20,

抽取的女生有40人,其体重的平均数和方差分别为45,11,则估计该校高三年级学生体重的方差为.

四、解答题

15.(2025•江西景德镇•模拟预测)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各

块稻田的亩产量(单位:kg)并整理如下表.

亩产

[900,950)[950,1000)[1000,1050)[1050,1100)[1100,1150)[1150,1200)

频数1()112230207

记这100块稻田亩产量的平均值的估计值为七标准差的估计值为s.(同一组中的数据用该组区间的中点值

为代表)

(1)求焉s2;

(2)判断该新型水稻能否推广种植(在这100块稻田中,若超过90块稻田的亩产量在@-£芝+孩)内,则

认为该新型水稻能推广种植)

12/15

16.(2025・宁夏•一模)某制药厂生产一种治疗流感的药物,该药品有效成分的标准含量为10mg/片.由于

升级了生产工艺,需检验采用新工艺生产的药品的有效成分是否达标,现随机抽取了生产的10片药品作为

样本,测得其有效成分含量如下:9.7,10,9.7,9.6,9.7,9.9,10.2,10.1,10,10.1.

(1)计算样本的平均数7和方差s2;

(2)判断采用新工艺生产的药品的有效成分是否达标(若庭-10|>3.25册,则认为采用新工艺生产的药品

的有效成分不达标;反之认为达标).

17.(2025・上海崇明•一模)王老师将全班4()名学生的高一数学期中考试(满分1()0分)成绩分成5组,

绘制成如图所示的频率分布直方图,现将[50,60)记作第一组,[60,70)、[70,80)、[80,90)、[90,100]分别记

作第二、三、四、五组.已知第一组、第二组的频率之和为()3第一组和第五组的频率相同.

八频率/组距

0.045........................

h.....T—

0.020..............................

一O'3060To80Soibo应绩(分)

(1)估计此次考试成绩的平均值

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论