版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第5节统计
知识点一、抽样
1、抽样调查
(1)总体:统计中所考察对象的某一数值指标的全体构成的集合称为总体.
(2)个体:构成总体的每一个元素叫做个体.
(3)样本:从总体中抽取若干个个体进行考察,这若干个个体所构成的集合叫做总体的一个样本,样
本中个体的数目叫做样本容量.
2、简单随机抽样
(1)定义
一般地,设一个总体含有N个个体,从中逐个不放回地抽取〃个个体作为样本QnMN),如果每次抽
取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫
做简单随机样本.
(2)两种常用的简单随机抽样方法
①抽签法:一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器
中,搅拌均匀后,每次从中抽取一个号签,连续抽取〃次,就得到一个容量为〃的样本.
②随机数法:即利用随机数表、随机数骰子或计算机产生的随机数进行抽样.这里仅介绍随机数表法.随
机数表由数字0,1,2,…,9组成,并且每个数字在表中各个位置出现的机会都是一样的.
注意:为了保证所选数字的随机性,需在查看随机数表前就指出开始数字的横、纵位置.
(3)抽签法与随机数法的适用情况
抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况,但是当总体容量
很大时,需要的样本容量也很大时,利用随机数法抽取样本仍不方便.
(4)简单随机抽样的特征
①有限性:简单随机抽样要求被抽取的样本的总体个数是有限的,便于通过样本对总体进行分析.
②逐一性:简单随机抽样是从总体中逐个地进行抽取,便于实践中操作.
③不放回性:简单随机抽样是一种不放回抽样,便于进行有关的分析和计算.
④等可能性:简单单随机抽样中各个个体被抽到的机会都相等,从而保证了抽样方法的公平.
只有四个特点都满足的抽样才是简单随机抽样.
3、分层抽样
(1)定义
一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的
个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.
分层抽样适用于已知总体是由差异明显的几部分组成的.
1/11
(2)分层抽样问题类型及解题思路
①求某层应抽个体数量:按该层所占总体的比例计算.
②已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算.
③分层抽样的计算应根据抽样比构造方程求解,其中“抽样比=学"尊=评学鳖”
总体容量各层个体数量
注意:分层抽样时,每层抽取的个体可以不一样多,但必须满足抽取q="•丝(i=1,2,…,左)个个体
(其中,是层数,"是抽取的样本容量,N,是第i层中个体的个数,N是总体容量).
知识点二、用样本估计总体
1、频率分布直方图
(1)频率、频数、样本容量的计算方法
①等x组距=频率.
组距
②工整£=频率,磐=样本容量,样本容量X频率=频数•
样本容量频率
③频率分布直方图中各个小方形的面积总和等于1.
2、频率分布直方图中数字特征的计算
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的.设中位数为X,利用x左(右)侧矩形面积之
和等于05,即可求出X.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形
底边中点的横坐标之和,即有X=+X]0[+…+,其中X”为每个小长方形底边的中点,。"为每个小
长方形的面积.
3、百分位数
(1)定义
一组数据的第。百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至
少有(100-p)%的数据大于或等于这个值.
(2)计算一组〃个数据的的第p百分位数的步骤
①按从小到大排列原始数据.
②计算i=nxp%.
③若,不是整数而大于,的比邻整数j,则第p百分位数为第/项数据;若,是整数,则第p百分位数为
第i项与第i+1项数据的平均数.
(3)四分位数
我们之前学过的中位数,相当于是第50百分位数.在实际应用中,除了中位数外,常用的分位数还有
2/11
第25百分位数,第75百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位
数.
4、样本的数字特征
(1)众数、中位数、平均数
①众数:一组数据中出现次数最多的数叫众数,众数反应一组数据的多数水平.
②中位数:将一组数据按大小顺序依次排列,把处在最中间位置的一个数据(或最中间两个数据的平
均数)叫做这组数据的中位数,中位数反应一组数据的中间水平.
③平均数:n个样本数据占应,%的平均数为-=■+%+…+%,反应一组数据的平均水平,公式
n
n_
变形:Z/=nx.
Z=1
5、标准差和方差
(1)定义
①标准差:标准差是样本数据到平均数的一种平均距离,一般用s表示.假设样本数据是否,9,
表示这组数据的平均数,则标准差5=.-[(%[-X)2+(尤2-孑+...+X-X)2].
Vn
②方差:方差就是标准差的平方,即S2=」(X「X)2+(X2-X)2+-+(X“-X)2].显然,在刻画样本数据
n
的分散程度上,方差与标准差是一样的.在解决实际问题时,多采用标准差.
(2)数据特征
标准差、方差描述了一组数据围绕平均数波动程度的大小.标准差、方差越大,则数据的离散程度越
大;标准差、方差越小,数据的离散程度越小.反之亦可由离散程度的大小推算标准差、方差的大小.
(3)平均数、方差的性质
如果数据否,9,……,毛的平均数为"方差为S',那么
①一组新数据无1+b,x2+b,xn+6的平均数为x+6,方差是Y.
②一组新数据叼,依2,...,%的平均数为ax,方差是a2s2.
22
③一组新数据ax1+b,ax2+b,...+6的平均数为ax+b,方差是as.
题型一随机抽样、分层抽样
【例1】现要完成下列2项抽样调查:
①从10盒酸奶中抽取3盒进行食品卫生检查;
②东方中学共有160名教职工,其中教师120名,行政人员16名,后勤人员24名.为了了解教职工对学
校在校务公开方面的意见,拟抽取一个容量为20的样本.
较为合理的抽样方法是()
A.①抽签法,②分层随机抽样B.①随机数法,②分层随机抽样
3/11
C.①随机数法,②抽签法D.①抽签法,②随机数法
【例2】某工厂为了对产品质量进行严格把关,从500件产品中随机抽出50件进行检验,对这500件产品
进行编号001,002,…,500,从下列随机数表的第二行第三组第一个数字开始,每次从左往右选取三个数
字,则抽到第四件产品的编号为()
283931258395952472328995
721628843660107343667575
943661184479514096949592
601749514068751632414782
A.447B.366C.140D.118
【例3】为了庆祝中国共产党第二十次全国代表大会,学校采用按比例分配的分层随机抽样的方法从高一
1002人,高二1002人,高三1503人中抽取126人观看“中国共产党第二十次全国代表大会”直播,那么高
三年级被抽取的人数为()
A.36B.42C.50D.54
题型二统计图表
【例1】(2023•上海)如图为2017-2021年上海市货物进出口总额的条形统计图,则下列对于进出口贸易
B.从2018年开始,进出口总额逐年增大
C.从2018年开始,进口总额逐年增大
D.从2018年开始,2020年的进出口总额增长率最小
4/11
【例2】(2017•新课标m)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年
1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.
O1234567891011121234567891011121234567S9101112
2014年2015年2016年
根据该折线图,下列结论错误的是()
A.月接待游客量逐月增加
B.年接待游客量逐年增加
C.各年的月接待游客量高峰期大致在7,8月
D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳
【例3】(多选题)某公司经营五种产业,为应对市场变化,在五年前进行了产业结构调整,优化后的产业
结构使公司总利润不断增长,今年总利润比五年前增加了一倍,调整前后的各产业利润与总利润的占比如
A.调整后传媒的利润增量小于杂志
B.调整后房地产的利润有所下降
C.调整后试卷的利润增加不到一倍
D.调整后图书的利润增长了一倍以上
5/11
题型三频率分布直方图
频率分布直方图的数字特征
1.众数:最高矩形的底边中点的横坐标.
2.中位数:中位数左边和右边的矩形的面积和应该相等.
3.平均数:平均数在频率分布直方图中等于各组区间的中点值与对应频率之积的和.
【例1】(2022•天津)将1916年到2015年的全球年平均气温(单位:°C),共100个数据,分成6组[13.55,
13.75),[13.75,13.95),[13.95,14.15),[14.15,14.35),[14.35,14.55),[14.55,14.75],并整理得
到如下的频率分布直方图,则全球年平均气温在区间[14.35,14.75]内的有()
【例2】(2021•甲卷)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收
入的调查数据整理得到如下频率分布直方图:
根据此频率分布直方图,下面结论中不正确的是()
A.该地农户家庭年收入低于4.5万元的农户比率估计为6%
B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%
C.估计该地农户家庭年收入的平均值不超过6.5万元
D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
6/11
[例3](2023•新高考H)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显
差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:
患病者未患病者
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判
定为阴性,此检测标准的漏诊率是将患病者判定为阴性的概率,记为〃(c);误诊率是将未患病者判定为
阳性的概率,记为q(c).假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
(1)当漏诊率p(c)=0.5%时,求临界值c和误诊率q(c);
(2)设函数/(c)=p(c)+q(c).当ce[95,105],求/(c)的解析式,并求/(c)在区间[95,105]
的最小值.
题型四百分位数
【例1】以下数据为参加数学竞赛决赛的15人的成绩(单位:分),分数从低到高依次:
56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,则这15人成绩的第80百分位数是
【例2】为了养成良好的运动习惯,某人记录了自己一周内每天的运动时长(单位:分钟),分别为53,57,
45,61,79,49,x,若这组数据的第80百分位数与第60百分位数的差为3,则x=()
A.58或64B.59或64C.58D.59
7/11
题型五样本的数字特征
1.平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.
2.方差的简化计算公式:?=%(x;+*+…+片)-后\或写成s?+*+…+4-/,即方差等于原
数据平方的平均数减去平均数的平方.
【例1】(2017•新课标I•多选)为评估一种农作物的种植效果,选了"块地作试验田.这"块地的亩产量
(单位:炮)分别是否,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()
A.再,x?,…,x〃的平均数B.再,x2,的标准差
C.占,x2,...,x〃的最大值D.再,赴,…,》”的中位数
【例2】(2021•新高考II•多选)下列统计量中,能度量样本玉,/,…,%的离散程度的有()
A.样本再,工2,%〃的标准差B.样本再,x2,...»X〃的中位数
C.样本再,x2,...»的极差D.样本再,x2,...»的平均数
【例3】(2023•新高考I•多选)有一组样本数据玉,x2,…,4,其中国是最小值,血是最大值,则()
A.x2,x3,x4,工5的平均数等于玉,工2,工6的平均数
B.x2,x3,x4,%的中位数等于%,的中位数
X99
C.X2,X3,x4,工5的标准差不小于项,2"工6的标准差
X9
D.x2,X3,x4,工5的极差不大于再,2…,工6的极差
【例4】(多选题)有一组样本数据:%,%2,…,/,其平均数为2,由这组样本数据得到新样本数据:再,々,…,/,2,
那么这两组样本数据一定有相同的()
A.平均数B.中位数C.方差D.极差
8/11
题型六分层方差问题
分层随机抽样的方差:设样本容量为〃,平均数为亍,其中两层的个体数量分别为,两层的平均数分
别为斗可,方差分别为则这个样本的方差为§2=&[§;+(%—可2卜公[y+伉—可2.
【例1】某车间有甲、乙两台机床同时加工直径为100cm的零件,为检验质量,从中各抽取6件,测得甲、
乙两组数据的均值为福=生=100,两组数据的方差分别为s,=l,则估计该车间这批零件的直径
的方差S2=
【例2】某校高三年级有男生400人和女生600人,为分析期末物理调研测试成绩,按照男女比例通过分层
随机抽样的方法取到一个样本,样本中男生的平均成绩为80分,方差为10,女生的平均成绩为60分,方
差为20,由此可以估计该校高三年级期末物理调研测试成绩的方差为.
【例3】湖州地区甲、乙、丙三所学科基地学校的数学强基小组人数之比为3:2:1,三所学校共有数学强基
学生48人,在一次统一考试中,所有学生的成绩平均分为117,方差为21.5.已知甲、乙两所学校的数学
强基小组学生的平均分分别为118和114,方差分别为15和21,则丙学校的学生成绩的方差是.
9/11
题型七利用样本的数字特征解决优化决策问题
【例1】(2021•乙卷)某厂研制了「种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,
用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
旧设备9.810.310.010.29.99.810.010.110.29.7
新设备10.110.410.110.010.110.310.610.510.410.5
旧设备和新设备生产产品的该项指标的样本平均数分别记为了和歹,样本方差分别记为s;和s;.
⑴求五,y,s;,其;
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果歹-亍》24徐卫,则认为新设
备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).
【例2】(2019•新课标0)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠
随机分成/、8两组,每组100只,其中N组小鼠给服甲离子溶液,8组小鼠给服乙离子溶液.每只小鼠
给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分
比.根据试验数据分别得到如图直方图:
•频率/组距[频率/组距
a---------------------------
0.30-------------1
60
S5
0
O.5
O.
。
1.52.53.54.55.56.57.5百分比
甲离子残留百分比直方图乙离子残留百分比直方图
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.
(1)求乙离子残留百分比直方图中0,6的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
10/11
【例3】
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年排他性仓储管理服务合同书
- 2026年注册城乡规划师之城乡规划管理与法规试题预测试卷附参考答案详解(A卷)
- 全周期外卖平台运营合同书
- 2025年湖北荆州市八年级地生会考真题试卷+解析及答案
- 2025年7月住院医师规范化培训《内科》习题库+答案(附解析)
- 建筑工地物料管理细则
- 电子组装厂品质管控办法
- 家政员入户安全意识培训教案
- 《走进物联网》教案-2025-2026学年浙教版(新教材)初中信息技术七年级下册
- 稻纵卷叶螟统防统治作业标准
- 机器人操作系统(ROS2)入门与实践 课件全套 第1-12章 Linux Ubuntu入门基础 -基于ROS2的综合应用
- DL∕T 2340-2021 大坝安全监测资料分析规程
- 2024年陕西省西安市灞桥区西安国际港务区铁一中陆港初级中学陆港分校小升初分班考数学试题
- DB11T 489-2024 建筑基坑支护技术规程
- 《春夜喜雨》完美版课件
- 2021年山东省淄博市中考生物真题
- GB/T 38537-2020纤维增强树脂基复合材料超声检测方法C扫描法
- GB/T 28037-2011信息技术投影机通用规范
- GA/T 1400.2-2017公安视频图像信息应用系统第2部分:应用平台技术要求
- 多维阅读第4级Animal Fathers 动物爸爸 课件
- 颈动脉超声检查课件
评论
0/150
提交评论