版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
专题5.1统计【清单01】几个概念总体:统计中所考察对象的全体叫做总体.个体:总体中的每一个考察对象叫做个体.样本:从总体中抽取的一部分个体叫做样本.样本容量:样本的个体的数目叫做样本容量.【清单02】简单随机抽样(1)定义:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫做简单随机样本.(2)常用方法:抽签法和随机数法.【清单03】分层抽样(1)在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.(2)分层抽样的应用范围当总体是由差异明显的几个部分组成时,往往选用分层抽样.【清单04】数据的数字特征1.最值:一组数据的最大值与最小值,反映这组数据的极端情况.2众数:一组数据出现次数最多的数叫众数,众数反应一组数据的多数水平;3.中位数:一组数据中间的数,(起到分水岭的作用)中位数反应一组数据的中间水平;4.平均数:反应一组数据的平均水平;5.百分位:一般地,一组数据的第p百分位是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.6.极差:即一组数据中最大值和最小值的差.7.方差:s2=eq\f(1,n)[(x1-eq\x\to(x))2+(x2-eq\x\to(x))2+…+(xn-eq\x\to(x))2],方差是和中心偏离的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差.在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定.方差的简化计算公式:s2=eq\f(1,n)[(xeq\o\al(2,1)+xeq\o\al(2,2)+…+xeq\o\al(2,n))-neq\x\to(x)2]或写成s2=eq\f(1,n)(xeq\o\al(2,1)+xeq\o\al(2,2)+…+xeq\o\al(2,n))-eq\x\to(x)2,即方差等于原数据平方的平均数减去平均数的平方.8.标准差是样本数据到平均数的一种平均距离,一般用s表示,通常用以下公式来计算s=eq\r(\f(1,n)[x1-\x\to(x)2+x2-\x\to(x)2+…+xn-\x\to(x)2])标准差是方差的算术平方根,意义在于反映一个数据集的离散程度.标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度和离散程度的大小.标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小.【清单05】数据的直观表示1.柱形图(条形图):建立直角坐标系,用横轴(横轴上的数字)表示样本数据类型,用纵轴上的单位长度表示一定的数量,根据每个样本(或某个范围内的样本)的数量多少画出长短不同的等宽矩形,然后把这些矩形按照一定的顺序排列起来,这样一种表达和分析数据的统计图称为条形图.2.折线图:建立直角坐标系,用横轴上的数字表示样本值,用纵轴上的单位长度表示一定的数量,根据样本值和数量的多少描出相应各点,然后把各点用线段顺次连接,得到一条折线,用这种折线表示出样本数据的情况,这样的一种表示和分析数据的统计图称为折线图.3.扇形图:用一个圆表示总体,圆中各扇形分别代表总体中的不同部分,每个扇形的大小反映所表示的那部分占总体的百分比的大小,这样的一种表示和分析数据的统计图称为扇形图.4.茎叶图茎叶图是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.①“叶”位置只有一个数字,而“茎”位置的数字位数一般不需要统一;②茎叶图上重复出现的数据要重复记录,不能遗漏.【清单06】频数分布直方图与频率分布直方图1.频数分布直方图的画法第一步:求极差,决定组数和组距,组距=eq\f(极差,组数);第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表.第四步:做出有关图示2.频率分布直方图(1)找出最值,计算极差:即一组数据中最大值和最小值的差.(2)合理分组,确定区间:决定组距与组数:将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.这时应注意:①一般样本容量越大,所分组数越多;②为方便起见,组距的选择应力求“取整”;③当样本容量不超过100时,按照数据的多少,通常分成5~12组.④将数据分组:按组距将数据分组,分组时,各组均为左闭右开区间,最后一组是闭区间.(3)整理数据(4)做出有关图示.【清单07】用样本估计总体常用结论与知识拓展1.频率分布直方图与众数、中位数、平均数的关系(1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.2.平均数、方差的公式推广(1)若数据x1,x2,…,xn的平均数为eq\x\to(x),那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是meq\x\to(x)+a.(2)若数据x1,x2,…,xn的方差为s2,那么①数据x1+a,x2+a,…,xn+a的方差也为s2;②数据ax1,ax2,…,axn的方差为a2s2.【考点题型一】简单随机抽样【例1】(23-24高一下·福建宁德·阶段练习)某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号分别为01,02,…,50,从中抽取5个样本,下面提供随机数表的第1行到第2行:66
67
40
37
14
64
05
71
11
05
65
09
95
86
68
76
83
20
37
9057
16
03
11
63
14
90
84
45
21
75
73
88
05
90
52
23
59
43
10若从表中第1行第7列开始向右依次读取数据,则得到的第5个样本编号是.【变式1-1】(2024高三·全国·专题练习)在对101个人进行一次抽样时,先采用抽签法从中剔除1个人,再在剩余的100个人中随机抽取10个人,那么下列说法正确的是(
)A.这种抽样方法对于被剔除的个体是不公平的,因为他们失去了被抽到的机会B.每个人在整个抽样过程中被抽到的机会均等C.由于采用了两步进行抽样,所以无法判断每个人被抽到的可能性是多少D.每个人被抽到的可能性不相等【变式1-2】(2024高三·全国·专题练习)为了了解某地参加计算机水平测试的5000名学生的成绩,从中抽取了200名学生的成绩进行调查分析,在这个问题中,被抽取的200名学生的成绩是(
)A.总体 B.个体C.样本 D.样本量【变式1-3】(22-23高二上·陕西咸阳·开学考试)省农科站要检测某品牌种子的发芽率,计划采用随机数表法从该品牌800粒种子中抽取60粒进行检测,现将这800粒种子编号如下001,002,…,800,若从随机数表第8行第7列的数7开始向右读,则所抽取的第4粒种子的编号是.(如下是随机数表第8行至第9行)63
01
63
78
59
16
95
55
67
19
98
10
50
71
75
12
86
73
58
07
44
39
52
38
79
33
21
12
34
29
78
64
56
07
82
52
42
07
44
38
15
51
0
13
42
99
66
02
79
54【变式1-4】(23-24高一下·四川内江·阶段练习)总体由编号为1,2,⋯,99,100的100个个体组成,现用随机数法选取60个个体,利用电子表格软件产生的若干个1~100范围内的整数随机数的开始部分数据,如下表,则选出来的第5个个体的编号为8
44
2
17
8
31
57
4
55
688
8
31
47
7
21
76
33
50
63【考点题型二】分层抽样中的计算问题【例2】(22-23高三上·云南曲靖·阶段练习)珠江源位于云南东部曲靖市以北47公里处,整个景区由马雄山珠江源、花山湖和城区部分景点组成,总面积50平方公里.珠江源风景区是森林公园、省级风景名胜区、国际水利风景名胜区.景区森林茂密,溪流淙淙,有“一水滴三江,一脉隔双盘”的奇异景观.其美景吸引着大批的游客前往参观,某旅行社分年龄段统计了前往珠江源的老、中、青旅客的人数比为5:2:3,现使用分层随机抽样的方法从这些旅客中随机抽取n名,若青年旅客抽到90人,则下列说法正确的是(
)A.被抽到的老年旅客和中年旅客人数之和超过200B.n=300C.中年旅客抽到40人D.老年旅客抽到150人【变式2-1】(24-25高三上·河南许昌·期中)唐代以来,牡丹之盛,以“洛阳牡丹甲天下”的美名流传于世.唐已知根据花瓣类型可将牡丹分为单瓣类、重瓣类、千瓣类三类,现有牡丹花n朵,千瓣类比单瓣类多30朵,采用分层抽样方法从中选出12朵牡丹进行观察研究,其中单瓣类有4朵,重瓣类有2朵,千瓣类有6朵,则n=(
)A.360 B.270 C.240 D.180【变式2-2】(24-25高二上·四川成都·期中)某校高一年级有900名学生,现用比例分配的分层随机抽样方法抽取一个容量为81的样本,其中抽取男生和女生的人数分别为45,36,则该校高一年级的女生人数为(
)A.350 B.400 C.500 D.550【变式2-3】(24-25高二上·四川成都·阶段练习)某学校高二年级选择“物化生”,“物化地”和“史地政”组合的同学人数分别为240,90和120.现采用分层抽样的方法选出30位同学进行某项调查研究,则“史地政”组合中选出的同学人数为(
)A.8 B.12 C.16 D.6【变式2-4】(23-24高一下·广东茂名·阶段练习)某工厂生产三种不同型号的产品,它们的产量之比为,用分层抽样的方法抽取一个容量为的样本.若样本中型号的产品有120件,则样本容量为(
)A.150 B.180 C.200 D.250【考点题型三】数据的数字特征【例3】(23-24高一下·江苏无锡·期末)已知一组数据满足,则下列说法正确的是(
)A.这组数据的40%分位数是B.的平均数小于的平均数C.的方差大于的方差D.的极差小于的极差【变式3-1】(24-25高二上·山东青岛·期中)为了了解某班学生数学成绩,利用分层随机抽样抽取了一个10人的样本,统计如下表:则可估计全班学生数学的平均分和方差分别为(
)学生数平均分方差男生6804女生4752A.77.5,9.2 B.77.5,11 C.78,9.2 D.78,11【变式3-2】(24-25高二上·四川成都·期中)2024年度最具幸福感城市调查推选活动于9月16日正式启动,在100个地级及以上的候选城市名单中,成都市入选.“幸福感指数”是指某个人主观地评价他对自己目前生活状态满意程度的指标,常用区间内的一个数来表示,该数越接近10表示满意度越高,现随机抽取10位成都市居民,他们的幸福感指数分别为4,5,6,7,7,7,8,8,9,9,则下列说法错误的是(
)A.该组数据的第60百分位数为7.5 B.该组数据的极差为5C.该组数据的平均数为7.5 D.该组数据的中位数为7【变式3-3】(24-25高一上·四川雅安·开学考试)已知一组数据8,5,x,8,10的平均数是8,以下说法错误的是()A.极差是5 B.众数是8 C.中位数是9 D.方差是2.8【变式3-4】(24-25高一上·湖南永州·开学考试)为了迎接中国共产党建党一百周年,某班50名同学进行了党史知识竞赛,测试成绩统计如下表,其中两个数据被遮盖.成绩\分919293949596979899100人数■■1235681012下列关于成绩的统计量中,与被遮盖的数据无关的是(
)A.平均数,方差 B.中位数,方差 C.中位数,众数 D.平均数,众数【考点题型四】数据的直观表示【例4】(多选)(25-26高一上·全国·课后作业)为倡导健康生活方式,某大学社团联合学生会倡议全校学生参与“每日万步行”健走活动.如图为该校甲、乙两名同学在同一星期内每日步数的折线统计图,则下列说法正确的是(
)A.这一星期内甲的日步数的中位数小于乙的日步数的中位数B.这一星期内甲的日步数的平均数大于乙的日步数的平均数C.这一星期内乙的日步数的标准差小于甲的日步数的标准差D.这一星期内乙的日步数的第75百分位数是12400【变式4-1】(多选题)(23-24高一下·四川乐山·期末)小刘一周的总开支分布如图①所示,该周的食品开支如图②所示,则以下说法正确的是(
)A.娱乐开支比通信开支多5元B.日常开支比食品中的肉类开支多100元C.娱乐开支金额为100元D.肉类开支占储蓄开支的【变式4-2】(多选)(23-24高一下·重庆巫山·期末)某学校对高一学生选科情况进行了统计,发现学生选科仅有物化生、政史地、物化地、物化政、生史地五种组合,其中选考物化地和物化政组合的人数相等,并绘制得到如下的扇形图和条形图,则(
)A.该校高一学生总数为B.该校高一学生中选考物化政组合的人数为96C.该校高一学生中选考物理的人数比选考历史的人数多D.用比例分配的分层随机抽样方法从该校高一学生抽取人,则生史地组合抽取人【变式4-3】(多选)(24-25高三上·河北邯郸·开学考试)某公司计划组织秋游活动,定制了一套文化衫,女职工需要不同尺码文化衫的频数如图.根据图中数据,下列结论正确的是(
)A.文化衫尺码的众数为187 B.文化衫尺码的平均数为165C.文化衫尺码的方差为28 D.文化衫尺码的中位数为165【变式4-4】(多选)(22-23高二上·浙江温州·开学考试)甲、乙两个跑步爱好者利用微信运动记录了去年下半年每个月的跑步里程(单位:公里),现将两人的数据绘制成如图所示的折线图,则下列结论中正确的是()A.甲跑步里程的极差等于110B.乙跑步里程的中位数是270C.分别记甲、乙下半年每月跑步里程的平均数为,,则D.分别记甲乙下半年每月跑步里程的标准差为,,则【考点题型五】频率分布直方图中的数字特征【例5】(多选)(23-24高一下·江苏常州·期末)某校1000名学生在高一测试中数学成绩的频率分布直方图如图所示(同一组中的数据用该组区间的中点值作代表),则(
)
A.B.约有200人的成绩不低于110分C.约有60人的成绩低于70分D.本次考试的平均分约为93.6分【变式5-1】(24-25高二上·内蒙古赤峰·阶段练习)某大学生暑假到工厂参加劳动,生产了100件产品,质检人员测量其长度(单位:厘米),将所得数据分成6组:,得到如图所示的频率分布直方图,则对这100件产品,下列说法中不正确的是(
)
A.B.长度的平均数是93C.长度的中位数一定落在区间内D.长度落在区间内的个数为35【变式5-2】(24-25高二上·黑龙江齐齐哈尔·期中)某次数学考试后,为分析学生的学习情况,某校从某年级中随机抽取了100名学生的成绩,整理得到如图所示的频率分布直方图.则下列说法错误的是(
)
A.估计该年级学生成绩的众数约为75B.C.估计该年级学生成绩的75百分位数约为85D.估计该年级成绩在80分及以上的学生成绩的平均数约为87.50【变式5-3】(23-24高一下·河北张家口·期末)某时间段公路上车速的频率分布直方图如图所示,则(
)
A. B.车速的众数估计值是70C.车速的平均数估计值大于其中位数的估计值 D.车速的中位数估计值是62.5【变式5-4】(24-25高二上·湖北·阶段练习)某校组织50名学生参加庆祝中华人民共和国成立75周年知识竞赛,经统计这50名学生的成绩都在区间内,按分数分成5组:,得到如图所示的频率分布直方图(不完整),根据图中数据,下列结论错误的是(
)A.成绩在上的人数最少B.成绩不低于80分的学生所占比例为C.50名学生成绩的极差为50D.50名学生成绩的平均分小于中位数【考点题型六】频率分布直方图的应用【例6】(23-24高一下·广东广州·阶段练习)某公司为了解用户对其产品的满意程度,从地区随机抽取了名用户,从地区随机抽取了名用户,请用户根据满意程度对该公司产品评分,该公司将收集到的数据按照、、、分组,绘制成评分频率分布直方图如图.(1)从地区满意程度评分的第百分位数;(2)根据频率分布直方图,假设同组中的每个数据用该区间的中点值代替,估计地区抽取的名用户对该公司产品的评分的平均值为,地区抽取的名用户对该公司产品的评分的平均值为,以及两地区抽取的名用户对该公司产品的评分的平均值为,试比较和的大小.【变式6-1】(23-24高一下·青海·期末)为了解某批零件的质量,质检员从这批产品中随机抽取100件产品,测量它们的直径(单位:mm),根据测量所得数据,将其按分成5组,得到如图所示的频率分布直方图.
(1)估计这批零件的直径的中位数;(2)已知这批零件共有10000件,若零件的直径在内为优等品,估计这批零件中优等品的件数.【变式6-2】(2024高一下·江苏·专题练习)某工厂人员及月工资构成如下:人员经理管理人员高级
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 培训认购合同范本
- 墙纸加盟合同范本
- 2025年无人零售店投资可行性研究报告
- 2025年慢性病管理服务项目可行性研究报告
- 控股公司协议合同
- 教师三方协议合同
- 搏击队员合同范本
- 日杂采购合同范本
- 旧宅变卖合同范本
- 旷工免责合同范本
- 测绘地理信息安全保密管理制度
- 智慧树知道网课《外国文学史(山东联盟)》课后章节测试满分答案
- 污水处理极端天气应急预案
- 静脉留置针冲封管课件
- 2025ESC心肌炎与心包炎管理指南解读
- 办公室节约课件
- 2025-2026秋学生国旗下演讲稿:第17周呵护心灵拥抱阳光成长-心理健康教育
- 无尘室管理办法文件
- 压力性损伤疑难病例讨论
- 2024年中国火电在线监测行业调查报告
- 儿童心理健康疾病的治疗与康复
评论
0/150
提交评论