第1节 随机抽样、统计图表_第1页
第1节 随机抽样、统计图表_第2页
第1节 随机抽样、统计图表_第3页
第1节 随机抽样、统计图表_第4页
第1节 随机抽样、统计图表_第5页
已阅读5页,还剩13页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第九章

DIJ1UZH/KNG统计与成对数据的统计分析

第1节随机抽样、统计图表

考试要求1.理解随机抽样的必要性和重要性.2.会用简单随机抽样方法从总体中

抽取样本,了解分层随机抽样方法,掌握分层随机抽样的样本均值和样本方差.3.

理解统计图表的含义.

知识诊断•基础夯实

【知识梳理】

1.简单随机抽样

(1)简单随机抽样:分为放回简单随机抽样和不放回简单随机抽样.

(2)简单随机样本:通过简单随机抽样获得的样本称为简单随机样本.

(3)简单随机抽样的常用方法:抽签法和随机数法是比较常用的两种方法.

2.分层随机抽样

(1)分层随机抽样的概念

一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于

一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取

的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体

称为层.

(2)比例分配的分层随机抽样所获得样本的均值与方差

利用比例分配的分层(两层)随机抽样获得的样本中,第一层的样本量为,,均值

为笛,方差为正;第二层的样本量为均值为此,方差为,当则总的样本均值x

——生一XI+一空—X2,总的样本方差S2=—£一|5l+(X1—X)21+一空一国土也2—

十〃2---小十〃2一十〃2---------十〃2---------

3.统计图表

⑴常见的统计图表有条形图、扇形图、折线图、频数分布直方图、频率分布直方

图等.

(2)频率分布表、频率分布直方图的制作步骤及意义

即一组数据中最大值与最小

值的差

组数代髓,若k£Z,则组数

决定组跑为k,若k&Z、则组数为不小于

V组

A的最小整数

解数据各组均为左闭右开区间,最后

1分组」一组是闭区间

一般分四列:分细、频数累计、

列频率频数、频率,最后一行是合计,

、分布表

其中频数合计应是样本量,频

率合计应是1

在频率分布直方图中,纵轴表

示舞,数据落在各小组内的

画频率

分布占

、方图/频率用各小长方形的面积来

表示,告小长方形的面积的总

和等于1

[常用结论]

1.不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.

2.分层随机抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比.

频率

3.频率分布直方图中小长方形高=瓦宙.

【诊断自测】

1.思考辨析(在括号内打“J”或“X”)

⑴简单随机抽样中,每个个体被抽到的机会不一样,与先后有关.()

(2)抽签法和随机数法都是简单随机抽样.()

(3)分层随机抽样中,每个个体被抽到的可能性与层数及分层有关.()

(4)频率分布直方图中,小长方形的面积越大,表示样本数据落在该区间的频率越

大.()

答案(1)X(2)V(3)X(4)V

解析(1)简单随机抽样中,每个个体被抽到的机会一样,与先后无关.

(3)分层随机抽样中,每个个体被抽到的可能性与是数及分层无关.

2.(必修二P224Tl改编)为了了解某地参加计算机水平测试的5000名学生的成绩,

从中抽取了200名学生进行调查分析,在这个问题中,被抽取的200名学生成绩

是()

A.总体B.个体

C.样本D.样本量

答案C

解析由题意可得200名学生成绩是样本.

3.已知某地区有小学生12000人,初中生11000人,高中生9000人,现在要了

解该地区学生的近视情况,准备抽取320人进行调查,则应该抽取小学生、初中

生、高中生的人数分别是_______.

答案120,110,90

解析小学生、初中生、高中生人数的比例为12000:11000:9000=12:11:9,

1?11

故抽取的小学生、初中生、高中生的人数分别为.+]]+9乂320=120,修+]]+9

9

X320=110,12+11+9X320=90.

4.(必修二Pl84Tl改编)己知23名男生的平均身高是170.6cm,27名女生的平均

身高是160.6cm,则这50名学生的平均身高为cm.

答案165.2

考点突破•题型剖析

考点一简单随机抽样

例1(1)下列抽取样本的方式属于简单随机抽样的个数为()

①从无限多个个体中抽取10()个个体作为样本.

②盒子里共有80个零件,从中抽取5个零件进行质量检验.在抽样时,从中任意

拿出一个零件进行质量检验后再把它放回盒子里.

③从20件玩具中一次性抽取3件进行质量检验.

④某班有56名同学,指定其中个子最高的5名同学参加学校组织的篮球赛.

A.OB.1

C.2D.3

答案A

解析①不是简单随机抽样,因为被抽取样本的总体的个数是无限的,而不是有

(2)(多选)要考察某种品牌的850颗种子的发芽率,利用随机数表法抽取50颗种子

进行实验.先将850颗种子按001,002,…,850进行编号,如果从随机数表第2

行第2列的数开始并向右读,下列选项中属于最先检验的4颗种子中一个的是

(下面抽取了随机数表第1行至第3行)()

03474373863696473661469863716233261680456011141095

97749467744281145720425332373227073607512451798973

16766227665650267107329079785313553858598897541410

A.774B.946

C.428D.572

答案ACD

解析最先检验的4颗种子符合条件的为774,428,114,572,选ACD.

考点一分层随机抽样

角度1分层随机抽样的比例分配

例2(多选)(2023・新余模拟)在《九章算术》第三章“衰分”中有如下问题:“今

有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百

钱,欲以钱多少衰出之,问各几何?”其译文为“今有甲持56()钱,乙持350钱,

丙持18()钱,甲、乙、丙三人一起出关,关税共1()0钱,要按照各人带钱多少的

比例进行交税,问三人各应付多少税?”下列说法正确的是()

A.甲应付51孺钱

B.乙应付32裔钱

C.丙应付16需钱

D.三者中甲付的钱最多,丙付的钱最少

答案ACD

解析依题意由分层随机抽样可知,

甲、乙、丙出钱的比例为560:350:180=56:35:18,

则甲应付:器X100=51儡(钱);

乙应付:磊X100=32备(钱卜

丙应付:孺X100=16荒(钱).故选ACD.

感悟提升分层抽样中有关计算的方法

〃、批洋该层样本量〃该层抽取的个体数

(1)于田秤比一总样本量%~该层的个体数.

⑵在分层随机抽样中,如果第一层的样本量为加,平均值为为第二层的样本量

为〃,平均值为),,则样本的平均值为筹誓.

角度2分层随机抽样的样本均值与样本方差

例3(1)某学校高一年级共有3个班,1班有30人,优秀率为30%,2班有35人,

优秀率为60%,3班有35人,优秀率为40%,则该校高一年级学生的优秀率为

答案44%

解析某学校高一年级共有三个班,按优秀率进行评选:

1班30人,优秀率30%,2班35人,优秀率60%,三班35人,优秀率40%,则

30X30%+35X60%+35X40%

高一年级优秀率为

30+35+35°,

(2)某工厂新、旧两条生产线的产量比为7:3,为了解该工厂生产的一批产品的质

量情况,采用比例分配的分层随机抽样的方法从两条生产线抽取样本并计算得:

新生产线生产的产品的质量指标的均值为1(),方差为1;旧生产线生产的产品的

质量指标的均值为9,方差为2,据此估计该批产品的质量指标的均值为,

方差为.

答案9.71.51

解析根据两条生产线的产量比为7:3,且新生产线质量指标的均值为10,方差

为1,旧生产线质量指标的均值为9,方差为2,

计算该批产品的质量指标的均值为x=W;X(10X7+9><3)=9.7;

/IJ

37

则所求的方差$2=中[2+(9—9.7)2]+亍*[1+(10—9.7)2]=1.51.

训练2(1)(2023・潍坊质检)某学校参加志愿服务社团的学生中,高一年级有50人,

高二年级有30人,高三年级有20人,现用分层随机抽样的方法从这100名学生

中抽取部分学生组成一个活动小组,已知从高二年级的学生中抽取了6人,则从

高三年级的学生中应抽取的人数为.

答案4

解析设从高三年级的学生中抽取的人数为x,则余=今,解得了=4.

JU^\J

⑵为了解学生的课外阅读情况.某校采用比例分配的分层随机抽样的方法对高中

三个年级的学生进行平均每周课外阅读时间(单位:小时)的调查,所得样本数据

如下:

年级抽样人数样本平均数样本方差

高一4053.5

高二2

30X2

高二303si

已知高中三个年级的总样本平均数为4.1,总样本方差为3.14,则高二年级学生的

样本平均数口=,高三年级学生的样本方差,0=.

答案41.5

解析由高中三个年级学生的总样本平均数为4.1,

_丁万40X5+3052+30X3

可何―40+30+3。­=4.1,解得X2=4;

因为总样本方差为3.14,

所以瑞义[3.5+(5—4.1)2]+需X[2+(4—4.1)2]+需X尻+(3—4.1月=3.14,

解得s4=1.5.

考点三统计图表

角度1扇形图、条形图

例4(多选)某中学组织三个年级的学生进行“庆祝中国共产党成立100周年”党

史知识竞赛.经统计,得到前200名学生分布的饼状图(如图)和前200名中高一学

生排名分布的频率条形图(如图),则下列选项正确的是()

前200名学生分布的饼状图

高二

30%高一

45%

高三

25%

前200名中高一学生排名分布的频率条形图

A.成绩前200名的200人中,高一人数比高二人数多3()

B.成绩第1〜1()0名的100人中,高一人数不超过一半

C.成绩第1〜50名的50人中,高二最多有32人

D.成绩第51〜100名的50人中,高二人数比高一的多

答案ABC

解析由饼状图知,成绩前200名的200人中,高一人数比高二人数多200X(45%

-30%)=3(),A正确;

由条形图知高一学生在前200名中,前10()和后1()()人数相等,因此成绩第1〜

100名的100人中,高一人数为200X45%X0.5=45V50,B正确;

成绩第1〜50名的50人中,高一人数为200X45%X0.2=18,因此高三最多有

32人,C正确;

第51〜100名的50人中,高一人数为200X45%X0.3=27,高二最多有23人,

因此高二人数比高一少,D错误.

角度2折线图

例5(多选)我国新冠疫情防控进入常态化,各地有序推进复工复产,下面是某地

连续11天复工复产指数折线图,下列说法正确的是()

A.这11天复工指数和复产指数均逐日增加

B.这11天期间,复产指数增量大于复工指数的增量

C.第3天至第11天复工复产指数均增大都超过80%

D.第9天至第11天复产指数增量大于复工指数的增量

答案CD

解析由图可知,第1天到第2天复工指数减少,第7天到第8天复工指数减少,

第10天到第11天复工指数减少,第8天到第9天复产指数减少,故A错误;

由图可知,第一天的复产指数与复工指数的差大于第11天的复产指数与复工指数

的差,所以这11天期间,复产指数增量小于复工指数的增量,故B错误;

由图可知,第3天至第11天复工复产指数均超过8()%,故C正确;

由图可知,第9天至第11天复产指数增量大于复工指数的增量,故D正确.

角度3频率分布直方图

例6随机抽取100名学生,测得他们的身高(单位:cm),按照区间[160,165),

[165,170),[170,175),[175,180),[180,185]^,得到样本身高的频率分

布直方图如图所示.

0.02

0.01

----------------------——

16016517017518()1"身高/cm

(1)求频率分布直方图中x的值及身高在170cm及以上的学生人数;

⑵将身高在[170,175),[175,180),[180,185]区间内的学生依次记为A,B,C

三个组,用分层随机抽样的方法从这三个组中抽取6人,求这三个组分别抽取的

学生人数.

解(1)由频率分布直方图可知5X(0.07+x+0.04+0.02+0.01)=l,

解得x=0.06,

身高在170cm及以上的学生人数为100X5X(0.06+0.04+0.02)=60.

(2)A组人数为100X5X0.06=30,

B组人数为100X5X0.04=20,

C组人数为100X5X0.02=10,

由题意可知A组抽取人数为30X:=3,

B组抽取人数为20X=2,

JUI。^\JIJL\J

C组抽取人数为10乂30+:)+10=1.

感悟提升1.通过扇形图可以很清楚地表示出各部分数量同总数之间的关系.

2.折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于

显示在相等时间间隔下数据变化的趋势.

3.频率分布直方图的数据特点:

(1)频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵

轴上的数据是各组的频率,不要和条形图混淆.

(2)频率分布直方图中各小长方形的面积之和为1,这是解题的关键,常利用频率

分布直方图估计总体分布.

训练3⑴已知我市某居民小区户主人数和户主对户型结构的满意率分别如图1和

图2所示,为了解该小区户主对户型结构的满意程度,用分层抽样的方法抽取3()%

的户主进行调查,则样本量和抽取的户主对四居室满意的人数分别为()

A.240,18B.200,20

C.240,20D.200,18

答案A

解析样本量〃=(25()+15()+400)X30%=240,

抽取的户主对四居室满意的人数为15()X3()%X40%=18.

⑵(2023・南昌调研)从某小区抽取100户居民进行月用电量调查,发现其用电量都

在50度至350度之间,频率分布直方图如图.

频率

组距

0.0060——---------——

x------------------------------

0.0036-----------——

0.0024——].....................................

0.0012...........................................―|

°5010()15()20025030()350月用1也的度

①直方图中X的值为;

②在这些用户中,月用电量落在区间[100,250)内的户数为.

答案©0.0044②70

解析①由频率分布直方图知数据落在[200,250)内的频率为1—(0.0024+0.003

6+0.0060+0.0024+0.0012)X50=0.22,

022

于是x——0.0044.

J\J

②因为数据落在[100,250)内的频率为

(0.0036+0.0060+0.0044)X50=0.7,

所以所求户数为0.7X100=70.

分层精练•巩固提升

【A级基础巩固】

1.下列情况中,适合用全面调查的是()

A.检查某人血液中的血脂含量

B.调查某地区的空气质量状况

C.乘客上飞机前的安检

D.调查某市市民对垃圾分类处理的意识

答案C

解析乘客上飞机前的安检适合用全面调查,只有确认每一名乘客所携带的物品

都安全才能保证航班安全.

2.要完成下列两项调查:(1)某社区有100户高收入家庭,210户中等收入家庭,

90户低收入家庭,从中抽取100户调查购买力的某项指标;(2)从某中学高二年级

的10名体育特长生中抽取3人调查学习负担情况应采取的抽样方法是()

A.(l)(2)都用简单随机拍样法

B.(l)用分层随机抽样法,(2)用简单随机抽样法

C.(l)用简单随机抽样法,(2)用分层随机抽样法

D.⑴⑵都用分层随机拍样法

答案B

解析(1)中收入差距较大,采用分层随机抽样法较合适;

(2)中总体容量较小,采用简单随机抽样法较合适.

3.在对101个人进行一次抽样时,先采用抽签法从中剔除1个人,再在剩余的100

个人中随机抽取10个人,那么下列说法正确的是()

A.这种抽样方法对于被剔除的个体是不公平的,因为他们失去了被抽到的机会

B.每个人在整个抽样过程中被抽到的机会均等

C.由于采用了两步进行抽样,所以无法判断每个人被抽到的可能性是多少

D.每个人被抽到的可能性不相等

答案R

解析由于第一次剔除时采用抽签法,对每个人来说可能性相等,然后随机抽取

10人对每个人的机会也是均等的,所以总的来说每个人的机会都是均等的,被抽

到的可能性都是相等的.

4.从某班50名同学中选出5人参加户外活动,利用随机数表法抽取样本时,先将

5()名同学按()1,02,…,5()进行编号,然后从随机数表的第1行第5列和第6

列数字开始从左往右依次选取两个数字,则选出的第5个个体的编号为()

注:表为随机数表的第1行与第2行

03474373863696473661469863716297

74246792428114572042533237321676

A.24B.36

C.46D.47

答案A

解析由题知,从随机数表的第1行第5列和第6列数字开始,依次选取43,36,

47,46,24.

5.从一个容量为根(〃?23,mWN)的总体中抽取一个容量为3的样本,当选取简单

随机抽样方法抽取样本时,总体中每个个体被抽中的可能性是小则选取分层随机

抽样方法抽取样本时,总体中每个个体被抽中的可能性是()

B4

c.1

D-3

答案D

解析・・•随机抽样每个个体被抽到的概率相等,

・,・选取分层随机抽样方法抽取样本时总体中每个个体被抽中的概率仍为上

6.(多选)某学校为了调查学生在一周生活方面的支出情况,抽出了一个样本量为〃

的样本,其频率分布直方图如图所示,其中支出在[50,60)元的学生有60人,则

下列说法正确的是()

。"鲤频率...

0.024-------------------------

0.010.....................

20304;)5;)6;)支出

A.样本中支出在[50,60)元的频率为0.03

B.样本中支出不少于40元的人数为132

C.n的值为200

D.若该校有2()0()名学生,则一定有600人的支出在[5(),60)元

答案BC

解析在A中,样本中支出在[50,60)元的频率为

1-(0.010+0.024+0.036)X10=0.3,故A错误;

在C中,,产200,故〃的值为200,故C正确;

U.UJ入1U

在B中,样本中支出不少于40元的人数为

200X(0.030+0.036)X10=132,故B正确;

在D中,若该校有2000名学生,则可能有600人的支出在[50,60)元,故D错

误.

7.(多选)(2023・湖北九师联盟模拟)某企业2022年12个月的收入与支出数据的折线

图如图.

已知:利润=收入一支出,根据该折线图,下列说法正确的是()

A.该企业2022年1月至6月的总利润低于2022年7月至12月的总利润

B.该企业2022年1月至6月的平均收入低于2022年7月至12月的平均收入

C.该企业2022年8月至12月的支出持续增长

D.该企业2022年11月份的月利润最大

答案ARC

解析因为图中的实线与虚线的相对高度表示当月利润.由折线统计图可知1月至

6月的相对高度的总量要比7月至12月的相对高度总量少,故A正确;

由折线统计图可知1月至6月的收入都普遍低于7月至12月的收入,故B正确;

由折线统计图可知2022年8月至12月的虚线是上升的,所以支出持续增长,故

C正确;

由折线统计图可知11月的相对高度比7月、8月都要小,故D错误.

8.(多选)太阳能是一种可再生能源,光伏是太阳能光伏发电系统的简称,主要有分

布式与集中式两种方式.下面的图表展示了近年来中国光伏市场的发展情况,则下

列结论中正确的是(

我国光伏发电电情况(亿kWh)

A.2015〜2022年,年光伏发电量与年份成正相关

B.2015〜2022年,年光伏新增装机规模同比(与上年相比)增幅逐年递减

C.2015〜2022年,年新增装机规模中,分布式的平均值小于集中式的平均值

D.2015〜2022年,每年光伏发电量占全国发电总量的比重与年份成正相关

答案ACD

解析对于A,由图知,2015〜2022年,随着年份的增加,光优发电量增加,年

光伏发电量与年份成正相关,故A正确;

对于B,由图知,2()15〜2022年,年光伏新增装机规模同比(与上年相比)增幅不

是逐年递减,前几年先递增,再递减,故B不正确;

对于C,由图知,每一年的新增装机规模中,集中式都比分布式的大,所以分布

式的平均值小于集中式的平均值,故C正确;

对于D,由图知,2015〜2022年,每年光伏发电量占全国发电总量的比重随年份

逐年增加,所以每年光伏发电量占全国发电总量的比重与年份成正相关,故D正

确.

9.将一个共有20个个体的总体编号为00,()1,02,…,19,根据随机数法从中抽

取一个容量为8的样本,从随机数表的第13行、第11列开始读,依次获取样本

号码,直至取满为止,则取出的第5个样本编号为.

(附:随机数表第13行:834539963406288980831374570078184754

06106871177817)

答案10

解析随机数表第13行、第11列的数字为0,故依次可得:06,28(舍),89[舍),

80(舍),83(舍),13,74(舍),57(舍),0(),78(舍),18,47(舍),54(舍),06(舍),

10,故第5个样本编号为1().

10.一汽车厂生产A,B,C三类轿车,每类轿车均有舒适型和标准型两种型号,

某月的产量如表所示(单位:辆):

轿车A轿车B轿车C

舒适型100150Z

标准型300450600

按类型用分层随机抽样的方法在这个月生产的轿车中抽取50辆,其中有A类轿

车10辆,则z的值为.

答案400

解析设该厂这个月共生产轿车〃辆,

由题意得年=]00;)3oo,所以〃=200(),

则z=2000-100-300-150-450-600=400.

11.甲、乙两班参加了同一学科的考试,其中甲班50人,乙班40人,甲班的平均

成绩为76分,方差为96,乙班的平均成绩为85分,方差为60,那么甲、乙两班

全部90名学生的平均成绩是________分,方差是分.

答案80100

解析甲、乙两班全部90名学生的平均成绩是不篙X76+前万X85=80[分);

甲、乙两班全部90名学生的方差是表{50[96+(76-8O)2]+40[60+(85-8O)2]}

=100(分2).

12.(2023・沈阳一模)已知某地区中小学生人数和近视情况分别如图甲和乙所示.为

了了解该地区中小学生的近视形成原因,用分层随机抽样的方法抽取3%的学生

进行调查,则样本量为;抽取的高中生中近视的人数为.

图甲图乙

答案30030

解析样本量为(3500+2000+4500)X3%=300.

2000

抽取的高中生中近视的人数为300XX50%=30.

3500+2000+4500

【B级能力提升】

13.(多选)高中阶段教育(含普通高中、中等职业学校及其他适龄教育机构)近六年

的在校规模与毛入学率情况图表及2023年高中阶段教育在校生结构饼图如图,根

据图中信息,下列诊断正确的有(名词解释:高中阶段毛入学率=在校生规模;适

龄青少年总人数X1()()%)()

全国高中阶段在校生规模及毛入学率

万人口高中在校生人数一毛入学率%

42(。

4(XX)

38(。

36a)

34(。

32(。

3(MN)

2018年2019年2020年2021年2022年2023年

2023年高中阶段教育在校生结构

其他适龄教育机构

A.近六年,高中阶段在校生规模与毛入学率均持续增长

B.近六年,高中阶段在校生规模的平均值超过4000万人

C.2022年,未接受高中阶段教育的适龄青少年不足420万人

D.2023年,普通高中的在校生超过2470万人

答案BD

解析对于A,高中在校生人数在前四年有下降的过程,故A错误;

对丁B,近六年的高中在校生总数为24()37万人,平均值为4006万人以上,故

B正确;

对于C,怒||乂0.105g469(万人),大于420万人,故C错误;

对于D,4128X0.601^2481(万人),故D正确.

14.(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论