第十章-统计、统计案例、算法初_第1页
第十章-统计、统计案例、算法初_第2页
第十章-统计、统计案例、算法初_第3页
第十章-统计、统计案例、算法初_第4页
第十章-统计、统计案例、算法初_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十章统计、统计案例、算法初步

第一节/随机抽样

口■础知1RM打牢■双基|周本源|闫基础分|掌握钗度

[知识能否忆起]

一、简单随机抽样:

1.简单随机抽样的概念:

设一个总体含有N个个体,从中逐个不放回地抽取〃个个体作为样本SWN),如果每次

抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.

2.最常用的简单随机抽样方法有两种——抽签法和随机数法.

二、系统抽样的步骤

假设要从容量为N的总体中抽取容量为〃的样本:

(1)先将总体的N个个体编号;

(2)确定分段间隔左,对编号进行分段,当N;是整数时,取左=N

(3)在第1段用简单随机抽样确定第一-个个体编号/(/WA);

(4)按照一定的规则抽取样本.通常是将I加上间隔k得到第2个个体编号l±k,再加k

得到第3个个体编号/+2,依次进行下去,直到获取整个样本.

三、分层抽样

1.分层抽样的概念:

在抽样n寸,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数

量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是分层抽样.

2.当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.

3.分层抽样时,每个个体被抽到的机会是均等的.

[小题能否全取]

1.(教材习题改编)在某班的50名学生中,依次抽取学号为5、10、15、20、25、30、35、

40、45、50的10名学生进行作业检查,这种抽样方法是()

A.随机抽样B.分层抽样

C.系统抽样D.以上都不是

解析:选C由系统抽样的特点可知C正确.

2.为了了解一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零

件的长度是()

A.总体B.个体是每一个零件

C.总体的一个样本D.样本容量

解析:选C200个零件的长度是总体的一个样本.

3.某工厂生产A,B,C三种不同型号的产品,产品的数量之比依次为3:4:7,现在

用分层抽样的方法抽出容量为"的样本,样本中A型产品有15件,那么样本容量”为()

A.50B.60

C.70D.80

,3

解析:选C由.X「+4+7=15得”=70.

4.(2012・金华模拟)某学院有A,B,C三个专业共1200名学生.现采用分层抽样的方

法抽取一个容量为120的样本,已知A专业有420名学生,B专业有380名学生,则在C专

业应抽取名学生.

解析:由已知条件可得每一名学生被抽取的概率为尸二^^朱二白,则应在。专业中抽取

(1200-420-380)X点=40名学生.

答案:40

5.将某班的60名学生编号为:01,02,60,采用系统抽样方法抽取一个容量为5的

样本,且随机抽得的一个号码为04,则剩下的四个号码依次是.

解析:依据系统抽样方法的定义知,将这60名学生依次按编号每12人作为一组,即01~

12、13~24、…、49~60,当第一组抽得的号码是04时,剩下的四个号码依次是16,28,40,52(即

其余每一,卜组所抽出来的号码都是相应的组中的第四个号码).

答案:16,28,40,52

------------------1名如叮嘱要牢记]-------------------------------------[自壬园地]--------------

三种抽样方法的异同点:

类别共同点各自特点相互联系适用范围

简单随\

从总体中逐个抽取总体中的个体数较少

机抽样

抽样过程

将总体均匀分成几部

系统抽中每个个在起始部分抽样时

分,按事先确定的规总体中的个体数较多

样体被抽取采用简单随机抽样

则在各部分抽取

的机会均

各层抽样时采用简

分层抽等将总、体分成几层,分总体由差异明显的几部

单随机抽样或系统

样层进行抽取分组成

抽样

也I高频考点要通关肌考点]学技法I对竣高分

简单随机抽样

1典题导入

[例1]下面的抽样方法是简单随机抽样的是()

A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确

定号码的后四位为2709的为三等奖

B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量

是否合格

C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解学校机构改

革的意见

D.用抽签法从10件产品中选取3件进行质量检验

[自主解答]A,B是系统抽样,因为抽取的个体间的间隔是固定的;C是分层抽样,因

为总体的个体有明显的层次;D是简单随机抽样.

[答案]D

2由题悟法

1.简单随机抽样需满足:(1)抽取的个体数有限:(2)逐个抽取;(3)是不放回抽取;(4)是

等可能抽取.

2.简单随机抽样常有抽签法(适用总体中个体数较少的情况)、随机数法(适用于个体数较

多的情况).

工以题试法

1.(2012•宁波月考)在简单随机抽样中,某•个个体被抽到的可能性()

A.与第儿次抽样有关,第一次抽到的可能性最大

B.与第儿次抽样有关,第一次抽到的可能性最小

C.与第几次抽样无关,每一次抽到的可能性相等

D.与第几次抽样无关,与样本容量无关

解析:选C由随机抽样的特点知某个体被抽到的可能性与第几次抽样无关,每一次抽

到的可能性相等.

*系统抽样

1典题导入

[例2](2012・山东高考)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他

们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到

的32人中,编号落入区间[1,450]的人做问卷4,编号落入区间[451,750]的人做问卷B,其余

的人做问卷C.则抽到的人中,做问卷B的人数为()

A.7B.9

C.10D.15

[自主解答]由系统抽样的特点知:抽取号码的间隔为^=30,抽取的号码依次为

9,39.69,939.落入区间[451,750]的有459,489,729,这些数构成首项为459,公差

为30的等差数列,设有n项,显然有729=459+(n-1)X30,解得n=10.所以做问卷B的

有10人.

[答案]C

2由题悟法

1.系统抽样适用的条件是总体容量较大,样本容量也较大.

2.使用系统抽样时,若总体容量不能被样本容量整除,可以先从总体中随机地剔除几个

个体.

工以题试法

2.(2012•汕头模拟)用系统抽样法从160名学生中抽取容量为20的样本,将160名学生

随机地从1〜160编号,按编号顺序平均分成20组(1~8号,9〜16号,…,153~160号),

若第16组抽出的号码为126,则第1组中用抽签的方法确定的号码是.

解析:设第1组抽取的号码为b,则第”组抽取的号码为8(n-1)+/>,.,.8X(16-1)+/?

=126,;.b=6,故第1组抽取的号码为6.

答案:6

T|分层抽样

1典题导入

[例3](1)(2012•福建高考)一支田径队有男女运动员98人,其中男运动员有56人.按男

女比例用分层抽样的方法,从全体运动员中抽出一个容量为28的样本,那么应抽取女运动员

人数是.

(2)(2012•天津高考)某地区有小学150所,中学75所,大学25所.现采用分层抽样的方

法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取所学校,

中学中抽取所学校.

[自主解答](1)依题意,女运动员有98-56=42(人).设应抽取女运动员x人,根据分

层抽样特点,得,7=||,解得x=12.

("50X际宝五=,5OX55O=电75*加=9.

[答案](1)12⑵189

»>一题多变

本例(2)中条件变为“某地区有小学、中学、大学若干所,现采用分层抽样的方法从这些

学校中抽取30所学校,其中从150所小学中抽取18所”试求该地区共有多少所学校.

解:设共有“所学校,

•••150X—=18,

n

An=250.

2由题悟法

进行分层抽样时应注意以下几点

(1)分层抽样中分多少层,如何分层要视具体情况而定,总的原则是:层内样本的差异要

小,两层之间的样本差异要大,且互不重叠.

(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同.

(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样.

“、儿…样本容量各层样,数量

(4)刑件比一总体容量一各层个体数量.

3以题试法

3.(2012•惠州二调)某工厂的一、二、三车间在12月份共生产了3600双皮靴,在出厂

前要检查这批产品的质量,决定采用分层抽样的方法进行抽取,若从一、二、三车间抽取的

产品数分别为。、b、c,且a、b、c构成等差数列,则二车间生产的产品数为()

A.800B.1000

C.1200D.1500

解析:选C因为a、从c成等差数列,所以2b=a+c,所以二车间抽取的产品数占抽

取产品总数的三分之一,根据分层抽样的性质可知,二车间生产的产品数占总数的三分之一,

即为3600X3=1200.

0高分障冏3Hs除攻重点|补短板|得满分拿规程度

“易错地带扫雷——不丢分”系列之(十五)

分层抽样中的易误点

[典例](2012•四川高考)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的

知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,

其中甲社区有驾驶员96人.若在甲、乙、内、丁四个社区抽取驾驶员的人数分别为12,21,25,43,

则这四个社区驾驶员的总人数"为()

A.101B.808

C.1212D.2012

[尝试解题]由题意知抽样比为荒12,而四个社区一共抽取的驾驶员人数为12+21+25+

43=101,故有96=N'解得N=808.

[答案]B

------------[易错提醒]--------------------------------------------------

1.因忽视了分层抽样中各层的抽样比相同而导致本题不会列出比例关系式求解.

2.因不理解出样本容量,总体容量)=抽样比,而导致本题不会解答.

3.对于分层抽样问题,其解决的关键是抓住“\f(样本容量,总体容量)=抽样比"这一条

件,所有问题便可迎刃而解.)

针对训练

某单位有职工160名,其中业务人员120名,管理人员16名,后勤人员24名.为了解

职工的某种情况,要从中抽取一个容量为20的样本.若用分层抽样的方法,抽取的业务人员、

管理人员、后勤人员的人数应分别为.

解析:分层抽样应按各层所占的比例从总体中抽取.

,­•120:16:24=15:2:3,又共抽取20人,

J.各层抽取人数分别为20X^=15(A),

23

20X—=2(A),20义行=3(人).

答案:15,2,3

曷整题训练要恚效照速度|抓规范|拒绝限高于低掌握般度

A级全员必做题

1.(2013・江西模拟)在100个零件中,有一级品20个,二级品30个,三级品50个,从

中抽取20个作为样本:①采用随机抽样法,将零件编号为00,01,02,…,99,从中抽出20

个;②采用系统抽样法,将所有零件分成20组,每组5个,然后每组中随机抽取1个;③采

用分层抽样法,随机从一级品中抽取4个,二级品中抽取6个,三级品中抽取10个.贝")

A.不论采取哪种抽样方法,这100个零件中每个零件被抽到的概率都是上

B.①②两种抽样方法,这100个零件中每个零件被抽到的概率都是:,③并非如此

C.①③两种抽样方法,这100个零件中每个零件被抽到的概率都是②并非如此

D.采用不同的抽样方法,这100个零件中每个零件被抽到的概率各不相同

解析:选A由于随机抽样法、系统抽样法与分层抽样法均是等可能性抽样,因此不论

采取哪种抽样方法,这100个零件中每个零件被抽到的概率都是去

2.某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中

任意抽取25人,从女生中任意抽取20人进行调查.这种抽样方法是()

A.简单随机抽样法B.抽签法

C.随机数法D.分层抽样法

解析:选D总体由差异明显的几部分组成、按比例抽样,为分层抽样.

3.(2013•执信中学月考)将参加夏令营的600名学生编号为:001,002,…,600,采用系

统抽样的方法抽取一个容量为50的样本,且随机抽得的编号为003.这600名学生分住在3

个营区,从001到300住在第1营区,从301到495住在第2营区,从496到600住在第3

营区,则3个营区被抽中的人数依次为()

A.26,16,8B.25,16,9

C.25,17,8D.24,17,9

解析:选C由题意知,被抽中的学生的编号构成以3为首项,12为公差的等差数列{a,,},

其通项册=12〃-9(1W"W5O,n£N*).令1W12〃-9W300,得1W”W25,故第1营区被抽

中的人数为25;令301W12〃-9W495,得26WwW42,故第2营区被抽中的人数为17;令

496W12〃—9W600,得43W〃W50,故第3营区被抽中的人数为&

4.(2013・潍坊模拟)为调查参加运动会的1000名运动员的年龄情况,从中抽查了100名

运动员的年龄,就这个问题来说,下列说法正确的是()

A.1000名运动员是总体

B.每个运动员是个体

C.抽取的100名运动员是样本

D.样本容量是100

解析:选D所调查的是运动员的年龄,故A、B、C错误,样本容量是100.

5.(2012・中山调研)甲校有3600名学生,乙校有5400名学生,丙校有1800名学生.为

统计三校学生某方面的情况,计划采用分层抽样法,抽取一个容量为90的样本,应该在这三

校分别抽取的学生人数是()

A.30,30,30B.30,45,15

C.20,30,10D.30,50,10

901

解析:选B抽取比例是3、6八0e0+5400十5158030=段12。,故三校分别抽取的学生人数为3

600X*=30,5400X-p^=45,l800X卷=15.

6.某学校在校学生2000人,为了加强学生的锻炼意识,学校举行了跑步和登山比赛,

每人都参加且每人只参加其中一项比赛,各年级参加比赛的人数情况如下:

高一年级高二年级高三年级

跑步人数abC

登山人数XyZ

其中a:b:c=2:5:3,全校参加登山的人数占总人数的1.为了了解学生对本次活动的

满意程度,按分层抽样的方式从中抽取一个200人的样本进行调查,则高三年级参加跑步的

学生中应抽取()

A.15个B.30人

C.40人D.45人

3

解析:选D由题意,全校参加跑步的人数占总人数的不所以高三年级参加跑步的总人

33

数为彳X2000X行=450,由分层抽样的特征,得高三年级参加跑步的学生中应抽取的人数为

空X450=45

2000M

7.(2012•浙江高考)某个年级有男生560人,女生420人,用分层抽样的方法从该年级全

体学生中抽取一个容量为280的样本,则此样本中男生人数为.

解析:由分层抽样得,此样本中男生人数为560X<=160.

56。+42。

答案:160

8.(2012・湖北高考)一支田径运动队有男运动员56人,女运动员42人.现用分层抽样的

方法抽取若干人,若抽取的男运动员有8人,则抽取的女运动员有人.

解析:分层抽样的特点是按照各层占总体的比相等抽取样本,设抽取的女运动员有x人,

则青=差解得尤=6.

答案:6

9.(2012・清远模拟)某市有A、B、C三所学校,共有高三文科学生1500人,且A、B、

C三所学校的高三文科学生人数成等差数列,在三月进行全市联考后,准备用分层抽样的方

法从所有高三文科学生中抽取容量为〃的样本,进行成绩分析,若从8校学生中抽取40人,

贝Un—.

解析:设4、B、C三所学校学生人数分别为x,y,z,由题知x,y,z成等差数列,所

以x+z=2y,又x+y+z=1500,所以y=500,用分层抽样方法抽取B校学生人数为丁4记X500

=40,得“=120.

答案:120

10.(2012・开封模拟)某公路设计院有工程师6人,技术员12人,技工18人,要从这些

人中抽取〃个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,

不用剔除个体;如果参会人数增加1个,则在采用系统抽样时:需要在总体中先剔除1个个

体,求”.

解:总体容量为6+12+18=36.

当样本容量是”时,由题意知,系统抽样的间隔为至,分层抽样的比例是白,抽取的工

n36

77777777H77

程师人数为正X6=7,技术员人数为正x12=鼻,技工人数为彳X18=5,所以〃应是6的倍

3ooJo3JO2

数,36的约数,即“=6,12,18.

当样本容量为(〃+1)时,总体容量是35人,系统抽样的间隔为1,因为手7必须是整

数,所以n只能取6.即样本容量〃=6.

11.(2013・聊城联考)某单位有2000名职工,老年、中年、青年分布在管理、技术开发、

营销、生产各部门中,如下表所示:

人数管理技术开发营销生产共计

老年40404080200

中年80120160240600

青年401602807201200

共计16032048010402000

(1)若要抽取40人调查身体状况,则应怎样抽样?

(2)若要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人?

(3)若要抽20人调查对某运动会筹备情况的了解,则应怎样抽样?

解:(1)用分层抽样,并按老年4人,中年12人,青年24人抽取.

(2)用分层抽样,并按管理2人,技术开发4人,营销6人,生产13人抽取.

(3)用系统抽样,对2000人随机编号,号码从0001~2000,每100号分为一组,从第一

组中用随机抽样抽取一个号码,然后将这个号码分别加100,200,…,1900,得到容量为20

的样本.

12.一个城市有210家百货商店,其中大型商店有20家,中型商店有40家,小型商店

有150家.为了掌握各商店的营业情况,要从中抽取一个容量为21的样本,按分层抽样方法

抽取样本时,各类百货商店要分别抽取多少家?写出抽样过程.

解:,••21:210=1:10,

.2040150

•,IO-2,10-4,10-15-

,应从大型商店中抽取2家,从中型商店中抽取4家,从小型商店中抽取15家.

抽样过程:

711

(1)计算抽样比丽=而;

(2)计算各类百货商店抽取的个数:

22=240=4^=15.

10''1010j

(3)用简单随机抽样方法依次从大、中、小型商店中抽取2家、4家、15家;

(4)将抽取的个体合在一起,就构成所要抽取的一个样本.

B级重点选做题

1.从编号为1〜50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,

若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()

A.5,10,15,20,25B.3,13,23,33,43

C.1,2,3,4,5D.2,4,6,16,32

解析:选B间隔距离为10,故可能编号是3,13,23,33,43.

2.最近网络上流行一种“QQ农场游戏”,这种游戏通过虚拟软件模拟种植与收获的过

程.为了了解本班学生对此游戏的态度,高三(6)班计划在全班60人中展开调查,根据调查

结果,班主任计划采用系统抽样的方法抽取若干名学生进行座谈,为此先对60名学生进行编

号01,02,03,…,60,已知抽取的学生中最小的两个编号为03,09,则抽取的学生中最大的编

号为.

解析:由最小的两个编号为03,09可知,抽样间距为6,因此抽取人数的比例为看即抽

取10名同学,其编号构成首项为3,公差为6的等差数列,故最大编号为3+(10-1)X6=

57.

答案:57

3.(2012•山西四校联考)调查某高中1000名学生的身高情况,得下表.已知从这批学生

中随机抽取1名学生,抽到偏低男生的概率为0.15.

偏低正常偏高

女生100173y

男生X177Z

⑴求X的值:

(2)若用分层抽样的方法,从这批学生中随机抽取50名,问应在偏高学生中抽多少名;

(3)已知y,193,z》193,求偏高学生中男生不少于女生的概率.

Y

解:(1)由题意可知,丁丽=0.15,故x=150.

(2)由题意可知,偏高学生人数为y+z=1000-(100+173+150+177)=400.设应在偏高

学生中抽,"名,

m50,,”

则rtl丽=77而,故'"=2(1

应在偏高学生中抽20名.

(3)由⑵知y+z=400,且y2193,z>193,满足条件的0,z)有(193,207),(194,206),…,

(207,193),共有15组.

设事件A:"偏高学生中男生不少于女生”,即yWz,满足条件的z)有(193,207),

8

(194,206),…,(200,200),共有8组,所以P(A)=百.

Q

偏高学生中男生不少于女生的概率为法.

I教笳各选题

1.(2012・抚顺模拟)某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类

分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若

采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是()

A.4B.5

C.6D.7

201

解析:选C四类食品的每一种被抽到的概率为40+1o:30+2Q=5'则植物油类和果蔬

类食品被抽到的种数之和为(10+20)X2=6.

2.某工厂生产A、B、C三种不同型号的产品,其相应产品数量之比为2:3:5,现用

分层抽样方法抽出一个容量为n的样本,样本中4型号产品有16件,那么此样本的容量n

235

解析:设分别抽取8、C型号产品加1,〃?2件,则由分层抽样的特点可知左=—=一,

1Om1/九2

m\=24,机2=40,

〃=16+ni\+=80.

答案:80

A第7r一—二用样本估计总体

掌提程度

昌基础知1R便打牢遗双基古本源学基础分

[知识能否忆起]

一、作频率分布直方图的步骤

1.求极差(即■-组数据中最大值以最小值的差).

2.确定组距内组数.

3.将数据分组.

4.列频率分布表.

5.画频率分布直方图.

二、频率分布折线图和总体密度曲线

1.频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线

2.总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频

率折线图会越来越接近于条光滑曲线,即总体密度曲线.

三、样本的数字特征

数字特征定义

众数在一组数据中,出现次数最多的数据叫做这组数据的众数

将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数

中位数据的生均数)叫做这组数据的中位数在频率分布直方图中,中位数左边和右边

的直方图的面积相等

平均数样本数据的算术平均数.即x=~(XI+X2H--

』(rlX)2+(Xo-X『+…+(x〃-X力,

方差n

其中S为标准差

四、茎叶图

茎叶图的优点是可以保留原始数据,而且可以随时记录,方便记录与表示.

[小题能否全取]

124

20356

3011

412

1.(教材习题改编)在如图所示的茎叶图表示的数据中,众数和中位数分别是()

A.23与26B.31与26

C.24与30D.26与30

解析:选B观察茎叶图可知,这组数据的众数是31,中位数是26.

2.(教材习题改编)把样本容量为20的数据分组,分组区间与频数如下:[10,20),2;[20,30),

3;[30,40),4;[40,50),5;[50,60),4;[60,70],2,则在区间[10,50)上的数据的频率是()

A.0.05B.0.25

C.0.5D.0.7

解析:选D由题知,在区间[10,50)上的数据的频数是2+3+4+5=14,故其频率为与

=0.7.

3.(2012・长春模拟)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制

成频率分布直方图由图中数据可知身高在[120,130]内的学生人数为()

A.20B.25

C.30D.35

解析:选C由题意知aX10+0.35+0.2+0.1+0.05=l,

则”=0.03,故学生人数为0.3X学0=30.

4.(教材习题改编)甲、乙两人比赛射击,两人所得的平均环数相同,其中甲所得环数的

方差为5,乙所得环数如下:5、6、9、10、5,那么这两人中成绩较稳定的是.

解析:x=7,st=4.4,

则s节〉母,故乙的成绩较稳定.

答案:乙

5.(2012•汕尾模拟)将容量为〃的样本中的数据分为6组,绘制频率分布直方图,若第一

组至第六组的数据的频率之比为2:3:4:6:4:1,且前三组数据的频数之和为27,则n=

2+3+49279

解析:依题意得,前三组的频率总和为c+2+/+/+,+]=而,因此有一=而,即"=

2+3+4+6+4+12()n2.()

60.

答案:60

------------------[名师,丁必要率id]-------------------------------[自主园她]-----------

1.在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数

的值,而平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横

坐标之和,众数是最高的矩形的中点的横坐标.

2.注意区分直方图与条形图,条形图中的纵坐标刻度为频数或频率,直方图中的纵坐标

刻度为频率/组距.

3.方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,虽然方差与标准差在

刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.

由।高频考点要通关肌考点]学技法]/竣高分|掌提短卮

,•-用样本的频率分布估计总体分布

1典题导入

[例1](2012・广东高考)某校100名学生期中考试语文成绩的频率分布直方图如图所示,

其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].

(1)求图中4的值:

(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;

(3)若这100名学生语文成绩某些分数段的人数⑸与数学成绩相应分数段的人数。)之比

如下表所示,求数学成绩在[50,90)之外的人数.

分数段[50,60)[60,70)[70,80)[80,90)

X:y1:12:13:44:5

[自主解答](1)由频率分布直方图知(%+0.02+0.03+0.04)X10=1,解得a=0.005.

⑵由频率分布直方图知这100名学生语文成绩的平均分为55X0.005X10+

65X0.04X10+75X0.03X10+85X0.02X10+95X0.005X10=73(分).

(3)由频率分布直方图知语文成绩在[50,60),[60,70),[70,80),[80,90)各分数段的人数依

次为0.005X10X100=5,0.04X10X100=40,0.03X10X100=30,0.02X10X100=20.

14

由题中给出的比例关系知数学成绩在上述各分数段的人数依次为5,40X-=20,30X-=

40,20x1=25.

故数学成绩在[50,90)之外的人数为100-(5+20+40+25)=10.

>»一—多变

在本例条件下估计样本数据的众数.

解:众数应为最高矩形的中点对应的横坐标,故约为65.

2由题悟法

解决频率分布直方图问题时要抓住

(1)直方图中各小长方形的面积之和为1.

(2)直方图中纵轴表示篝,故每组样本的频率为组距X箸,即矩形的面积.

(3)直方图中每组样本的频数为频率X总体数.

3以题试法

1.(2012•深圳调研)某中学组织了“迎新杯”知识竞赛,从参加考试的学生中抽出若干名

学生,并将其成绩绘制成频率分布直方图(如图),其中成绩的范围是[50,100],样本数据分组

^[50,60),[60,70),[70,80),[80,90),[90,100],已知样本中成绩小于70分的个数是36,则

样本中成绩在[60,90)内的学生人数为.

解析:依题意得,样本中成绩小于70分的频率是(0.010+0.020)X10=0.3;样本中成绩

在[60,90)内的频率是(0.020+0.030+0.025)X10=0.75,因此样本中成绩在[60,90)内的学生人

36X0.75

数为=90.

0.3

答案:90

"7茎叶图的应用

1典题导入

[例2](2012・陕西高考)从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额

进行统计,统计数据用茎叶图表示(如图所示).设甲、乙两组数据的平均数分别为x甲、X4,

中位数分别为mm乙,贝lj()

88400028

752202337

800312448

238

A.x甲<x乙,m甲乙B.x甲v无乙,m甲<w乙

C.x用>x乙,tnni>/n乙D.x甲〉x乙,tn甲vm乙

[自主解答]T甲=*(41+43+30+30+38+22+25+27+10+10+14+18+18+5+6

345

=记,

—1

x乙=记(42+43+48+31+32+34+34+38+20+22+23+23+27+10+12+18)=

457

-16--

***X甲<X乙.

又"1甲=20,团乙=29,「•加甲<m乙.

[答案]B

2由题悟法

由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率

分布直方图的第一点是从茎

叶图中能看到原始数据,没有任何信息损失;第二点是茎叶图便于记录和表示.其缺点

是当样本容量较大时,作图较繁.

亚以题试法

2.(2012・淮北模考)如图所示的茎叶图记录了一组数据,关于这组数据,①众数是9;②

平均数是10;③中位数是9或10;④标准差是34

其中说法正确的序号是.

解析:由茎叶图知,该组数据为7,8,9,9,9,10,11,12,12,13,.,.众数为9,①正确;中位数

9+10—1

是一^—=9.5,③4普;平均数是x=元(7+8+9+9+9+10+11+12+12+13)=10,②正确;

方差是?=,[(7-10)2+(8-10)2+(9-10)2+(9-10)2+(9-10)2+(10-10)2+(11-10)2+

(12-10)2+(12-10)2+(13-IO)"=3.4,标准差s=④错.

答案:①②

样本的数字特征

1典题导入

[例3]⑴(2012•江西高考)样本(元1,物…,X”)的平均数为x,样本(力,为,…,加)的

平均数为7(7工7).若样本但,如…,斯,力,及,・・・,%)的平均数三+(1一0歹,

其中0<a<1,贝lj",m的大小关系为()

A.n<mB.n>tn

C.n=mD.不能确定

(2)(2012・山东高考)在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.

若8样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的下列数字特征对

应相同的是()

A.众数B.平均数

C.中位数D.标准差

白主铲免力+%+…+%

r[自王解答1](ZD.-X=-X-|-+-X-2-+--…---+-X-”,—y=-------------,

—X1+检+…+%,+力+)'2+…+%,

Z=,

YI|

由题意兔----<z,n<m.

m+n2

(2)对样本中每个数据都加上一个非零常数时不改变样本的方差和标准差,众数、中位数、

平均数都发生改变.

[答案](1)A(2)D

2由题悟法

(1)众数体现了样本数据的最大集中点,但无法客观地反映总体特征.

(2)中位数是样本数据居中的数.

(3)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据越分

散,标准差、方差越小,数据越集中.

3以题试法

3.(2012・茂名模拟)一农场在同一块稻田中种植一种水稻,其连续8年的产量(单位:kg)

如下:450,430,460,440,450,440,470,46(),贝U该组数据的方差为()

A.120B.80

C.15D.150

解析:选D根据题意知,该组数据的平均数为

450+430+460+440+450+440+470+460▼一、*小皿皿山—》31,,,,

-------------------«-------------------=450,所以该组数据的方差为wX(02+2022+102

O----------------------------O

+102+02+102+202+102)=150.

昌^高分障碍要破除双重点|补知板|得满分|才梃程度

-------“易错地带扫雷——不丢分”系列之(十六)

频率分布直方图中的易误点

[典例I(2012.山东高考)如图是根据部分城市某年6月份的平均气温(单位:七)数据得

到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),

[21.5,22.5),[22.5,23.5),[23.5,24,5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低

于22.5C的城市个数为11,则样本中平均气温不低于25.5℃的城市个数为.

[尝试解题]最左边两个矩形面积之和为0.10X1+0.12X1=0.22,总城市数为11+0.22

=50,最右边矩形面积为0.18X1=0.18,50X0.18=9.

[答案]9

------------[易错提醒]---------------------

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论