统计学 第六章统计量与抽样分布(习题附参考答案)_第1页
统计学 第六章统计量与抽样分布(习题附参考答案)_第2页
统计学 第六章统计量与抽样分布(习题附参考答案)_第3页
统计学 第六章统计量与抽样分布(习题附参考答案)_第4页
统计学 第六章统计量与抽样分布(习题附参考答案)_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第6章统计量与抽样分布

【弓I例】1899年,戈塞特(18767937)进入都柏林A.吉尼斯父子酿酒公

司担仟酿酒化学技师,主要从事统计和实验工作。他在工作中发现,供酿酒的

每批麦子质量相差很大,而同一批麦子中能抽样供试验的麦子又很少,每批样

本在不同的温度下做实验,其结果相差很大。这就决定了不同批次和温度的麦

子样本是不相同的,不能进行样本合并。这样一来,实际上取得的麦子样本,

不可能是大样本,只能是小样本。他在工作中还发现,利用小样本得出的结果,

和正态分布有较大的差异,特别是两端尾部的概率,比正态分布明显高。因此

1907年戈塞特决心把小样本和大样本之间的差别搞清楚。为此,他试图把一个

总体中的所有小样本的平均数的分布刻画出来。做法是;在一个大容器里放了

一批纸牌,把它们弄乱,随机地抽若干张(小样本),对这一样本记录观察值,

然后再把纸牌弄乱,抽出几张,对相应的样本再记录观察值。大量地记录这种

随机抽样的小样本观察值,就可以获得小样本观察值的分布。1908年,戈塞特

以“学生(Student)”为笔名在《生物计量学》杂志发表了论文《平均数的规

律误差》。这篇论文开创了小样本统计理论的先河,为研究样本分布理论奠定了

重要基础。被统计学家誉为统计推断理论发展史上的里程碑。

那么总体和样本是如何联系的?大样本和小样本下究竟有什么差异?什么

是t分布?它和正态分布有什么不同?它有什么作用?统计推断中常用的分布

还有哪些?这些问题都将在本章中找到答案。

统计研究的目的是为了探索现象内在的数量规律性。为了解总体的数量特

征,可以直接对总体进行全面调查,得到总体数据,进而归纳出数量特征;也

可以对总体进行抽样,利用样本对总体进行推断,后一种方法称为统计推断。

抽样分布是进行统计推断的理论基础。本章将主要介绍统计推断所涉及的总体、

样本、统计量及抽样分布等概念,以及在统计推断中最常用的/分布,/分布

和产分布和抽样分布定理。

§6.1总体与样本的统计分布

总体与样本是统计推断中的两个基本概念。统计推断的目的是从样本信息

出发,运用概率论的方法,推断总体的特征;因此如何将统计学的总体、样本

和概率论的基础一一随机变量与分布联系起来,就成为统计推断首先要解决的

问题。

§6.1.1统计推断中的总体及总体分布

第一章中已经明确统计所研究的是由同类事物构成的总体的数量特征,总

体是根据一定的目的确定的所要研究的事物的全体,它是由客观存在的、具有

某种共同性质的众多个体构成的。总体中的每个单位称为个体。比如前面引例

中,每一批麦子的全体就是一个总体,而其中每单位的麦子就是个体。这是统

计学中关于总体的概念,我们可以称其为实物总体。

在前面章节的学习中,我们已经发现:我们真正关心和收集研究的并不是

这些总体中的个体本身,而是这些个体的某些特征及其数值,在前面我们将这

些特征用变量来描述,对应的数值称为变量值。关心这批麦子,主要关心的是

其酿酒的效果出酒量。此时出酒量成为需要研究的变量,每单位麦子出酒量的

具体数值成为变量值。在研究这批麦子时,并不需要将全部这批麦子都收集过

来,只需要记录这批麦子每单位出酒量的数值,再对这些数值进行研究就可以

了。此时的总体实质是这批麦子的出酒量对应的若干个数值,总体已经从实物

抽象到了数值,可以称之为数值总体。这是对总体概念的第一次抽象。

如果实物总体中个体很多,则对应的数值总体其规模将非常大,而且往往

其中重复的值会很多,即使没有重复值(变量取值连续时),在不同值周围的“密

集程度”也会不相同。逐一研究每个变量值将会非常繁琐,当总体规模趋于无

穷时,研究每个变量值更是变得不可能。若统计出变量的所有不同取值(或取

值区间)及其出现的频率,编制变量的分布数列,则可以对变量的全部取值情

况一览无遗。研究一个变量的全部数值,就转化为研究该变量的分布了。用变

量及其分布来描述一个总体,可以称之为分布总体。例如研究某批麦子的出酒

量X,这是个连续变量,可以统计出X在不同区间取值的频率,得到X的分布。

对全部单位出酒量的数值的研究,就可转化研究出酒量X的分布了。这是对总

体概念的第二次抽象。

对于随机变量X,其取值是随机的,关注该变量的全部取值,也就是要关

注其各个可能取值(或取值区间)及其相应概率,即关注该随机变量的概率分

布。在统计推断中利用随机变量X及其概率分布来描述一个总体,应用起来非

常有优势,尤其是当总体容量趋于无穷时,另外一个好处是可以利用概率论的

理论和方法来研究总体。例如麦子出酒量的总体分布如果是正态分布,就可以

利用正态分布的密度函数计算出酒量在各区间的概率。

经过上述讨论,完成了从“实物总体f数值总体f分布总体”的两次抽象,

也完成了我们将统计学中“总体”与概率论中“分布”的衔接,这是统计推断

对总体概念的延伸,也是概率论知识应用于统计推断的基础。以后在本章及以

后统计推断的相关章节中,如无特别说明,总体均表示分布总体,给定一个总

体,只需耍给出总体的分布即可。

§6.1.2统计推断中的样本及样本性质

统计推断的重要任务是通过对总体中随机抽取的部分个体的观测结果来推

断总体的特征。按照随机原则,通过观测或试验的方法所获得的总体中一部分

个体的取值称为样本,每个个体的取值称为样本点或样品。抽出样本之前,由

于总体中各个体有同等被抽中的可能,抽中那个个体不能确定,因此样本是一

组随机变量,每个样本点都可以取总体中任意一个值;但是当样本被抽取并观

测记录后,若干个体被抽出,各样本点的取值确定,样本成为是一组确定的数

值。统计推断中为了区分此二重性,将抽取前具有随机性的样本称为样本,用

大写字母表示;将抽取的一组确定的数值称为样本观测值,用小写字母表示。

如要推断某种灯泡使用寿命总体X的特征,拟随机抽取〃只灯泡进行测试,其

使用寿命(X,X2,…,Xn)称为灯泡使用寿命总体X的样本,一次具体抽样测试得

到n个灯泡使用寿命的数值(即,及,…用0,称为总体X的样本观察值。

统计推断中,把具有以下两个重要性质的样本称为简单随机样本:

1.样本点与总体同分布

这一点很容易从数值总体的角度加以理解:由于采取随机原则抽取样本点,

每个个体被抽中的可能性相同。假设总体容量为M则每个个体被抽中的概率

为1/M假设对离散型总体取值等于x,或对连续型总体取值在区间x+/x)中

的个体总数为M,那么抽出样本点取值为X或在区间(.%工+〃幻中的概率就是

M小,恰好等于总体X取值为x或取值在区间(x,x+ZYx)中的频率(或概率),从

而可以看出样本点与总体分布相同。

2.样本点之间相互独立

从总体中抽取样本的方法有重复抽样和不重复抽样两种。采用重复抽样时,

每次随机抽取一个样本点并记录其特征以后,又将它放回总体中参加下一次抽

取,每次抽取样本点都是在总体的N个单位中进行的,前一次抽取的结果不会

影响后一次抽取的结果,因此样本点之间相互独立。采用不重复抽样时,每次

随机抽出一个样本点后不再将它放回总体中,下一次只能在其余个体中抽取,

前面抽取的结果就会影响后面的抽取,因此样本点之间不是相互独立的。但通

常实际工作中总体容量非常大,采用不重复抽样时也可以近似认为样本点之间

相互独立。对于总体容量无限的情形,无论采取重复抽样还是不重复抽样,都

可以认为样本点是相互独立的。

在本书后面的叙述中,常常将以上两个性质一同简写为“样本点独立同分

布(让4”。没有特别说明的情况下,我们讨论的样本均指的是简单随机样本。

§6.2统计量

§6.2.1统计量的概念

在统计推断中,总体信息是未知的,但从总体中抽取的样本中含有总体的

信息、,统计推断就是利用样本的信息来推测总体的信息。然而样本的信息是隐

蔽的、分散的,必须经过必要的加工对样本信息进行集中和提炼才能用来推断

总体信息,构造样本统计量是集中和提炼样本信息来推断总体信息的有效手段

之一。

设(X1….,X〃)是来自总体X的一个样本,如果T=T(X1,X2,…,X“)是

样本(X1,…,X")的函数,7中不含任何未知参数,则称T(X1,X2,…,X“)为

一个统计量。如果(芭,…,x“)为样本(X1,…,X〃)的观测值,则

T=7(4工2,…,G为统计量7=nxPx2,…,X“)的观测值。统计量的观测

值是确定的,没有随机性。

统计量有以下两个特征:统计量是样本的函数,统计量通常为随机变量;

统计量不能含有未知的参数。例如,当从正态总体中抽出样本“时,

考查随机变量£(Xj-4)2,当总体均值〃为已知时,该变量是统计量;当

/=|

总体均值未知时,该变量就不是统计量。

统计量既然是随矶变量,那么它应该有概承分布,统计量的分布称为抽样

分布。抽样分布和统计推断有着密切的联系。统计量明确以后,必须要知道其

抽样分布才能在统计推断中使用,因为只有知道了统计量的分布,才能利用概

率论对总体的特征进行推断,并得到相应的推断置信度。所以在统计推断中,

一项重要的工作就是寻找统计量和导出统计量的抽样分布或渐近抽样分布。

【例6-1】总体X股从两点分布,概率分布律如下:

p(x=1)=p,P(X=O)=1—〃

从总体中抽取容量为〃的样本,构造统计量T=ZX,.,求此统计量的分布。

z=i

解:由于样本是犯立的,X,服从两点分布:统计量7为随机变量,其取

值是。到〃之间的所有整数,其分布恰好是二项分布:

P(T=k)=C:pA(1—p)"-k,A=0,1,2,〃

从上面的例子中,可以看出抽样分布未必与总体的分布一致。

【例6-2】总体分布为X〜N(l,l),抽取容量为〃的样本,构造如下三个统

计量:T=7;=X1+X2和7;=又求此三个统计量的抽样分

n,=i

布。

解:由于样本是独立的,X,服从均值和方差都为1的正态分布,三个统计

量都是样本的线性函数,由正态分布的性质,三个统计量仍服从正态分布,下

面分别求解其均值和方差:

£(7;)=£(%,)=1,D(7;)=D(X)=1

E(T2)=E(X])+E(X2)=2,D(T2)=£>(.)+O(X2)=2

1n1n1

矶()=—ZE(X,)=I,o(t)==£Q(X,)=—

nz=iri=i〃

由上面计算可以得出,统计量7;服从均值和方差都为1的正态分布,这和

总体的分布相同;统计量7;服从均值和方差都为2的正态分布,而统计量7;服

从均值为1,方差为//力的正态分布。

§6.2.2常用统计

1.样本均值和样本方差

设X,X2,…,x”是总体x中抽出的简单随机样本,则样本均值为

x=-Yxif样本方差为

2.样本矩

称&为样本的原点矩,称纥=-y(xz-xV为样本的中心

〃,=1〃/=1

矩。特别当%=2时,&Xj—又『称为样本的未修正方差,常记S;,

〃,=1

,常用统计量还包括样本相关系数,我们将在第9章介绍。

显然有S;二(TDS2。

n

3.顺序统计量

设X1,丫».・,*“是总体乂中抽出的简单随机样本,把样本点排序为

X⑴<X(2)<•••<X(“),则称X⑴,X(2),•一X。为顺序统计量,其中X⑵称为

第i个顺序统计量。基于顺序统计量计算的常用统计量有:

最大顺序统计量X(n)=max{X19X2,...,X3}和最小顺序统计量

乂⑴=min{X],X2,...,X3};

样本极差R=X(〃)—X⑴;

也)〃为奇数

样本中位数也=X,、+x,、

上~刿〃为偶数

2

样本的P分位数Mp=*必+(〃+l)(p_噜)%则「*必)

其中[〃〃]为不超过秋的最大整数:

1n-k

样本的切尾均值Tnk=-------VX(>0<k<n9样本的切尾均值是分别

〃-23士⑴

去掉k个最小的和k个最大的观测值后得到的均值。

§6.3抽样分布及抽样分布定理

为了在正态分布假定下,得到样本统计量的精确分布,本节需要讨论几个

十分重要的随机变量函数的分布,它们是力2分布、,分布和尸分布。在此基础

上讨论抽样分布的重要定理。

§6.3.1%?分布

分布是海尔墨特(Hermert)和卡.皮尔逊(K.Pearson)分别于1875年

和1890年提出的,是统计推断中的重要分布。它主要应用于对总体方差的估计

或检验以及对总体概率密度函数的检验等。

1./分布的定义及其密度函数

定义6-1若随机变量X»..,X〃独立且同标准正态分布N(O,1),则它们

的平方和

(6.1)

«=1

服从自由度为〃的/分布,记为〜/(〃)。

/=i

根据服从卡方分布随机变量的定义,我们可以根据求随机变量函数的概率

分布的方法求出Z2分布的概率密度函数I。如果随机变量X服从自由度为〃的

72分布,其概率密度为:

1J上

22

--n-----xex>0

22r(-)(6.2)

0x<0

其中「(〃)为gamma函数。

2.%?分布的性质特征

(1)/分布的数学期望与方差

若X服从自由度为〃的了?分布,其数学期望和方差分别为

E(X)=n,Z)(X)=2/z(6.3)

可见随着自由度的增大,/分布的期望和方差随之增大,自由度决定了

力2分布的形状。从密度函数定义可以看出,/分布是一种不对称偏峰分布,

其取值区域为(0,+8);随着自由度的逐渐增大,%?分布曲线的最高点逐渐下

降并向右移动,分布曲线趋于对称,如图6-1所示。

1推导过程略,有兴趣的读者可以参考陈希孺,《数理统计引论》,高教出版社

P{^2(n)>^(n)}=a

关于22分布上侧。分位数/5)可以通过书后附表求得,附表给出了自

由度〃V45的分布上侧a分位数。也可通过EXCEL的CH1NV函数求得。

例如/必(11)=2.603,若。(13)=27.688。

(2)分布的自由度

力2分布中〃称为自由度。对于变量X-…,X〃,如果存在一组不全为零的

常数c“2…・,%,使得C1X+C2X2+…+c〃X”=0成立,则称变量

之间存在一个线性约束条件。如果变量X,..,X〃中存在攵个独立的线性约束

条件,则Xj(i=l,2,…,〃)中独立变量的个数为(〃一2),称它为自由度。自由

度也可粗略解释为可以自由选择数值的变量个数。

例如,fx;由〃个独立的随机变量X构成,由于它们之间没有线性约

;=1

束条件(即Z=0),所以它的自由度为〃。£(Xj—廿2的自由度为(〃_]),

/=1

这是因为计算£(x厂区)2时要用又,又满足限制条件£。「区)=0,即

<=1/=1

相对于反的〃个离差变量(X1-又),(X2-又),…,(X〃一刀),只有(〃一1)个可

以任意确定,第〃个失去了“自由”,所以能其自由度为(〃—1)。

(3)/分布的可加性

若x、y相互独立,且分别服从自由度为阳、%的?2分布,则x+y服

从自由度为々+”的?2分布,即

x+y〜/(4+〃2)

【例6-3]设X]….,乂6是独立同服从N(0,2)分布的随机变量,求a,b

22

和c使+b(X2+X3)+c(X4+X5+X6)服从/分布。

因为….,X6独立同N(0,2)分布,所以

则至从而;

X~N(0,2),~N(O,1),

VV1

X2+X3-/V(o,4),则\3〜Q(O,1),从而z(X?+X3)2〜72(1)

X+X+X

X+X+X^7V(0,6),则^~~~N(O,1),从而

4S6瓜

22

1(X4+X5+X6)-Z(1)O

o

由于42分布的可加性,则

2222

-X,+-(X2+X3)+-(X4+X5+X6)^^(3),自由度为3。且

ci=-,b=一和。=—o

246

§6.3.2亡分布

,分布又称为“学生分布”,是统计推断中的重要分布。它在总体均值的估

计与检验、相关与回归分析等方面有着广泛的应用。

Lf分布的定义及其密度函数

定义6-2若随机变量X~N(O,1),随机变量Y〜z2(n),且随机变量X与

丫相互独立,则随机变量

X

(6.4)

F77

服从自由度为〃的,分布,记为,〜«〃)。

f分布的概率密度函数比较夏杂。如果随机变量X服从自由度为〃的/分布,

则其概率密度函数为

I_«+1

/(X)=-------------(1+—)2-00<%<00(6.5)

观察/分布的概率密度函数,可以发现它是偶函数,所以/分布是关于原点

对称的,这一点和分布是不同的,却和标准正态分布相似。图6-2的三条曲

线分别是标准正态曲线以及自由度为19和5的/分布曲线。

通过比较可以发现/分布和标准正态分布类似,都是对称分布,均在

-8<工<8上取值。但是/分布与标准正态分布也有区别,,分布尾部厚,即服

从t分布的随机变量取到尾部值的概率比标准正态分布略大。而对于接近原点

的坐标点,f分布密度函数的值比标准正态分布密度函数的值小。因而/分布曲

线尾部厚于标准正态分布,而峰低于标准正态分布。

满足尸{,(〃)>ta(九)}=。的%⑺称为自由度为n的f分布上侧a分位数。

关于,分布上侧a分位数%(〃)可以通过书后附表求得,附表给出了自由度

〃工45的1分布上侧a分位数。例如a5(1°)=1・8125,由于,分布是定称分

布,所以九95(1°)=一1・8125。

2.t分布的性质特征

(1)/分布的数学期望与方差

[分布的数学期望与方差分别是

E(r)=O,。(/)=〃/(〃-2)n>2(6.6)

由于/分布是对称分布,其数学期望当然为0。隽要注意的是:只有当自由

度大于1,其数学期望才为0,自由度为1时,数学期望不存在;同时注意到/分

布的方差与其自由度有关,自由度小于等于2时,方差不存在,当自由度

〃―8,方差极限为lo

(2)/分布的自由度

f分布的自由度是由生成/分布的分母即卡方分布随机变量的自由度而来。

1分布的形状和自由度〃有较大关系,自由度越小,f分布曲线与标准正态分布

曲线的区别越明显,,分布“比较平”,而自由度增大,1分布曲线与标准正态分

布曲线的差异逐渐缩小。这一点也可以由f分布的方差来说明,当自由度〃较小

时,/分布的方差较大,此时其分布就“比较平”;而当自由度较大时,方差较

小,而月越来越接近1.此时/分布与标准正态分布逐渐接近C

【例6-4】设X”..,X6是独立同服从N(0,2)分布的随机变量,如果随机

Y

变量c/力服从自由度为5的I分布,求c等于多少。

因为X,.・,X6独立同服从服(0,2)分布,所以

v

X「N(0,2),则2=方~阳0,1)。

Y2丫2Y2Y2丫2

又因为%2=&_&+工+工+工〜2(5)

22222

而Z与%?相互独立,则由/分布的构造,有

医+9+星+应+巡/5

V22222

J(X;+X;+X:+X;+X;)/5

所以

§6.3.3厂分布

产分布是统计学家费雪(R.A.Fisher)于1924年提出的,尸分布在假设检

验、总体方差的统计推断、方差分析、回归分析和多元统计分析等方面有着广

泛的应用。

1.尸分布的定义及其密度函数

定义6・3若随机变量X、y分别服从自由度为〃1、%的卡方分布,且X、

y相互独立,则随机变量

F=*(6.7)

Y/n2

服从第一自由度为勺,第二自由度为%的尸分布,记为尸〜尸(勺,4)。

从户分布的定义可以看出,尸分布是两个独立的卡方分布随机变量与其各

自自由度商的比值,因而产分布具有两个自由度,作为分子的卡方分布随机变

量的自由度称为第一自由度,作为分母的卡方分布随机变量的自由度称为第二

自由度。

产分布的密度函数比较复杂,若随机变量/服从笫一自由度为々,第二自

由度为々的“分布,那么其密度函数为:

「(工

〃产〃2

22x>0

/(0=,吟(6.8)

0x<0

如图6-3所示,尸分布曲线有些类似于卡方分布,也是一种非对称的正偏

分布。其值域为(0,+8),但它有两个自由度修和〃2。尸分布的分布曲线随着

两个自由度的不同组合而不同。两个自由度的不同组合形成厂分布曲线的不同

形态,这在尸分布的图形中可清楚看到。随着第一自由度小的增大,分布曲线

逐渐趋向对称,随着两个自由度的增大,分布曲线逐渐趋于正态分布。

0.8

满足pS(〃],%)2乙(〃|,〃2))=二的心(〃|,〃2)称为自由度为〃的F分布

上侧。分位数。由于F分布有两个自由度,所以附表仅仅给出了某些较小。值

对应的外(勺〃2)值。例如a05(20,30)=1.93。对于任意的。和自由度,其分

位数都可通过EXCEL的FINV函数求得。

2.尸分布的性质特征

(1)产分布的数学期望和方差

F分布的数学期望和方差分别为

E(F)(%>2)

(6.9)

2片(勺+&-2)

D(F)=(%>4)

452—2)2(〃2—4)

从方分布的均值和方差表达式可以看出,随着第二自由度公增大,尸分布

的均值趋于1,而方差则取决于两个自由度。

(2)尸分布的自由度

厂分布的自由度是由构造F分布的分子和分母的两个z2分布的自由度而

来,由于其分子和分母的分布可以交换,所以尸分布的两个自由度有一个

重要性质,就是它们是可以互相转化的。

若F〜尸(公氏),则1/F〜。这个重要性质对于查尸分布求大。

的分位数提供了方便:

U,%)=工;----7(6.10)

工(乙,4)

【例6・5】给定显著水平。=0.95,查尸(15,20)的a上侧分位点。

因为一般F分布表并未给出a=0.95的上侧分位点。则要根据F分布的性

质,首先查乙05(20,15)=2.328,根据公式(6.9)可求得:

与95(15,20)=熹=0.4296

也可以通过EXCEL的统计函数功能中的函数FINV直接计算该分位数L

调出EXCEL的函数£,选中函数FINV,根据对话框输入相关信息即可。FINV

的对话框如图6-4所示。

图6-4EXCEL的函数FINV的对话框

§6.3.4抽样分布定理

下面讨论总体为正态分布时样本统计量的抽样分布。这是因为在实际应用

中许多总体分布或是正态分布,或是近似可以认为是正态的。即使总体分布非

正态,由中心极限定理可知,大样本下,样本均值的分布也可以近似认为是正

态分布。

定理6-1若〃是从总体N(〃,b2)抽取的一个简单随机样本,则

有:

-(y2

1.X〜N(〃,一)(6.11)

n

1%?分布和,分布的百分位点,也可分别通过EXCEL的统计函数CHINV和TINV得到。

(6.12)

期X,-方(〃.」或

〜/(〃T)(6.13)

3.样本均值X与样本方差52相互独立।o

其中又号,心上出厂对。

【例6-6]在正态总体NO/,。?)中抽出一个容量为25的样本,

125_

S2=—£(Xj-刀产为样本方差,这里〃和,均为未知。求

24/=|

(1)当b=2.3时,求P(|又一〃区1);

c2

(2)P(0.577<—<1,5173);

CT~

(3)D(S2);

2

解:(1)因为反〜N(〃J),所以当。=2.3,"二25时有:

n

P(|X-//|<1)

X—〃1

=P(\2.3/后区2.3/后)

=P(|Z|<2.174)=2P(Z<2.174)-1=2X0.985-1=0.97

(2)因为样本来自于总体样本容量〃=25,所以

(n-l)52(25-1)52

z2〜八24)

(72(J2

92

则^(0.577<^-<1.5173)

24s2

=P(0.577x24<<1.5173x24)

=P(0.577x244/(24)41.5173x24)

=尸(13.848</(24)<36.415)

=P(Z2(24)>13.848)-P(Z2(24)>36.415)

=0.95-0.05=0.90(查斤2分布表得出)

i定理证明略,读者可以参看的诗松等著《概率论与数理统计》。

24s2

因为(,所以由式()可知:。(/())。

(3)/24)=96.324=48

而。&)=唱等)

444

__p(z2(24))=__x48=,

定理6・2若总体服从从中抽取容量为〃的样本XI….,X„,则

t=(6.14)

S/y/n

证明:样本XI,...,X“相互独立,且都服从NT。?),由公式(6.12)和

(6.13)有:

Z=j一〃〜N(0,1)

/no7n

(-1)S2

和~~2

而且随机变量z与y相互独立。结合।分布的定义有:

z又一〃V^Tcr_X-JLI

=川川(〃-西=^^()

即/(〃-1)

【例6-7]设总体X服从正态分布NT。?),X1,…,X〃,X»1是来自

2

总体的一个样本,记》=一£Xi和s?=——y(xz.-x),试求

〃9〃-1言

Y_y

向“的分布。

S

由于X1,…,X”,X向来自总体N(〃Q2)的简单随机样本,则分别有

2

〜N(4,〃)和兄〜N(〃,——),且X,和Xfl相互独立,则

nJ+1

X,I+I-又"〜N(0,四/),且z=X「%~N0』)。

n"十12

Vn

2

因为72二%二比〜,2(〃一]),而且根据定理6/的结论有Z和7?相互独

立,所以

nX.-Xn

〜r(n-l)o

〃+1S

定理6・3若总体X服从N(4,b:),总体y服从N(4,b;),且两个总体

相互独立。从两总体中分别抽取容量为4和%的样本X,.X/和几...,小。

(2)当b;=b;,贝IJ

f_又-丫-(内-%)

I-1〜/(4+H-,—2)(6.16)

11

S”,—+——

用%

(々-l)S;+(〃2-l)S;

其中S“工

nA+%—2

i.i.di.i.d

证明:(1)因为X1,…,X,,~N(wd),几…〜N("?,6),并且

两组样本是相互独立的。所以

1~N(内,6g,一~N(-2/%)

并且又和「相互独立,从而

反一歹_(4_从)〜N(0,互+贡)

勺%

则z=又一;一(从二小)

〜N(0,l)。

?7

0-+%

V勺%

(2)因为由(6.12)式可以得到:

(H.-D5,2(叫一1局

~/(4-1),~/(%一1)

22

旦S:和S;相互独立,从而

Z=,十一,一〜=5]+%—2)

bb

并且(1)中的Z和上述/相互独立。根据t分布定义并化简可得

ZX—Y—(//1—//)

,=/,=---1:二0-〜5+%一2)

Jr/(%+%-2)s,十_L

所以,上述变量服从自由度为“+%-2的,分布。

定理6-4若总体X〜N(月,端),另一总体y〜N("2,b;),从第一总体

中抽取容量为々的样本,从第二个总体中抽取容量为小的样本,两个总体是独

立的,则变量

(6.17)

证明:因为样本相互独立且和总体具有相同的分布,所以

i.i.d

X],…,X%~N(〃0:)

i.i.d

加…,工〜Ngj

由前面定理6-13,

7(〃1—1)S:2/八

石=I2H/T)

0

9(%—i)s;[、

2〜万(D

两个总体相互独立,所以随机变量力:和%;相互独立,从而

产二//―2/b:

〜F(%

//(均一1)s;/8

所以该随机变量服从第一自由度为第二自由度为&-1的〃分布。

本章小结

I.总体可抽象为所感兴趣的变量及其取值的分布。通过观测或试验的方法

获得的总体中一部分个体称为样本,样本中每个个体称为样本点。

2.统计量是样本(X1,…,X〃)的函数且不含任何未知参数。在统计推断问

题中,经常需要利用取自总体的样本构造出合适的统计量,并使其服从或

渐进地服从已知的分布。常用统计量有样本均值和方差等。统计量的分布

为抽样分布。

3.在正态分布假定下三种常用分布——7?分布、t分布和F分布。本章介

绍了三种分布的定义、构造原理和重要性质,以及相应分位数的含义和计算方

法。

4.本章介绍了抽样分布理论中的几个重要定理。它们是对正态总体的均

值、方差等参数进行统计推断的重要理论基础。

基本知识梳理

基本知识点含义或公式

总体指所研究事物的全体(实物总体),或指所研究事物在某个特征上

的取值的全体(数值总体)。

样本按照随机原则从总体中抽出的n个个体。简单随机样本的性质:

(1)样本点和总体具有相同的分布

(2)样本点之间是独立的

统计量丁二/以不,….)是样本的函数,如果丁中不含任何未知

参数,则称7(%,兀,.../〃)为一个统计量。常用统计量有:样本均值

和样本方差、样本矩统计量、样本相关函数、样本的顺序统计量。

抽样分布统计量的分布称为抽样分布,常用的抽样分布有/分布、,分布、F

分布。

分布目互独立的且服从标准正态分布,则它们的平方和服从自

由度为n的/分布,即为X;〜#2(〃)。

z=l

/2分布的性自由度为n的/分布变量,均值和方差分别为n和2n;随自由度的增加,

质/分布趋近正态分布;独”42分布变量具有可加性。

自由度自由度也可粗略解释为可以自由选择数值的变量个数,即变量的总

个数减去线性约束的个数。

1分布x,y相互独立;X~N(O,1),y~/(〃);X即服从自由度为〃

x/r/n

的,分布,即〜/(〃)。

y/yTn

,分布的性质均值E(f)=0,方差。⑺=〃/(〃—2);/分布的自由度和分母中y

的自由度相同;(分布曲线比标准正态曲线低峰厚尾,随自由度的

增加,/分布趋近标准正态分布。

F分布X)相互独立;X~/(4),y~/2(%);F=X'即服从第一自由

~Y/n2

度为勺,第二自由度为%的尸分布,即尸=泮〜A%%)。

产分布的性质产分布的均值随着第一自由度&增大而趋于1,方差则取决于两个

自由度;若尸〜尸(勺,2),则//~F(%,〃i)。

在正态总体的假定条件下,有

抽样分布重X—N入T/八(«-1)522/1、

要定理r-~N(0/),、~/51),

o/<nb

;x_y”i2)_(_2)

依正一

练习题

一、单项选择题(在4个备选答案中选择1个正确答案)

1.某产品出厂检验规定:次品率〃不超过4%才能出厂,现从一1批产品中抽取

12件进行检查,假设取值为1代表次品,取值为0代表合格品,则数值总体是

()

A.OB.lC.0和1D.许多取值为0或1的数的全体

2.某厂生产的螺丝钉,其标准长度为6.8,而其真实的长度X〜N(〃,0.36),

从上述叙述中,假设总体均值就是标准长度,从生产的螺丝钉中抽取了1个螺

丝钉作为样本,其长度为6.7mm,则该样本X1的分布是()

A.P(X\=6.7)=1B.N(6.8,0.36)C.N(6.7,0.36)D.U(6.7,6.8)

3.样本和样本观测值的关系是()

A.两者都是随机变量,分布相同B.两者都是随机变量,但分布不同

C.样本观测值是样本的一次实现D.样本只能取样本观测值

4.设总体服从参数4的Poisson分布,从总体中抽取〃个样本,样本的联合分

布为()

n

%心

A--"叱七=0』,...B./E(1-A)1=1

在中

;=1

C.—e,xi=0,1,...D.以上都不对

xi!

5.以下不是统计量是()

A.样本均值B.样本方差C.样本极差D.样本量

6.设总体X〜N(0J),从总体中抽取〃个样本,下列统计量中不服从疗分布的

是()

A岂X;B.X;十X;C.(X]+X2)>+(乂3+乂力D.(X1+%2)

i=\2

7.设总体X服从自由度为3的/分布,从总体中抽取〃个样本,下列统计量

服从自由度为9的卡方分布的是()

22

A.(X[+X2)+(X3+X4)B.X;+X;+X;

C.X]+X、+X3D.(X]+X、+X?)2

8.比较标准正态分布和自由度为5的/分布的0.05分位数Z0o5和foos(5),可

以得到()

A.Zo,05<,0.05(5)B.Zoo5>ho5⑸C.Z)05=,o.O5⑸D.不能比较

9.假设独立总体X和y都服从标准正态分布,从两个总体中分别抽取10个和

15个样本,则下列说法中,正确的是()

10

A.Z(X4工.)2服从自由度为10的/分布

/=1

B.fx;服从自由度为14的/分布

1510

C-ZX/2/Z^2服从自由度为15和10的〃分布

/=1;=1

1510

D.2Z甲/©ZX;)服从自由度为15和10的r分布

/=i;=1

10.根据抽样分布重要定理,以下结论错误的是()

A.X服从正态分布B.f(X,—X)2服从自由度为(n-1)的二分布

/=1

C.r=〜,(〃一1)D.F=〜0,巧-1)

二、多项选择题(在5个备选答案中选择2-5个正确答案)

1.设X,..,X〃表示从总体X中抽出的样本,与表示样本观测值,总体

的均值〃和标准差。都是未知的,以下是统计量的有()

A.X,B.XC.£(Xj—“)2D.fx:+5E.x_

*=1i=l

2.设总体x是标准正态分布,X'…,X”表示从总体中抽出的样本,以下统

计量中,服从自由度为1的/分布的有()

2

9(>X.))

2B(k+Xjc台DrJX+X/f2

A・X1Jo•YJ•IJu*•/y\.•

'2n2白’

3.假设总体X是标准正态分布,用X1….,X〃+:表示从总体中抽出的样本,以

下统计量中,服从自由度为1的,分布的有()

X,X1+X“X+X,+X?yiX)

得|夜xV3|X4|版氏/Jx:+x;

4.假设独立总体X.Y是标准正态分布,用X”…,X“,X….,工表示从总体

中抽出的两个样本,以下统计量中,服从尸分布的有()

X:+片x;+y2(n-DXr

A.X;/『B.C.~D.E.

X:2X:*2fx;

i=2

5.正态总体的抽样分布定理和统计量,以下说法正确的是()

A.样本均值的分布是正态分布

B.当总体方差未知时,不能用正态分布对总体均值进行推断

C.当两个独立总体方差己知时,应该用/分布对均值的差异进行推断

D.当两个独立总体方差未知且相等时,可以用,分布对均值差异进行推断

E.可以用/分布统计量对两个独立总体的方差是否相等进行推断

三、判断分析题

1.样本点是相互独立的,并且和总体具有同一分布。

2.因为/具有可加性,所以/分布也具有可加性。

3.,分布随机变量的平方服从产分布。

四、简答题

1.什么叫抽样分布?为什么要研究抽样分布?

2./(勺,乙)和厂(他,勺)的百分位点有什么关系?

3.统计量的定义是什么?样本点是不是统计量?

4.为什么说标准正态分布是抽样分布理论的重耍基础?

五、计算题

1.假设(X「…,X„)是来自总体的一个样本,当总体服从以下分布时,求

出样本均值》的抽样分布:(1)X〜P(㈤(2)X-r(m)

2

2.查表计算下列分位数:(1)I。)。,为,/(5)0,05;(2)Z(10)(X975,/(⑼。.^,

(3)%75(12,10)

O

3,分别从方差为20和35的两正态总体中抽取容量为8和9的两个独立样

本,(%…(匕试计算P(S:>2S;)。

4.设(X,..,X〃,X用…是来自正态总体N(0,/)的样本,试求

下列统计量的分布

而力X,

忐X;

(1)i=l

Y=——产n+m°

心x;

V/=/»+1/=/»+!

第6章抽样分布参考答案

一、单选题

1~5:DBCAD;6~10:CCADBo

二、多选题

1.ABCDE;2.ABD;3.ABC;4.ACD;5.ADE;6.ADE。

三、判断分析题

1.正确,在统计推断口,假设总体是无限总体,因而无论采用何种抽样方式,

样本都是相互独立的,样本与总体的同分布性是由样本抽样时的随机原则决定

的。

2.错误,,分布不具有可加性,假设有两个独立的,统计量,自由度分别为,〃

vV

和小则根据/分布的构造,。=———小=——ro即使假定x,y,*S2

S、7mS2/\Jn

cy_i_cv

相互独立,t.+t2=-=——7^=,通分计算后分子不再服从卡方分布

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论