多元统计分析第三章 假设检验与方差分析_第1页
多元统计分析第三章 假设检验与方差分析_第2页
多元统计分析第三章 假设检验与方差分析_第3页
多元统计分析第三章 假设检验与方差分析_第4页
多元统计分析第三章 假设检验与方差分析_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第3章多元正态总体的假设检验与方差分析

从本章开始,我们开始转入多元统计方法和统计模型的学习。统计学分析处理的对象是带

有随机性的数据。按照随机排列、重复、局部控制、正交等原则设计一个试验,通过试验结果

形成样本信息(通常以数据的形式),再根据样本进行统计推断,是自然科学和I:程技术领域

常用的一种研究方法。由于试验指标常为多个数量指标,故常设试验结果所形成的总体为多元

正态总体,这是本章理论方法研究的出发点。

所谓统计推断就是根据从总体中观测到的部分数据对总体中我们感兴趣的未知部分作出推测,

这种推测必然伴有某种程度的不确定性,需要用概率来表明其可靠程度。统计推断的任务是“观

察现象,提取信息,建立模型,作出推断”。

统计推断有参数估计和假设检验两大类问题,其统计推断目的不同。参数估计问题回答诸如“未

知参数的值有多大?”之类的问题,而假设检验回答诸如“未知参数的值是吗?”之类的问

题。本章主要讨论多元正态总体的假设检验方法及其实际应用,我们将对•元正态总体情形作

一简单回顾,然后将介绍单个总体均值的推断,两个总体均值的比较推断,多个总体均值的

比较检验和协方差阵的推断等。

3.1一元正态总体情形的回顾

一、假设检验

在假设检验问题中通常有两个统计假设(简称假设),一个作为原假设(或称零假设),另

一个作为备择假设(或称对立假设),分别记为和。

1.显著性检验

为便于表述,假定考虑假设检验问题:设,,…,来自总体的样本,我们要检验

假设

,%:〃工4。(31)

原假设与备择假设应相互排斥,两者有且只有一个正确。备择假设的意思是,一旦否

定原假设,我们就选择已准备的假设。

当已知时.,用统计量

在原假设成立下,统计量服从正态分布,通过查表,查得的上分位点。

对于检验问题(3.1.1),我们制定这样一个检验规则(简称检验):

当时,拒绝;

当时,接受。(3.2)

我们称为临界值,是的上分位点,不同的临界值代表不同的检验。称拒绝原假设的

统计量的范围为拒绝域,称接受的统计量的范围为接受域,因此给出一个检验,就是给

出一个拒绝域。

2.两类错误

由于样本具有随机性,因此在根据样本进行判断时,有可能犯两种类型的错误。一类错误

是,原假设本来正确,但按检验规则却作出了拒绝的判断,这类错误称为第一类错误(弃

真错误),其发生的概率称为犯第一类错误的概率;另一类错误时,原假设本来不正确,但

按检验规则却作出了接收的判断,这类错误称为第二类错误(存伪错误),其发生的概率称

为犯第二类错误的概率,记为。

同时控制这两类错误是困难的,当时在样本容量固定的条件下,要使和同时减小,

通常是不可能的。在假设检验的应用中,由奈曼(NEYMAN)与皮尔逊(PEARSON)提出了一个原则,

即在控制犯第一类错误的概率条件下,尽量使犯第二类错误的概率小,这种检验问题,称

为显著性检验问题。根据这一原则,原假设受到保护,不至于被轻易拒绝,一旦检验结果拒绝

了原假设,则表明拒绝的理由是充分的,如果接受了原假设,则只是表明拒绝的理由还不充分,

未必意味着原假设就是正确的。所以,在实际问题中,为了通过样本观测值对某一猜测取得强

有力的支持,通称我们把这一猜测的否定作为原假设,而把猜测本身作为备择假设。

3.关于检验的值

下面,我们再介绍进行检验的另一种方式一一值,我们就以⑶1.1)的检验问题为例来

加以说明,对于样本,我们通过统计量,计算出,是一确定值,这里的是样本观测值的均

值,再由统计量服从正态分布,计算为检验的值。

由于等价于=,所以检验规则可以表述为:

当时,拒绝;

当时,接受。接受。(3.3)

上述值的检验规则与(3.1.2)的检验结果相比含有更丰富的信息、,值越小,拒绝原假

设的理由就充分。通常SAS等软件的计算机输出一般只给出值,由你自己给定的值来判断

检验结果

二、单一变量假设检验的回顾

1、单个正态总体均值的检验

考虑假设检验问题:设,,…,来自总体的样本,我们要检验假设

“°:〃=〃o,%

(1)总体方差己知

构造统计量

在原假设成立下,服从正态分布,可得这样一个检验规则:

(2)当时,拒绝;

(3)当时,接受。

(4)总体方差/未知

构造统计量

在原假设成立下,服从自由度为的分布可得这样一个检验规则:

当时,拒绝;

当时,接受。(3.1.4)

2、两个正态总体均值的比较检验

考虑假设检验问题

“0:=〃2,”1:工〃2(3.1.5)

(1)设是取自总体的容量为的样本,是取自的容量为的样本,给定显

著性水平。

(2)两个总体方差。:和(7;已知

文_yz

构造检验统计量z=1(3.1.6)

V巧叫

在原假设成立下,服从正态分布,检验规则为:

当时,拒绝;

当时,接受.

在方差分析问题中,变量是示性变量,即只取0或1的变量。GLM过程对每一因子的每

一水平,通过CLASS语句产生1个示性变量,也称分类变量。

GLM过程主要有四个语句:PROCGLM,CLASS,MODEL和LSMEANS语句。

PROCGLM语句用以调用GLM过程,有许多选项,一般形式是:

Procglm[daia=数据集名称][。111$3=输出的统计量]

[oider=foiniatted|fieq|data|internall;

CLASS语句说明哪些变量是分类变量。方差分析中的因素都是分类变量,如:

ClassVIV2V3;

此语句指示计算机把因子VI,V2,V3作为分类变量,可以是字符型变量或数字型变量。如

果是字符型变量,长度限于10个字符以内。

MODEL语句语句中等号前是响应变量,如:

ModelY=A:单因子ANOVA

ModelY=ABC;主效应模型

ModelY=ABA*B;含交互效应的因子模型

ModelY1Y2=AB;多因子方差模型MANOVA

LSMEANS语句用以求待估参数的最小二乘估计。

LsmcansABA*B;

MANOVA语句用以说明是做多元方差分析。

3.2均值等于常数向量的检验

在经济生产、管理决策中的很多实际问题,通常要选取多个指标进行考察,根据历史数据,

将项指标的历史平均水平记作,考虑新的项指标平均值是否与历史数据记载的平均值有

明显差异?若有差异,进一步分析差异主要在哪些指标匕先看下面的实例:

例3.1测量20名健康女性排汗量、钠含量、钾含量得表3.1。问健康女性、、

的均值是不是4、50.10?

表3-120名健康女性排汗量阳、钠含量工2、钾含量工数据

排汗量再钠含量乙钾含量工

3.748.59.3

5.765.18.0

3.847.210.9

3.253.212.0

3.155.59.7

4.636.17.9

2.424.814.0

7.233.17.6

6.747.48.5

5.454.111.3

3.936.912.7

4.558.812.3

3.527.89.8

4.540.28.4

1.513.510.1

8.556.47.1

4.571.68.2

6.552.810.9

4.144.111.2

5.540.99.4

一般的,我们考虑维正态分布均值等于常数的检验问题:为取自维正态总体的一

个样本,要检验:

,(3.4)

其中〃。为已知〃维向量。

对于这样一个检验问题,分为以下两种情形:

一、协方差阵已知条件下,均值的检验

作出假设后,需要构迨一个合适的统计量。要检验的假设在形式上同一维情形是一样的。

"o:〃二〃o;乩

在一维时构造的统计量为且在成立时,服从正态分布。

依照一维情形,由于成立时服从维正态分布,。若记,为非奇异对称阵,

则有服从但用来确定拒绝域不方便,因此,改选用统计量,

/=〃(又—〃0),£7(又一〃0)(35)

当成立时,服从-分布。对给定的,从,求出,当

时,要先求,这需要大量的计算。实际计算时,可以不必求出,只要令

即zy=(X-//0)(3.6)

求解方程组(3.2.3),求出Y后,则

/=〃(9—〃。)『丫

二.协方差阵未知条件下均值的检验

假设检验问题仍然是:

其中〃。为已知〃维向量。

回顾一元情况,在原假设成立下,服从自由度为的分布,

在维正态情况下,当协方差已知时,选用时统计量为

/二〃(又一〃。)72"(又一〃。)

现用样本协方差代替总体协方差阵,令

2Tl

T=n(n-l)(X-jLic)S-(X-ju0)

统计量的分布是一元统计中分布的推广,最早由HOTELLING导出,在上一章中,我们

已经给出了这个定义,可以直接用它作为检验的统计量,分布已被仔细研究过,幽及5%的

分位点已经列成专表,读者可在[3]中找到这个表。也可以利用HOTELLING分布的性质,

.+1尸~F(p,〃-p)(证明参见朱道元P210)

5-1)〃

当不成立时,有变大的趋势,对给定的,从

求出,当时,拒绝;否则接受。

例3.1测量20名健康女性排汗量、钠含量、钾含量得表3.1。问健康女性、、的

均值是不是450、10?

解:建立

用SAS,MATEMATICA,MATLAB等软件都可算出

-4.64■2879368410.0100000-1.8090526-

x=45.4,S=10.0100000199.7884211-5.6400000

9.965-1.8090526-5.64000003.6276579

T2=20(X一4)'ST(X-//())=9.74。

F=(20-3)*7,2/(19*3)=2.90>A;,,(0.10)=2.44

所以否定原假设,即在o.10显著水平下拒绝。

例3.1也可用下列SAS程序计算

datahanye;

inputxl-x3;yl=xl-4;y2=x2-50;y3=x3-10;a=l;

cards;

3.748.59.3

5.765.18.0

3.847.210.9

3.253.212.0

3.155.59.7

4.636.17.9

2.424.814.0

7.233.17.6

6.747.48.5

5.454.111.3

3.936.912.7

4.558.812.3

3.527.89.8

4.540.28.4

1.513.510.1

8.556.47.1

4.571.68.2

6.552.810.9

4.144.111.2

5.540.99.4

procglm;

modelyl-y3=a/noint;

manovah=a/printeprmth;

run;

执行此程序后得到的输出中主要的是最后一个表

H=TypeIIISSCPMatrixfora

E=ErrorSSCPMatrix

S=1M=0.5N=7.5

StatisticValueFValueNumDFDenDFPr>F

Wilks*Lambda0.661127742.903170.0649

Pi1lai'sTrace0.338872262.903170.0649

Hotelling-LawleyTrace0.512566992.903170.0649

Roy'sGreatestRoot0.512566992.903170.0649

可见P值为0.0649,所以否定原假设,即在0.10显著水平下拒绝。

在实际工作中,一元检验与多元检验可以联合使用,多元的检验具有概括和全面的优点,而一

元的检验容易发现各指标之间的关系和差异,两者的结合能给统计人员提供更多的统计分析信

息。

3.3两总体均值的比较检验

例3.2为了研究日美两国在华企业对中国经营环境的评价是否存在差异,从两国在华企

业对中国的政治、经济、法律、文化等环境打分,得表3-2。试分析日美两国在华企业对中国

经营环境的评价是否存在差异?

表3-2日美两国在华企业对中国经营环境的评价

美国企业号政治环境XI经济环境X2法律环境X3文化环境X4

美165352560

美275502055

美360453565

美475404070

美570303050

美655403505

美760453060

美865402560

美960503070

美1055553575

日本企业号政治环境Y1经济环境Y2法律环境Y3文化环境Y4

日1,55554065

日250604570

日345453575

日450505070

F1555503075

日660404560

日765554575

日850653580

日940453065

日1045504570

假设服从,服从下,且有10对样品,要做复合检

一般情况下,我们考虑为取自维正态总体的一个样本,为取自维正态总体的

一个样本。假定两组样本相互独立,且

一、有共同已知的协差阵时

对于例3.2提出的问题,可归类为假设检验问题:

“0:M=〃2〃1:〃1工〃2其中〃i4为已知'维向量。

在一维情形下,用了统计量,与前面相似的思路,在维时,选用统计量

Z2=^(X_F)7E-1(X_F)

〃+〃2

当成立时,服从-分布。对给定的显著性水平,从,求出。当时,拒绝

:当<时,接受“

二、有共同的未知协差阵时

假定两组样本相互独立,己知两总体有相同的协方差年>0,但未知,要检验的假设

/:从=〃2W:从其中从生为己知〃维向量。记

r

5)=J(Xf-X)(Xr-X)

i=l

S2=Z(Z-F)(Z—F)T

1=1

采用统计量为

T2=--(〃?+〃一2)(x-y)/(y+s,『(x_y)

m+n

定理3.2若,成立;则

F—+/n-p—\)T2/[p(n+m—2)]〜尸(〃,〃十/〃一p—1)

证明参见朱道元P217

定理3.2可用于用做两总体复合检验。

根据定理3.2,当成立时,统计量

(〃+加一2)一〃+12n+m-p-\

r=------------------------I------------------12

(〃+m-2)〃(〃+in-2)p

二刖加+力/⑸+S,)~\X-Y)〜F",〃”一p-l)

p(m+n)

当不成立时,有变大的趋势,对给定的,从

求出,当时,拒绝;否则接受O

以上有关的统计量在成立时所服从的分布的相应证明都比较复杂,这里我们只叙述了有

关结论,没有给出证明,可参看第二章的相关内容。这些统计量同一维相应的统计量均有相似

之处,对比两者的形式有助于理解和应用。

例3.2的解:作假设

-64-'51'

__43_51

X=r=

30.5740

6370.5

-54.44444444-18.888888汾-13.33333333-27.22222222'

-18.888888®56.666666671.1111111134.44444444

SY=

-13.333333231.1111111135.8333333828.88888889

-27.2222222234.4444444428.888888汾56.66666667

45.833333335.8333333319.44444444-0.83333333

5.8333333355.833333332.7777777826.94444444

Sy二

19.444444羽2.7777777850.000000(1)-11.11111111

-0.8333333326.94444444-11.1111111135.83333333

10*10_———

T2=(X—P7ST(X—y)=29.8625

10+10

F=(10+10-4-l)/(910+10-2)*4)*29.8625=6.2214>^15(0.01)

所以日美两国在华企业对中国经营环境的评价存在显著差异。

例3.2可用如下SAS程序实现

datawul;

inputno$polecnlegculcou$;

cards;

2<6535256o

21

255o2o55

36o453565

4757o

40

5o

3050

6554o3565a

376o453o6oa

65256o

40

96o5o3o7o

:1o55553575a

t

Lt155554o65

Em25o457o

60

日345453575D

日450505070j

日555503075j

日6604045603

日765554575j

日850603580j

口940453065j

日1045504570j

procglm;

classcou;

modelpolecnlegcu_=cou/ss3;

manovah=cou/printeprinth;

run;

执行此程序后得到的输出中主要的是最后一个表

H=TypeITTSSCPMatrixforcou

E=ErrorSSCPMatrix

S=1M=1N=6.5

StatisticValueFValueNumDFDenDFPr>F

Wilks'Lambda0.376077346.224150.0037

PillaisTrace0.623922666.224150.0037

Hotelling-LawleyTrace1.659027526.224150.0037

Roy'sGreatestRoot1.659027526.224150.0037

由此可见P值是0.0037,因而日美两国在华企业对中国经营环境的评价存在显著差异。

3.4多个总体均值向量的比较检验

在研究作物栽培时,要考虑播种期、品种、土质、施肥方式、灌溉方式对产量的影

响;在化学反应中要观察原料成分、剂量、催化剂、温度、压力,搅拌速度等对得

率的影响。在很多应用领域尤其是科学研究中,都遇到过类似的问题,常涉及许多

因素,这类问题要分析出影响最“大”的因素,就是比较各种因素对试验结果所起的

作用问题。作为影响试脸结果的每一因素或因素的某一水平或某一方案,且试验结

果都形成一个随机总体。这样,比较各种因素对试验结果所起的作用问题就变成对

各种因素的试验结果所形成的总体的比较问题。

由于试验指标常为多元指标,故常设试验结果所形成的总体为多元正态总体。此外,

我们按照随机排列、重复、局部控制、正交等原则设计一个试验,除要考察的因素

外,其他试验条件均要求一致,即要考察的试验因素的试验结果都是同协方差阵的

且相互独立的多元正态总体。因而,各因素对试验结果影响的结果的比较,就变成

了多个同协方差阵的多元正态总体均值向量的比较。统计上解决两个以上同协方差

阵多元正态总体均值向量比较的方法叫做多元方差分析。多个总体均值向量的比较

检验,特别是多元方差分析正是本节的内容,这类方法在经济管理,系统控制,生

物医药等许多领域有着广泛的应用。这里先看一个具体实例。

3.4.1提出问题

例3.3为了研究某种疾病,对三组人测量:第1组是20至35岁女性、第2组是20至25岁

男性、第3组是30至55岁男性。每组取20个人,测量第I组的第J人4个指标是:脂蛋白

()、甘油三脂()、脂蛋白()、前脂蛋门()。测量结果见表3-3。问三组

人的指标间有没有显著差别?

表3-3夕脂蛋白、甘油三脂、。脂蛋白、前夕脂蛋白数据

r(,)X⑴r(,)X⑵r(2)丫⑶(3)丫⑶r⑶

巧4%r

力1勺2勺3人〃勺1为2勺3勺2勺3人J4

2607540183101223021320643917

200723417310603518260593711

2408745181904027153GO88282G

1706539172256534162951003612

2701103924170653716270653221

20513034232108231173801143621

190692715280673718240554210

200464515210383617260553420

25011721202806530232601102920

2001072820200764017295733321

22513036112007639202401143818

21012526172809426113101033218

1706431141906033173301122111

2707633132955530163451272420

1906034162701252421250622216

2808120182801203218260592119

31011925152406232202251003430

270573182806929203451203618

2506731143707030203601072523

26013539292804037172501173616

问题中的3组人的测量值、、,每个随机向量有4个指标,即4维随机向量。例3.3要

从每个总体20个样品值出发,检验是否成立。

3.4.2单因素方差分析的数学模型

方差分析的目的在于找出自变量与因变量之间的线性关系,或自变量对因变量的实验效果。方

差分析是一种处理实验数据的方法,考察一个被称为因变量或相依变量(depencientvariable,)

的连续响应变量,乂称反应变量(ResponseVariable),其数值则是连续的,它在由分类变量识别的

几种试验条件下被测量,这些分类变量被称为自变量,独立变量(independentvariable),定性变量

(QualitativeVariable)或分类变量(ClassificationVariable),其数值多半是不连续的。这些分

类变量的水平组合形成试验设计的单元。例如,某个试验要测量男人和女人的重量变化〔因变

量),他们采取了三种不同的减肥方法,这个设计的6个单元由性别(男、女)和减肥方法(ABC)

6种组合形成。

一项试验有多个影响因素,因素也可以看成是一种变量,其取值不是数,而是水平。例如“产地”

是一个变量,它取的值是“北京”、“上海”、“南京”等。这种变量称为属性变量,定性变量或分

类变量.如果只有一个因素在发生变化,其他因素保持不变,则称为单因素试验,与之对应的方

差分析,称为单因素方差分析。

我们所考察的.影响产品指标的因素(如产地,温度)也称为因子,用大写字母A,B,C表小。

因素所能处的状况,如甲、乙、丙;60,65,70,75,……,称为因素的水平,简称为水平。水平常

以表示。

一般地,假设因素A有k个水平:。对第个水平进行试验,独立观察次,,整个试

验共作了次,且完全随机排列。

设4的第/次观察的试验指标为p维向量

假设:

(I)同一个水平下得到的观测值,…;…:,…,由于实验过程中各种倡然因

素的干扰及测量误差所致,每次实验中这些偶然因素的总和称为实验误差,它们是

方差相同的零均值正态随机变最;

(2)所有误差相互独立;

由于水平的不同,可能会给一个定量的确定性的影响,其大小是未知的。

假定〃=一工从令〃

〃日

于是有模型:

X?=〃+%+%

・%~Np(0、E)且相互独立

i=l,2,…,4,7=1,2,…,《

其中称为总体均值向量,为的主效应向量,为的第次观察的随机误差向量,根据假设

相互独立且均服从。

判断这个因素的影响是否显著就是要检验假设:

H0:a[=a2=---=ak=0储:%%不全为0(3.7)

设第I组样本均值X")=上方X?

总均值又=」£yX?

flr=lj=l

样本组内差后=之石(X;”—湎)(x,—而y

/=1;=1

样本组间差3二之〃,(又一尸)(又一尸)、

1=1

A=ti(X?-5)(Xf-又)=5+E,

r=lj=\

对干该检验问题的统计量,取WILKS统计量

定理3.3若,则服从WILKS分布

证明参见朱道元第177页

例3.3为了研究某种疾病,对三组人测量:第1组是20至35岁女性、第2组是20至25

岁男性、第3组是30至55岁男性。每组取20个人,测量第I组的第J人4个指标是:脂蛋

白()、甘油三脂()、脂蛋白()、前脂蛋白()。测量结果见表3.3。问三

组人的指标间有没有显著差别?

解这儿有3个总体,建立假设

计算三总体样本均值

一231.0--253.5--292.75-

89.672.5590.2

X=(2)=,A„(3)=

32.932.4531.75

_17.1_17.9__18.4

计算组内差

-305306298-1078195­

15736.8-796.81:387.8

E[二

*95590.2

•.413.8_

-517057021.5-1571.5827

12288.95-807.95321.

E=

2364.95-5.1

■•**133.8

-

■43173.759959-1301.25723

•12441.2-333457.4

4=761.5-112

••476.8

12504.823278.5-395.751748-

40466.395-1937.752166.3

E=E4分卜氏二

2082.5-26.9

*•1024.2

计算组间差

—-

39065.832307.92-724.08786

4017.23-35.82-26.9

B=

13.43-14.7

*•17.2

--

计算总方差

-164474.5825586.42-4674.832534-

•44484.18-1973.572139.4

B+E=

2095.93-41.6

•••1041.4

计算统计量,资得〉0.6621;

所以高度显著否定,故三组人身体指标有显著差异。

3.5总体协差阵相等的检验

本章第三节和第四节中,总假定不同总体的方差是相同的,这一假定是否合理?在一些问题

中应当加以证明。

3.5.1一个正态总体协方差阵的检验

设为取自维正态总体的一个样本,未知,且。

首先,我们考虑假设检验问题:,

所构造的检验统计量为

行expTMN*产

其中

r

A=^(X/-X)(X;-X)

2I

然后,我们考虑假设检验问题:,

因为,所以存在非奇异矩阵,使得

令匕=OX,,i=l,2,…,〃

则Yj~Np®i,DXDT)=Np("*£)

因此检验2==等价于£*=/「

此时构造检验统计量为

/l=exp{--rM^}A*|n/2(-)n,V2

21n

其中

A;力(工―力(匕―力,

/=1

给定检验水平,因为直接卷的分布计算临界值很困难,所以通常采用的近似分布。

在成立时,的极限分布是,因此当»,由样本值计算出值,若〉,即

<,则拒绝,否则不能拒绝。

3.5.2多个协方差阵相等检验

刚才讨论的检验是一个正态总体协方差阵的检验,是检验当前协方差阵与过去是否

一样,在一些实际问题中,可能会遇到多个正态总体的协方差阵是否相等的问题。

设有个正态总体分别为,…,,且未知,

从第i个总体中取%个样本

m,□

这里+%+,,•+,”=〃为总样本容量。

我们考虑假设检验问题为

,不全相等

构造检验统计量为

小丁2-

♦=%产1----------------

|A|口,产

r=l

其中4=火4

1=1

4=宜(X?—又⑴)(x7_x(i))T,

按照Bartlett的建议,记,得到修正的检验统计量

,M产N喇2

2-Jrl___________________

£一IA|N/2k

i=l

则在成立时,的极限分布是,其中

.f=g〃(P+D伏-1)

2P、3p-l侍1___

6(〃+1)(攵-幅同—片{NJ不必相等;

(2p2+3p-l)(k+l){“相等

6(p+l)M

有甲、乙两品种,取得如表3-4所示的两个二元正态样本,试检验

表3-4方差阵检验数据

观察值和百

3002322171002863201455385109

甲⑴26385

X235254310171233417

2001503331502833833503002149635167

乙X⑵161638

5043834173808610055642044

解:

「90163.48540.01

A=

[8540.04297.5

|A|=14892822ln|4,|=16.5164

|阕=460883525ln|4|=17.6461

|41=314545504.1ln|A|=19.5666

由于,,,,,,,故

kk

-21n2'=N(In|A\-p\nN)+收乂lnN女工ln|4|

r-l/=l

=175.1614+43.3371-206.0957=7.815

6/=0.1874

/=gp(〃+l)d)=3

=而3(3)=9.6176

由于,故应拒绝,即认为有显著差异。

3.6独立性检验

一个随机向量,若其中两子向量相互独立,则可化为两个低维随即向量处理,给统计

分析带来极大的便利,因此检验一个随机向量的子向量之间是否独立是参数假设检验中的重大

课题,而当

时,,相互独立,互不相关()。这时,,的独立性检验可归结

为参数假设检验。

一般情况下,设,正定,将分割成个子向量:

X=(X⑴,X⑵,•.•,X⑹),,

其中的维数为,,将与也作相应的剖分:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论