多元第三章 精品课件_第1页
多元第三章 精品课件_第2页
多元第三章 精品课件_第3页
多元第三章 精品课件_第4页
多元第三章 精品课件_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、多元课件第三章 第1页,共83页,2022年,5月20日,13点40分,星期二1第三章 多元正态总体参数的假设检验目 录(二)3.3 多总体均值向量的检验3.4 协差阵的检验3.5 独立性检验3.6 正态性检验 第三章所涉及的最大似然估计量小结 第2页,共83页,2022年,5月20日,13点40分,星期二2第三章 多元正态总体参数的假设检验3.3 多总体均值向量的检验-两个p元正态总体 当p1时,因 且相互独立,故有 1. 两总体协差阵相等(但未知)时均值向量的检验 设X()(1,n)为来自总体XNp(1),)的随机样本;Y()(1,m)为来自总体Y Np(2),)的随机样本,且相互独立,未

2、知.检验第3页,共83页,2022年,5月20日,13点40分,星期二3第三章 多元正态总体参数的假设检验3.3 多总体均值向量的检验-两个p元正态总体 取检验统计量为 t (n+m-2) (在H0成立时) ,即 第4页,共83页,2022年,5月20日,13点40分,星期二4第三章 多元正态总体参数的假设检验3.3 多总体均值向量的检验-两个p元正态总体 推广到p元总体,检验统计量的形式类似,可考虑以下检验统计量T2: 其中A1和A2是两总体的样本离差阵.它们是一元统计中的偏差平方和(X(i)-X)2在p元情况下的推广.以下来证明统计量T 2 T 2 (p,n+m-2). 因 第5页,共83

3、页,2022年,5月20日,13点40分,星期二5第三章 多元正态总体参数的假设检验3.3 多总体均值向量的检验-两个p元正态总体 由Wishart分布的可加性知 A1+ A2Wp(n+m-2,),由T2统计量的定义3.1.5可知 第6页,共83页,2022年,5月20日,13点40分,星期二6第三章 多元正态总体参数的假设检验3.3 多总体均值向量的检验-两个p元正态总体 利用T2与F的关系,检验统计量取为 可以证明T2 (或F)统计量是检验以上假设H0的似然比统计量.(见习题3-10)第7页,共83页,2022年,5月20日,13点40分,星期二7第三章 多元正态总体参数的假设检验3.3

4、多总体均值向量的检验-两总体均值检验例子 为了研究日、美两国在华投资企业对中国经营环境的评价是否存在差异,今从两国在华投资企业中各抽出10家,让其对中国的政治、经济、法律、文化环境进行打分,评分结果见表3.2(表中1至10号为美国在华投资企业的代号,11至20号为日本在华投资企业的代号.数据来源于:国务院发展研究中心APEC在华投资企业情况调查). 解 比较日、美两国在华投资企业对中国多方面的经营环境的评价是否有差异问题,就是两总体均值向量是否相等的检验问题.(见yydy331a.sas或yydy331b.sas)第8页,共83页,2022年,5月20日,13点40分,星期二8第三章 多元正态

5、总体参数的假设检验3.3 多总体均值向量的检验-两总体均值检验例子 第9页,共83页,2022年,5月20日,13点40分,星期二9第三章 多元正态总体参数的假设检验3.3 多总体均值向量的检验-两总体均值检验例子 记美国在华投资企业对中国4个方面的经营环境的评价为4维总体X,并设XN4(1),).日本在华投资企业对中国经营环境的评价为4维总体Y,并设YN4(2),). 来自两总体的样本容量n=m=10.检验取检验统计量为 由样本值计算得:X(64, 43, 30.5, 63), Y(51.5, 51, 40, 70.5),第10页,共83页,2022年,5月20日,13点40分,星期二10第

6、三章 多元正态总体参数的假设检验3.3 多总体均值向量的检验-两总体均值检验例子进一步计算可得: 第11页,共83页,2022年,5月20日,13点40分,星期二11第三章 多元正态总体参数的假设检验3.3 多总体均值向量的检验-两总体均值检验例子对给定显著性水平=0.01,利用统计软件进行检验时,首先计算p值(此时检验统计量FF(4,15): p=PF6.2214=0.0037 .因p值=0.00370.01=,故否定H0,即日、美两国在华投资企业对中国经营环境的评价存在显著性差异.在这种情况下,可能犯第一类错误,且犯第一类错误的概率为0.01.第12页,共83页,2022年,5月20日,1

7、3点40分,星期二12第三章 多元正态总体参数的假设检验3.3 多总体均值向量的检验-两个p元正态总体 2. 两总体协差阵不等时均值向量的检验 在一元统计中(p=1时),当12 22时,检验H0:(1)(2)也没有很好的方法,以下介绍实用中的几种方法. 当n=m时,作为成对数据进行处理.令Z(i)=X(i) -Y(i) (i=1,n),化为单个p元总体Z的均值检验问题 H0:(1)(2) H0: Z0 利用前面介绍的方法进行检验. 注意:在这里两组样本相互独立的信息没有利用.第13页,共83页,2022年,5月20日,13点40分,星期二13第三章 多元正态总体参数的假设检验3.3 多总体均值

8、向量的检验-两个p元正态总体 当nm时(不妨设nm):想法也是化为单个p元新总体的均值检验问题.若只取n对数据按方法处理,又将损失一些信息.改进的办法是利用X(i) (i=1,n)和Y(j) (j=1,m),构造新总体Z的样本Z(i) ,令可以证明: 第14页,共83页,2022年,5月20日,13点40分,星期二14第三章 多元正态总体参数的假设检验3.3 多总体均值向量的检验-两个p元正态总体所以Z(i) N p(1)-(2),Z) (i1,n),且相互独立.利用前面介绍的单个正态总体均值向量的检验方法进行检验. 当1 , 2相差甚大时, 可构造近似检验统计量进行检验(见参考文献1). 其

9、中第15页,共83页,2022年,5月20日,13点40分,星期二15第三章 多元正态总体参数的假设检验3.3 多总体均值向量的检验多元方差分析 多个正态总体均值向量的检验问题也称为多元方差分析 . 设有k个p元正态总体Np(t),) (t1,k),样品 (t1,k,1,nt )是来自Np(t),)的随机样本,检验 H0:(1)(k),H1:至少存在ij使得(i)(j) (即(1),(k)中至少有一对不等). 当p=1时,此检验问题就是一元方差分析问题,比如比较k个不同品牌的同类产品中一个质量指标X(如耐磨度)有无显著差异的问题,我们把不同品牌对应不同总体(假定为正态总体),这种多组比较问题就

10、是检验问题.第16页,共83页,2022年,5月20日,13点40分,星期二16第三章 多元正态总体参数的假设检验3.3 多总体均值向量的检验多元方差分析 从第i个总体抽取容量为ni的随机样本如下(i=1,k;记n=n1+n2+nk): 第17页,共83页,2022年,5月20日,13点40分,星期二17第三章 多元正态总体参数的假设检验3.3 多总体均值向量的检验多元方差分析(p=1) 当p=1时,利用一元方差分析的思想来构造检验统计量.记 则有平方和分解公式: SSTSSA+SSE 第18页,共83页,2022年,5月20日,13点40分,星期二18第三章 多元正态总体参数的假设检验3.3

11、 多总体均值向量的检验多元方差分析(p=1) 直观考察,若H0成立(即k个总体均值无显著差异),当总偏差平方和SST固定不变时,应有组间偏差平方和 SSA小,而组内偏差平方和 SSE大,因而比值SSA/SSE应很小. 检验统计量取为 给定显著性水平,按传统检验方法,查F分布临界值表得F满足: PFF,否定域WFF .第19页,共83页,2022年,5月20日,13点40分,星期二19第三章 多元正态总体参数的假设检验3.3 多总体均值向量的检验多元方差分析 推广到k个p元总体Np(t,) (假定k个总体的协差阵相等,且记为),记第i个p元总体的数据阵为对总离差阵进行分解: 第20页,共83页,

12、2022年,5月20日,13点40分,星期二20第三章 多元正态总体参数的假设检验3.3 多总体均值向量的检验多元方差分析 其中 称为组间离差阵. 故交叉项=O称为组内离差阵. 第21页,共83页,2022年,5月20日,13点40分,星期二21第三章 多元正态总体参数的假设检验3.3 多总体均值向量的检验多元方差分析 根据直观想法及用似然比原理得到检验H0的统计量为 由Wishart分布的定义容易得出: 因 Ai Wp(ni-1,)且相互独立(i1,k),由可加性可得AA1+AkWp(n-k,) (n=n1+nk). 在H0下,TWp (n-1,). 还可以证明在H0下,BWp(k-1,),

13、且B与A相互独立.第22页,共83页,2022年,5月20日,13点40分,星期二22第三章 多元正态总体参数的假设检验3.3 多总体均值向量的检验多元方差分析根据分布的定义,可知 给定显著性水平,查Wilks分布临界值表,可得,使 P,故否定域W . 当手头没有Wilks临界值表时,可用2分布或F分布来近似,即由的函数的近似分布进行检验(见参考文献1或2).第23页,共83页,2022年,5月20日,13点40分,星期二23第三章 多元正态总体参数的假设检验3.3 多总体均值向量的检验多元方差分析的例子 为了研究某种疾病,对一批人同时测量了四个指标:脂蛋白(X1),甘油三酯(X2),脂蛋白(

14、X3),前脂蛋白(X4).按不同年龄、不同性别分为三组(20至35岁的女性、20至25岁的男性和35至50岁的男性),数据见书中表3.3.试问这三组的四项指标间有无显著性差异? 解 比较三个组(k=3)的4项指标(p=4)间是否有差异问题,就是多总体均值向量是否相等的检验问题.设第i组为4维总体N4(i),)(i=1,2,3).来自3个总体的样本容量n1=n2=n3=20.检验 H0: (1)(2)(3) H1:(1),(2),(3)至少有一对不相等. ( 见yydy332?.sas )第24页,共83页,2022年,5月20日,13点40分,星期二24第三章 多元正态总体参数的假设检验3.3

15、 多总体均值向量的检验-两总体均值检验例子 第25页,共83页,2022年,5月20日,13点40分,星期二25第三章 多元正态总体参数的假设检验3.3 多总体均值向量的检验-多元方差分析的例子 因似然比统计量(p,n-k,k-1),此例中k-1=2,可以利用统计量与F统计量的关系,取检验统计量为F统计量:由样本值计算得:X=(259.08, 84.12, 32.37, 17.8), 第26页,共83页,2022年,5月20日,13点40分,星期二26第三章 多元正态总体参数的假设检验3.3 多总体均值向量的检验-多元方差分析的例子第27页,共83页,2022年,5月20日,13点40分,星期

16、二27第三章 多元正态总体参数的假设检验3.3 多总体均值向量的检验-多元方差分析的例子进一步计算可得对给定=0.01,利用统计软件(如SAS系统),首先计算p值(此时检验统计量FF(8,108): p=PF3.09007=0.003538.因p值=0.0035380.01=,故否定H0,这表明三个组的指标之间有显著的差异.在这种情况下,可能犯第一类错误,且第一类错误的概率为0.01.第28页,共83页,2022年,5月20日,13点40分,星期二28第三章 多元正态总体参数的假设检验3.3 多总体均值向量的检验-多元方差分析的例子 进一步地若还想了解三个组指标间的差异究竟是哪几项指标引起的,

17、可以对4项指标逐项用一元方差分析方法进行检验,我们将发现三组指标间只有第一项指标X1有显著差异. 事实上,用一元方差分析检验第一项指标X1在三个组中是否有显著差异时,因 第29页,共83页,2022年,5月20日,13点40分,星期二29第三章 多元正态总体参数的假设检验3.3 多总体均值向量的检验-多元方差分析的例子其中t11和a11分别是T和A中的第一个对角元素. p1=PF18.8780=0.0004401(检验统计量F1F(2,57)p值=0.0004401显著地小于0.01,故第一项指标X1在三个组中有显著差异. 第30页,共83页,2022年,5月20日,13点40分,星期二30第

18、三章 多元正态总体参数的假设检验3.4 协差阵的检验-单个p元正态总体 设X()(=1,n)为来自p元正态总体Np(,)(0未知)的随机样本,检验 H0: 0(00为已知阵),H1:0 1. 当0 Ip时检验H0:Ip,H1:Ip 利用似然比原则来导出检验统计量1 当Ip成立时,似然函数L(,Ip)在X达最大值.第31页,共83页,2022年,5月20日,13点40分,星期二31第三章 多元正态总体参数的假设检验3.4 协差阵的检验-单个p元正态总体 所以似然比统计量 其中 第32页,共83页,2022年,5月20日,13点40分,星期二32第三章 多元正态总体参数的假设检验3.4 协差阵的检

19、验-单个p元正态总体 利用定理3.2.1可知,当n很大且H0成立时, =-2ln1的近似分布为2(p(p+1)/2),参数空间的维数为p+p(p+1)/2,而0的维数为p,故卡方分布的自由度为p(p+1)/2. 取作为检验统计量,按传统检验方法,对给定显著性水平,否定域为 2,其中2 满足:P 2 =.第33页,共83页,2022年,5月20日,13点40分,星期二33第三章 多元正态总体参数的假设检验3.4 协差阵的检验-单个p元正态总体 2. 当0 I p时检验H0 :0 ,H1 :0 因00,存在p阶非退化阵D,使D0DI p, 令 Y()=DX ()(1,n),则Y()N p(D,DD

20、)=N p(*,*)检验H 0 :0 H0 :* I p 从新样本Y()(=1,n)出发,检验H0:*Ip的检验统计量取为记为第34页,共83页,2022年,5月20日,13点40分,星期二34第三章 多元正态总体参数的假设检验3.4 协差阵的检验-单个p元正态总体 其中 若注意到D0DI p ,即第35页,共83页,2022年,5月20日,13点40分,星期二35第三章 多元正态总体参数的假设检验3.4 协差阵的检验-单个p元正态总体 研究似然比统计量2的抽样分布是很困难的.通常根据定理3.2.1由2的近似分布来构造检验法. 当样本容量n很大,在H0成立时,-2ln2 的极限分布为2(p(p

21、+1)/2). 除此外在不同适用范围下还有其它近似分布可用来构造检验法.则似然比统计量2还可以表示为 第36页,共83页,2022年,5月20日,13点40分,星期二36第三章 多元正态总体参数的假设检验3.4 协差阵的检验-单个p元正态总体 3. 检验H0:20 (2 未知) 当0 Ip 时此检验常称为球性检验.利用似然比原则来导出检验统计量3: 当2给定时,似然函数L(,20)在=X达最大值,且第37页,共83页,2022年,5月20日,13点40分,星期二37第三章 多元正态总体参数的假设检验3.4 协差阵的检验-单个p元正态总体 可得出 第38页,共83页,2022年,5月20日,13

22、点40分,星期二38第三章 多元正态总体参数的假设检验3.4 协差阵的检验-单个p元正态总体 所以似然比统计量 或等价于 当样本容量n很大,在H0为真时有以下近似分布: 第39页,共83页,2022年,5月20日,13点40分,星期二39第三章 多元正态总体参数的假设检验3.4 协差阵的检验-多个p元正态总体 设有k个总体Np(t),t)(t=1,k),X()(t)(t1,k;1,n t)来自第t个总体Np(t) ,t )的随机样本,记nn1+n2+nk. 检验H0 :1=2=k,H1 : 1, 2,k不全相等. 样本 X()(t)的似然函数为似然比统计量4为 第40页,共83页,2022年,

23、5月20日,13点40分,星期二40第三章 多元正态总体参数的假设检验3.4 协差阵的检验-多个p元正态总体 第41页,共83页,2022年,5月20日,13点40分,星期二41第三章 多元正态总体参数的假设检验3.4 协差阵的检验-多个p元正态总体 则似然比检验统计量为( 其中 A=A1+Ak)第42页,共83页,2022年,5月20日,13点40分,星期二42第三章 多元正态总体参数的假设检验3.4 协差阵的检验-多个p元正态总体 根据无偏性的要求进行修正,将4中的ni用ni -1替代,n用n-k替代.然后对4取对数,可得到统计量: 当样本容量n很大时,在H0为真时M有以下近似分布: (1

24、-d)M=-2(1-d)ln4*2(f)其中 f=p(p+1)(k-1) /2,第43页,共83页,2022年,5月20日,13点40分,星期二43第三章 多元正态总体参数的假设检验3.4 协差阵的检验-多个p元正态总体(例) 例3.4.1 对例3.3.2表3.3中给出的身体指标化验数据,试判断三个组(即三个总体)的协差阵是否相等(=0.10) 解 这是三个4维正态总体的协差阵是否相等的检验问题.设第i组为4维总体N4(i),i)(i=1,2,3).来自三个总体的样本容量n1=n2=n3=20.检验H0:123,H1:1,2,3至少有一对不相等.在H0成立时,取近似检验统计量为2(f)统计量:

25、由样本值计算三个总体的样本协差阵: 第44页,共83页,2022年,5月20日,13点40分,星期二44第三章 多元正态总体参数的假设检验3.4 协差阵的检验-多个p元正态总体(例) 第45页,共83页,2022年,5月20日,13点40分,星期二45第三章 多元正态总体参数的假设检验3.4 协差阵的检验-多个p元正态总体(例) 第46页,共83页,2022年,5月20日,13点40分,星期二46第三章 多元正态总体参数的假设检验3.4 协差阵的检验-多个p元正态总体(例) 进一步计算可得 第47页,共83页,2022年,5月20日,13点40分,星期二47第三章 多元正态总体参数的假设检验3

26、.4 协差阵的检验-多个p元正态总体(例) 对给定=0.10,利用统计软件(如SAS系统),首先计算p值(设检验统计量2(20):p=P 20.331621=0.4373646.因p值=0.43736460.10=,故H0相容,这表明三个组的协差阵之间没有显著的差异.第48页,共83页,2022年,5月20日,13点40分,星期二48第三章 多元正态总体参数的假设检验3.4 -多个正态总体均值向量和协差阵的同时检验 设有k个总体Np(t),t)(t=1,k), X()(t)(t1,k; 1,nt)来自第t个总体Np(t ,t )的随机样本,记nn1+n2+nk. 检验 H0 : (1) = (

27、2) = =(k) =, 1=2=k = , H1 : (1) , (2) , ,(k) 或1, 2,k不全相等.记 第49页,共83页,2022年,5月20日,13点40分,星期二49第三章 多元正态总体参数的假设检验3.4 -多个正态总体均值向量和协差阵的同时检验 似然比统计量5为 第50页,共83页,2022年,5月20日,13点40分,星期二50第三章 多元正态总体参数的假设检验3.4 -多个正态总体均值向量和协差阵的同时检验 则检验以上假设H0的样本 X(t)() 似然函数为第51页,共83页,2022年,5月20日,13点40分,星期二51第三章 多元正态总体参数的假设检验3.4

28、-多个正态总体均值向量和协差阵的同时检验 若用表示当协差阵均相同时检验k个总体均值向量是否相等的似然比统计量,将发现这里的检验统计量5=4 . 在实际应用中我们采用类似的修正方法,在5中用nt-1替代nt,用n-k替代n.修正后的统计量记为5*:第52页,共83页,2022年,5月20日,13点40分,星期二52第三章 多元正态总体参数的假设检验3.4 -多个正态总体均值向量和协差阵的同时检验 当样本容量n很大,在H0为真时5*有以下近似分布: 其中 第53页,共83页,2022年,5月20日,13点40分,星期二53第三章 多元正态总体参数的假设检验3.4 -多个正态总体均值向量和协差阵的同

29、时检验 例3.4.2 对例3.3.2表3.3给出的身体指标化验数据,试判断三个组(即三个总体)的均值向量和协差阵是否全都相等(=0.05)? 解 这是三个4维正态总体的均值向量和协差阵是否同时相等的检验问题.取近似检验统计量为近似2统计量: =-2(1-b)ln5* 2( f ).由样本值计算三个总体的样本协差阵见例3.4.1,所有样本的总离差阵T见例3.3.2.进一步计算可得第54页,共83页,2022年,5月20日,13点40分,星期二54第三章 多元正态总体参数的假设检验3.4 -多个正态总体均值向量和协差阵的同时检验 对给定=0.05,利用统计软件(如SAS系统),首先计算p值(设检验

30、统计量 2(28): p=P 43.1408= 0.03373.因p值=0.033730.05=,故否定H0,这表明三个组的均值向量和协差阵之间有显著的差异.在这种情况下,可能犯第一类错误,且第一类错误的概率0.05.第55页,共83页,2022年,5月20日,13点40分,星期二55第三章 多元正态总体参数的假设检验3.5 独立性检验 设总体XNp(,),将X剖分为k个子向量,而和也相应剖分为其中p= p1+ pk,且知pt维子向量X(t)Npt(t),tt) (t1,k). 若k个随机子向量相互独立,把p维(高维)随机向量的问题化为k个低维随机向量的问题来处理,在处理多元统计分析的许多问题

31、中将带来极大的方便.第56页,共83页,2022年,5月20日,13点40分,星期二56第三章 多元正态总体参数的假设检验3.5 独立性检验 在第二章我们已介绍过若X(1),X(k)相互独立,则有ij O(对一切ij).因此检验X(1),X(k)是否相互独立的问题等价于检验对任二个子向量,其协差阵ij 是否等于O(对一切ij). 在正态总体下,独立性检验可化为检验H0: ij O(一切ij),H1: ij O,至少有一对ij. 设X(t)(t1,n,np)为来自总体X的随机样本.将样品X(t) ,样本均值X和样本离差阵A作相应剖分为第57页,共83页,2022年,5月20日,13点40分,星期

32、二57第三章 多元正态总体参数的假设检验3.5 独立性检验 用似然比原理,在H0成立时, X(t)() Npt(t),tt )(t1,k; 1,n) 且相互独立,故样本的似然函数为 所以似然比统计量的分子为第58页,共83页,2022年,5月20日,13点40分,星期二58第三章 多元正态总体参数的假设检验3.5 独立性检验 似然比统计量为Box证明了,在H0成立下当n时,-blnV2(f),其中 第59页,共83页,2022年,5月20日,13点40分,星期二59第三章 多元正态总体参数的假设检验3.5 独立性检验-例 例3.4.1 试检验例3.2.1女性汗液数据中随机向量X的三个分量是否相

33、互独立(=0.05). 解 记随机向量X=(X1,X2,X3),假定XN3(,),且记=(ij).检验 H0:12=0,13=0,230, H1: 12,13,23不全为0. 取检验统计量为 当X的三个分量相互独立,且样本容量n很大时,近似于2(f) . 第60页,共83页,2022年,5月20日,13点40分,星期二60第三章 多元正态总体参数的假设检验3.5 独立性检验-例 由表3.1的样本值计算样本离差阵A,可得: 此例中n=20, p=3, p1=p2=p3=1, k=3.进一步计算可得: b=17.1667, f=3,第61页,共83页,2022年,5月20日,13点40分,星期二6

34、1第三章 多元正态总体参数的假设检验3.5 独立性检验-例 对给定显著性水平=0.05,用统计软件SAS系统计算时,通过计算p值进行检验: p=P9.7555=0.02076.因p值=0.020760.05=,故否定H0,即随机向量的三个分量不相互独立.在这种情况下,可能犯第一类错误,且第一类错误的概率为0.05.第62页,共83页,2022年,5月20日,13点40分,星期二62第三章 多元正态总体参数的假设检验3.6 正态性检验 在均值和协差阵的检验中,以及以后将介绍的一些统计方法中都是假定样本来自p元正态总体.所作统计推断的结论是否正确,在某种意义上取决于实际总体与正态总体接近的程度如何

35、?因此建立一些方法来检验多元观测数据与多元正态数据的差异是否显著是十分必要的.设X()(X1 , , Xp) (1,n)是来自p元总体X的样本,试问总体X是否服从Np(,)分布? 若总体X(X1,Xp)Np(,),利用多元正态分布的一些性质可知(记=(1,p),=(ij)pp ): 第63页,共83页,2022年,5月20日,13点40分,星期二63第三章 多元正态总体参数的假设检验3.6 正态性检验 每个分量XiN(i,ii) (i1,p). 任二个分量(Xi , Xj )二元正态分布. 设l=(l1,lp)为任给的p维常向量,令lX,则N1( l,ll ). 令=(X-)-1(X-),则2

36、(p). 正态随机向量X的概率密度等高线为椭球. 若总体X为多元正态总体,必具有以上所列的几条性质.如果X具有以上这些性质,也不一定能得出X为p元正态分布.但如果经过检验,比如发现某个分量Xi与正态分布有显著差异,即可得出p元总体X与p元正态分布也有显著差异.利用以上性质,要来构造出好的满意的多元正态的整体性检验十分困难.第64页,共83页,2022年,5月20日,13点40分,星期二64第三章 多元正态总体参数的假设检验3.6正态性检验-一维边缘分布的正态性检验 在实际应用中如果经过从多方面得到的检验结果与正态分布均无显著性差异,也就认为该总体X与p元正态无显著差异. 设p维随机向量X(X1

37、,Xp),检验分量XiN(i,2) (i1,p) ,把p维正态性检验化为p个一维数据的正态性检验.常用的检验方法有以下几种. 1. 2检验法 这是适用于连续型或离散型随机变量分布的拟合优度检验方法,也称为Pearson 2 检验法. 2. 柯氏(Kolmogorov,A.N.)检验法 这是适用于连续型分布的拟合优度检验方法.第65页,共83页,2022年,5月20日,13点40分,星期二65第三章 多元正态总体参数的假设检验3.6正态性检验-一维边缘分布的正态性检验 3. 偏峰检验法 4. W (Wilks)检验和D检验 5. Q-Q (QuantileQuantile)图检验法 6. P-P

38、 (ProbabilityProbability )图检验法 7. “3”原则检验法 8. A2和W2统计量检验法 方法3至方法8都是只适用于正态分布的检验法.第66页,共83页,2022年,5月20日,13点40分,星期二66第三章 多元正态总体参数的假设检验3.6正态性检验-二维数据的正态性检验 设X(X1,Xp) 为p维随机向量,X的任二个分量的n次观测数据记为X(i)=(Xi1,Xi2)(i=1,n).下面介绍检验二维观测数据是否来自二元正态分布的方法. 1. 等概椭圆检验法 若二维随机向量X=(X1,X2)N2(,),则X的概率密度函数等高线 f(x1,x2)a (X-)-1(X-)

39、b2右边是中心在(1,2)由(X-)-1(X-)b2决定的椭圆.由本章3.1的介绍的知识可知 D2(X-)-1(X-)2 (2).对给定p0(0,1),则存在d0使 P D2 d0p0 注:此检验法较粗糙,详见教材P99例第67页,共83页,2022年,5月20日,13点40分,星期二67第三章 多元正态总体参数的假设检验3.6正态性检验-二维数据的正态性检验 2. 二维数据的2图检验法 因二维数据的2图检验法与p维数据的2图检验法原理完全相同.故关于二维数据的2 图检验方法请参阅下面p维数据的2图检验方法.第68页,共83页,2022年,5月20日,13点40分,星期二68第三章 多元正态总

40、体参数的假设检验3.6正态性检验-p维数据的正态性检验 设X()(X1 , , Xp) (1,n)是来自p元总体X的样本, 检验H0: XNp(,),H1:X不服从Np (,). 1. 2统计量的Q-Q图检验法(或P-P图检验法) 这是由正态分布的性质构造的检验法. 在H0下,样品X到总体中心的广义平方距离(或称马氏距离)D2(X,)记为D2 ,则有 D2 (X-)-1(X-)2(p)以下构造的检验方法就是检验统计量D2是否2(p).直观的想法是:由样品X()计算D2(1,n),对D2排序: 第69页,共83页,2022年,5月20日,13点40分,星期二69第三章 多元正态总体参数的假设检验

41、3.6正态性检验-p维数据的正态性检验 D2(1) D2(2) D2(n) .统计量 D2 的经验分布函数取为 其中H(D2(t) |p)表示2 (p)的分布函数在D2(t)的值. 设2 分布的pt分位数为t2 ,显然t2满足: H(t 2 |p)= pt.即2 分布的pt 分位数t2 H-1(pt |p). 由经验分布得到样本的pt 分位数D2(t)=Fn-1(pt ).若H(x|p) Fn(x),应有D2(t) t2 ,绘制点(D2(t) , t2 )的散布图,当X为正态总体时,这些点应散布在一条直线上. 第70页,共83页,2022年,5月20日,13点40分,星期二70第三章 多元正态

42、总体参数的假设检验3.6正态性检验-p维数据的正态性检验 这种检验法其实就是卡方分布的Q-Q图检验法. 类似地也可以绘制点(pt , H(D2(t) |p)的散布图,当X为正态总体时,这些点也应散布在一条直线上.这种检验法其实就是卡方分布的P-P图检验法. 具体检验步骤如下: (1) 由n个p维样本点X() (1,n)计算样本均值X,样本协差阵S:第71页,共83页,2022年,5月20日,13点40分,星期二71第三章 多元正态总体参数的假设检验3.6正态性检验-p维数据的正态性检验 (2) 计算样品点X(t)到X的广义平方距离(即马氏距离) (3) 对广义平方距离D2t 按从小到大的次序排序 (4) 计算pt(t-0.5)/n (t=1, 2,n) ,t2 ,其中t2满足: H(t2 |p)= pt (或计算H(D2(t)|p)的值).第72页,共83页,2022年,5月20日,13点40分,星期二72第三章 多元正态总体参数的假设检验3.6正态性检验-

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论