《应用多元分析》第三版(第四章--多元正态总体的统计推断)PPT课件_第1页
《应用多元分析》第三版(第四章--多元正态总体的统计推断)PPT课件_第2页
《应用多元分析》第三版(第四章--多元正态总体的统计推断)PPT课件_第3页
《应用多元分析》第三版(第四章--多元正态总体的统计推断)PPT课件_第4页
《应用多元分析》第三版(第四章--多元正态总体的统计推断)PPT课件_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.,1,第四章多元正态总体的统计推断,4.1一元情形的回顾4.2单个总体均值的推断4.3单个总体均值分量间结构关系的检验4.4两个总体均值的比较推断4.5两个总体均值分量间结构关系的检验4.6多个总体均值的比较检验(多元方差分析)4.7总体相关系数的推断,.,2,4.2单个总体均值的推断,一、均值向量的检验二、置信区域三、联合置信区间,.,3,一、均值向量的检验,设x1,x2,xn是取自总体xNp(,)的一个样本,这里0,np,欲检验H0:=0,H1:01.已知检验统计量为拒绝规则为:若,则拒绝H0,.,4,2.未知检验统计量为称之为霍特林(Hotelling)T2统计量。当H0为真时服从F(p,np),对给定的显著性水平,拒绝规则为:若,则拒绝H0其中。,.,5,例4.2.1对某地区农村的6名2周岁男婴的身高、胸围、上半臂围进行测量,得样本数据如表4.2.1所示。根据以往资料,该地区城市2周岁男婴的这三个指标的均值0=(90,58,16),现欲在多元正态性假定下检验该地区农村男婴是否与城市男婴有相同的均值。这是假设检验问题:H0:=0,H1:0,表4.2.1某地区农村男婴的体格测量数据,.,6,查表得F0.01(3,3)=29.5,于是故在显著性水平=0.01下,拒绝原假设H0,即认为农村与城市的2周岁男婴上述三个指标的均值有显著差异(p=0.002)。,.,7,二、置信区域,.,8,的置信度为1的置信区域为当p=1时,它是一个区间;当p=2时,它是一个椭圆,这时可将其在坐标平面上画出;当p=3时,它是一个椭球;当p3时,它是一个超椭球;它们均以为中心。同置信区间与假设检验的关系一样,置信区域与假设检验之间也有着同样的密切关系。一般来说,0包含在上述置信区域内,当且仅当原假设H0:=0在显著性水平下被接受。因此,可以通过构造的置信区域的方法来进行假设检验。,.,9,三、联合置信区间,即以1的概率对一切aRp成立,称它为一切线性组合a,aRp的置信度为1的联合置信区间(simultaneousconfidenceintervals)。对k个线性组合ai,i=1,2,k,有,.,10,当k很小时,联合T2置信区间的置信度一般会明显地大于1,因而上述区间会显得过宽,即精确度明显偏低。这时,我们可以考虑采用邦弗伦尼(Bonferroni)联合置信区间:它的置信度至少为1。若t/2k(n1)T,则邦弗伦尼区间比T2区间要窄,这时宜采用前者作为联合置信区间;反之,若t/2k(n1)T,则邦弗伦尼区间比T2区间宽,宜采用后者作为联合置信区间。当k=p时,邦弗伦尼区间要比T2区间窄。故在求的所有p个分量1,2,p的联合置信区间时,应采用邦弗伦尼区间。,.,11,例4.2.2为评估某职业培训中心的教学效果,随机抽取8名受训者,进行甲和乙两个项目的测试,其数据列于表4.2.2。假定x=(x1,x2)服从二元正态分布。n=8,p=2,取1=0.90,F0.10(2,6)=3.46,于是,T0.10=2.841。,表4.2.2两个项目的测试成绩,.,12,的0.90置信区域为即0.0436(172.5)20.0812(172.5)(279)+0.0475(279)21.009这是一个椭圆区域。1和2的0.90联合T2置信区间为即61.84183.16,68.80289.20这两个区间分别正是椭圆在1轴和2轴上的投影。,.,13,1和2的0.90邦弗伦尼联合置信区间为(t0.025(7)=2.3646)即63.63181.37,70.51287.49这个联合置信区间在精确度方面要好于T2联合置信区间。由该联合置信区间可得到置信度至少为0.90的矩形置信区域(见图4.2.1中的实线矩形),但其矩形面积要大于椭圆面积。,.,14,图4.2.1置信椭圆和联合置信区间,.,15,利用置信区域进行假设检验,在例4.2.2中,如果在=0.10下对假设H0:=0,H1:0进行检验,其中=(1,2),0=(01,02),则我们容易利用图4.2.1中的椭圆得出检验的结果。若被检验值0位于图4.2.1中的椭圆外,则拒绝;反之,则接受。图4.2.1中的虚线矩形在1和2轴上的区间范围分别是1和2的0.90置信区间。当0位于椭圆外虚线矩形内的位置(如图中A点)时,检验结果虽拒绝H0,但如在=0.10下分别检验H01:1=01,H11:101和H02:2=02,H12:202则检验结果都将接受原假设;当0位于椭圆内虚线矩形外的位置(如图中B点)时,检验结果虽接受H0,但H01:1=01和H02:2=02都将会被拒绝。,.,16,4.3单个总体均值分量间结构关系的检验,设x1,x2,xn是取自多元正态总体Np(,)的一个样本,0,np,欲检验H0:C=,H1:C其中C为一已知的kp矩阵,kp,rank(C)=k,为已知的k维向量。根据多元正态分布的性质知CxNk(C,CC)由于,.,17,故CC0。故我们可以用上一节检验假设H0:=0的方法来检验上述假设。检验统计量为当原假设H0:C=为真时,对于给定的显著性水平,拒绝规则为:若,则拒绝H0其中。特别地,若欲检验H0:C=0,H1:C0则T2可简化为,.,18,例4.3.1设xNp(,),=(1,2,p),0,x1,x2,xn是取自该总体的一个样本,欲检验H0:1=2=p,H1:ij,至少存在一对ij令则上面的假设可表达为H0:C=0,H1:C0检验统计量为,.,19,对于给定的显著性水平,拒绝规则为:若,则拒绝H0其中由于C是行满秩的,且每行均为对比向量(即有一个1和一个1,其余皆为0),故称C为对比矩阵。该例中对比矩阵C的选择不是惟一的,比如也可以选取对比矩阵为,.,20,例4.3.2在例4.2.1中,假定人类有这样一个一般规律:身高、胸围和上半臂围的平均尺寸比例为6:4:1,我们希望检验表4.2.1中的数据是否符合这一规律,也就是欲检验H0:1/6=2/4=3,H1:1/6,2/4,3至少有两个不等令则上面假设可表达为H0:C=0,H1:C0经计算从而,.,21,故又因所以拒绝原假设H0,即认为这组数据与人类的一般规律不一致(p=0.008)。上述的C也可以选择为检验的结果是不变的。,.,22,4.4两个总体均值的比较推断,一、两个独立样本的情形二、成对试验的T2统计量,.,23,一、两个独立样本的情形,设从两个总体Np(1,)和Np(2,)中各自独立地抽取一个样本和,0,欲检验H0:1=2,H1:121,2的无偏估计的联合无偏估计其中,.,24,为两个样本协方差矩阵。霍特林T2检验统计量当原假设H0为真时,对给定的,拒绝规则为:若,则拒绝H0其中,.,25,在实际应用中,一旦H0:1=2被拒绝了,则可以考虑对所有的i(1ip),在相同的显著性水平下再进一步检验H0i:1i=2i,以判断是否有分量及(若有)具体是哪些分量对拒绝H0:1=2起了较大作用,这样做常常是有益的。a(12),aRp的1联合置信区间为当k很小时,可采用邦弗伦尼不等式给出ai(12),i=1,2,k的1联合置信区间,.,26,例4.4.1(例4.2.1续)表4.4.1给出了相应于表4.2.1的9名2周岁女婴的数据。我们欲在多元正态性假定下检验2周岁的男婴与女婴的均值向量有无显著差异。,表4.4.1某地区农村女婴的体格测量数据,.,27,从例4.2.1得从表4.4.1计算得,.,28,所以因,故不能拒绝原假设H0,即认为两个均值向量无显著差异(p=0.27)。,.,29,二、成对试验的T2统计量,设(xi,yi),i=1,2,n(np)是成对试验的数据,令di=xiyi,i=1,2,n又设d1,d2,dn独立同分布于Np(,),其中0,=12,1和2分别是总体x和总体y的均值向量。希望检验H0:1=2,H1:12等价于H0:=0,H1:0这样,两个总体的均值比较检验问题就可以化为一个总体的情形。检验统计量为,.,30,其中当原假设H0:=0为真时,统计量对给定的显著性水平,拒绝规则为:若,则拒绝H0其中,.,31,4.5两个总体均值分量间结构关系的检验,设两个独立的样本和分别取自总体Np(1,)和总体Np(2,),0,n1+n22p,我们希望检验H0:C(12)=,H1:C(12)其中C为一已知的kp矩阵,kp,rank(C)=k,为一已知的k维向量。检验统计量为其中Sp是的联合无偏估计。当原假设H0为真时,,.,32,拒绝规则为:若,则拒绝H0其中例4.5.1某种产品有甲、乙两种品牌,从甲产品批和乙产品批中分别随机地抽取5个样品,测量相同的5个指标,数据列于表4.5.1。在多元正态性假定下,试问甲、乙两种品牌产品的每个指标间的差异是否有显著的不同。该题就是要检验H0:C(乙甲)=0,H1:C(乙甲)0其中,.,33,表4.5.1甲、乙两种品牌产品的指标值,.,34,检验统计量为经计算,.,35,.,36,所以由于,所以在=0.05下拒绝原假设H0(p=0.044)。,.,37,4.6多个总体均值的比较检验(多元方差分析),设有k个总体1,2,k,它们的分布分别是Np(1,),Np(2,),Np(k,),今从这k个总体中各自独立地抽取一个样本,取自总体i的样本为,i=1,2,k。现欲检验H0:1=2=k,H1:ij,至少存在一对ij记,.,38,则SST=SSE+SSTR称SST、SSE和SSTR分别为总平方和及交叉乘积和、误差(或组内)平方和及交叉乘积和和处理(或组间)平方和及交叉乘积和,它们分别具有自由度(n1)、(nk)和(k1)。采用似然比方法可以得到威尔克斯(Wilks)统计量对给定的显著性水平,拒绝规则为:若p,k1,nkp,k1,nk,,则拒绝H0其中临界值p,k1,nk,满足:当原假设H0为真时,P(p,k1,nkp,k1,nk,)=p,m,r,常通过查F分布(或卡方分布)表得到(或近似得到)。,.,39,例4.6.1为了研究销售方式对商品销售额的影响,选择四种商品(甲、乙、丙和丁)按三种不同的销售方式(、和)进行销售。这四种商品的销售额分别为x1,x2,x3,x4,其数据见表4.6.1。,表4.6.1销售额数据,.,40,.,41,该题中,我们需要检验H0:1=2=3,H1:1,2,3中至少有两个不相等其中1,2,3分别为销售方式、和的总体均值向量。假定这三个总体均为多元正态总体,且它们的协差阵相同。p=4,k=3,n1=n2=n3=20,n=n1+n2+n3=60,.,42,.,43,于是由附录43中的(43.4)式可得查F分布表得,F0.01(8,108)=2.683.039,从而在=0.01的水平下拒绝原假设H0,因此可认为三种销售方式的销售额有十分显著的差异(p=0.004)。,.,44,为了解这三种销售方式的显著差异究竟是由哪些商品引起的,我们对这四种商品分别用一元方差分析方法进行检验分析。利用SSTR和SSE这两个矩阵对角线上的元素有查表得,F0.05(2,57)=3.16,F0.01(2,57)=5.01,故甲商品有显著差异(p=0.041),丁商品有十分显著的差异(p=0.001),而乙和丙商品无显著差异(p=0.208和p=0.848)。,.,45,如果剔除丁商品,然后再对其他三种商品用统计量进行检验,则有F0.05(6,110)=2.181.328,不显著,因此说明对甲、乙、丙这三种商品,销售方式、和的总体均值向量之间无显著差异(p=0.251)。,.,46,4.7总体相关系数的推断,设x1,x2,xn是取自总体Np(,)的一个样本,样本协方差矩阵S=(sij)。一、简单相关系数的推断二、复相关系数的推断三、偏相关系数的推断,.,47,一、简单相关系数的推断,欲检验H0:ij=0,H1:ij0当H0:ij=0为真时,检验统计量服从t(n2)分布,其中是样本相关系数。对于给定的显著性水平,拒绝规则为:若,则拒绝H0,.,48,如果希望检验H0:ij=ij0,H1:ijij0则可以使用一种近似的方法。在n很大的情况下,近似服从。利用这一结论可构造检验统计量为当原假设H0:ij=ij0为真时,它近似地服从N(0,1),对于给定的,拒

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论