多元统计分析期末试题及答案_第1页
多元统计分析期末试题及答案_第2页
多元统计分析期末试题及答案_第3页
多元统计分析期末试题及答案_第4页
已阅读5页,还剩4页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、.1、设XN2( ,),其中 X( x1 , x 2 ),( 1 ,212 ),1则 Cov( x1x 2 , x1x 2 )=_.102、设X i N 3 (,), i 1, L,10,则 W =( X i)( X i)i 1服从_。4433、设随机向量Xx1x2x3, 且协方差矩阵492 ,3216则它的相关矩阵R_4、 设 X= x1x2x3 , 的相关系数矩阵通过因子分析分解为112330.93400.1280.4171R100.4170.9340.83530.8940.8940.0270.83500.4472010.4470.10332_,_,X1的共性方差 h1X1的方差11公因子

2、 f 1对 X的贡献 g12_。5、设 X i , i 1,L ,16 是来自多元正态总体N p (, ), X 和 A分别为正态总体N p ( ,)的样本均值和样本离差矩阵 , 则T 2154( X) A 14( X) _。1642、设( x1 , x2 , x3) N3(, ),其中(1,0, 2) ,441 ,1X214试判断 x12 x3与 x2 x3是否独立?x1.2、对某地区农村的6 名 2 周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下 , 根据以往资料 , 该地区城市 2周岁男婴的这三个指标的均值0(90,58,16), 现欲在多元正态性的假定下检验该地区农村男婴是否与

3、城市男婴有相同的均值。82.04.310714.62108.9464其中 X60.2 ,(5 S ) 1( 115.6924)114.62103.17237. 376014.58.946437.376035.5936(0.01,F 0.01 (3, 2)99.2,F 0.01 (3,3)29.5,F0.01 (3, 4)16.7)、设已知有两正态总体G与 G,且12,24,1211,3126219而其先验概率分别为q1q20.5,误判的代价C(2 1)4;e ,C(1 2)e试用判别法确定样本X3属于哪一个总体?Bayes514、设X(X1,X2, X3,X4 )T,协方差阵1 N4(0, )

4、,0111(1) 试从出发求 X 的第一总体主成分;(2) 试问当取多大时才能使第一主成分的贡献率达 95以上。、设T,Y (Y1, X2)T 为标准化向量,令ZX,且其协方差阵5X (X1,X2)Y1000001112V( Z)2122010.950,00.9510000100求其第一对典型相关变量和它们的典型相关系数?1、设随机向量X的均值向量、协方差矩阵分别为、 ,试证: E( XX )。.2、设随机向量 X N P (, ), 又设 Y=Ar pX+br 1 ,试证: Y N r ( A b, A' 。A )1、02、W3(10,)3 、12134211R63111464、0.

5、87211.7435、T2( 15,p)或( 15p/(16-p)) F( p, n-p )、令x2x3, y2x12x3 ,则1y1x1y1x2x301-1x1x1100x2y2x12x3102x3y101-11210001Ey210223y101-1164 201-1100441100Vy21022141021061661620162040210616故y1,y2的联合分布为 N3 (1 ,61620 )3162040故不独立。.、假设检验问题:H 0 :,020H1 :8.0经计算可得: X02.2,1.54.310714.62108.9464S 1(23.13848) 114.6210

6、3.17237.37608.946437.376035.5936构造检验统计量: T 2n( X0) S 1(X0 )670.0741420.445由题目已知F0.01(3,3),由是29.5T02.0135F0.01 (3,3)147.53所以在显著性水平下,拒绝原设H 00.01即认为农村和城市的周岁男婴上述三个2指标的均值有显著性差异3、由 Bayes判别知f1(x)W ( x)exp( xf2(x)T 1(12 ) exp(4 x12x24)其中,1(12 )2dq2 C (1| 2)e3 ,W ( xq1C (2 |1)X3G253, ?1191%141,(813)exp(2)de3

7、5%2)242624.1、(1) 由1得特征根为11 3 ,401123411x1解1 所对应的方程1x201x31 x4得1 所对应的单位特征向量为11112222故得第一主成分11112 X12 X 22 X32 X 4Z(2) 第一个主成分的贡献率为11395%12344得0.95410.93335、由题得1110.10,11022220100.1T111TT2122121122110.10001000.950.1000010.95000.01000100.9025求 TT T的特征值,得 00020.90250.902520.9025,200.95121TT T的单位正交化特征向量00

8、e10.9025e1,00.902510.1000112 e11011111112221111000.95010.9500.10010V1X 2,W10.54Y1为第一典型相关变量,且(V1 ,W1) 0.95为一对典型相关系数。.1、证明:=V (X )E( XEX )(XE(XX )(EX )(EX )E(XX )故E(XX ).2、证明 : 由题可知 Y服从正态分布,EX)E(Y)E( AXb)AE ( X ) bAbV (Y)V(AXb)AV (X )AA A'故 Y N r ( Ab, A A' )。一、填空题:1、多元统计分析是运用数理统计方法来研究解决多指标问题的

9、理论和方法 .2、回归参数显著性检验是检验解释变量对被解释变量的影响是否著 .3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。通常聚类分析分为Q型聚类和R型聚类。4、相应分析的主要目的是寻求列联表行因素 A和列因素 B的基本分析特征和它们的最优联立表示。5、因子分析把每个原始变量分解为两部分因素:一部分为公共因子,另一部分为特殊因子。6、若 x( ) : N P (,),=1,2,3 .n 且相互独立,则样本均值向量x 服从的分布为_ x N(, /n)_ 。二、简答1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。在每组变量中找出变量的线性组合,使得两组的线性组

10、合之间具有最大的相关系数。选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。2、简述相应分析的基本思想。相应分析,是指对两个定性变量的多种水平进行分析。设有两组因素A和 B,其中因素 A 包含 r 个水平,因素 B 包含 c 个水平。对这两组因素作随机抽样调查,得到一个 rc 的二维列联表,记为。要寻求列联表列因素A 和行因素 B 的基本分析特征和最优列联表示。相应分析即是通过列联表的转换,使得因素A 和因素 B 具有对等性,从而用相同的因子轴同时描述两

11、个因素各个水平的情况。把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素 A、 B 的联系。3、简述费希尔判别法的基本思想。.从 k 个总体中抽取具有 p 个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数系数:确定的原则是使得总体之间区别最大,而使每个总体内部的离差最小。将新样品的 p 个指标值代入线性判别函数式中求出值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。5、简述多元统计分析中协差阵检验的步骤第一,提出待检验的假设和 H1;第二,给出检验的统计量及其服从的分布;第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域;第

12、四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受) 。协差阵的检验检验 0H 0: I pexp1 tr SSn /2enp /22n1np /2H 0: 0 I pexp*n /2etrSSn2检验 1 2L k H 0: 12 L kkk统计量 knnp /2Sini /2S n/ 2ni pni /2i 1i16、在进行系统聚类分析时,不同的类间距离计算方法有何区别?请举例说明。设 dij 表示样品 Xi 与 Xj 之间距离,用 Dij 表示类 Gi 与 Gj 之间的距离。( 1) . 最短距离法DijmindijX i G i, X j G j

13、DkrXimindijmin Dkp , Dkq Gk , X jGr( 2)最长距离法DpqXimaxdijG p , X jGqDkrmaxdijmax Dkp , DkqX i Gk ,X jGr( 3)中间距离法D kr2 1 D kp21 D kq2D pq2其中错误 ! 未找到引用源。22.( 4)重心法Dpq2( X pXq ) ( X pXq )X r1 ( np X pnq X q )nr2np2nq2np nq2DkrDkpnrDkq2Dpqnrnr( 5)类平均法212212np2nq2D pqnp nq XidijDkrnknr X i G k X j GrdijDkp

14、nrDkqG p X jG jnr( 6)可变类平均法Dkr2(1npDkp2nqD pq2)(Dkq2 )nrnr其中是可变的且<1( 7)可变法Dkr21(Dkp2Dkq2 )D pq2其中是可变的且 <12nt( 8)离差平方和法St( XitX t ) ( X it X t )t1错误 ! 未找到引用源。2nknp2nknq2nk2DkrnrnkDkpnrnkDkqnr nkD pq7、比较主成分分析与因子分析的异同点。相同点:两种分析方法都是一种降维、简化数据的技术。两种分析的求解过程是类似的,都是从一个协方差阵出发,利用特征值、特征向量求解。因子分析可以说是主成分分析的姐妹篇,将主成分分析向前推进一步便导致因子分析。因子分析也可以说成是主成分分析的逆问题。如果说主成分分析是将原指标综合、归纳,那么因子分析可以说是将原指标给予分解、演绎。主要区别

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论