完整多元统计分析期末试题及答案_第1页
完整多元统计分析期末试题及答案_第2页
完整多元统计分析期末试题及答案_第3页
完整多元统计分析期末试题及答案_第4页
完整多元统计分析期末试题及答案_第5页
已阅读5页,还剩1页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 ?1?2?,?(?,?,?),其中X?(x,x),),1、设XN(?21221?1?)=_.?xx,x则Cov(x?2211 10?=、设则L)(X(?),i?1,X,10,?W2XN(?,ii3ii?1服从_。 4?43?xxX?2?4?,9x3、设随机向量,且协方差矩阵?213?162?3?则它的相关矩阵R?_4、 ,?的相关系数矩阵通过因子分析分解为x设X=xx312 21?1? 33 0.12800.934?0.8350.4170.934?1?0.027?0.4171?0R?0.894? ? 0.44700.8943?0.4470.8350.103?2? 10? 3? , _, ?2

2、?X的方差?hX的共性方差11111 2?gX的贡献公因子f对11 _。 ?分别为正态总体和、设L是来自多元正态总体,?)N(?,),X5(X,i?1,16AN pip2?1?)?A_。4(的样本均值和样本离差矩阵,则T?154(X?X) 16?42?,14?,?2)Nx,?1、设X(xx,)(,?),其中?(1,0,?4?3123?4?12?x?x?32试判断x?2x与是否独立??31x?12、对某地区农村的6名2周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的?,现欲在多元正态性的假定下检验该地区农村男婴是?(90,58,16)均值0

3、否与城市男婴有相同的均值。?14.621082.04.31078.9464?1?1376037.60.23.172,(5S)?14.6210?( 115.6924)?其中X? ?35.593637.376014.58.9464?16.7)4)(3,?F(3,3)?29.5,F(?0.01,F(3,2)?99.2,0.010.010.01 2411?,?GG与,且?,?,3、设已知有两正态总体?2211126219?4 ,C(12)?e误判的代价C(21)?e;而其先验概率分别为q?q?0.5,213?试用Bayes判别法确定样本X?属于哪一个总体??5? ?1?1?T?1,0),协方差阵?(0

4、,X?4、设X(X,X,X)N?43142?1?1? 试从出发求X的第一总体主成分;(1) ? (2) 试问当取多大时才能使第一主成分的贡献率达95以上。 X?TT且其协方差阵,X(,?5、设X(XX),Y?Y,)为标准化向量,令Z?2211Y?100000?010.950? 1211,?(VZ)?0.95010?2221?000100?求其第一对典型相关变量和它们的典型相关系数? ?、?,的均值向量、协方差矩阵分别为1、设随机向量X?。?)XX(E试证: ?,?),又设Y=AX+b、设随机向量XN(,21r?pP?r?)。A?AN(A?b,试证:Yr1、0 2、W(10,) 3、 312?1

5、? 43?12?R?1 ?63?11?1? 64?0.872 1 1.743 、42 ,n-p)5、T)(15,p)或(15p/(16-p)F(pxx?32则,?,y、令1y?x?2x?3211x?1xx?x-101?132y?1?x00x?1?21y?2x10?x2x2?3132110-1?y?110?10E0?y?231022?041601-11-1?2?y?11?01?100V0?44 ?y?22110202?14?16?106?2016?6?4016?20?16610?2?),1(的联合分布为y,故yN16206?312?40?16?203?故不独立。?:H?:,2、假设检验问题:H0

6、001?8.0?,?经计算可得:X?2.2 ?0?1.5?4.3107?14.62108.9464?11?37.3760?14.6210S3.172?(23.13848)?35.5936?37.37608.9464?2?1?)SXn(X?)(构造检验统计量:T? 00?6?70.0741?420.445由题目已知F(3,3)?29.5,由是10.0 53?2147.5?F(3,3)T 01.0.0103?H所以在显著性水平下,拒绝原设?0.010即认为农村和城市的2周岁男婴上述三个指标的均值有显著性差异3、由Bayes判别知f(x)T?1?1)?exp(4x?)2?xxW()?(4)?exp(

7、x 2211f(x)239?124?2 ?11?1?%?其中,?,(?()?)?,? ? 212142?116482?3?2)qC(1|332ed?)?dx?e,W(?exp(2)? 5|1)(2qC?13?G?X?25? ?1?1?,?得特征根为3?14、(1)由?01?1?1?1?432?x?1?1?x?1?2?所对应的方程解?01?x?1?3?x?1?4?1111?所对应的单位特征向量为得? 12222?1111故得第一主成分Z?X?X?X?X 43122222(2)第一个主成分的贡献率为?3?11?95% ?4?4132 1?40.95?0.933?得 3110010.1? ?5、由题

8、得,22?22111000.1?11 1T?TT?22222111111201000.950.10000.100?010.95000.0100100.90250? 0?T2?0.9025?的特征值,得0?求TT?0.9025022?0.950.9025,0?121T的单位正交化特征向量TT00?e?0.9025e,?110.90250?10.1000? ?e?2?11110111?1?1?12111221000.9501?1? 0000.1010.95?Y?W0.54XV?,1211?V,W为一对典型相关系数。为第一典型相关变量,且(0.95?)112、证明:由题可知Y服从正态分布,?EX?)

9、?EX)(XV(X)?E(X、证明:1?=E(Y)?E(AX?b)?AE(X)?b?)EXEX)(?E(XX)?(?Ab?)(XX?E?A)AV(X(AX?b)?V(Y)V?(XX?)故EA?A?)。A?AA?b,故YN( r 一、填空题: 1、多元统计分析是运用 数理统计 方法来研究解决 多指标 问题的理论 和方法. 2、回归参数显著性检验是检验 解释变量 对 被解释变量 的影响是否著. 3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。通常聚类分析分为 Q型 聚类和 R型 聚类。 4、相应分析的主要目的是寻求列联表 行因素A 和 列因素B 的基本分析特 征和它们的最优联立表示。

10、5、因子分析把每个原始变量分解为两部分因素:一部分为 公共因子 ,另一 部分为 特殊因子 。 6、若=1,2,3.n且相互独立,则样本均值向量服从的分布为?),?x:N(,x ?P()_N(,/n)_。 x 二、简答 1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。 在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。 2、简述相应分析的基本思想。 相应分析,是指

11、对两个定性变量的多种水平进行分析。设有两组因素A和B,其中因素A包含r个水平,因素B包含c个水平。对这两组因素作随机抽样调查,得到一个rc的二维列联表,记为 。要寻求列联表列因素A和行因素B的基本分析特征和最优列联表示。相应分析即是通过列联表的转换,使得因素A 和因素B具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素A、B的联系。 、简述费希尔判别法的基本思想。3个指标的样品观测数据,借助方差分析的思想构造一p从k个总体中抽取具有 个线性判别函数 系数:确定的原则是使得总体之间区别最大,而使每个总体内部的

12、离差最小。将新样值,然后根据判别一定的规则,就 品的p个指标值代入线性判别函数式中求出 可以判别新的样品属于哪个总体。 、简述多元统计分析中协差阵检验的步骤5 ; 和H1第一,提出待检验的假设 第二,给出检验的统计量及其服从的分布;第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定 域;第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判 。假设做出决策(拒绝或接受) 协差阵的检验 检验?02/npe1?2n/ ?I?H:SSexp?tr? ? p0n2?2/npe1?2n/ * ?IH:?SS?tr?exp? p00n2? 检验?L?H:?Lk1k1202k

13、kn/2n/2?pn/22np/ 统计量? nS?nSiiiki1?1ii 6、在进行系统聚类分析时,不同的类间距离计算方法有何区别?请举例说明。 设d表示样品与之间距离,用D表示类与之间的距离。 GXGXijijjjii(1). 最短距离法 dmin?D ijijX?G,X?Gjjii D?mind?minD,D ijkrkqkpGX?X?G,rijk 2)最长距离法(D?maxd ijpqGG,X?XqpjiD?maxd?maxD,D ijkrkqkpGGX?,X?rkij(3)中间距离法 11 2222?D?DD?D?其中错误!未找到引用源。 pqkqkrkp22(4)重心法 12? )

14、X(XX?X)?D?( )X?Xn(nXqppqqp qrpqpnrnnnnqqpp2222DDD?D? pqkqkrkp2nnnrrr(5)类平均法 nn11?qp222222d?D dD?D?D? ijpqijkrkqkpnnnnnnG?G?XXGX?X?Gqprkrrjjpirjki(6)可变类平均法 nnqp2222 ? D?(1?D)()DD? pqkpkrkqnn rr 1 是可变的且? 其中? 7)可变法(?12222?DD?D?D)( 1 ? 其中?是可变的且 pqkpkrkq2nt? )?(X(X?X)XS? 8)离差平方和法(tttitit1t? 错误!未找到引用源。 n?nn?nnqpkk2222kDDD?D pqkrkpkqnn?nn?nn?krrkrk:两种分析方法都是一种降维、简化数7、比较主成分分析与因子分析的异同点。相同点据的技术。两种分析的求解过程是类似的,都是从一个协方差阵出发,利用特征值、特征向量求解。因子分析可以说是主成分分析的姐妹篇,将主成分分析向前推进一步便导致因子分析。因子分析也可以说成是主成分分析的逆问题。如果说主成分分析是主要区别 将原指标综合、归纳,那么因子分析可以说是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论