多元统计分析模拟考题及答案 (一)_第1页
多元统计分析模拟考题及答案 (一)_第2页
多元统计分析模拟考题及答案 (一)_第3页
多元统计分析模拟考题及答案 (一)_第4页
多元统计分析模拟考题及答案 (一)_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一、判断题

(对)1X=(X”X2,,XJ的协差阵一定是对称的半正定阵

(对)2标准化随机向量的协差阵与原变量的相关系数阵相同。

(对)3典型相关分析是识别并量化两组变量间的关系,将两组变量的相关关系

的研究转化为一组变量的线性组合与另一组变量的线性组合间的相关关系的研究。

(对)4多维标度法是以空间分布的形式在低维空间中再现研究对象间关系的数据

分析方法。

(错)5X=(%N2,…,XJ~Np(〃,E),又,S分别是样本均值和样本离

差阵,则取士分别是的无偏估计。

n

(对)6X=(X1,X?,…,又作为样本均值〃的估计,是

无偏的、有效的、一致的。

(错)7因子载荷经正交旋转后,各变量的共性方差和各因子的贡献都

发生了变化

(对)8因子载荷阵A=(他)中的均表示第i个变量在第j个公因子上

的相对重要性。

(先t)9判别分析中,若两个总体的协差阵相等,则Fisher判别与距离判别等价。

(对)10距离判别法要求两总体分布的协差阵相等,Fishei•判别法对总体的分布无特

定的要求。

一、填空题

1、多元统计中常用的统计量有:样本均值向量、样本协差阵、样本离差阵、

样本相关系数矩阵.

2、设E是总体X=(X],…,X„,)的协方差阵,E的特征根4«=1,…,相)与相应的单

位正交化特征向量。产伍",如,…,%”),则第一主成分的表达式是

y=4[X]+。]2*2+…+4,“x„I,方差为4。

3设X是总体X=(X,X2,X”X,)的协方差阵,2的特征根和标准正交特征向量分别

为:4=2.920U\=(0.1485,-0.5735,-0.5577,-0.5814)

4=1.024U2=(0.9544,-0.0984,0.2695,0.0824)

%=0.049U'3=(0.2516,0.7733,-0.5589,-0.1624)

%=0.007区=(-0.0612,0.2519,0.5513,-0.7930),则其第一个主成分的表达式是

为=0.9544X,-0.0984X2+0.2695X3+0.0824X4,方差为1.024

4.若Xg~Np",E),(a=l,2,…,〃)且相互独立,则样本均值向量又服

y

从的分布是N〃(〃,乙).

n

5.设Xj(小Z)/=12…,16,天和A分别是正态总体的样本均值和样本离差

阵,则〃=15[4(5-4)]414(5—,)]服从_〃(i5,p)或上乙-F(p,〃一p)

16-p

10

6设%&(〃百=1,2,,10,则W=2(X--〃)(")'服从卬3(10,2)

i=i-------------

,4-43、

7.设随机向量X=(X1,X2,X3)',且协差阵工=_49_2,则其相关矩阵

<3-216,

[86

(1n\

8.设X=(X\,X?)-N2(",Z),其中〃=(必,4,),£=(/,则

Cov(X1+X„XI-XJ=0_

9设X,Y是来自均值向量为〃,协差阵为£的总体G的两个样品,则LY间的马氏平

方距离d2(X,Y)=(X-y)'2"(X-Y)

1()设X,Y是来自均值向量为〃,协差阵为E的总体G的两个样品,则X与总体G的马

氏平方距离解(X,G)=(X-〃)'Z7(X-〃)

11设随机向量X=(X1,X2,x3y的相关系数矩阵通过因子分析分解为

/

1

0.93400.128

0.934-0.4170.835

R=---0.4170.894+0.027

100.8940.447;

[0.8350.447k0.103J

则毛的共性方差0.9342=u872,其统计意义是:描述了全部公因于对变量XI

的总方差所作的贡献,称为变量XI的共同度,反映了公共因子对变量XI的影响程度。

标准化变量XI的方差为1,公因了fl对X的贡献女:=0.9342+0.4172+0.8352=1.743

12.对应分析是将。型因子分析和R型因子分析结合起来进行的统计分析方法

13典型相关分析是研究两组变最间相关关系的一种多元统计方法

14.聚类分析中,O型聚类是指对样本进行聚类,R型聚类是指对指标进

行聚类。

15Spssforwindows中主成分分析由DataReduction->FactorAnalysis

过程实现。

16设4,匕是第k对典型变量则D(UJ=1,。(匕)=1(攵=1,2,…/)

Cov(U,,U)=0,C^v(V.,V.)=0(iw力

4工。a=),,=i,2,-

cw/”K)=oD

0(j>r)

17.在多维标度分析中,当D是欧几里得距离阵时,X是D的一个构图

三、简答题(答案见平时习题)

1简述多元统计的主要内容与方法(10分)

可对比一元统计列出多元统计的主要内容与方法

(从随机变量及其分布、数字特征、四大分布(正态分布密度(1分)、/(〃)

与威沙特分布Wp(〃,Z)(1分)、t分布与Hoteling"分布(1分)、F分布

与威尔克斯分布A(p,〃「〃2)(1分))、抽样分布定理、参数估计和假设检验、

统计方法(2分)

2.请阐述距离判别法、贝叶斯判别法和费希尔判别法的基本思想和方法,比较其异同

3请阐述系统聚类法、K均值聚类法、有序样品聚类法的基本思想和方法,比较其异同

4请阐述主成分分析和因子分析的基本思想、方法步骤和应用,比较其异同

5请阐述相应分析、多维标度法、典型相关分析和多变量的可视化分析的基本思想和应

四、计算题

1设三维随机向量X华(〃,2/;),已知

2

-1

//=00求丫=4¥+4的分布

0-00.5Jm[2)

(x-F)=(64))-(皿)=(205

厂=3(7£安)

39671-24S£)

(内-旧)=(2,3),

Wp=854*)G)=心

•・.XEG]即样品X属于总体G]

4设已知有两个正态总体G1,G2,且从,而其

先验概率分别为1=%=。5误判的代价L(211)=U\\2)=e,试用贝叶斯判别

法确定样本X=(;)属于哪个总体?

解:由Bayes判别知,W(x)==exp[(x-(//.-)]

人。)

11"(4\]⑶

"=55"幻=56+2=4

其中LV7'v7

'1"9-n(-2}

z=8-(-11尸,M_〃>=

d=%C("2)-3

0c(211)

(x}⑶,

\V(x)=W}1=W<d

<X2)⑸

故乂=属于G2总体

5表1是根据某超市对不同品牌同类产品按畅销(1)、平销(2)和滞销(3)的数据,

利用SPSS得到的Bayes判别函数系数表,请据此建立贝叶斯判别函数,并说明如何判

断新样品(xl,x2,x3)属于哪类?

ClassificationFunctionCoefficients

group

123

xl-11.689-10.707-2.194

x212.29713.3614.960

x316.76117.0866.447

(Constant

-81.843-94.536-17.449

)

Fisher'slineardiscriminantfunctions

表1Bayes判别函数系数

解:根据判别分析的结果建立Bayes判别函数:

Bayes判别函数的系数见表4.1。表中每一列表示样本判入相应类的Bayes判别函数系

数。由此可建立判别函数如下:

Group1:XI=-81.843-11.689%1+12.297X2+16.761X3

Group2:Y2=-94.536-10.707X1+13.361X2+17.086X3

Group3:X3=-17.449-2.194X1+4.960X2+6.447X3

将新样品的自变量值代入上述三个Bayes判别函数,得到三个函数值。比较这三个函

数值,哪个函数值比较大就可以判断该样品判入哪一类。

6.对某数据资料进行因子分析,因子分析是从相关系数阵出发进行的,前两个特征根

和对应的标准正交特征向量为

4=2.920U\=(0.1485,-0.5735,-0.5577,-0.5814),

4=2.920U\=(0.1485,-0.5735,-0.5577,-0.5814)

(1)取公因子个数为2,求因子载荷阵

(2)用F1F2表示选取的公因子,马,名为特殊因子,写出因子模型,说明因子载荷

阵中元素%的统计意义

7在一项对杨树的形状研究中,测定了20株杨树树叶,每个叶片测定了四个变量

乂,乂2,乂3,乂4分别代表叶长,叶子2/3处宽,1/3处宽,1/2处宽,这四个变量的相

关系数矩阵的特征根和标准正交特征向量分别为:

4=2.920U\=(0.1485,-0.5735,-0.5577,-0.5814)

A2=1.024U2=(0.9544,-0.0984,0.2695,0.0824)

%=0.049=(0.2516,0.7733,-0.5589,-0.1624)

%=0.007U4=(-0.0612,0.2519,0.5513,-0.7930)

若按一般性原则选取主成分个数,请写出主成分表达式,并计算每个主成分的方差贡

献率

解:选取主成分的一般原则是特征值大于1或累积贡献率达到80%以上。据题选取两个

主成分,其表达式和贡献率分别是:

y=0.1485X「0.5735X2-0.5577X3-0.5814X4,贡献率为4=2.920

y2=0.9544X1-0.0984X2+0.2695Xj+O.O824X4,贡献率为4=1.024

8下表是进行因子分析的结果,试根据表中信息写出每个原始变量的因子表达式,并分

析是否需要对因子载荷旋转。

ComponentMatrix

Component

123

X1.969-1.084E-02.205

X2.911.321-.102

X3.847-.120.323

X4.941.281-2.693E-02

X5.899.215-1.963E-02

X6-.313.839.305

X7-.6666.280E-02.679

X8.575-.580.367

ExtractionMethod:PrincipalComponentAnalysis.

a3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论