应用多元统计分析课后答案1_第1页
应用多元统计分析课后答案1_第2页
应用多元统计分析课后答案1_第3页
应用多元统计分析课后答案1_第4页
应用多元统计分析课后答案1_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、精品(Xi,X2,L Xp)的联合分布密的子向量的概率分布,其概率密度2.1.试叙述多元联合分布和边际分布之间的关系。解:多元联合分布讨论多个随机变量联合到一起的概率分布状况,度函数是一个p维的函数,而边际分布讨论是X(X1,X2,LXp)函数的维数小于p。12感谢下载载2.2设二维随机向量(XiX2)服从二元正态分布,写出其联合分布。解:设(X1X2)的均值向量为12,协方差矩阵为21121;,则其联合分布密2度函数为1/2211222exp2(x211222(x山。2.3已知随机向量(X1X2)的联合密度函数为f国公)2(dc)(x1 a) (b a)(x2 c)2(x1 a)(x2c)2

2、2(b a) (d c)其中ax1(1)随机变量X1和X2的边缘密度函数、均值和方差;(2)随机变量X1和X2的协方差和相关系数;(3)判断X1和x2是否相互独立。(1)解:随机变量 X1和X2的边缘密度函数、均值和方差;葭(X)d 2(d c)(x a) (b a)(x2 c) 2(x1 a)(x2 c)22(b a) (d c)dx2(d c)(x1 a)x2(b a)2(d c)2d2(b a)(x2 c) 2(x1 a)(x2 c)(b a)2(d c)2dx22(d c)(x1 a)x222(b a) (d c)d c2(b a)t 2(x1 a)t220 (b a) (d c)dt

3、2(d c)(x a)x22_2(b a)t2(x1a)t 22(b a) (d c)22(b a) (d c)、,_ba所以由于X1服从均匀分布,则均值为,方差为精品感谢下载载同理,由于X2服从均匀分布fX(x2)Xic,ddc,则均值为,方差其它2dc2为12(2)解:随机变量X1和X2的协方差和相关系数;cov(Xi,X2)XiX2d c 2(d c)( x12a)(b a)(X2 c) 2(Xi a)(X2 c)(b a)2(d c)2dX1dx2(c d)(ba)36cov(x1,x2)X1X2(3)解:判断X1和X2是否相互独立。X1和X2由于f(X1,X2)f%(X1)fx2(X

4、2),所以不独立2.4设X(X1,X2,LXp)服从正态分布,已知其协方差矩阵为对角阵,证明其分量是相互独立的随机变量解:因为X(X1,X2,LXp)的密度函数为11,、2(x。2 (x 山p11/2f(x1,,Xp)Eexp2122又由于2O2p12;L2精品1感谢下载载1212L1/2f(Xi,Xp)exp1-rexp1)2211(X2expi1i2(Xi2i)222.6渐近无偏性、有效性和一致性;12112p3)21(Xpp)22pf(x1).f(Xp)则其分量是相互独立。2.7设总体服从正态分布,XNp(),有样本X1,X2,.,Xn。由于X是相互独立的正态分布随机向量之和,所以X也服

5、从正态分布。又E(X)nXii1XiD(X)DXiXi所以Np(Q2.8方法1:(XiX)(XiX)XiXinXXE(?)nXiXinXXXiXinEXXn1(n1)2精品n方法 2: s (Xi -X)(x i - X)i 1nXi-M(XXi-(Xi1感谢下载载n(X(!)(X (1 X (1)n(Xi-Q(Xi-m)i1n2(Xi-Q(X-Qi12.9.n(Xi-pXXi)2n(X.(Xi1)n(Xm)(Xn(Xi-p)(Xi-n(X加X加i1S1n-EK)nEi。-以X7n(X心1n-E(Xi-0(Xi-山nE(X0(Xn1i1S、故为2的无偏估计。n1设X,X,X(n)是从多元正态分

6、布XNp(肉刀抽出的一个简单随机样本,试求S的分布证明:设r令z=(zZ2L4)二*(ij)为一正交矩阵,即rrIo1nX1X2LXnr,由于Xi(i所以 (12 L n)独立同正态分布。且有1,2,3,4,Ln)独立同正态分布,且r为正交矩阵Var(Zn) 2o1n1nZn丁Xi,E(Zn)/E(Xi)Jng-ni1.ni1nE(Za)E(rajXj)(a1,2,3,L,n1)j1jnqj/M&Mrajrnj0j1ni1nVar(Za)Var(r.Xj)j1n%2VarjiXjn一 2 一2 raj 2j 1n所以21马LZni独立同N(0,2)分布。又因为S(XjX)(XjX)XjXjj

7、1nXX因为nXXXii 1ZnZnX1X1n又因为 XjXj X1 X2 j 1XnX2X1 X2 LXnrrX2MZ1 Z2 LZn乙Z2Mn所以原式XjXj ZnZnj 1nZjZj ZnZn Z1Z1Z2Z2j 1ZnZn-ZnZn 1故S j j ,由于Z1,Z2,L ,Zn 1独立同正态分布Np(0, ),所以 j 1n 1S j jWp(n 1,)j 12.10X16 p)是来自Np (出,不)的简单随机样本,i 1,2,3,L ,k,11)已知因 由(Jk且斗 、2、k 、,求和2的估计(2)已知4 为3k 、求出,%,,Mk和 2的估计kna解:(1)? xk na a Xi

8、Hk a 1 i 1Xia 1 i 1nn2.rvi1lnL(%L ,库,与n;21kna1ln(2)Nexp(x:-%)(x:-%)2a1i11nipnln(2)ln2(xi-Ma)(xi-la)222a1i1n11aaa12-21-(Xia%)(X:%)A1022a1i1ln L(枸,2)内n. jEi 11(Xj内)0(j 1,2,,k)解之,得xjnjnjXj,?i 1knjXij Xj Xij Xj j 1 i 1n!n2. nk第三章3.1元述多元统计分析中的各种均值向量和协差阵检验的基本思想和步骤。其基本思想和步骤均可归纳为:第一,提出待检验的假设H0和H1;第二,给出检验的统计

9、量及其服从的分布;第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域;第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受)。均值向量的检验:统计量拒绝域均值向量的检验:在单一变量中当2已知z(X立品|z|z/2当2未知t (XJnS|t| t /2(n 1)(S21n-22t(XiX)2作为2的估计量)n1i1一个正态总体H0:(1比21222协差阵、已知Ton(X风)(X(p)To(n1)p12nP2协差阵、未知T-TF(p,np)-TF(n1)P(n1)P(T2(n1)石(XS1衣(X)两个正态总体H0:(11由有共同已知协差阵

10、T02-n(XY)21(XY)2(p)To22nm有共同未知协差阵F(n-m-2)p1T2F(p,nmp1)FF(nm2)p2,nm1nm(其中T2(nm2)J(XY)S1J(XY),nm.nm协差阵不等nmF(n-p)nZS-1ZF(p,np)FFP(np)n-1协差阵不等nmFZSZF(p,np)FFP多个正态总体H0:单因素方差FSAtiF(k1,nk)FF多因素方差(p,nk,k1)协差阵的检验检验220np/21 n/2eexp-trSS-2 nH 0: E0I pexp1 *-trS 2np/2* n/2 eS - n2kH0:%&L2kpn /2 nikk统计量nnp/2Sini

11、/2Sn/2i1i13.2 试述多元统计中霍特林T分布和威尔克斯人分布分别与一元统计中t分布和F分布的关系答:(!)霍特林TH分布是t分布对于多元变量的推广。t2X2)n(X)(S2)1(X)而若设XNp(然,、),SWp(n,2)且X与SS相互独立,np,则称统计量T:=n(X-|1了一1(1一的分布为非中心霍特林T2分布。2_1若XNp(0,为,SWp(n,)且X与S相互独立,令TnXSXn-p-T2F(p,np1)。np统计(2)威尔克斯A分布在实际应用中经常把A统计量化为T2统计量进而化为F统计量,利用F量来解决多元统计分析中有关检验问题。与F统计量的关系pn11F统计量及分别任意任意

12、1np11(p,n1,1);F(p,nip1)p(p,n1,1)任意任意2np1J(p,n1,2)2TF(2p,2(n1p)pJ(p,n1,2)1任意任意n11(1,n1,n2)匚/nF(n2,n1)出(1,%,1)2任意任意n111J(2,”2)F(2叫,2(n11)n2y(2,5,1)3.3 试述威尔克斯统计量在多元方差分析中的重要意义。答:威尔克斯统计量在多元方差分析中是用于检验均值的统计量。H 0):(11M2LMkHi:至少存在i j使山 内用似然比原则构成的检验统计量为(p, n k, k 1)给定检验水平Wilks分布表,确定临界值,然后作出统计判断。第四章4.1 简述欧几里得距

13、离与马氏距离的区别和联系。答:设p维欧几里得空间RP中的两点x=(X1,X2-Xp)/和丫式Yn%。则欧几里得距离为-耳产欧几里得距离的局限有在多元数据分析中,其度量不合理。会受到实际问题中量纲的影响。设X,Y是来自均值向量为,协方差为上的总体G中的p维样本。则马氏距离为d(x,丫尸工1(X-Y)o当-二即单位阵时d(x,y尸ayex-打=里11cxi-上尸即欧几里得距离。因此,在一定程度上,欧几里得距离是马氏距离的特殊情况,马氏距离是欧几里得距离的推广。4.2 试述判别分析的实质。答:判别分析就是希望利用已经测得的变量数据,找出一种判别函数,使得这一函数具有某种最优性质,能把属于不同类别的样

14、本点尽可能地区别开来。设R1,R2,,Rk是p维空间Rp的k个子集,如果它们互不相交,且它们的和集为RP,则称艮丁为的一个划分。判别分析问题实质上就是在某种意义上,以最优的性质对p维空间Rp构造一个“划分”,这个“划分”就构成了一个判别规则。4.3 简述距离判别法的基本思想和方法。答:距离判别问题分为两个总体的距离判别问题和多个总体的判别问题。其基本思想都是分别计算样本与各个总体的距离(马氏距离),将距离近的判别为一类。两个总体的距离判别问题设有协方差矩阵相等的两个总体Gi和G2,其均值分别是1和2,对于一个新的样品X,要判断它来自哪个总体。计算新样品X到两个总体的马氏距离D2(X,Gi)和D

15、2(X,G2),则XmGi,D2(X,G1)三D2(X,G2)IX巨,D2(X,Gi)D2(X,G2,具体分析,D2(X,Gi)D2(X,G2)11(X四)2(X由)(X函2(X由)11_1111、X2X2X由M1A由(X2X2X2密思、曲)2X21(J2(11)M131Ml(121(12cvy112X2(p2(H)(J2)2(区)12 X2之(的他)2(X%)a2a(X不)记W(X)a(X%)则判别规则为X巨,w(X)IndX巨G,W(X)lnd距离判别的判别规则是XEG1,W(X)之部X巨,w(x)=(S-|I)-TP1-k2)(配仃一(4,0二口-0国1/7.6-2.1=3967-215

16、.8f弧-)=(2。Wp=(2乩5)蔡国蠡)(9=第二犬EG1即样品X属于总体值!第五章5.1 判别分析和聚类分析有何区别?答:即根据一定的判别准则,判定一个样本归属于哪一类。具体而言,设有n个样本,对每个样本测得p项指标(变量)的数据,已知每个样本属于k个类别(或总体)中的某一类,通过找出一个最优的划分,使得不同类别的样本尽可能地区别开,并判别该样本属于哪个总体。聚类分析是分析如何对样品(或变量)进行量化分类的问题。在聚类之前,我们并不知道总体,而是通过一次次的聚类,使相近的样品(或变量)聚合形成总体。通俗来讲,判别分析是在已知有多少类及是什么类的情况下进行分类,而聚类分析是在不知道类的情况

17、下进行分类。5.2 试述系统聚类的基本思想。答:系统聚类的基本思想是:距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品(或变量)总能聚到合适的类中。5.3 对样品和变量进行聚类分析时,所构造的统计量分别是什么?简要说明为什么这样构造?答:对样品进行聚类分析时,用距离来测定样品之间的相似程度。因为我们把n个样本看作p维空间的n个点。点之间的距离即可代表样品间的相似度。常用的距离为(一)闵可夫斯基距离:dj (q)XikX jkq)1/qq取不同值,分为(1)绝对距离(q1)djXikXjk(2)欧氏距离(q2)dj (2)XikXjk2)1/2(3)切比雪夫距离(

18、),dijmax X1 k pikXjk(二)马氏距离dj(L)Xik XjkXik Xjk2_1(三)兰氏距离dij(M)(XiXj)2(XiXj)对变量的相似性,我们更多地要了解变量的变化趋势或变化方向,因此用相关性进行衡量。将变量看作p维空间的向量,一般用(一)夹角余弦pXikXjkcosj(二)相关系数pP(Xi2)(Xj2k)k1k1r1ij(XikXi)(XjkXj)k1PXi)2(XjkXj)2k15.4在进行系统聚类时,不同类间距离计算方法有何区别?选择距离公式应遵循哪些原则?答:设dij表示样品Xi与Xj之间距离,用Dij表示类Gi与Gj之间的距离(1).最短距离法Djxmm

19、Gdjii,jIDkr*mingdjminDkp,DkqXiGk,XjGrLr(2)最长距离法DpqmaxdijPqXiGp,XjGqjDkrxmaxdjmaxDkp,DkqXiGk,XjGr(3)中间距离法212DkrDkp2DkqDpq2(4)重心法Dpq(XpXq)(XpXq)Xr1(npXpnqXq)n2I.2(5)类平均法DpqdijnpnqXiGpXjGj212np2nq2DkrdijDkpDkqnmXiGkXjGrnrn(6)可变类平均法D:r(1)(小DkpnqDjq)D2qnrnr其中是可变的且1(7)可变法D:2Dpq其中是可变的且1(8)离差平方和法St(XitXt)(X

20、itXt)t1nr2nknp2nknq22DkrDkpDkqDpqnrnknr、n必通常选择距离公式应注意遵循以下的基本原则:(D要考虑所选择的距离公式在实际应用中有明确的意义。如欧氏距离就有非常明确的空间距离概念。马氏距离有消除量纲影响的作用。(2)要综合考虑对样本观测数据的预处理和将要采用的聚类分析方法。如在进行聚类分析之前已经对变量作了标准化处理,则通常就可采用欧氏距离。(3)要考虑研究对象的特点和计算量的大小。样品间距离公式的选择是一个比较复杂且带有一定主观性的问题,我们应根据研究对象的特点不同做出具体分折。实际中,聚类分析前不妨试探性地多选择几个距离公式分别进行聚类,然后对聚类分析的

21、结果进行对比分析,以确定最合适的距离测度方法。5.5 试述K均值法与系统聚类法的异同。答:相同:K均值法和系统聚类法一样,都是以距离的远近亲疏为标准进行聚类的。不同:系统聚类对不同的类数产生一系列的聚类结果,而K均值法只能产生指定类数的聚类结果。具体类数的确定,离不开实践经验的积累;有时也可以借助系统聚类法以一部分样品为对象进行聚类,其结果作为K均值法确定类数的参考。5.6 试述K均值法与系统聚类有何区别?试述有序聚类法的基本思想。答:K均值法的基本思想是将每一个样品分配给最近中心(均值)的类中。系统聚类对不同的类数产生一系列的聚类结果,而K均值法只能产生指定类数的聚类结果。具体类数的确定,有

22、时也可以借助系统聚类法以一部分样品为对象进行聚类,其结果作为K均值法确定类数的参考。有序聚类就是解决样品的次序不能变动时的聚类分析问题。如果用X,X(2),X(n)表示n个有序的样品,则每一类必须是这样的形式,即X(i),X(i1),X(j),其中1in,且jn,简记为Gii,i1,j。在同一类中的样品是次序相邻的。一般的步骤是(1)计算直径D(i,j)。(2)计算最小分类损失函数Lp(l,k)。(3)确定分类个数ko(4)最优分类。5.7 检测某类产品的重量,抽了六个样品,每个样品只测了一个指标,分别为1,2,3,6,9,11.试用最短距离法,重心法进行聚类分析。(1)用最短距离法进行聚类分

23、析。采用绝对值距离,计算样品间距离阵_GiQsGaGaGs觞0超10Gm210年15430G87630心1098520由上表易知Dm中最小元素是D12=D2a=i于是将Gj,6工,G3聚为一类,记为G7计算距离阵_GyGaG5GeG:0(a30630G,8520中最小元素是D;&=2于是将G5,G。聚为一类,记为的计算样本距离阵D尔G?G:fl10精品D中最小兀素是D,r=3于是将G1,Gg聚为一类,记为Gg计算样品间平方距离阵-,GG2GaG4G5G6;G甘10禽a410G125169064493690G瓦10081642540易知口3心中最小元素是311=DZ=1于是将G,函,G窗聚为一类

24、,记为Gt计算距离阵-,%0G;,4990818812540注:计算方法.-.,其他以此类推。D3tti:中最小元素是D356=4于是将G&,G。聚为一类,记为Gs计算样本距离阵-.,GaGb1%0(:%160年立64160甲中最小元素是D:a-=16于是将G-G;G匕聚为一类,记为Gg答:我们处理的问题多是多指标变量问题,由于多个变量之间往往存在着一定程度的相关性,人们希望能通过线性组合的方式从这些指标中尽可能快的提取信息。当第一个组合不能提取更多信息时,再考虑第二个线性组合。继续这个过程,直到提取的信息与原指标差不多时为止。这就是主成分分析的基本思想。6.2 主成分分析的作用体现在何处?答

25、:一般说来,在主成分分析适用的场合,用较少的主成分就可以得到较多的信息量。以各个主成分为分量,就得到一个更低维的随机向量;主成分分析的作用就是在降低数据“维数”的同时又保留了原数据的大部分信息。6.3 简述主成分分析中累积贡献率的具体含义。答:主成分分析把p个原始变量XhX2,L,Xp的总方差tr(力分解成了p个相互独立的变量p_kY1,,,L,Yp的方差之和k1。主成分分析的目的是减少变量的个数,所以一般不会使用所有p个主成分的,忽略一些带有较小方差的主成分将不会给总方差带来太大的影响。这里我们称kk/k为第kk1个主成分Yk的贡献率。第一主成分的贡献率最大,这表明Y1T1X综合原始变量Xi

26、,X2,L,Xp的能力mp最强,而,,Y3,L,Yp的综合能力依次递减。若只取m(p)个主成分,则称mkk为主k1k1成分Y1,L,Ym的累计贡献率,累计贡献率表明Y,L,Ym综合Xi,X2,L,Xp的能力。通常取m,使得累计贡献率达到一个较高的百分数(如85%以上)。6.4 在主成分分析中“原变量方差之和等于新的变量的方差之和”是否正确?说明理由。i=lk=l答:这个说法是正确的。工=tr=tr(ETT,)=tr(TrET)=tr(A)=h即原变量方差之和等于新的变量的方差之和6.5 试述根据协差阵进行主成分分析和根据相关阵进行主成分分析的区别答:从相关阵求得的主成分与协差阵求得的主成分一般

27、情况是不相同的。从协方差矩阵二出发的,其结果受变量单位的影响。主成分倾向于多归纳方差大的变量的信息,对于方差小的变量就可能体现得不够,也存在“大数吃小数”的问题。实际表明,这种差异有时很大。我们认为,如果各指标之间的数量级相差悬殊,特别是各指标有不同的物理量纲的话,较为合理的做法是使用R代替工对于研究经济问题所涉及的变量单位大都不统一,采用R代替炉,可以看作是用标准化的数据做分析,这样使得主成分有现实经济意义,不仅便于剖析实际问题,又可以避免突出数值大的变量。6.6解:已知 x=(Xi.L,Xa),11-1IS - AE| = v/23/2if的协差阵为由拓v,枳21/45何43/25第/43

28、1/4试进行主成分分析计算得-64。顼久一8)6-12)=I=14=也、D(YJ=耳=1ZD(Y2)=&=8,D(Y3)=二4当Ai=12时a1=(2yl71.何同理,计算得K=8时,5=(-2,V3j3丫,褊=4时,叫=(必一$j1了易知力;叼目互正交单位化向量得,Il-;:i,:;v1,%=5综上所述,第一主成分为、-.:二fintT,第二主成分为_.:,第三主成分为Y=:,-6.7设XRA/Xp)的协方差阵(pXp为证明:k=tr2阴为最大特征根,其对应的主成分为Y*(p 一 l) pGF力 + 0?工 一 X(p l)pa* + aT- A(p - l)po2 +CF3 A(p I)p

29、i” + 炉,一工pcj3 pa2 0a-Z pa=0oB(l - p) 1 11 pa2-I-;G ;0- 0 cf2 (1 p J-A肝0 F 0I = (p - i)p +1屋为最大特征根当 = (p-i)p+i)屋时,p/ pa2a2p(l p) a*p(l-p)a2p(l p)pT寸,“住茅,嗑卜,所以,“钻羽第七章7.1 试述因子分析与主成分分析的联系与区别。答:因子分析与主成分分析的联系是:两种分析方法都是一种降维、简化数据的技术。两种分析的求解过程是类似的,都是从一个协方差阵出发,利用特征值、特征向量求解。因子分析可以说是主成分分析的姐妹篇,将主成分分析向前推进一步便导致因子分

30、析。因子分析也可以说成是主成分分析的逆问题。如果说主成分分析是将原指标综合、归纳,那么因子分析可以说是将原指标给予分解、演绎。因子分析与主成分分析的主要区别是:主成分分析本质上是一种线性变换,将原始坐标变换到变异程度大的方向上为止,突出数据变异的方向,归纳重要信息。而因子分析是从显在变量去提炼潜在因子的过程。此外,主成分分析不需要构造分析模型而因子分析要构造因子模型。7.2 因子分析主要可应用于哪些方面?答:因子分析是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的统计分析方法。目前因子分析在心理学、社会学、经济学等学科中都有重要的应用。具体来说,因子分析可以用于分类。如用考试分数将学

31、生的学习状况予以分类;用空气中各种成分的比例对空气的优劣予以分类等等因子分析可以用于探索潜在因素。即是探索未能观察的或不能观测的的潜在因素是什么,起的作用如何等。对我们进一步研究与探讨指示方向。在社会调查分析中十分常用。因子分析的另一个作用是用于时空分解。如研究几个不同地点的不同日期的气象状况,就用因子分析将时间因素引起的变化和空间因素引起的变化分离开来从而判断各自的影响和变化规律。7.3 简述因子模型X=A+日中载荷矩阵A的统计意义。感谢下载载答:对于因子模型Xiail F1ai2F2Laij Fjaim Fmi i 1,2, L , p因子载荷阵为Aail a21La12a22Laim a

32、2mL(AA,L A)apiap2a pmXi与Fj的协方差为:Cov(Xi,Fj) Cov(maik Fk k 1i,Fj)m= Cov(aikFk,Fj)k 1Cov( /)=aij若对Xi作标准化处理,X即月=aij,因此aij 一方面表小Xi对Fj的依赖程度;另一方面也反映了变量 Xi对公共因子Fj的相对重要性。变量共同度mhi2ai2i 1,2,L ,pj 1D(Xi)2_2_2_2ai1D(F1)ai2D(F2)LaimD(Fm) D( i) hi2 、一 i说明变量Xi的方差由两部.2-分组成:第一部分为共同度 hi ,它描述了全部公共因子对变量 Xi的总方差所作的贡献,反映了公

33、共因子对变量Xi的影响程度。第二部分为特殊因子i对变量Xi的方差的贡献,通常称为个性方差。pj 1,2,L ,m而公共因子Fj对X的贡献gjai2i1表示同一公共因子Fj对各变量所提供的方差贡献之总和,它是衡量每一个公共因子相对重要性的一个尺度。7.4 在进行因子分析时,为什么要进行因子旋转?最大方差因子旋转的基本思路是什么?答:因子分析的目标之一就是要对所提取的抽象因子的实际含义进行合理解释。但有时直接根据特征根、特征向量求得的因子载荷阵难以看出公共因子的含义。这种因子模型反而是不利于突出主要矛盾和矛盾的主要方面的,也很难对因子的实际背景进行合理的解释。这时需要通过因子旋转的方法,使每个变量

34、仅在一个公共因子上有较大的载荷,而在其余的公共因子上的载荷比较小。最大方差旋转法是一种正交旋转的方法,其基本思路为:dA -,*、(aij) p m,*其中令a a r*dij aij / hi djdi21.*1 pA的第j列兀素平方的相对方差可定义为Vj-p i(d;一 2dj) . . . *最大方差旋转法就是选择正交矩阵r,使得矩阵a所有m个列元素平方的相对方差之和达到最大。7.5 试分析因子分析模型与线性回归模型的区别与联系。答:因子分析模型是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的统计分析方法的模型。而线性回归模型回归分析的目的是设法找出变量间的依存(数量)关系,用

35、函数关系式表达出来。因子分析模型中每一个变量都可以表示成公共因子的线性函数与特殊因子之和。即Xiai1F1ai2 F2Laim Fmi(i 1,2,L ,p)该模型可用矩阵表示为:X AF e而回归分析模型中多元线性回归方程模型为:力=瓦+为巧,+ - + 1+ /其中bn是常数项,frjbjbjj是偏回归系数,等是残差。因子模型满足:(1)P;(2)Cov(F,)0,即公共因子与特殊因子是不相关的;(3)DfD(F)Im ,即各个公共因子不相关且方差为1 ;(4)D(9,即各个特殊因子不相关,方差不要求相等。而回归分析模型满足1)正态性:随机误差(即残差)e服从均值为0,方差为 2的正态分布

36、;(2)等方差:对于所有的自变量x,残差e的条件方差为2,且为常数;(3)独立性:在给定自变量x的条件下,残差e的条件期望值为0(本假设又称零均值假设);(4)无自相关性:各随机误差项e互不相关。两种模型的联系在于都是线性的。因子分析的过程就是一种线性变换。7.6 设某客观现象可用X=(t+X”X4来描述,在因子分析时,从约相关阵出发计算出特征值为XK2 = l; X3 = a:.255.由于K+k + D 3 85%,所以找前两个特征值所对应的公共因子即可,又知人 .,入上对应的正则化特征向量分别为(0.707,-0.316,0.632)及(0,0.899,0.4470。,要求:(1)计算因子载荷矩阵A,并建立因子模型。(2)计算共同度峙3=3外0.632a,4470/。V0.8370.44707二建立因子模型为,X1s936F+E1,X2=-04i8F+O.B99Fn+Xa=0,fl37F1+0.4470F2+(2)hf=0.9362=0.876,=-ft41fft+0.89=0x903,呜=D-B3*+0,447=&9M(3)因为是从约相关阵计算的特征值,所以公共因子对X的“贡献”为谓=k=L754。第八章相应分析8.1 什么是相应分析?它与因子

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论