《多元统计分析》课后习题参考答案_第1页
《多元统计分析》课后习题参考答案_第2页
《多元统计分析》课后习题参考答案_第3页
《多元统计分析》课后习题参考答案_第4页
《多元统计分析》课后习题参考答案_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《多元统计分析》参考答案第1章多元分布1.1解:所求的概率密度分别为:fXfY1.2解:随机变量X,Y的联合概率密度为:fx,yfY1.3解:对fx,yf=1则可得:fY由X,Y的对称性得:fX综上,X~Nμ1.4解:X,Y的协方差为:E=1令z=11−ρE==则有ρ1.5解:由已知X1雅可比行列式为:J=∂(则fu1.6解:ff由定理1.1知,用关于x2的函数给出xE则近似误差U的方差为:VarU1.7解:由二维标准正态分布的性质知,其边缘分布为标准正态分布,即U~N0,1;V~N0,1C由于U,V是随机变量,可以保证上述的逆运算是唯一的,因此C是唯一的,符合Sklar定理。1.8解:由已知Y=VarY1.9证明略。1.10略。1.11解:(1)由已知,ff因为有fx1,x2EXVarXEXVarX(2)由已知,fXfXEXVarX同理可得,EXfXfXEX同理可得,EX(3)由已知,fXX1fX由于x2EXfXfXEXVarXEX1.12解:由已知X雅可比行列式为:J=fu1.13解:(1)当α=0时,椭圆轮廓线为:x当α=−1x当α=1x当α=1时,椭圆轮廓线为x1(2)记Y=X−μ~N要求C,使得P等价于P由YTΣ−11.14解:fPfPPP1.15解:(1)由0101(2)fff则有E(X1)=E(X2)=fffCovCov则有ΣX(3)ff则有ΣX

第2章多元正态分布理论2.1证明:设X=X1根据定理2.3,有μ对比(1)等式两端,得Σ即Σ21由(2)式,可知Σ22综上,μΣ=2.2解:根据定理2.4,由XYμ又由定理2.3,可知μZ|Yμ由(1)和(2)解得W=Y由已知XY,Z=XW~Ν12+2Y+3Z,1,可知μX|W=2+2Y+3Z=2+WX于是μ=现已知XY~N3μσX|Y令T=Y+Z,则μT=μY+X(Y+Z)=X其中μσX|(Y+Z)2.3解:由定理2.5可知,当Β=Σ−2.4解:由威沙特分布定义知:设Zi~Np(0,W=i=1由此可得EW2.5证明:(1)⇒(2).若随机变量X=(XϕX只有当ϕXt仅依赖于t的长度时,(2)的结论才成立。那么,取ϕX(2)⇒(3).首先ϕX1t=EeitXϕa所以,a'X与(3)⇒(1).对任意正交矩阵U,有ϕUX2.6解:设随机向量X服从标准正态分布Νd0,ϕX由习题2.5(2)可知,X~Sd(ψ2.7解:因为X服从二元正态分布,所以AX,BX都服从正态分布且Cov即AX与BX不相关,又AX与BX都服从正态分布,因此,AX与BX是独立的。2.8解:(1)由题可知X~N(12,2112)和由定理2.3知,Y2|Y1~N((2)W=X−Y~N(μW,2.9解:(1)由定理2.4知,ZY~N(01,1112),即YZ~N(10,μY|σY|(2)由(1)可知Z−YUV(3)因Y|Z~N(1+Z,1)EY|U2.10解:根据定理2.3可知(1)、(2)不可能成立,因为条件期望和条件方差公式中不含二次项。但(3)、(4)的情况可能成立,因为条件期望是作为条件变量的线性函数,而条件方差是个常数。2.11解:(1)①将X1的线性函数μX3|X1作为X3的最优线性近似。由定理2.②简单相关系数度量了一个随机变量与另一个随机变量之间的线性关系强弱,而多重相关系数度量了一个随机变量与一组随机变量之间的线性关系强弱。记X=X1X2X3=X4(2)由题可知Z1~N(−1,24),Z2~N(5,8)且Z1Z12.12解:由定理2.4可得XZ~N15X与Y的协方差为σXY=ρXYσ固定Z时,X与Y之间的偏相关系数为ρ===−≈−0.5976使用Y和Z的线性函数μX|YZμ=1+=−可以使用多重相关系数来评估该线性近似的好坏:ρ==≈0.8367这说明X与Y,ZT间有强线性相依性,所以使用Y和Z的线性函数μ2.13解:(1)使用X1,X4的线性函数μ(2)同理,使用X1,X3,μ 上述结果说明X4在基于X1,X4来近似X2时不重要,而使用X2.14证明:设X~Npμ,fX考虑如下线性变换,Z=此时,rankDf=注意到上式为p维正态分布NpZ~~N因此,根据定理2.1,Y=Aμ+c2.15证明nS=XTℋX~W 易知trℋ=i=1nℎii=nn−1n=n−1。由ℋℋ=ℋΓΓΓn 记Y=ΓTX=γiTXji=1,⋯,nEyCovyCovy 即Y每个元素的期望为0,Y各行不相关且每行的协方差矩阵Σ相同。根据定理2.2,Y仍服从多元正态分布。因此,nS= 其中,Y的n-1个行向量均服从多元正态分布Np0,Σ2.16证明:①推论2.1: 当X1与X2独立时,显然可以得到Σ12=0。当Σ12=0时,Σ=②推论2.2:设Z=A

第3章基于因子的数据矩阵降维技术3.1证明:记XiZ=V证毕。3.2解:由P个独立同分布随机变量知,其协差阵为Σ=σ2则有λ1τ1τ13.3解:由题3.2知,λ13.4解:X1和X2的相关系数矩阵为:ρ=由λ1λ2=ρ3.5略3.6略

第4章主成分分析4.5证明: 对Σ进行谱分解,得Σ= 易知主成分为Y1=X1+X2Covc 易得cΣ的特征根为λ1,2c2 则有x1=λ1−1x2cρ,x 综上,改变变量单位对主成分分析结果有较大影响。如果各变量数量级差异较大,建议采用标准化的主成分分析方法。4.6解:易知E因此,P=Corr易证得Pγ1=2γ1,Pγ2=2γ易知前两个标准化主成分为Y1=26U1+4.7解:假设ai≠0(i=1,2,3)Z=其协方差矩阵为VarZ易见,rankVarZ=1,VarZY==

第5章因子分析5.1证明略。5.2略。5.3解:在二维空间中,旋转可以用一个单一的角θ定义。把笛卡尔坐标的列向量关于原点逆时针旋转θ的矩阵是:M在三维空间中,旋转矩阵有一个等于单位1的实特征值。旋转矩阵指定关于对应的特征向量的旋转(欧拉旋转定理)。如果旋转角是θ,则旋转矩阵的另外两个(复数)特征值是exp⁡(iθ)和exp⁡(−iθ)。从而得出3维旋转的迹数等于在三维中,旋转可以通过单一的旋转角θ和所围绕的单位向量方向v=(x,y,z)Mv5.4解:由R解得Σ的特征值和特征向量分别为:λ1=2.354λ2=0.616λ3=0.03则当取因子个数为1时,此时方差贡献率为78.45453%,因子正交模型为:X=u5.5略。5.6略。5.7解:为了便于研究,将原始变量标准化,记为X,则因子分析模型可简写为:X=此时,矩阵Q中的元素qij因子载荷qijCov即qij是Xi与Fj的协方差。由于Xi与Fj都是均值为0,方差为1的变量,q在实际问题分析中,qij的绝对值越大,表明Xi与Fj的相依程度越大,或公共因子F第6章聚类分析6.1解:计算欧氏距离、绝对值距离、切比雪夫距离的R程序如下:x1=c(5,7,3,6,6)x2=c(7,1,2,5,6)X=cbind(x1,x2)dist(X,upper=TRUE)dist(X,method="minkowski",p=2)dist(X,method="manhattan")dist(X,method="minkowski",p=1)dist(X,method="maximum")6.2解:(1)Jaccard度量下的矩阵D=(2)Tanimoto度量下的矩阵D=(3)SingleMatching度量下的矩阵D=6.3解:在聚类分析中,接近程度测量工具的选择和子类构建算法的选择是两个基本步骤。接近程度的测量工具是用于测量个体之间的相似程度。个体越接近,相似程度越高。基于对个体之间接近程度的测量,我们把个体划分为若干子类别,使得类内差异小,类间差异大。6.4解:R相关语句:iris.hc<-hclust(dist(iris[,1:4]),"centroid")plclust(iris.hc,labels=FALSE,hang=-1)聚类结果:显然,重心法下的聚类结果较前三种聚类结果复杂,划分的小类较多。图1.基于离差平方和法的鸢尾花数据集聚类结果图2.基于最长距离法的聚类结果与真实结果对比表图3.基于最长距离法的各子类指标均值对比表图4.基于类平均法的聚类结果与真实结果对比表图5.基于类平均法的各子类指标均值对比表图6.基于类平均法的聚类结果与真实结果对比表6.5解:聚类分析的基本思想是研究的样品或指标之间存着程度不同的相似性,于是根据一批样品的多个观测指标,具体找出一些能够度量样品或指标之间的相似程度的统计量,以这些统计量作为划分类型的依据,把一些相似程度较大的样品聚合为一类,把另外一些彼此之间相似程度较大的样品又聚合为另外一类,直到把所有的样品聚合完毕,形成一个有小到大的分类系统,最后再把整个分类系统画成一张分群图,用它把所有样品间的亲疏关系表示出来。功能是把相似的研究对象归类。6.6解:系统聚类算法的原理:系统聚类是将每个样品分成若干类的方法,其基本思想是先将各个样品各看成一类,然后规定类与类之间的距离,选择距离最小的一对合并成新的一类,计算新类与其他类之间的距离,再将距离最近的两类合并,这样每次减少一类,直至所有的样品合为一类为止。系统聚类的凝结算法步骤如下:(1)将每个个体记为一类,形成n个类;(2)计算n个样本两两间的距离矩阵D;(3)合并两个距离最近的类;(4)重新计算距离矩阵D;(5)重复步骤(3)、(4),直到所有个体聚为一类;(6)画聚类图(7)确定类的个数,得出分类结果。

第7章判别分析7.1证明:(1)Lj要使Ljx最大,即X分类到Πj(j∈{1,2,3⋯,J}),等价于使(x−μ(2)在J=2的情况下,要使X分到Π1,(x−等价于2((α其中α=Σ7.2略。7.3解:已知有J类,且Xi~Expλi,i=1,2,⋯,J,对于一个新的观测x,计算L7.4解:思路同题7.3,对于一个新的观测(x,y)7.5略。7.6证明:在J=2的情况下,Fisher线性判别的判别准则如下:xx而当Πixx其中μ=17.7解:由已知,f1(x)=10x0.2xR1

第8章对应分析8.1解:如果X是对角阵,则行元素之和xi∙和列元素之和x∙i,i=1,...,n均等于对角元素xii,有rsk将第二个式子代入第一个公式,得到λk=x∙∙8.2解:U.S.犯罪数据集由7个变量的50个测量构成,给出了1985年美国50个州在7种犯罪类型(X3到X9)上的犯罪人数。将该数据集读入R中,通过对应分析得到如下结果。从特征值与方差解释百分比表中,可以得知前两个因子总共解释了整体方差的70.7%,前三个因子总共解释了整体方差的88.6%,因此可以考虑保留前3个因子。从行因子绝对贡献表中可知,第9个州(PA(+))和第7个州(NY(+))最大程度上解释了第一个轴的方差变动,且这两个州都属于东北部地区,因此第一个轴主要由东北部地区影响。第28个州(GA(+))和第34个州(AR(+))最大程度上解释了第二个轴的方差变动,且这两个州都属于南部地区,因此第二个轴主要由南部地区影响。第4个州(MA(+))和第28个州(GA(+))最大程度上解释了第三个轴的方差变动,且这两个州分别属于东北部地区和南部地区,因此第三个轴主要由东北部地区和南部地区综合决定。图5:U.S.犯罪数据的特征值及解释的方差百分比从列因子绝对贡献表中可知,第一维的方差变动主要由第六和第七种犯罪类型决定,即盗窃及汽车偷盗对第一个轴起决定作用。第二维的方差变动主要由第五和第七种犯罪类型决定,即入室行窃及汽车偷盗对第二个轴起决定作用。第三维的方差变动主要由第三和第四种犯罪类型决定,即抢劫及袭击对第三个轴起决定作用。从两幅投影图中可以明显看出,犯罪类型和各个州之间具有紧密的联系。具体地说,从第一维和第二维的投影图中可知,西部地区和谋杀、袭击、强奸和入室行窃这些犯罪有紧密的联系,可见西部地区是这几种犯罪的常发地区;盗窃和南部地区比较靠近,反映盗窃是南部地区的常发地区;抢劫和东北部地区比较接近,说明抢劫是东北部地区的常发地区。从第二维和第三维的投影图中可知,汽车偷盗和东北部地区的距离最近,反映了东北部地区的汽车偷盗犯罪发生频率较高。因此,这些足以说明四个地区在犯罪方面有显著的差异。给出的三维图直观地反映了各个州及各种犯罪类型在三个维度上的分布情况。结合二维图和三维图,均说明了第9个州的异常分布,即位于东北部、中大西洋处的PA州是一个异常点。专门应用于对应分析的R包为ca,关于该包的具体讲解及应用请参考Nenadic,O.&Greenacre,M.(2007)。该习题相应的R程序为library(ca)library(rgl)X=read.table("D:/B10.txt",header=TRUE)result=ca(X[,4:10],nd=3)print(result)summary(result)plot(result)plot3d.ca(result)图13.6:行因子的绝对贡献(第一部分)图13.7:行因子的绝对贡献(第二部分)图13.8:列因子的绝对贡献图13.9:第一维和第二维上的行投影(50个州)和列投影(7种犯罪类别)图13.10:第二维和第三维上行投影(50个州)和列投影(7种犯罪类别)图13.11:三维投影图8.3证明: 已知A=diagxi∙,ℬ=diagx∙j,xi∙=j=1A− 下证上式中λ=1,γ=1,⋯,1T=A======= ℬ−8.4证明: 设Cn×p=cCTC和CCT的第k个特征向量为Cδrk ①Cn×pbp×1的第iC====== 对称地可得CT ②由8.12可得δk ③由rkrs8.5证明:①Ax=②a③由8.4题知rkr=x同理可得sk8.6解:该列联表说明I1行和J2列、I2行和J1列存在很强的负相关关系,这些关系很可能反映在第一个因子中。在两因子的对应分析图中,I1行投影和J

第9章典型相关分析9.1解:典型相关分析是在寻找向量a和b,使得两个指标aTX和bTX之间相关关系最大化,即令a=ΣXX−12u,b=ΣYY−12v,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论