版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章2.1.试叙述多元联合分布和边际分布之间的关系。解:多元联合分布讨论多个随机变量联合到一起的概率分布状况,X=(X1,X2,Xy的联合分布密度函数是一个p维的函数,而边际分布讨论是x=(x1,x2,X"的子向量的概率分布,其概率密度函数的维数小于p。2.2设二隹随机向量(X1X2)'服从二元正态分布,写出其联合分布。解:设(X1X2)'的均值向量加=(七四2儿协方差矩阵为'b21,则其联合分布密度函数为f(x)='b21伊21—1/2fl2W1-1(X-p)\。2.3已知随机向量(X1
X2)'的联合密度函数为2(b一a)2(d一c)2f()=2[(d一c)(xa)+(ba)(x一c)一2(x一a2(b一a)2(d一c)2其中a<x<b,c<x<d。求(1)随机变量X1和X2的边缘密度函数、均值和方差;(2)随机变量X1和X2的协方差和相关系数;(3)判断X1和X2是否相互独立。(1)解:随机变量X1和X2的边缘密度函数、均值和方差;f()=jd2[(d一c)(x一a)+(b一a)(x一c)一2(x一a)(x一c)]日x11c2(b一a)2(d一c)22(d一c)(x一a)x
(b-a)2(d-c)2d2[(b-a)(x-c)-2(x-a)(x-c)]日乂
(b-a)2(d-c)2(d-c)(x-a)x
(b-a)2(d-c)22(d-c)(x-a)x
(b-a)2(d-c)2所以〃-c2[(bH”—"心]dtd+j…_:——0(b-a)2(d-c)2cd[(b-a)t2-2(x-a)t2]+(b-a)2(d-c)2d-c1
b-a由于X1服从均匀分布,则均值为牛,方差为(b-a12同理,由于X服从均匀分布f(x)=〈TOC\o"1-5"\h\z2x22x1"c,d],则均值为土,方差为^一^一212其它212⑵解:随机变量X1和X2的协方差和相关系数;cov(x,x)(aXx(aXx1d+c)2[(d一c)(x一a)+(b一a)(x一c)一2(x一a)(x一c)]121(b一a)2(d一c)2-s—dxdx12(c—d)(b—a)36_cov(x,x)1P=—=3(3)解:判断X1和X2是否相互独立。X和X由于f(x,x)。f(x)f(x),所以不独立。1212x11x22dS-、S8KWEisMS、隹々枪Hw鉴、(x。X。X)Hx思17CN则其分量是相互独立。2.5由于多元正态分布的数学期望向量和均方差矩阵的极大似然分别为0=X=YX/ni:•1/i=1£=才(X-X)(X-X)i(35650.00)介一X—P=X=£=才(X-X)(X-X)i(35650.00)介一X—P=X=12.3317325.00*152.50/ii=1(201588000.0038900.0083722500.0038900.0083722500.00-736800.0013.06716710.0016710.0036573750.00-35.800-199875.00-736800.00、-35.80-199875.0016695.10/注:利用X1=1X1,10S=X@n—n叩:)X其中】n=012.6渐近无偏性、有效性和一致性;2.7设总体服从正态分布,X〜N/£),有样本X「X2,...,Xn。由于X是相互独立的正态分布随机向量之和,所以X也月眦正态分布。又E(X)=ED(X)=D[EX*i=1n==Pn]=1Ed(x)=1E£=£)n"i=1n2ni=1所以X〜N(P,£)。p2.8方法1:£=,£(X-x)(x.—x)r
ni=12.8—£XX—nXXn一1.i=1E(£)=—E(£XX-nXX)
n一1iii=1£E(XX,)—nEii1-i=11£y£1,nTT=——7乙£一n—=——7(n—1)£=£。n—1\_.1nJn—1方法2:S=£(X-X)(X.-X)i=1=£_X.-p—(X_p)]_X-p—(X—p)[i=1EV-.--_.(X-p)(X.-py-2£(X.-p)(X-p),+n(X—p)(Xp—Xp),i=1i=1V=£(X-p)(X-p),一2n(X—p)(X—p),+n(X—p)(X—p),iii=1=£(X.-p)(X-p),-n(X—p)(X—p),i=1E(=)=-^E]£(X-p)(X-p),—n(X—p)(X—p),'
n—1n—1k.]iiJ_・_.、E(X-p)(X-p),—nE(X—p)(X—p),=£。..J
故旦为£的无偏估计。n-12.9.设X(1),X(2),...,X(n产从多元正态分布X,£)抽出的一个简单随机样本,试求S的分布。证明:设f**「f**「=*顼***1***1顷"为一正交矩阵,即以=I。令z=(z1气...z)=(X1X2x)r,,由于X由于X(i=1,2,3,4,1••n)独立同正态分布,且r为正交矩阵所以Z'=(Z1Z2...Z)独立同正态分布。且有z=)咒X,E(z)=}E(X)=面,Var(Z)=£i=1i=1E(E(z)=E(£rj=1X.)(a=1,2,3,,n-1)=应raj.=1=tnpX/r=0i=1Var(z)=Var(ZrX)j=1Zr2Var(X)=£Zr2=£ajjajj=1jj=1所以Z1Z2zn1独立同N(0,£)分布。又因为S=Y・(X-X)(X-X)jji=1£XX-nXXj=1因为nXX'=n[而于£XJ^^^1=£X,j又因为£XX'jjj=1=(X1X1
X'IX'nJ=(X1)rriX11IX:J=(Z=(Z1Z2Zn)(z2IZ:J所以原式£XX'-ZZ'=£ZZ'-ZZ'jjnnjjnnj=1j=1=ZZ'+ZZ'+...+ZZ'-ZZ'1122nnnn故S=£ZZ',由于Z1,Z2,,Z1独立同正态分布N(0,£),所以j=1S=£ZZ'〜W(n-12)七-M。斗1)7UI8工。一¥•••+M+M11I—穹HM(IDC——?以<一.IIc一is+:•+s:x力iHXHm(IM七zI七zI。右坦sHaklif.n^Mnmh.:hMn目骨(Cxi)•:;zi工CI。右坦sg至拣、MnMHHmHiHhiH台骨(I)77d77-『crrEH、好卅壹麒s®s(71)z皿水暇(dxM)x^.OIcxiM+:・+M+M2&HM、:s»、『」<(X—3"xpz一.II』hUrrx钉"XHme-N雎1.11li—x)m尺.LMm7u£I业Tu、UL•-JL•」SS粘oe;)(I.IITuu7u7SSS(li:x)rw(1<・应产削-——»一UG——(齿)UIWi——HM£)7UI3.1试述多元统计分析中的各种均值向量和协差阵检验的基本思想和步骤。其基本思想和步骤均可归纳为:答:第一,提出待检验的假设〃和H1;第二,给出检验的统计量及其服从的分布;第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域;第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受)均值向量的检验:统计量拒绝域均值向量的检验:在单一变量中当a2已知z=—~vnaIzl>za/2当a2未知t=—侦05S111>t(n-1)a/21(S2=扪^(X「X)2作为a2的估计量)i=1一个正态总体H:p=p协差阵£已知T02=n(X-00)'Z-1(X-“0)〜X2(p)T协差阵£未知(n~—~P^~T2〜F(p,n-p)(n-1)pn-pT2>F(n一1)pa(T2=(n-1)kn(X—p)'St寸n(X—p)])两个正态总体H:p=p有共同已知协差阵n-m.——.——T2=——(X-Y)'£-1(X-Y)~X2(p)°n+mT02>Z(2有共同未知协差阵(n+m―2)―p+1F=T2〜F(p,n+m—p—1)(n+m一2)p(其中T2=(n+m-2)——T(X-Y)S-i(X-Y))协差阵不等n=mf=(n一P)nZ'S-iZ〜F(p,n-p)p协差阵不等n丰mF=(n一p)nZ'S-1Z〜F(p,n-p)F>FTOC\o"1-5"\h\zpa多个正态总体H:旦=p==p单因素方差F=%A(*-1)〜f(k-1,n-k)F>FSSE(n-k)a多因素方差A=回=—E—〜A(p,n-k,k-1)多因素方差|T|A+E|协差阵的检验检验区=£0「1](°\np/2H°:£=I*=exp卜2'«阱/2lH°:£=I人=exp|-2trS*(e\np/2闵n/21板J检验£=£==£H:£=£==£n”"/2
ii=1统计量人*np/2HSM/2/''i=1n”"/2
ii=14.2试述判别分析的实质。答:判别分析就是希望利用已经测得的变量数据,找出一种判别函数,使得这一函数具有某种最优性质,能把属于不同类别的样本点尽可能地区别开来。设R1,R2,…,Rk是p维空间Rp的k个子集,如果它们互不相交,且它们的和集为",则称■■为.的一个划分。判别分析问题实质上就是在某种意义上,以最优的性质对?维空间"构造一个"划分",这个"划分”就构成了一个判别规则。4.3简述距离判别法的基本思想和方法。答:距离判别问题分为①两个总体的距离判别问题和②多个总体的判别问题。其基本思想都是分别计算样本与各个总体的距离(马氏距离),将距离近的判别为一类。4.4简述贝叶斯判别法的基本思想和方法。TOC\o"1-5"\h\z基本思想:设k个总体G,G,…,G,其各自的分布密度函数f(x),f(x),…,f(x),假设k个总体各自出现的概率12k12k分别为q,q,…,q,q>0,寸q=1。设将本来属于G总体的样品错判到总体G.时造成的损失为C(jIi),12kiiiji=1i,j=1,2,…,k。设k个总体G,G,…,G相应的p维样本空间为R=(R,R,…,R)。12k12k在规则R下,将属于G的样品错判为G/勺概率为P(jIi,R)=』f(x)dxi,j=1,2,…,ki。jRj,则这种判别规则下样品错判后所造成的平均损失为r(iIR)=Z[C(jIi)P(jIi,R)]i=1,2,…,kj=1则用规则R来进行判别所造成的总平均损失为g(R)=Yqr(i,R)i=1=£q〔Ec(jIi)P(jIi,R)i=1j=1贝叶斯判别法则,就是要选择一种划分R/气,…,Rk,使总平均损失g(R)达到极小。4.5简述费希尔判别法的基本思想和方法。答:基本思想:从k个总体中抽取具有P个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数U(X)=uX+uX++uX=u'X1122pp系数u=(u「u2,…,u「可使得总体之间区别最大,而使每个总体部的离差最小。将新样品的p个指标值代入线性判别函数式中求出U(X)值.,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。4.7设有两个二元总体、和,从中分别抽取样本计算得到’'「,,*--;-".:「【.;假设二:匚,试用距离判别法建立判别函数和判别规则。样品X二(6,0)'应属于哪个总体?解:门=*‘,‘-C*,门..二"「.),;二「=;:)(x-E)-(6,0)-〔4,0,5)-〔2,0,5〕-1_1I7.6-2.U一3967卜”15.8)(壮-代)—03)'—'七即样品X属于总体第五章5.2试述系统聚类的基本思想。答:系统聚类的基本思想是:距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品(或变量)总能聚到合适的类中。5.5试述1<均值法与系统聚类法的异同。答:相同:K—均值法和系统聚类法一样,都是以距离的远近亲疏为标准进行聚类的。不同:系统聚类对不同的类数产生一系列的聚类结果,而K—均值法只能产生指定类数的聚类结果。具体类数的确定,离不开实践经验的积累;有时也可以借助系统聚类法以一部分样品为对象进行聚类,其结果作为K—均值法确定类数的参考。5.7检测某类产品的重量,抽了六个样品,每个样品只测了一个指标,分别为1,2,3,6,9,11.试用最短距离法,重心法进行聚类分析。(1)用最短距离法进行聚类分析。采用绝对值距离,计算样品间距离阵”'®⑶.缶'-1"%'210TOC\o"1-5"\h\z'■'I5430''876301098由上表易知'中最小元素是'于是将、,’,,,聚为一类,记为*计算距离阵。■-Gg0'■'I368'中最小元素是七=2于是将,,"聚为一类,记为计算样本距离阵:'缶ga缶0'■'I30膈630
L7L7土附'采一实器勺’勺’为毋晋壬[.-E麟—诳广晋望里\[>窖中⑹0rJ017宓"918001为069£6""90691宓切0I叨0I勺0lD切'勺节9F勺⑹》呻5皆皿鸟好采器?忠亲Q重由(1)叼实旦1'采一实器为勺’勺毋晋壬EE站=m口晋举四「/窖中⑵0a上sws长世眦左、*—苔占、寸"渲上mK促三«廿二wo+¥爻修一—.靠板眦云|..坦。寸KI8丁。66寸日。9190J叶/、跟J—、滩—蕾匚•£、项寒嗯诉9一代孚上Twmm促二福廿§。916.1试述主成分分析的基本思想。答:我们处理的问题多是多指标变量问题,由于多个变量之间往往存在着一定程度的相关性,人们希望能通过线性组合的方式从这些指标中尽可能快的提取信息。当第一个组合不能提取更多信息时,再考虑第二个线性组合。继续这个过程,直到提取的信息与原指标差不多时为止。这就是主成分分析的基本思想。6.2主成分分析的作用体现在何处?答:一般说来,在主成分分析适用的场合,用较少的主成分就可以得到较多的信息量。以各个主成分为分量,就得到一个更低维的随机向量;主成分分析的作用就是在降低数据"维数"的同时又保留了原数据的大部分信息。TOC\o"1-5"\h\z[11■3/23/2、6.6已知X=("".:)’的协差阵为、3/221/45043/25『6.6已知X=("".:)’的协差阵为11.⑶23/2用-涸=崩〃孕I5^3/4解:3/2E/4fl”计算得-、I■:.1「=12,Aj=8,熟=4〃(『])一&—12,0(^3)-习一&。(卜3)=吗=41,,同理,计算得习二8时,叼一(SB?)'1,,易知'!■'相互正交综上所述,.=第一主成分为"'.:'1"•'叩1)="第二主成分为综上所述,.=第一主成分为"'.:'1"•'叩1)="第二主成分为第三主成分为雄)「46.7设X=(,)’的协方差阵(p*为'1P■■-P'I"1PiHIfip■■-1],0<p<1证明:-.I■'为最大特征根,其对应的主成分为二「(p-+<r2-1p/■■-pa2TOC\o"1-5"\h\z(p—1)+ex'-—A/—A…pd'1■!■1:i:[p—l)py'4-/—Apb-••/—AI(P-l)P砂+<7,项p普■■■时0-P)-A,■■p<T‘卜■4*;•'■rD--0/〔l-p)—』■■0<p<ld为—[(p_l)p+itr2习—a2(l-p).「,=1:-,'<:为最大特征根Pp…吃=〔LLL…)'门(1-p)p…0p(l-p)-■-oO.:Pp…吃=〔LLL…)'门(1-p)p…0p(l-p)-■-oO.:O■h-.1►■4L41O・:.O肖・*7.1试述因子分析与主成分分析的联系与区别。答:因子分析与主成分分析的联系是:①两种分析方法都是一种降维、简化数据的技术。②两种分析的求解过程是
类似的,都是从一个协方差阵出发,利用特征值、特征向量求解。因子分析可以说是主成分分析的姐妹篇,将主成分分析向前推进一步便导致因子分析。因子分析也可以说成是主成分分析的逆问题。如果说主成分分析是将原指标综合、归纳,那么因子分析可以说是将原指标给予分解、演绎。因子分析与主成分分析的主要区别是:主成分分析本质上是一种线性变换,将原始坐标变换到变异程度大的方向上为止,突出数据变异的方向,归纳重要信息。而因子分析是从显在变量去提炼潜在因子的过程。此外,主成分分析不需要构造分析模型而因子分析要构造因子模型。7.3简述因子模型十•「中载荷矩阵A的统计意义。i=l,2,,p答:对于因子模型X=aF+aF++aF++aF+s••11♦cr\••i=l,2,,piill122ijjimmiaalll2alm因子载荷阵为A=a…a2l22-a2m=(4,"气)aaLPlP2a…pm」乂,与Fj的协方差为:•••••••••Cov(X,F)=Cov(£a*"危i,Fj)k=l=Cov(工aF,F)+Cov(g,F)ikkjijk=l=aij若对X作标准化处理,’=a,因此a一方面表示X对F的依赖程度;另一方面也反映了变量土对公共因子iijijijFj的相对重要性。变量共同度h2=Ya2i=l,2,,piij
j=lD(X)=a2D(F)+a2D(F)++a2D(F)+D缶)=h2+。2说明变量X的方差由两部分组成:第一部分为ii11i22immiiii共同度h;,它描述了全部公共因子对变量X〔的总方差所作的贡献,反映了公共因子对变量X〔的影响程度。第二部分为特殊因子£j对变量Xi的方差的贡献,通常称为个性方差。而公共因子F对X的贡献g2=Ya2j=1,2,,mi=1表示同一公共因子F对各变量所提供的方差贡献之总和,它是衡量每一个公共因子相对重要性的一个尺度。j7.4在进行因子分析时,为什么要进行因子旋转?最大方差因子旋转的基本思路是什么?答:因子分析的目标之一就是要对所提取的抽象因子的实际含义进行合理解释。但有时直接根据特征根、特征向量求得的因子载荷阵难以看出公共因子的含义。这种因子模型反而是不利于突出主要矛盾和矛盾的主要方面的,也很难对因子的实际背景进行合理的解释。这时需要通过因子旋转的方法,使每个变量仅在一个公共因子上有较大的载荷,而在其余的公共因子上的载荷比较小。最大方差旋转法是一种正交旋转的方法,其基本思路为:其中令A*=Ar=(a*),d=a*/hd=—况d2ijpxmijijijpiji=11…-A*的第j列兀素平方的相对方差可定义为V=—^(d2-d)27pi=1"7②V=V+V++V最大方差旋转法就是选择正交矩阵r,使得矩阵A*所有m个列元素平方的相对方差之和达到最大。7.5试分析因子分析模型与线性回归模型的区别与联系。答:因子分析模型是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的统计分析方法的模型。而线性回归模型回归分析的目的是设法找出变量间的依存(数量)关系,用函数关系式表达出来。因子分析模型中每一个变量都可以表示成公共因子的线性函数与特殊因子之和。即X=aF+aF++aF+e,(i=1,2,,p)该模型可用矩阵表示为:X=AF+e而回归分析模型中多ii11i22immi元线性回归方程模型为:’I'.L■其中‘‘、是常数项,.、•“•••'..是偏回归系数,’是残差。因子模型满足:(1)m<p;(2)Cov(F,e)=0,即公共因子与特殊因子是不相关的;(3)D=D(F)(3)D=D(F)==j,即各个公共因子不相关且方差为1;m°12(4)D广D(e)=气"即各个特殊因子不相关,方差不要求相等。b2p-1而回归分析模型满足(1)正态性:随机误差(即残差)e服从均值为0,方差为S2的正态分布;(2)等方差:对于所有的自变量x,残差e的条件方差为S2,且s为常数;(3)独立性:在给定自变量x的条件下,残差e的条件期望值为。(本假设又称零均值假设);(4)无自相关性:各随机误差项e互不相关。两种模型的联系在于都是线性的。因子分析的过程就是一种线性变换。7.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 区政府工作制度
- 八点半工作制度
- 地磅工作制度
- 劝导站工作制度
- 停车房工作制度
- 停送票工作制度
- 卫龙工作制度
- 储物间工作制度
- 制服员工作制度
- 创城办工作制度
- 2026新疆兵团第七师胡杨河市公安机关社会招聘辅警358人笔试备考试题及答案解析
- 企业车间绩效考核制度
- 乡镇禁毒举报奖惩制度
- 2026年云南省公务员考试《行政职业能力测验》(省直卷)真题解析
- 2026年安徽新闻出版职业技术学院单招综合素质考试题库及一套答案详解
- DLT 5035-2016 发电厂供暖通风与空气调节设计规范
- 污水泵站工艺及施工课件
- 中国酒城醉美泸州四川泸州旅游攻略城市风土人情介绍PPT图文课件
- DB34T 2915-2022 公路水运工程三阶段安全风险分析与预防管理规程
- 国际标准行业分类第4版ISICRev-4中文版
- 2022年吉林大学第二医院医护人员招聘考试笔试题库及答案解析
评论
0/150
提交评论