集美大学实用统计方法信计专业.doc_第1页
集美大学实用统计方法信计专业.doc_第2页
集美大学实用统计方法信计专业.doc_第3页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一章:最小二乘估计、检验统计量的最小二乘估计:选择时的误差项的平方和最小 S(的最大释然估计:L()1 1 nn exP2(Yi(2 )2 n 2 j11 Xi1也是使得S()所以和上面相同。【作业Var( i)(2)设解:( 1)i2T ,最后导出(XTX) 1xty2 1 12X12) nexp - 2S( )(2 )22】考虑回归模型:Yi1XM 2Xi2 i, i 1,2川n其中i(i 1,2川n)互不相关且E( i) 0,(1)求i N(0, 2)求最小二乘估计:则该回归模型课简化为:A nS( ) i2i 1达到最小,则分别对n即:YXiki 11和2的最小二乘估计2的极大似然估

2、计,它们和(丫1令丫 丫2X11X21X21X22,X中的最小二乘估计是否相同?Yn(Y XX n1 X n2,要使误差项的平方和:)T(Y X2求偏导并令其为XijXik0,2 n(XijXik)j 1 i 1申 rank(XTX) rank(X)所以解正规方程即得:i I(22i N(0,),则 Yi(i所以Y(y,y2,|M)L(n2(Yi 1j 1T1(X X)存在的最小二乘估计Xijj)2(Yi 1(Yij,(k1,2),即:XTX1Xi12Xi2)Xij j)Xik0(k 1,2)xty(XTX) 1xty,即为所求。1,2川n)相互独立,且T的似然函数为:exp (Y 1Xi12

3、Xi2)2(2 )2 j1使L()达最大,即使S()达最小,(XTX)2的极大似然估计和(1)中最小二乘估计相同YN(1xty1Xi12Xi2 ,2)-expn)2Xi23XMXi24、兀 i,i 1,2|n写出下列情况下的约简模型,检验统计量及检验准则:(1)340(3)SSE;R) SSEJF)解:(1)约简模型Yi0 N 2Xi2 i(i 1,2|n) ,检验统计量SSE(F)*SSE(R) SSE(F)SSE(Xi, X2) SSE(Xi, X2,X3, X4) SSRn | %,X2)fR n 3, fFSSR3,x | X1, X2)SSR3,X4 |巒2)2SSEn 52MSE检

4、验准则:检验假设H 0 :3H1:30,给定显著性水平,则若F的观测值Fo F (2,n 5),接受H。 若F的观测值Fo F (2,n 5),拒绝H。(2)因为5,所以约简模型:丫05(X1X2)3 Xi1 Xi2 4 Xi3 iY 5( XiX2)3Xi1Xi24i (i检验统计量Y 5( XiX2)03X11X12i (i1,lln)【作业6】在某水源问题的研究中, 考虑下述回归模型:Y 01Xi1SSE(R) SSE(F)fR n 3, fFfRSSE(F)SSE(R) SSE(F)F(2,n 5)MSFH :假设检验0H1:若F的观测值F0 若F的观测值F。F (2,n 5),接受H

5、oF (2,n 5),拒绝Ho第二章:1.主成分分析:Cov(X1,X1) Cov(X1,X2)Cov(X2,XJ Cov(X2,X2)Cov(Xj,Xj)ij方法:由协方差矩阵求特征值;正交单位化特征向量(将特征值代入,算出X,可以得到关系式,再加上【作业1】设总体XX1X2 T的协方差矩阵为E 52,求X的主成分丫和丫2并计算第一主成分 丫的贡献率2 2X12 X22川1)各个主成分就是 Yi eTx :第一主成分即为最大除以 总和转换成相关矩阵2.相关矩阵:另外,在各个变量方差差别太大的情况下,需要将协方差矩阵T解:设特征值为 ,2、5552、521,相应的特征向量ei,e2555因此X

6、的主成分丫eXX15X2,Y2eX5X15X2,第一主成分的贡献率为=85.7%55556 1【作业2】变换协方差矩阵为相关矩阵2 2(1)求其标准化变量的主成分 第*和丫2*及第一主成分Y*的贡献率;(2)与第一题中的结果作比较有什么差异?(3)计算丫与X!,丫与X2及丫2与X1之间的相关系数,其中X1与X2为X1与X2的标准化变量,这些量有何统计意义?_2_解:(1)_Jo5(2)得其特征值及其相应的正交单位化特征向量:.105,得e1105e2则X的两个主成分:丫1.1010一 1010X1X2X1X22 ,第一主成分的贡献率为:1迈L 81.6%2第一主成分的贡献率有所下降,且X1,X

7、2的权重由2. 5522T和牙变为和3,即X2的相对重要性得到提升,ar) Var(X1* 2X2)Var(X12Cov(X1*,X2*) -Var(X2*) - -1022225Var (Y2*) Var(#X;X2 )1var(X1*)Cov(X1*,X2*) -Var(X2*)2 2 2 21 105105Cov ,X1 )Cov(忑 X12:/ 2 * *TX2,X1)Cov(X1*,X122 * *)严(X1,X2)2 102、5 5一210Cov( ,X2 )Co2 2 * *1X2,X2),210255.2 2.510Cov(Y2 ,X1 )Cov(2 x12X2 ,X1 )5.

8、2 2,510Cov ,X1 )Cov(丫 ,X2 )101 TY1*,X2*.VarM) jVar(X2*)2 52101 ;0Y2*,XiCov(Y2*,X1*)Var(Y2*) ,Var(X;)5、2 2、5统计意义:它反应了变量之间的相关程度,因为Y是第一主成分,所以相关度比较高第三章:距离判别和Bayes判别1.距离判别:计算样本均值 (k)x1nknk i 1xi(k)协方差矩阵Sknknk(k)- (k)(k)-(k) T(xix )(x x )T i 1无偏估计(ni 1)S1(n21)S2判断nin2 21是否等于 2,得出判别函数W( x)分以下两种情况:若不等W(x)11

9、 x 1 ,若相等W(x) x注:这里需要求逆矩阵:用矩阵行变换I A12.Bayes判别:概率密度函数:f,x)和f2(x),先验概率分布为误判损失为c(2 |1),c(1|2),则判别函数为:G2,若鵲C2C(1|2)C1C(2|1)C2C(1|2)C1C(2|1)X1xx3769【作业1】设G G2为两个二维总体,从中分别抽取容量为3的训练样本如下: G :G2 :24574748(1)求两样本的样本均值向量 x ,x 和样本协方差矩阵 S1 S2 ;(2)假定两总体协方差矩阵相等,记为,用S S2联合估计;(3)建立距离判别法的判别准则;(4)设有一新样品xo(2,7)t,利用(3)中

10、判别准则判定它属于哪一个。解:(1)-(1)x(3,6)T,-(2)2 x(5,8)T,S2(1)(xi 1-(1) (1)x )(Xix)T01 (01)2)11(11)3 (Xi3 1 i 1-(2) x )(Xix(2) )T11 (11)(01)1(0)(3 1)3(3)由上可知12,-(1)1 x(3,6)T,-(2)x(5,8)T,可求得T2, 2判别函数估计 W(x) (x 一) * 1( 12)T T 21x 4,7i iTT2, 2x1 4,x2 72,08 2x1当 W(x) 0,x Gi即 XiW(x) 0,x G2x24,x G4,x G2(4)把 xqT2,7 代入判

11、别函数,可知W(x)40 ,所以xoGi【作业3】已知两总体的概率密度函数分别为fi(x)和f2(x),且总体的先验概率分布为q 0.2,q20.8误判损失为c(2|i)50,c(i|2)i00 . ( i )按总期望损失达到最小,建立Bayes判别准则;(2)设有一新样品X。满足fi(x)0.3, f2(x)0.5,判定X。的归属问题解:(i)要使总期望损失L最小,根据题目已知条件可建立 Bayes判别准则:G2,右fi(x)f2(X)q2C(i|2) qic(2|i) q2c(i|2) qic(2|i)0.8 i00 c80.2 508方法:计算相似系数矩阵R或样品的距离矩阵 D;对于距离

12、矩阵 D由aydi maxdij得到模糊矩阵Af (x )0 3(2)把fi(x。)0.3,f2(x。)0.5代入判别函数可得亠00.68,所以X。属于G?f2(x)0.5判断模糊等价矩阵:计算褶积A模糊聚类:褶积的计算:(把i行和j行写下来,两行中相对应列的元素取最小(两两比较),得到一行,在这行中取最大A?A,A4A2? A2川直到A2kAk,Ak就是一个模糊等价矩阵记为A (ay);ii024【作业i】考虑下列四个样品的距离矩阵2Di0(i)用最短距离法、最长距离法和类平均法3ii2045340对ay按从大到小排列;依次从大开始取,得到-截阵(內 取i,否则取0),元素i的归为一类;画图

13、;对这4个样品聚类,画出聚类谱系图;(2)将D转化为模糊矩阵,利用模糊聚类法作聚类分析,画出谱系图。解:(i) i.最短距离法:di2=i最小,在水平i上合并 G,G2G5DGG) min di3,d232, DGG) min3,G50最新距离矩阵为D(dG320G4340D (G5,G3) 2距离最小,所以在水平 2上,合并G5,G3 G6 ,D(G6,G4) mind14.d24.d343G6G4新的距离矩阵为G60D(2)G430将1 , 2, 3 , 4在水平3合并成一个大类,谱系图:2.最长距离法:di2=1最小,在水平1上合并 G,G2G5G5G3G4* *G50 DGG)max d13,d2311, D(G5,G4) max du,d245,最新距离矩阵为110D(1) G3G4540 D (G3G)4距离最小,所以在水平 4上,合并G3,G4 G6,D(G6,G5) maxd13,d14,d23,d2411 新的距离矩阵为G6G50110G6G5将1,2,3,4在水平11合并成一个大类,谱系图:3.类平均法:121 Ji1089A201(1_134Dd12=1最小,在水平1上合并 GGG5,np 3,nq 1;DGG)1 d13d236.5,DGG)2 d14d242 2G5G3G4g5 04,最新距离矩阵为5D(1)G3 6.50G4 440D (G3,G4

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论