应用多元统计分析课后答案朱建平版(前9章)_第1页
应用多元统计分析课后答案朱建平版(前9章)_第2页
应用多元统计分析课后答案朱建平版(前9章)_第3页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章2.1.试叙述多元联合分布和边际分布之间的关系。解:多元联合分布讨论多个随机变量联合到一起的概率分布状况,X (Xi,X2,L Xp)的联合分布密度函数是一个 p维的函数,而边际分布讨论是X (Xi,X2,L Xp)的子向量的概率分布,其概率密度函数的维数小于p。22设二维随机向量(Xi X2)服从二元正态分布,写出其联合分布。解:设(X1 X2)的均值向量为合分布密度函数为21 f(x)荷21 12221 21/2exp212,协方差矩阵为1;,则其联21 21(x2心12111 (x m。22.3已知随机向量(X1X2)的联合密度函数为f (Xi,X2)2(d c)(xi a) (b

2、 a)(x2 c) 2(x, a)(x2 c)(b a)2(d c)2其中 a x, b, cx2d。求(1 )随机变量Xi和X2的边缘密度函数、均值和方差;(2 )随机变量Xi和X2的协方差和相关系数;(3)判断X,和X2是否相互独立。(1)解:随机变量 X,和X2的边缘密度函数、均值和方差;fx(Xi)dxd 2(d c)(X| a) (b a)(x2 c) 2(论 a)(x2 c)2 2(b a) (d c)d2(d c)(x-i a)x2d 2(b a)(x2 c) 2(Xi a)(X2 c)(b a)2(d c)2(b a)2(d c)2dx2d2(d c)(x1 a)x22 2(b

3、 a) (d c) cd c2(b a)t 2(xia)td.0 (b a)2(d c)22(d c)(Xi a)X222(b a) (d c) cd c2 2(b a) (d c) 02 2(b a)t2 (xi a)t 所以由于Xi服从均匀分布,则均值为方差为oI2xic,d其它,则均值为i同理,由于X2服从均匀分布 打(x2)Tc0方差为i2(2)解:随机变量Xi和X2的协方差和相关系数;cov( Xi, X2)XiX2d c 2( d c)(论2a)(b a )(X2 c) 2(捲 a )(X2 c)(b a)2(d c)2dxidx2(c d)(b a)36cov(Xi,X2)i3X

4、i X2J(3 )解:判断Xi和X2是否相互独立。Xi 和 X2 由于 f (X!, X2) fxi(Xi) fx2(X2),所以不独立。为对角阵,证明其分量是2.4设X (Xi,X2丄Xp)服从正态分布,已知其协方差矩阵相互独立的随机变量。解:因为X(Xi,X2丄Xp)的密度函数为f (Xi,Xp)1/2exp艺1(x又由于12 Il121则 f (Xi,,Xp)1"F12p1211/2exp(x卩)12p2L1exp1(X121)2211(X223)2221 (Xpp)22 2i1 i 2 eXp(Xi2 :f(Xi).f (Xp)则其分量是相互独立。2.5由于多元正态分布的数学

5、期望向量和均方差矩阵的极大似然分别为n _ _ / 乞 (Xj X)(Xj X) ni 135650.00c -12.33I X17325.00152.50201588000.0038900.0083722500.00?38900.0013.06716710.0083722500.0016710.0036573750.00-736800.00-35.800-199875.00-736800.00-35.80-199875.0016695.1010其中InO01Descriptives对话框。将待估计的四个变量移入右边的图 2.1。图 2.1 Descriptives 对话框注:利用 Xp1 X

6、 1n, S X (In 1n1n)Xnn在SPSS中求样本均值向量的操作步骤如下:Statistics 宀 Descriptives , 打 开1. 选择菜单项 Analyze 宀 DescriptiveVariables 列表框中,如2. 单击Options 按钮,打开Options 子对话框。在对话框中选择Mean复选框,即计算样本均值向量,如图2.2所示。单击Continue按钮返回主对话框。图2.2 Options 子对话框3. 单击OK按钮,执行操作。则在结果输出窗口中给出样本均值向量,如表2.1,即样本均值向量为(35.3333 ,12.3333 ,17.1667 ,1.5250

7、E2)。NX1035650.0000x2612.3333X35173251000x4B15Z5000有埶的N (列锹S)6表2.1 样本均值向量在SPSS中计算样本协差阵的步骤如下:1. 选择菜单项 Analyze 宀Correlate 宀 Bivariate ,打开Bivariate Correlations对话框。将三个变量移入右边的Variables列表框中,女口图 2.3。0 iirldteCorrelitiO 即Waiun CiMtfmnli|y| 'wwXL 匚 Erh#已 i+H 匚 *«处中TW«f SIuMgw#(-:fK44ed叵E 呻 nuiH

8、sft 说hcEiihdiOKHap图 2.3 Bivariate Correlations对话框2. 单击Options 按钮,打开Options 子对话框。选择Cross-product deviati ons and covaria nces复选框,即计算样本离差阵和样本协差阵,如图2.4。单击Continue 按钮,返回主对话框。图2.4 Options 子对话框3. 单击OK按钮,执行操作。则在结果输出窗口中给出相关分析表,见表2.2。表中Covarianee给出样本协差阵。(另外,PearsonCorrelation为皮尔逊相关系数矩阵,Sum of Squares and Cro

9、ss-products 为样本离差阵。)2.6渐近无偏性、有效性和一致性;2.7设总体服从正态分布,X Np( 4习,有样本X11X21.,Xn。由于X是相互独立的正态分布随机向量之和,所以 X也服从正态分布。又E(X)D(X)Xi ni 1.E XiiiXii 1D Xii 1 ?rlJFears 口时汝758An-皿QB1OOT43Q平肓与艮稲的和1 QDB|=9ig<500 DU11日的-ISMDQDinQ2.010=83 翎HD DOHB373E7j l;HH|h66sk2F轴岭on扌茯性758-沏-.077是苓吐即077平方乓足眾H和194600 00065 33383550

10、DOO-17IBJBC1th方亚38AOn ooo13 09710HOLDDO巧 IS 80 口&EhFmfw 口讨吠准3751-256II”D?7625平方与異和的和4.1BGEBS3SS0 DOOi anEB 99937BnrinunE?1B710.D003.S&TE7 IBBOTElOOOHF;eG8ppnear402D77-.2661Htt130潮価平方究见曰和3&34COO :<001T0 DOO MQBT6.DOOB3475 50Q-736BOO UDO-38 BOO-1S9BT6 DOUI6B95100NI'iGB8所以X Np(m习。2.8

11、 方法匕 n (Xi X)(Xin 1 i 1X)方法2 :E(三)nXiXi nXXi 1E( XiXin 1 i 1nXX )XiXi(Xi -X)(Xi -X)(Xi-1(Xi -11n(Xi - 1(Xi -卩)i 1n(Xi-1(Xi -1i 1(1nE XX(n 1)2 工。 1(X口)n2 (Xi- 1(X- 1i 1n(X口)(X(1 X 口)2n(X口 )(X口)n(X口)(X口)n(X口)(XM)匕E (Xi - 1(Xi- 1n 1 i 1nE(Xi - 1(Xi- 1 nE(Xi 1工的无偏估计。n(XQ(X1(X 11 2。2.9.设X (1) ,X(2) ,., X

12、 (n)是从多元正态分布 X Np(山艺)抽出的一个简单随机样本,试求S的分布。证明:设*L*L*r *L*( j)为一正交矩阵,即 rr I。11L1一 n、n, n令 z=( zZLZn)= X1 X2 L Xn r ,由于Xi(i1,2,3, 4丄n)独立同正态分布,且r为正交矩阵所以(12 Ln )独立同正态分布。且有Zn -UXi , E( Zn) + E( Xi)麻 R, Var( Zn)艺7n i 1Vn i 1E(Za)nE( raj X)j i(a 1,2,3,L ,n 1)n 1n raj j 1 n(1raj rnj1Var( Za)Var(jraj Xj)1rVarj

13、iXjn2艺raj艺 j 1又因为Z2 LZn ,独立同N(0,习分布。(Xj X)(Xj1X)nXjXjj 1nXX因为nXXn J nXi-n i 1ZnZnn又因为 XjXjj 1X1 X2XiXn X2XnXiX2XnXiX2 rrMXnZ2乙Z2MZn所以原式 XjXj ZnZnj 1ZjZjj 1ZnZn乙乙Z2Z2ZnZ-Zn Znn 1故Sj j ,由于乙,Z2,L ,Zn 1独立同正态分布 Np(O,习,所以j 1n 1Sjj 1jWp(n1,)2.10.设 Xi (nip)是来自Np( Mi,厶)的简单随机样本,i 1,2,3, L ,k ,(1)已知M2.MkM 且工1工

14、2.艺k 艺,求m和艺的估计。(2)已知艺1艺2. 耳 艺求 M1, M2,., Mk和艺的估计。解: (1) ?I XknaaXi ,0|“2Ilk a 1 i 1knaaaXiX Xi Xa 1 i 1n1n2.nk(2) lnL (山,L , M-k,艺)In(2)P 艺n 21exp(X:- Ma) £(X:- Ma)In L(仏习】pnln(2 )2na(X: - Xa) 2_1(xa- x)na(Xai 1Xa)(X:a )In L(%,习nj工 1(Xj0(j1,2,,k)解之,得njxjnXj , nj i 1Xj XjXjn,n2nk第三章3.1试述多元统计分析中的

15、各种均值向量和协差阵检验的基本思想和步骤。 其基本思想和步骤均可归纳为:答:第一,提出待检验的假设和 H1 ; 第二,给出检验的统计量及其服从的分布;第三,给定检验水平,查统计量的分布表,确定相应的临界 值,从而得到否定域;看是否落入否定域中,以便对待判假设做出第四,根据样本观测值计算出统计量的值, 决策(拒绝或接受)。均值向量的检验:拒绝域统计量均值向量的检验:在单一变量中2已知(XQ)n|Z| Z /22当2未知(S2(XQ);nSn2 2(Xi X)作为 的估计量)|t| t /2(n 1)n 1 i 1个正态总体H 0: 口(Xq协差阵艺已知2Ton(X1 2X)艺(X x)(p)To

16、22n p t2(n 1)p单因素方差F SSA(k 1)F(k 1,n k)k)SSE( n协差阵艺未知(n 2 1T2 F(p, n p)(n 1)p(t2 (n i)、n(x po)s vn(x Po)两个正态总体H0:P P有共冋已知协差阵T。2nm(X Y)艺1(XY)2(p)T022nm有共冋未知协差阵F(nm2) p 1T2 F(p,n m p1)F F(nm 2)p(其中T2 (n m2).,nrm(X Y) mS1.nm(X Y),n m协差阵不等 n m F (n p)n Z S-1Z F (p,n p)F Fp协差阵不等 n m F (n p)nZ S-1Z F(p, n

17、 p)F Fp多个正态总体H0:12多因素方差Ho:Ipexp1trS Sn/2 enp/2Ho:0I pexp统计量 k1trS2耳k np/2ni 1* n/2Snp/2Sini /2n/2kpm/2i 1EAEE(p,n k,k 1)T协差阵的检验检验艺 艺03.2试述多兀统计中霍特林分布和威尔克斯分布分别与一兀统计中t分布和F分布的关系。答:(!)霍特林分布是t分布对于多元变量的推广。n(X )2S2n(X2 1 )(S ) (X)而若设xN p(卩,习,SWp( n,习且X与S相互独立,n p,则称统计量的分布为非中心霍特林T2分布。若X Np(O,艺),SWp(n,习且X与S相互独

18、立,令T2 nX S 1X ,则- 口T2 F(p,n p 1)。 np(2)威尔克斯分布在实际应用中经常把统计量化为T2统计量进而化为 F统计量,利用F统计量来解决多元统计分析中有关检验问题。与F统计量的关系p5n2F统计量及分别任意任意1n 1p11(p, n1,1)匸/心F(p,q p 1) p(p,n1,1)任意任意2n1 p 1F(2p,2g p)pv (P,m,2)1任意任意n1 1(1,n1,n2)_、F(n2,nJn2(1,n 1, n?)2任意任意1 1 J (2,厲也)1J '1 2,F(2n2,2(n 1)n2V (2, nn2)3.3试述威尔克斯统计量在多兀方差

19、分析中的重要意义。答:威尔克斯统计量在多元方差分析中是用于检验均值的统计量。Ho:山(J2 L 姝H仁至少存在i j使 3(ij用似然比原则构成的检验统计量为E旦t| |a e(p,n k,k 1) 给定检验水平,查Wilks分布表,确定临界值,然后作出统计判断。第四章4.1简述欧几里得距离与马氏距离的区别和联系。答:设p维欧几里得空间中的两点 X =和Y=。则欧几里得距离为。欧几里得距离的局限有 在多元数据分析中,其度量不合理。会受到实际问题中量纲的影响。设X,Y是来自均值向量为,协方差为的总体 G中的p维样本。则马氏距离为D(X,Y)=。 当即单位阵时,D(X,Y)=即欧几里得距离。因此,

20、在一定程度上,欧几里得距离是马氏距离的特殊情况,马氏距离是欧几里得距离的推广。4.2试述判别分析的实质。答:判别分析就是希望利用已经测得的变量数据,找出一种判别函数,使得这一函数具有某种最优性质,能把属于不同类别的样本点尽可能地区别开来。设R1 , R2,Rk是p维空间R p的k个子集,如果它们互不相交,且它们的和集为,则称为的一个划分。判别分 析问题实质上就是在某种意义上,以最优的性质对p维空间构造一个“划分”,这个“划分”就构成了一个判别规则。其基本思想都4.3简述距离判别法的基本思想和方法。 答:距离判别问题分为两个总体的距离判别问题和多个总体的判别问题。 是分别计算样本与各个总体的距离

21、(马氏距离),将距离近的判别为一类。 两个总体的距离判别问题 设有协方差矩阵 刀相等的两个总体 Gi和G2,其均值分别是 mi和m2,对于一个新的样品 X,要判断它来自哪个总体。计算新样品X到两个总体的马氏距离 D2 (X , Gi)和D2 (X ,G2 ),则(X , Gi) > D2 (X, G2,X , D2 (X , Gi) D2 (X , G2) X , D2具体分析,D2(X,G2)* 2p) aa(X2 a (X p)对则判别规则为D2(X,Gi)(XPi)i(XPi)(XiP2)艺(XP2)X艺1X2X艺iPiPi艺iPi (X 艺 iX2X2X艺i(pPi)Pi 艺 1

22、 py i P2 yP22X工i(PPi)(pp)y i(P|P2)2Xpp艺i(PiP2)艺1 pp2 艺1 p2)2(X记 W(X)X , W(X)X , W(X)<0多个总体的判别问题。设有k个总体gG2,Gk,其均值和协方差矩阵分别是M-1 , 口2 , M-k 禾口 艺1 ,艺 2 ,艺 k ,艺k 艺。计算样本到每个总体的马氏距离,到哪个总体的距离最小就属于哪个总体。2 1具体分析,D (X,G ) (X 口 )艺(X 口 )1 11X 2 X 2 m2 X 卩艺卩X 2 X 2(I X C )1 1 1取 I 2 m , C m 2 m ,1,2, k o2可以取线性判别函

23、数为W (X) I X C ,1,2, ,k相应的判别规则为X Gi若Wi(X) max(l X C )1 kf1(x), f2(x), fk(x),假设 k1。设将本来属于 Gi总体的样品4.4简述贝叶斯判别法的基本思想和方法。基本思想:设k个总体G1,G2, ,Gk,其各自的分布密度函数k个总体各自出现的概率分别为qq2, ,qk, qi 0, qii 1 错判到总体Gj时造成的损失为C(j |i), i, j 1,2, ,k o设k个总体G1,G2, ,Gk相应的p维样本空间为 R (R1,R2, ,Rk)。 在规则R下,将属于Gi的样品错判为Gj的概率为P(j|i,R) R fi(x)

24、dx i, j 1,2, ,k i j则这种判别规则下样品错判后所造成的平均损失为kr(i | R) C(j |i)P(j|i,R) i 1,2, ,kj 1则用规则R来进行判别所造成的总平均损失为kg(R) qi(i,R)i 1kkqi C(j|i)P(j |i,R)i 1 j 1贝叶斯判别法则,就是要选择一种划分R1, R2, ,Rk,使总平均损失g(R)达到极小。基本方法:g(R)qiC(j |i)P(j|i,R)i 1 j 1qiC(j |i) r fi(x)dx.丿RjkkR ( qiC(j|i)£(x)dxj 1 j i 1令 qQ(j |i)£(x) hj(x

25、),则 g(R) Rhj(x)dxi 1j 1 jk若有另一划分 R* (Ri*,r2, ,Rk), g(R*)*hj(x)dxj i Rj则在两种划分下的总平均损失之差为k kg(R) g(R*) R R*hi(x) hj(x)dxi 1 j 1 i j因为在Ri上hi (x) hj(x)对一切j成立,故上式小于或等于零,是贝叶斯判别的解。D /D D d R x |hi(x) minhi(x),从而得到的划分R (R1,R2,Rk)为1jki 1,2, ,k4.5简述费希尔判别法的基本思想和方法。答:基本思想:从 k个总体中抽取具有 P个指标的样品观测数据,借助方差分析的思想构 造一个线性

26、判别函数U (X) u1X1 u2X2 L UpXp u X系数U (U1,U2, ,Up)可使得总体之间区别最大, 而使每个总体内部的离差最小。 将新样 品的p个指标值代入线性判别函数式中求出 U (X)值,然后根据判别一定的规则, 就可以判 别新的样品属于哪个总体。4.6试析距离判别法、贝叶斯判别法和费希尔判别法的异同。答:费希尔判别与距离判别对判别变量的分布类型无要求。二者只是要求有各类母体的 两阶矩存在。而贝叶斯判别必须知道判别变量的分布类型。因此前两者相对来说较为简单。 当k=2时,若则费希尔判别与距离判别等价。当判别变量服从正态分布时,二者与贝叶 斯判别也等价。 当时,费希尔判别用

27、作为共同协差阵,实际看成等协差阵,此与距离判别、贝叶斯判别 不同。 距离判别可以看为贝叶斯判别的特殊情形。贝叶斯判别的判别规则是X ,W(X)X ,W(X) <lnd距离判别的判别规则是rX ,W(X)X ,W(X)<0I二者的区别在于阈值点。当5 q2,C(1|2) C(2|1)时,d 1,ln d 0。二者完全相同。4.7设有两个二元总体和,从中分别抽取样本计算得到”假设,试用距离判别法建立判别函数和判别规则。样品X=( 6,0)'应属于哪个总体?解:皆S嗨宓I盘)0翥AO即样品X属于总体4.8某超市经销十种品牌的饮料,其中有四种畅销,三种滞销,三种平销。下表是这十种

28、品牌饮料的销售价格(元)和顾客对各种饮料的口味评分、信任度评分的平均数。销售情况产品序号销售价格口味评分信任度评分12.258畅销22.56733.03943.28652.876平销63.58774.89881.734滞销92.242102.743 根据数据建立贝叶斯判别函数,并根据此判别函数对原样本进行回判。 现有一新品牌的饮料在该超市试销,其销售价格为3.0,顾客对其口味的评分平均为8,信任评分平均为5,试预测该饮料的销售情况。解:增加group变量,令畅销、平销、滞销分别为 groupl、2、3 ;销售价格为Xi,口味 评分为X2,信任度评分为 Xa,用spss解题的步骤如下:1. 在S

29、PSS窗口中选择 Analyze宀Classify宀Discriminate ,调出判别分析主界面,将左边的变量列表中的“group ”变量选入分组变量中,将 X1、X2、X3变量选入自变量中,并选择Enter in depe nde nts together单选按钮,即使用所有自变量进行判别分析。2. 点击Define Range 按钮,定义分组变量的取值范围。本例中分类变量的范围 为1到3,所以在最小值和最大值中分别输入1和3。单击Continue 按钮,返 回主界面。如图 4.1图4.1判别分析主界面3. 单击Statistics按钮,指定输出的描述统计量和判别函数系数。选中Functi

30、on Coefficients 栏中的Fisher ' s:给出Bayes判别函数的系数。(注意:这个选项不是要给出Fisher判别函数的系数。这个复选框的名字之所以为Fisher ' s,是因为按判别函数值最大的一组进行归类这种思想是由Fisher提出来的。这里极易混淆,请读者注意辨别。)如图4.2。单击Continue 按钮,返回主界面。图4.2 statistics子对话框4. 单击Classify按钮,弹出 classification子对话框,选中Display 选项栏中的Summary table复选框,即要求输出错判矩阵,以便实现题中对原样本进行回判的要求。如图4

31、.3。图 4.3 classification 对话框5. 返回判别分析主界面,单击0K按钮,运行判别分析过程。1)根据判别分析的结果建立Bayes判别函数:Bayes判别函数的系数见表 4.1。表中每一列表示样本判入相应类的Bayes判别函数系数。由此可建立判别函数如下:Group1Y181.84311.689X112.297X216.761X3Group2 :Y294.53610.707X113.361X217.086X3Group3 :Y317.4492.194X14.960X 26.447X3将各样品的自变量值代入上述三个Bayes判别函数,得到三个函数值。比较这三个函数值,哪个函数值

32、比较大就可以判断该样品判入哪一类。Classification Function Coefficientsgroup123x1-11.689-10.707-2.194x212.29713.3614.960x316.76117.0866.447(Constant)-81.843-94.536-17.449group123x1-11.689-10.707-2.194x212.29713.3614.960x316.76117.0866.447(Constant)-81.843-94.536-17.449Fisher's linear discriminant functions表4.1Bay

33、es判别函数系数根据此判别函数对样本进行回判,结果如表4.2。从中可以看出在4种畅销饮料中,有3种被正确地判定,有1种被错误地判定为平销饮料,正确率为75%。在3种平销饮料中,有2种被正确判定,有1种被错误地判定为畅销饮料,正确率为66.7%。3种滞销饮料均正确判定。整体的正确率为80.0% 。Classification ResultsPredicted Group Membershipgroup123TotalOriginalCount 131042120330033% 175.025.0.0100.0233.366.7.0100.03.0.0100.0100.0a. 80.0% of o

34、riginal grouped cases correctly classified.表4.2错判矩阵2) 该新饮料的X1 3.0,X2 8,X3 5,将这3个自变量代入上一小题得到的Bayes判别函数,Y2的值最大,该饮料预计平销。也可通过在原样本中增加这一新样本,重复上述的判别过程,并在classificatio n子对话框中同时要求输出casewise results运行判别过程,得到相同的结果。,以决定是否给4.9银行的贷款部门需要判别每个客户的信用好坏(是否未履行还贷责任)予贷款。可以根据贷款申请人的年龄(Xi)、受教育程度(X2 )、现在所从事工作的年数(X3 )、未变更住址的年数

35、(X4)、收入(X5 )、负债收入比例(X6 )、信用卡债务(X )、其它债务(X8 )等来判断其信用情况。下表是从某银行的客户资料中抽取的部分数据,根据样本资料分别用距离判别法、Bayes判别法和Fisher判别法建立判别函数和判别规则。某客户的如上情况资料为(53 , 1 , 9, 18 , 50 , 11.20 , 2.02 , 3.58 ),对其进行信用 好坏的判别。目前信用客户X!X2X3X4X5X6X7X8好坏序号123172316.600.341.712341173598.001.812.91已履行还3422723414.600.94.94贷责任13.143911954801.9

36、34.36535191345.000.401.3015.16371132401.801.827291131427.401.461.65未履行还83221167523.37.769.72贷责任0928223236.400.191.2910.510261432702.47.36解:令已履行还贷责任为groupO,未履行还贷责任为 group1。令(53 , 1 , 9 , 18 , 50 ,11.20 , 2.02 , 3.58、客户序号为11 , group未知。用spss解题步骤如下:1. 在SPSS窗口中选择 Analyze宀Classify宀Discriminate,调出判别分析主界面,将

37、左边的变量列表中的“ group ”变量选入分组变量中,将X1 X6变量选入自变量中,并选择 Enter independentstogether单选按钮,即使用所有自变量进行判别分析。2. 点击Define Range按钮,定义分组变量的取值范围。本例中分类变量的范围为0到1,所以在最小值和最大值中分别输入0和1。单击Continue 按钮,返回主界面。3. 单击Statistics按钮,指定输出的描述统计量和判别函数系数。选中FunctionCoefficients栏中的 Fisher ' s 和 Unstandardized。单击 Continue按钮,返回主界面。4. 单击Cl

38、assify按钮,定义判别分组参数和选择输出结果。选择Display 栏中的Casewise results,以输出一个判别结果表。其余的均保留系统默认选项。单击Con ti nue按钮。5. 返回判别分析主界面,单击0K按钮,运行判别分析过程。1)用费希尔判别法建立判别函数和判别规则:未标准化的典型判别函数系数由于可以将实测的样品观测值直接代入求出判别得分,所以该系数使用起来比标准化的系数要方便一些。具体见表4.3。Canonical Dtscrimirianl huncoori LodT)cient&Fubrlim1XJ说汹雨K?X9ContairwS.5B7173-J 57JU2

39、47107B2-2JB3-1Q79AUnfindardladi w vHldanif表4.3未标准化的典型判别函数系数由此表可知, Fisher判别函数为:Y 10.794 0.32X16.687X2 0.173X3 0.357X4 0.024X5 0.710X6 0.792X7 2.383X8用Y计算出各观测值的具体坐标位置后,再比较它们与各类重心的距离,就可以得知分类,如若与group。的重心距离较近则属于group。,反之亦然。各类重心在空间中的坐标位置如表4.4所示。Functions al Group CetitroidsFunctiongrouD10-243712Unstarida

40、rdized canonica discriminantfunctons evaluated al group means表4.4各类重心处的费希尔判别函数值用bayes判别法建立判别函数与判别规则,由于此题中假设各类出现的先验概率相等且 误判造成的损失也相等,所以距离判别法与bayes判别完全一致。如表4.5所示,group栏中的每一列表示样品判入相应列的Bayes判别函数系数。由此可得,各类的 Bayes判别函数如下:G0118.693 0.340X1 94.070X2 1.033X3 4.943X4 2.969X5 13.723X6 10.994X7 37.504X8G1171.296

41、0.184X1 126.660X2 1.874X3 6.681X4 3.086X5 17.182X6 7.133X7 49.116X8Fitridinn nitemiHrifsijruiuin01V.340,104X29t070126.660疸1.0931.S74-4JU3-6.SS1k52.yby3 UKbxSr 3.72317 re?-10.991-7,f 33疙'37.304-43.115(Canetanp 0,603171.296Fishar'b lirteardi?trin nsrt functor t表4.5 Bayes判别函数系数将各样品的自变量值代入上述两个Ba

42、yes判别函数,得到两个函数值。比较这两个函数值,哪个函数值比较大就可以判断该样品该判入哪一类。2) 在判别结果的Casewise Stastics表中容易查到该客户属于groupO,信用好。4.10从胃癌患者、萎缩性胃炎患者和非胃炎患者中分别抽取五个病人进行四项生化指标的化验:血清铜蛋白 X1、蓝色反应X2、尿吲哚乙酸 X3和中性硫化物 X4,数据见下表。试用距离判别法建立判别函数,并根据此判别函数对原样本进行回判。类别病人序号X!X2X3X4胃1228134201122451341040癌患32001671227者41701507851001672014呈冃委-62251257147130

43、100612厶宀炎缩宙吐患、815011776性者9120133102610160100510非111851155191217012564亠,冃者炎1316514253患141351082121510011772解:令胃癌患者、萎缩性胃炎患者和非胃炎患者分别为group1、group2、group3,由于此题中假设各类出现的先验概率相等且误判造成的损失也相等,所以距离判别法与bayes判别完全一致。用 spss的解题步骤如下:1. 在SPSS窗口中选择 Analyze宀Classify宀Discriminate ,调出判别分析主界面,将左 边的变量列表中的“ group ”变量选入分组变量中,

44、将 X1、X2、X3、X4变量选入自变量中, 并选择Enter independents together 单选按钮,即使用所有自变量进行判别分析。2. 点击Define Range按钮,定义分组变量的取值范围。本例中分类变量的范围为1到3 ,所以在最小值和最大值中分别输入1和3。单击Continue 按钮,返回主界面。3. 单击Statistics按钮,指定输出的描述统计量和判别函数系数。选中FunctionCoefficients栏中的Fisher ' s :给出Bayes判别函数的系数。4. 单击Classify按钮,弹出classification子对话框,选中Display

45、选项栏中的Summarytable复选框,即要求输出错判矩阵,以便实现题中对原样本进行回判的要求。5. 返回判别分析主界面,单击0K按钮,运行判别分析过程。Bayes判别函数的系数见表 4.6。表中每一列表示样本判入相应类的Bayes判别函数系数。由此可建立判别函数如下:Group1Y179.2120.164X10.753X20.778X30.073X 4Group2 :Y246.7210.130X10.595X20.317X30.012X4Group3 :Y349.5980.130X10.637X20.100X30.059X4将各样品的自变量值代入上述三个Bayes判别函数,得到三个函数值。

46、比较这三个函数值,哪个函数值比较大就可以判断该样品判入哪一类。ciassmcdtiai Function Loenicients!l T123>11E4.130.130.763595.63 f.778.317.100>4.073.012-.053-79 21246.721-4S.59SFishes incar iiscnnni)sntfLncticni表4.6 Bayes判别函数系数根据此判别函数对样本进行回判,结果如表4.7。从中可以看出在5个胃癌患者中,有4个被正确地判定,有1个被错误地判定为非胃炎患者,正确率为80%。在5个萎缩性胃炎患者中,有4个被正确判定,有1个被错误地判定为非胃炎患者,正确率为80%。在5个非胃炎患者中,有4个被正确判定,有1个被错误地判为萎缩性胃炎患者。整体的正确率为80.0%。Prodi eta a Of0Lfi wonbrchijoarou 011JroiOriginal Count4015241590145% 1HQ.020.01D3C260.020.01 OOC3J20.030.01 JOCu.江推 y j'ij i'G

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论