数据分析5.5实验报告_第1页
数据分析5.5实验报告_第2页
数据分析5.5实验报告_第3页
数据分析5.5实验报告_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、考察鸢尾属植物中三个不同品种的话的如下四个形状指标:Xi:萼片长度;X2萼片宽度;X3 :花瓣长度;X4 :花瓣宽度。重这三个品种(记为1,2,3)各选取50株,测得上述指标的取值如表所示。假如 三个品种的着、这4个指标均服从4维正态分布,且先验概率相等,按下列要求 进行Bayes判别分析:表鸢尾属植物三个不同品种的话的形状数据编号品种X2X3X4编号品种X1X2X3X411503314276266294613214634143772522739143146361027826034451641513317579250203510515535132802552437106148311628125

2、827391271523414282262294313814936141832593042159144321328426022401010150351668526731471511144301328626323441312147321628725630411313148301438826325491514151381628926128471215148341929026429431316150301629125125301117150321229225728411318143301119326129471419158401229425629361320151381949526931491521

3、149301429625525401322151351429725523401323150341649826630441424146321429926828481425157441541002673050172615036142101364285622271543415410236731562428152421511033632851152915542142104369315123301493115210536530522031154391741063653055183215034152107358275119331442914210836832592334147321321093623454

4、233514631152110377386722361513415211136733572537150351331123763066213814931151113349254517391543715211436730522340154391341153593051184115135143116363255019421483416211736432532343148301411183793864204414523133119367335721451573817312037728672046151381531213632749184715434172122372326018481513715412

5、336130491849152351521243612656145015337152125364285621512652846151263622848185226222451512737730612353259324818128363345624542613046141293582751195526027511613037230581656256253911131371305921572572845131323643155185826333471613336030481859270324714134363295618602643245151353772669236126128401313636

6、022501562255243811137369325723632543045151383742861196425826401213935628492065255264412140373296318662502333101413672558186726731441414236530582268256304515143369315421692582741101443723661257026029451514536532512071257263510146364275319722571942131473683055217324924331014835725502074256274213149358

7、28512475257304212150363336025OtsFrom Cl ass If icd: kind intc kindObsF rom C il ass if i ed kind into kind55no105124130O.DOOOa.30780.6322o.ooocO.19O6.74140.0000Qt43900.56100.0000Q.37860.62640.0000J.00000.92510.0749D.OOOflQ.76570.23433 Hij申3 $3帝2由2 * ?出弗 Misclassi f isd observationnz Ad _h- n- nd 4 -

8、u5 55002-32 Az 2 2 3 3 -STfl-ODOO0.1430R.8570fi.0000OJ55?CU443oiaooo0.39790,fi021fl.OOOO0.8286D.67Q4fl.ODCD0.9860QJ1400.00000.9454Q.05450.00000.20&0otKervat ion1* Misclassified(1) 只考虑指标 X和X4,并假定各总体协方差矩阵不全相等,给出误判率的回代 估计和交叉确认估计;(2) 只考虑指标X2和X4,并假定各总体协方差矩阵相等,写出线性判别函数,给 出误判率的回代估计和交叉确认估计并于(1)中结果作比较;(3) 假定

9、有新样品Xo(X2,X4)T(35,18)T,在(1),(2)之下,该样品非别被判归哪个总体(4) 利用全部4个指标重复(1)和(2)的分析,结果如何是否所用指标越多,分类效果 越好在尝试其他几个指标组合,情况有如何解:(1)误判率的交叉确认估计:误判率的回代估计:V?237.41765 1.79074X2 1.76415x4由以上结果可以看出,当只考虑指标X2和X4 ,并假定各总体协方差矩阵不全相等的情况下,无论用回代法还是用交叉分析法,均存在误判,且误判情况相同,共有7个误判:将第52号的样品由品种2误判为品种3;第53号的样品由品种2误判为品种3;第55号的样品 由品种2误判为品种3;第

10、100号的样品由品种2误判为品种3;第103号的样品由品种3 误判为品种2;第124号的样品由品种3误判为品种2;第130号的样品由品种3误判为品种2。误判的回代估计p;和交叉确认估计P;为:?c71500.0467(2) 当各总体协方差矩阵相等,即,只需把程序中pool=no改为pool=yes,运行结果整理如下: 线性判别函数为:W?156.63828 3.38648x2 2.06379x4W360.仃687 1.45182x2误判率的回代估计:C Isss If 1 sdObskindinto kind12353230.00000.221777881033申0.00000.033?124

11、32Hi11.00000.01161303Hr0.00000.97430.U5?1363*OJOOO0J6220.2379半 Misclassified abseryation3.70086x4误判率的交叉确认估计:ObsF row kindClassif iedinto kind1235823 *0.00000.18930.810110023 *0.00000.48130.616710992 *0.00000.97D7&.0293IN32 #0.00000.93305.007032 *O.OOQOQ.1U6413E32 0.00000.* Niscl&sifledQbservftiign由以

12、上结果可以看出,当只考虑指标X2和X4 ,并假定各总体协方差矩阵相等的情况下,求出线性判别函数,并利用函数对样本进行回代估计和交叉确认估计,均误判现象,其中,用回代发法,共有5个误判现象:将第53号样品由品种2误判为品种3;第103号样品 由品种3误判为品种2;第124号样品由品种3误判为品种2;第130号样品由品种3误判为 品种2;第136号样品由品种3误判为品种2;故误判率的回代估计为:*?*51500.0333用交叉确认法,共有6个误判现象:将第53号样品由品种2误判为品种3;第100号样 品由品种2误判为品种3;第103号样品由品种32误判为品种2;第124号样品由品种3误 判为品种2

13、;第130号样品由品种3误判为品种2;第136号样品由品种3误判为品种2;故 误判率的交叉确认法为:*?c61500.04很显然,当各总体协方差矩阵相等时,误判率的回代估计和交叉确认估计都比各总体协 方差矩阵不全相等时的低。(3)在各总体协方差矩阵不全相等情况下,新样品X。 (X2,X4)T (35,18)T被判归品种2;而在各总体协方差矩阵相等的情况下,新样品X。 (X2,X4)T(35,18)t被判归品种3。(4 )首先是假设各总体协方差矩阵不全相等情况,考虑全部指标,结果如下: 误判率的回代估计:误判率的交叉确认估计:ObsFrom Cl日gwifiEd kindinto kind123

14、0b$From Classified kindint(? kindt235323 w0.000ft6.14480.855253fa *o.flooa0.14+80_a552旺230*00090.092B0.907423 O.OODD0.092C0_90741088 2 *0.0009G.652DJ843810832 #fl.coco065820.843E密 Miiedobservat i or* Misclassifiedbserval i on由以上结果可以看出,考虑全部指标Xi X2 X3 X4 ,并假定各总体协方差矩阵不全相等的情况下,无论用回代法还是用交叉分析法,均存在误判,且误判情况

15、相同,共有3个误判:将第53号的样品由品种2误判为品种3;第55号的样品由品种2误判为品种3;第103号的样品由品种3误判为品种2。误判的回代估计p;和交叉确认估计P;为:pc 右 0.002可求出其线性判别函数为:接着是假设各总体协方差矩阵相等情况,考虑全部指标,W 84.1184 2.1066x1 2.15311x2 1.663923 1.609794 覘 7240277 1.60676x1 0.59094x2 0.50419x3 0.71657x4 呃 104.23783 1.26525 0.3042&2 1.26711X3 2.1483%误判率的回代估计:ObsFrm kindCI ass if iInto kind123533 *O.OOflO02?5&0.77455520,00000.1479U21103a出O.OOIJO0.7286Q.Z70E* Niscl&sified observat i or误判率的交叉确认法:ObskindClassJ-f ledInto kind1?353?3 mo.aood0.8452653 m0.00 (JO0.10310.88S81032 wOJOOUC.7B750-2125 Mlsclusif ied

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论