实验3 判别分析指导.doc_第1页
实验3 判别分析指导.doc_第2页
实验3 判别分析指导.doc_第3页
实验3 判别分析指导.doc_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

实验项目三:判别分析实验指导一、实验目的:通过判别分析的实验教学,使学生熟悉判别分析问题的提出、解决问题的思路、方法和技能,会调用SAS软件判别分析过程命令,根据计算机计算的结果,训练学生分析和解决判别分析问题的能力。二、预备知识:解决判别分析问题的思路、理论方法和步骤。三、实验内容:判别分析问题的数据。四、实验仪器与材料:计算机与SAS软件。五、实验步骤:调用判别分析过程命令输入数据求得判别函数、回判结果、判别新样品类别(方法:贝叶斯判别法)。六、结果的分析与应用(有关表图要有序号、中英文名、表的上下线为粗线、表的内线为细线、表的左右边不封口、表图不能跨页、表图旁不能留空块,引用结论要注明参考文献):1、给出判别函数系数表2、判别函数;2、给出回判结果分析表3、相应回判结果分析的文字说明;3、给出新样品具体判别结果的表4、相应新样品具体判别结果的文字说明;4.实验程序。七、布置判别分析实验作业(一星期内交)。表1 人生三大要素指标数据序国家X1 X2 X3 类12345美国日本瑞士阿根廷阿联酋76 99 537479.5 99 535978 99 537272.1 95.9 524273.8 77.7 537011111678910保加利亚古巴巴拉圭格鲁吉亚南非71.2 93 425075.3 94.9 341270 91.2 339072.8 99 230062.9 80.6 3799222221234中国罗马利亚希腊哥伦比亚68.5 79.3 195069.9 96.9 284077.6 93.8 523369.3 90.3 5158判别分析实验程序例:实验内容:判别分析问题的数据-人文发展指数是联合国开发计划署于1990年5月发表的第一份人类发展报告中公布的。该报告建议,目前对人文发展的衡量应当以人生的三大要素为重点,衡量人生三大要素的指标采用X1-出生时的预期寿命、X2-成人识字率和X3-实际人均GDP,将以上三个指标的数字合成一个复合指数,即为人文发展指数。今从1995年世界各国人文发展指数的排序中,选取高发展水平、中等发展水平的国家各五 数据选自世界经济统计研究1996年第一期个作为样品,另选4个国家作为待判样品作贝叶斯判别分析。 实验仪器与材料:计算机与SAS软件。实验步骤:调用判别分析过程命令输入数据求得判别函数、回判结果、判别新样品类别(方法:贝叶斯判别法)。表2 两组判别函数的系数(Linear Discriminant Function for type) VariableLabel12Constant x1 x2 x3ABC-323.215685.791070.264980.03407-236.038235.140340.251670.02533结果的分析与应用调用判别分析过程命令输入数据求得表2-4.从表2得判别函数: Y(1/x)=-323.21568+5.79107x1+0.26498x2+0.03407x3Y(2/x)=-236.03823+5.14034x1+0.2 5167x2+0.02533x3表3 原各组样品回判结果(Number of Observations and Percent Classified into type) From type 1 21 2 Total5 0 5100.00 0.00 100.000 5 50.00 100.00 100.00 Total5 5 1050.00 50.00 100.00Priors0.5 0.5从表3得相应回判结果:原各组样品回判判对率为100%,判别函数效果相当好。从表4得新样品具体判别结果:中国、罗马利亚为第2类国家;希腊、哥伦比亚为第1类国家。表4 新样品判别结果与后验概率(Posterior Probability of Membership in type Classified) Obsinto type12 123422110.00000.00001.00000.98511.00001.00000.00000.0149第一类国家(高发展水平)均值::第二类国家(中等发展水平)均值:中国:第二类国家与第一类国家相比: X1-出生时的预期寿命少5年多,、X2-成人识字率相当靠近,X3-实际人均GDP少近2000美元;中国虽然判为第二类国家,但与第二类国家相比: X1-出生时的预期寿命少近2年、X2-成人识字率少12.44%,X3-实际人均GDP少1480美元;即中国在1995年还是比较落后的!实验程序:判别分析过程命令data discdatl; input no x1 x2 x3 type; label x1=A x2=B x3=C; cards;1 76 99 5374 12 79.5 99 5359 13 78 99 5372 14 72.1 95.9 5242 15 73.8 77.7 5370 16 71.2 93 4250 27 75.3 94.9 3412 28 70 91.2 3390 29 72.8 99 2300 210 62.9 80.6 3799 2;run;data discdat2; input no x1 x2 x3; label x1=A x2=B x3=C; cards;1 68.5 79.3 19502 69.9 96.9 28403 77.6 93.8 52334 69.3 90.3 5158;run;proc discrim data=discdatl testdata=discdat2 crosslisterr testlist; class type; var x1-x3;run;刷黑该块过程命令程序,提交便计算出贝叶斯判别法的结果见表2-4。语句解释: no-样品序号,type-原样品类别,label-标签,discrim-判别分析过程命令,crosslisterr-要求以交叉表的形式输出实际类别与分类结果之间一致和不一致的有关信息。逐步判别法过程命令data discdatl; input group x1-x3 ; cards;1 76 99 5374 1 79.5 99 5359 1 78 99 5372 1 72.1 95.9 5242 1 73.8 77.7 5370 2 71.2 93 4250 2 75.3 94.9 3412 2 70 91.2 3390 2 72.8 99 2300 2 62.9 80.6 3799 ;proc stepdisc sle=0.3 sls=0.3; class group; var x1-x3;run;刷黑该块过程命令程序,提交便计算出筛选的变量x1、x3;语句解释: stepdisc-逐步判别法命令, sle、 sls规定选人变量和剔除变量的显著水平。x1、x3的判别分析过程命令data discdatl; input no x1 x3 type; label x1=A x3=B; cards;1 76 5374 12 79.5 5359 13 78 5372 14 72.1 5242 15 73.8 5370 16 71.2 4250 27 75.3 3412 28 70 3390 29 72.8 2300 210 62.9 3799 2;run;data discdat2; input no x1 x3; label x1=A x3=B; cards;1 68.5 19502

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论