版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、距离判别和贝叶斯判别法SAS/STATDISCRIM过程局部语句说明一、 DISCRIM过程语句SAS/STATDISCRIM产生线性判别函数并进行分类,主要的语句如下:PROC DISCRIM <options>;必需语句CLASS variabaes;必需语句 可选择的语句 二、程序实例及解释例:某年为了研究某年全国各地农民家庭收支的分布情况,对全国28个地区进行了抽样调查。食品,衣着,燃料,住房,生活用品及其他和文化效劳支出。data a;input type x1-x6;cards;数据行;run;data b;input x1-x6;cards;PROC DISCRIM
2、DATA=a TESTDATA=b out=c crossvalidate method=normalTESTLIST testout=d;priors proportional; CLASS TYPE; VAR x3 x5 x6;proc print data=d;RUN;PROC DISCRIM DATA=a指定对数据集a中的数据进行判别分析;TESTDATA=b指定欲分类观测的样品所在的数据集;crossvalidate要求做交叉核实。交叉核实的想法是,为了判断对观测i的判别正确与否,用删除第i个观测的数据集算出判别规那么,然后用次判别函数来判别第i个观测;method=normal或n
3、par确定导出分类准那么的方法,却上缺省值为method=normal。当指定method=normal时,基于类内服从多员正态分布,并产生的判别函数是线性函数或二次判别函数; ALL规定打印出所有的结果;TESTLIST规定列出TESTDATA=b中的全部的分类结果;testout=d生成一个新的数据集,该数据集包括TESTDATA=b中的所有数据,后验概率和每个样品被分的类。priors proportional要求用各类出现的比例计算各类的先验概率;三、局部程序输出 Class Level Information类的水平信息 Output Prior TYPE SAS Name Freq
4、uency Weight Proportion Probability Pooled Covariance Matrix Information合并的协方差矩阵信息 Covariance Natural Log of the Determinant Matrix Rank of the Covariance MatrixPairwise Generalized Squared Distances Between Groups广义平方距离 Generalized Squared Distance to TYPE From TYPE 1 2 3 1 2.85423 12.39584 The SAS
5、 System 12:07 Sunday, November 4, 2001 4 Linear Discriminant Function线性判别函数 常数项 系数向量TYPE 1 2 3 Classification Summary for Calibration Data 回代核实 后验概率计算公式 Number of Observations and Percent Classified into TYPE: From TYPE 1 2 3 Total 1 5 1 0 6 2 0 9 1 10 3 0 0 9 9 Total 5 10 10 25 1 2 3 Total Discrimi
6、nant Analysis Classification Summary for Calibration Data Cross-validation Summary using Linear Discriminant Function交叉核实 Generalized Squared Distance Function: Posterior Probability of Membership in each TYPE: Number of Observations and Percent Classified into TYPE: From TYPE 1 2 3 Total 1 5 1 0 6
7、2 0 8 2 10 3 0 1 8 9 Total 5 10 10 25 Error Count Estimates for TYPE: 1 2 3 Total Classification Results using Linear Discriminant Function Generalized Squared Distance Function: Posterior Probability of Membership in each TYPE: OBS X1 X2 X3 X4 X5 X6 _1 _2 _3 _INTO_ 1 190.33 43.77 9.73 60.54 49.01 9
8、.04 1.00000 .0000000021 4.905E-16 114 1 3 182.55 20.52 18.32 42.40 36.97 11.68 0.99999 .0000084219 1.0142E-17 1聚类分析§1 SAS/STAT系统聚类CLUSTER过程局部语句说明二、 CLUSTER过程语句SAS/STAT系统聚类CLUSTER过程用于样品的聚类分析,主要的语句如下:PROC CLUSTER METHOD=NAME <options>;必需语句 可选择的语句FREQ variables; 只有PROC CLUSTER语句是必需的。通常情况下,还需
9、要VAR语句或 ID语句及COPY语句。三、 程序实例及解释根据信息根底设施的开展状况,对世界20个国家和地区进行分类。这里选取了兴旺国家,新兴工业化国家、拉美国家、亚洲开发国家、转型国家等不同类型的20个国家的资料:call-每千人拥有的 线数;callmove每千户居民拥有的蜂窝移动 数fee顶峰时期每三分钟国际 本钱computer每千人拥有的计算机每秒百万指令mips每千人中的计算机功率每秒百万指令net-每千人互联网户主数data infor;input country$ call move fee comp mips net;cards;ruidian 684.1 281.8 1.
10、4 2taiwanzhili 138.6 8.20 1.4 31 1411 1.28 ;proc cluster data=infor method=single pseudo standard outtree=c;var call move fee comp mips net;id country;proc tree graphics horizontal;data b;set c;where _ncl_<=15;run;proc sort data=b;by _ncl_;proc gplot data=b;plot _psf_*_ncl_ _pst2_*_ncl_ _sprsq_*_
11、ncl_ _rsq_*_ncl_;run;其中method= single选项指出用最短距离法聚类。除此之外在SAS中可供选择的方法还有: 最长距离法complete 类平均法average 最小方差法ward 重心法centroid 离差平方和法ward 中间距离法median 可变类平均法flexibleouttree=b选项要求生成一个输出数据集,用于画树状图的proc tree可使用该数据,可省略。Id语句指出聚类时的标识变量,如果缺省,系统采用obn个案序号作为观测的标识。pseudo选项要求计算伪F统计量和伪统计量。Std选项要求对数据进行零均值及方差为1的标准化处理proc tr
12、ee 是画树状谱系图的过程步,它是使用CLUSTER过程的输出数据来画谱系图。graphics 指定画谱系图时使用高分辨率图形。horizontal 指定画谱系图时用水平横画。制聚类之前的数据处理,主要有noonrm防止将数据标准化为单位均值和单位均方;standard将变量进行标准化,均值为零,标准差为1。三、输出 Single Linkage Cluster Analysis Norm Pseudo Pseudo Min NCL -Clusters Joined- FREQ SPRSQ RSQ ERSQ CCC F t*2 Dist 18 baxi moxige 2 0.000493 0.
13、99951 . . 119.2 . 17 taiwan hanguo 2 0.000813 0.99869 . . 95.6 . 16 eluosi taiguo 2 0.001386 0.99731 . . 74.1 . 15 CL18 bolan 3 0.002978 0.99433 . . 50.1 6.0 14 CL15 zhili 4 0.008526 0.98580 . . 26.7 4.9 13 deguo faguo 2 0.98245 . . 28.0 . 12 CL14 CL16 6 0.028865 0.95359 . . 13.1 8.6 11 CL12 yindu 7
14、 0.029075 0.92451 . . 9.8 3.4 10 CL11 xiongyal 8 0.91131 . . 10.3 1.1 9 CL17 CL10 10 0.85959 . . 7.7 4.8 8 xinjiapo yingguo 2 0.005694 0.85389 . . 9.2 . 7 CL9 malaixiy 11 0.84652 6 CL13 CL8 4 0.017704 0.82882 . . 12.6 3.9 5 CL6 ruishi 5 0.81614 . . 15.5 1.4 4 riben CL5 6 0.019942 0.79620 . . 19.5 2.
15、0 3 CL4 CL7 17 2 meiguo ruidian 2 0.40688 0.651898 -2.740 11.7 . 1 CL2 CL3 19 0.00000 0.000000 0.000 . 11.7 0.881850 SAS/STAT主成分分析princomp过程Princomp过程语句SAS/STATPrincomp主要的语句如下:PROC Princomp <options>;必需语句 可选择的语句实例分析例一 应收账款是指企业因对外销售产品、材料、提供劳务及其它原因,应向购货单位或接受劳务的单位收取的款项,包括应收销货款、其它应收款和应收票据等。出于扩大销售的
16、竞争需要,企业不得不以赊销或其它优惠的方式招揽顾客,由于销售和收款的时间差,于是产生了应收款项。应收款赊销的效果的好坏,不仅依赖于企业的信用政策,还依赖于顾客的信用程度。由此,评价顾客的信用等级,了解顾客的综合信用程度,做到“知己知彼,百战不殆,对加强企业的应收账款管理大有帮助。某企业为了了解其客户的信用程度,采用西方银行信用评估常用的5C方法,5C的目的是说明顾客违约的可能性。它们是:品格用X1表示,指顾客的信誉,履行归还义务的可能性。企业可以通过过去的付款记录得到此项。 2、能力用X2表示,指顾客的归还能力。即其流动资产的数量和质量以及流动负载的比率。顾客的流动资产越多,其转化为现金支付款
17、项的能力越强。同时,还应注意顾客流动资产的质量,看其是否会出现存货过多过时质量下降,影响其变现能力和支付能力。资本用X3表示,指顾客的财务势力和财务状况,说明顾客可能归还债务的背景。附带的担保品用X4表示,指借款人以容易出售的资产做抵押。环境条件用X5表示,指企业的外部因素,即指非企业本身能控制或操纵的因素。首先并抽取了10家具有可比性的同类企业作为样本,又请8位专家分别给10个企业的5个指标打分,然后分别计算企业5个指标的平均值,如表。这5个指标是按照百分制给出的分数,它们有同样的量纲,所以我们可以利用协方差阵做主成份分析。程序:data c;input x1-x5;cards;70.6 7
18、3 67.6 68.1 78.5 94 94 87.5 89.5 9277.5 73.6 70.9 69.8 74.8 57.7 60.4 57.4 60.8 65;PROC PRINCOMP data=c COV OUTstat=P out=b;Var x1 x2 x3 x4 x5;proc print data=p;proc print data=b;proc sort;by prin1;proc sort;by prin2;proc plot;plot prin2*prin1/haxis=60 to 90 by 5 vaxis=60 to 90 by 5;run;程序解释: PROC Pr
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026浙江事业单位统考丽水市景宁畲族自治县招聘31人笔试备考试题及答案解析
- 2026中国铁塔春季校园招聘(河北有岗)笔试备考试题及答案解析
- 河道自然岸线保护与修复方案
- 大连市政院2026届春季校园招聘笔试参考题库及答案解析
- 2026江苏事业单位统考连云港市赣榆区招聘45人笔试模拟试题及答案解析
- 施工现场危险品管理与储存方案
- 2026四川省综合地质调查研究所考核招聘8人笔试备考试题及答案解析
- 2026湖北十堰市竹山县工商业联合会招聘公益性岗位人员1人考试备考题库及答案解析
- 钢结构施工人员分工方案
- 2026年甘肃陇南成县抛沙镇中心卫生院招聘专业技术工作人员笔试备考题库及答案解析
- 2025甘肃公务员考试《行测》真题及答案解析(完整)
- 2025年湖北水利电力工程技术职务水平能力测试(农业水利工程专业理论知识)历年参考题库含答案详解(5卷)
- 2024年福建省长汀县事业单位公开招聘工作人员考试题含答案
- 《产品三维建模与结构设计(UG)》技工全套教学课件
- 设备定期清理管理制度
- DB4401-T 215-2023 井盖设施技术规范
- 政治●湖北卷丨2024年湖北省普通高中学业水平选择性考试政治试卷及答案
- 语文●浙江卷丨2021年普通高等学校招生全国统一考试语文试卷及答案
- 中医脾的生理功能
- 5.3《阳燧照物》(课件)-【中职专用】高二语文(高教版2023拓展模块下册)
- 垃圾清运服务承诺方案
评论
0/150
提交评论