聚类分析sasPPT课件_第1页
聚类分析sasPPT课件_第2页
聚类分析sasPPT课件_第3页
聚类分析sasPPT课件_第4页
聚类分析sasPPT课件_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.1、sas聚类分析程序。2,PROCCLUSTERMETHOD=系统聚类的基本格式;变量名称列表;标识变量名;复制变量名称列表;按变量名;快跑。具体的聚类方法包括平均类平均重心法、完全最长距离法、单最短距离法、沃德离差平方和法、可变类平均法、中值中等距离法、EML最大似然系谱法、系统聚类法等。3,选项1数据集选项输入数据集数据=sas数据集。默认的最近生成的数据集输出数据集outtree=sas数据集。生成用于绘制聚类树的数据集2,在聚类之前控制数据处理变量,标准化标准3,控制聚类过程信息的打印,禁止在聚类过程中每次生成合并时打印id值Print=n,在聚类过程的最后N层示例print=3中从3类打印聚类过程到当所有样本被合并到一个类时,要求sas打印聚类过程,默认打印过程Simple打印每个变量的描述统计数据。4。语句By语句对by变量定义的组执行聚类分析。Id语句指定了标记为观察的变量,用于区分由聚类历史中的打印输出集ottree指定的数据集中的观察。如果省略,则用obn表示。n是用于观察的序列号复制语句。语句中的Var语句将语句中指定的变量从输入数据集复制到outtree指定的输出数据集,outtree表示参与聚类分析的变量。默认情况下,所有数值变量都参与分析。5,2020/5/30,5,P127。例1。表4.18样本中两个指标的观测值为:在本例中,两个指标具有相同的维度,不能进行标准化转换。6,2020/5/30,6,datacluster07inputx1x2 卡片;25234443-43-22-32-1-3;procclusternoigen/*不计算特征值*/rsquare out=tremethod=single;varx1x2proctree快跑。嘿。7,2020/5/30,7,singlelinkageclusteranalysis root-Mean-squareTotal-samplestandardevariance=2.795085 eanddistancebebetween observations=5.035943 numberfrequencynormalizedofof new empartialminimuclusclusjoiclusterr-squaredStaticeiteters ned 7 ob3 ob 420.0045710.9954290.198573 t6ob6 ob 720.004,8,2020/5/30,8,均方根总样本标准差=2.795085,平均距离=5.035943。9,2020/5/30,9,NumBerfrequencyOnormalizedOfofnewemi-partialminiumclusclusjoiclusterr-SquaredR-squaredStaticeTesters ned 7 ob3 b420 . 0045710 . 9954290 . 198573 T6 ob6 OB 720 . 0045710 . 9908570 . 19735 ob5 cl630 . 0198100 . 97100,10,2020/5/30,10,11,10名候选人将接受智能测试。三个指标分别代表数学推理能力、空间想象能力和语言理解能力。分数如下。选择合适的统计方法对候选人进行分类。嘿。12,2020/5/30,12,dataexinputxyz 卡片;28292818231811221621232226292620232216222142324242924222724;procclusternoigenersquareout=tree method=single;varxyzproctreehor/*hor表示肖像谱系,默认风景*/run;嘿。13,2020/5/30,13,根-均值-平方总计-样本标准偏差=4.11141平均距离中间观察值=8.930861 ormtminincl-ClustersJoined-freqsprsqdiste9 ob4 OBB 620.0 011 . 9990 . 1128 ob1 ob 520 . 0088 . 9900 . 3167 T7 cl8 ob 930 . 0263 . 9640,14,2020/5/30,14,15,聚类的基本格式procfastclumaxcluster=n半径=t;变量名称列表;Id变量名;按变量名;快跑。解释maxcluster=n指定分类的最大数量nRadius=t指定下一个聚合点和现有聚合点之间的最小距离,默认值为0,动态群集,16,选项1数据集选项输入数据集数据=sas数据集种子=sas数据集,指定初始聚合点数据集。指定sas从中选择初始凝点的数据集。如果默认,sas从数据=给出的数据集中选择初始凝点,并输出数据组输出=sas数据组。除了输入数据集变量之外,SAS还包含两个变量:名为cluster的变量表示每个观测值被分成的类别号,名为distance的变量表示距离观测值所在类别重心的距离均值=SAS数据集。指定一个数据集,其中包含各种平均值和一些统计数据。17,选项2,选项收敛=c,用于计算最终凝点,并指定收敛标准,其中C为非负。当冷凝点变化的最大距离小于或等于初始冷凝点之间的最小距离乘以C时,循环过程结束。c的默认值是0.02。仅当maxiter=option出现且大于1时,才能使用此选项。删除=n当凝点所在类别的观察数小于或等于n时,这些凝点将被删除。删除过程在完成漂移选项和maxiter=选项指定的每次迭代后执行。当观测值最终被划分为不同的类别时,凝点不会被删除,因此,最终生成的类别中的样本数量可能小于n。选择初始漂移凝点后,每次观测值落入最接近凝点所在的类别时,该类别的凝点将被该类别中现有观测值的平均值替换。Maxiter=n指定重新计算类的凝点的最大迭代次数。18,2020/5/30,18,P149。示例4.7。表4.216。两个样本的两个指标的观测值为:实例中两个指标的维数相同,不允许标准化转换。19,2020/5/30,19,data club 1/*(type=dist)input x1 x2 ;卡片;05232544435162-43-32-30-52110-10-2-1-1-3;dataclu2inputx1x2 卡片;43-320-1;profastclusdata=clu 1 seed=clu 2 maxc=3 out=clu 3;procprintdata=clu3快跑。嘿。20,2020/5/30,20,Clustermeans ClusterX1X 213.83333.000002-3.000002.400003-0.20000-1.20000 OBX1X 2X集群距离1523.969892311.8333332512.71344411.0137954310.1200000,21,2020/5/30,21,OBX1X 2X集群距离65112.3154176212.386308-4321.166199-3220.4000010-3022.4000011-5222.039612132.5059130-130.2824140-230,22,2020/5/30,22,改变初始凝点ob2,ob10,OB14数据CLU 1/*(类型=距离)*/;inputx1x2 卡片;05232544435162-43-32-30-52110-10-2-1-1-3;dataclu2inputx1x2 卡片;23-300-2;profastclusdata=clu 1 seed=clu 2 maxc=3 out=clu 3;procprintdata=clu3快跑。嘿。23,2020/5/30,23,ThFastclusprocdeureReplace=FullRadius=0 Maxclusters=3 Maxiter=1 ClusterMeansClusterx1X 2-13.0000000003.000000002-3.75000000001.7500000003-0.500000000-1.7500000000 ClusterstandardDeviceClusterx1X 2-12,24,2020/5/30,24,Obsx1X 2集群距离10

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论