版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计本科应用多元分析教学,Cluster Analysis,聚类分析(第2部分),第四军医大学卫生统计学教研室,2002年11月,第四军医大学卫生统计学教研室,2002年11月,第四军医大学卫生统计学教研室,2002年11月,第四军医大学卫生统计学教研室,2002年11月,第四军医大学卫生统计学教研室,2002年11月,第四军医大学卫生统计学教研室,2002年11月,第四军医大学卫生统计学教研室,2002年11月,(二)最长距离法(complete linkage,furthest neighbor),B2 A2 * * B1 A1 * * B3 *,样品间:欧氏距离类类间:两类间样品两两距离
2、最长。即图中样品A2和B3之间的距离,第四军医大学卫生统计学教研室,2002年11月,第四军医大学卫生统计学教研室,2002年11月,第四军医大学卫生统计学教研室,2002年11月,第四军医大学卫生统计学教研室,2002年11月,第四军医大学卫生统计学教研室,2002年11月,第四军医大学卫生统计学教研室,2002年11月,(三)中间距离法(median method),最长距离夸大了类间距离,最短距离低估了类间距离。介于两者间的距离即为中间距离,K,L,J,M,第四军医大学卫生统计学教研室,2002年11月,(四)中间距离法的变形可变法,第四军医大学卫生统计学教研室,2002年11月,(五)
3、类平均法(average linkage between group),SPSS作为默认方法,称为 between-groups linkage,K,L,J,M,第四军医大学卫生统计学教研室,2002年11月,第四军医大学卫生统计学教研室,2002年11月,(六)可变类平均法(flexible-beta method),类平均法的变型,K,L,J,M,第四军医大学卫生统计学教研室,2002年11月,(七)重心法(centroid method),B2 A2 * * B1 A1 * * B3 *,类类间的距离用各自重心间的距离表示,第四军医大学卫生统计学教研室,2002年11月,(八)Ward最
4、小方差法(Ward minimum variance method),先将n个样品各自成一类,然后每次每缩小一类,每缩小一类离差平方和就要增加,选择使离差平方和增加(SSMSSKSSL)最小的两类合并,直至所有的样品归为一类为止。,第四军医大学卫生统计学教研室,2002年11月,第四军医大学卫生统计学教研室,2002年11月,(九)八种系统聚类方法的统一,以上聚类方法的计算步骤完全相同,仅类与类之间的定义不同。Lance和Williams于1967年将其统一为:,第四军医大学卫生统计学教研室,2002年11月,八种系统聚类法公式的参数,第四军医大学卫生统计学教研室,2002年11月,系统聚类法
5、的性质,单调性 中间距离法、重心法不具有单调性 空间的浓缩与扩张 不同聚类法作图,横坐标的范围可相差很大。最短距离法与重心法比较浓缩;可变类平均比较扩张;类平均法比较适中。,第四军医大学卫生统计学教研室,2002年11月,有关问题,几种聚类方法获得的结果不一定相同 指标聚类采用相似系数,相似系数大或距离小则表示类间关系密切,为了统一,可采用以下公式变换。,第四军医大学卫生统计学教研室,2002年11月,五、快速聚类法(quick cluster method k-means model )也叫动态聚类、逐步聚类、迭代聚类),样本量很大,用系统聚类法计算的工作量极大,作出的树状图也十分复杂, 不
6、便于分析,第四军医大学卫生统计学教研室,2002年11月,原理,选择初始凝聚点 根据欧氏距离将每个样品归类 各类的重心代替初始凝聚点 根据欧氏距离将每个样品归类, 直至分类达到稳定,第四军医大学卫生统计学教研室,2002年11月,初始凝聚点initial cluster seeds ;cluster centers,自动选择 必须给出允许分类的最大个数k( SAS中用MAXCLUSTERS=k(或MAXC=k) ) 凭经验选择 以初始凝聚点建立一个数据文件,在SAS的FASTCLUS过程的SEED=选择项中输入该数据文件,第四军医大学卫生统计学教研室,2002年11月,六、变量聚类法,原理与以
7、上聚类法类似, 只是将标准化后的变量视为“个体”,变量间的相关系数描述“个体”间的相似程度。 SAS中采用VARCLUS过程。,第四军医大学卫生统计学教研室,2002年11月,七、小结,与判别分析的区别(作用,数据要求?) 聚类分析是一种探索性技术,对于同一问题,可获得多种结果,解释需要结合专业知识 样品量大可采用快速聚类方法 变量的形式?距离与相似系数? 系统聚类常用方法?,第四军医大学卫生统计学教研室,2002年11月,存在的问题,分类数的确定 专业知识 聚类方法的选择 试用多种方法,系统聚类与快速聚类相结合,第四军医大学卫生统计学教研室,2002年11月,(一)SPSS聚类分析,八、软件
8、计算与实例分析,第四军医大学卫生统计学教研室,2002年11月,1.系统聚类,第四军医大学卫生统计学教研室,2002年11月,指定参与聚类的变量名和样品号,第四军医大学卫生统计学教研室,2002年11月,Statistics,聚类进度表,相似矩阵,样品或变量的分类情况,第四军医大学卫生统计学教研室,2002年11月,Plot,树状结构图,冰柱图,冰柱的方向,第四军医大学卫生统计学教研室,2002年11月,Method,聚类方法,标准化变换,亲疏关系指标,第四军医大学卫生统计学教研室,2002年11月,Method,将分类结果存入数据文件中,第四军医大学卫生统计学教研室,2002年11月,2.
9、快速聚类,第四军医大学卫生统计学教研室,2002年11月,选项,读写凝聚点,人为固定分类数,ANOVA表,初始凝聚点等,第四军医大学卫生统计学教研室,2002年11月,(二)SAS聚类分析,样品聚类:PROC CLUSTER pseudo RSQUARE STD METHOD=(AVE, AVERAGE, CEN, CENTROID, COM, COMPLETE, DEN, DENSITY, EML, FLE, FLEXIBLE, MCQ, MCQUITTY, MED, MEDIAN, SIN, SINGLE, TWO, TWOSTAGE, WAR, WARD); ID national; PROC TREE HORIZONTAL; ID national;,第四军医大学卫生统计学教研室,2002年11月,变量聚类:PROC VARCLUS CORR CENTROID HIERARCHY MAXC=4; 快速聚类:PROC FASTCLUS MAXC=4 MAXITER=100 ; ID national; 资料预处理:PROC ACECLUS ;(ACECLUS (Approximate Covariance Estimation for CLUStering) ),第四军医大学卫生统
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年佛山交通发展总公司校园招聘考试备考题库及答案解析
- 2026广东深圳市优才人力资源有限公司公开招聘聘员(派遣至龙城街道)18人考试备考试题及答案解析
- 2026河北邯郸市第一医院医疗健康集团选聘53人备考题库附参考答案详解【基础题】
- 2026上海奉贤区储备人才招录31人备考题库带答案详解(能力提升)
- 2026天津立度资产经营管理有限责任公司社会招聘工作人员1人备考题库附参考答案详解(研优卷)
- 2026江西赣州市全南县公用市政建设集团有限公司招聘1人备考题库及完整答案详解【名校卷】
- 2026中国平安保险(集团)股份有限公司四川分公司招聘备考题库有答案详解
- 2026中国能建中电工程中南院春季校园招聘8人备考题库完美版附答案详解
- 2026湖北黄石市大冶市事业单位统一招聘118人备考题库含答案详解【典型题】
- 2026江苏镇江市润州区卫生健康系统事业单位招聘专业技术人员21人备考题库【有一套】附答案详解
- 2026新疆兵团第七师胡杨河市公安机关社会招聘辅警358人笔试备考试题及答案解析
- 2026年安徽新闻出版职业技术学院单招综合素质考试题库及一套答案详解
- DLT 5035-2016 发电厂供暖通风与空气调节设计规范
- 新教科版六年级科学下册教学计划
- 应征入伍服兵役高等学校学生国家教育资助申请表
- 2型糖尿病及围手术期血糖管理【骨科】-课课件
- 污水泵站工艺及施工课件
- 中国酒城醉美泸州四川泸州旅游攻略城市风土人情介绍PPT图文课件
- DB34T 2915-2022 公路水运工程三阶段安全风险分析与预防管理规程
- 国际标准行业分类第4版ISICRev-4中文版
- 2022年吉林大学第二医院医护人员招聘考试笔试题库及答案解析
评论
0/150
提交评论