版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
SPSS软件聚类分析过程的图文解释及结果的全
面分析
SPSS聚类分析过程
聚类的主要过程一般可分为如下四个步骤:
1.数据预处理(标准化)
2.构造关系矩阵(亲疏关系的描述)
3•聚类(根据不同方法进行分类)
4.确定最佳分类(类别数)
SPSS软件聚类步骤
1.数据预处理(标准化)
fAnalyzefClassify-►HierachicalCluster
Analysis-►Method然后从对话框中进行如
下选择
从TransformValues框中点击向下箭头,此为
标准化方法,将出现如下可选项,从中选一即可:
Zscores▼
None
Zscores
Range-1to1
Range0to1
Maximummagnitudeof1
Meanof1
Standarddevia由onof1
标准化方法解释:None:不进行标准化,这是系
统默认值;ZScores:标准化变换;Range-1to
1:极差标准化变换(作用:变换后的数据均值为0,极差为1,且|8;|<1,消
去了量纲的影响;在以后的分析计算中可以减少误差的产生。);Range0to1(极
差正规化变换/规格化变换);
2.构造关系矩阵
在SPSS中如何选择测度(相似性统计量):
fAnalyze-►Classify-►HierachicalCluster
AnalysisfMethod然后从对话框中进行如
下选择
常用测度(选项说明):Euclideandistance:
欧氏距离(二阶Minkowski距离),用途:聚类
分析中用得最广泛的距离;SquaredEucidean
distance:平方欧氏距离;Cosine:夹角余弦(相
似性测度;Pearsoncorrelation:皮尔逊相关
系数;
3.选择聚类方法
SPSS中如何选择系统聚类法
常用系统聚类方法
a)Between-groupslinkage组间平均距离连接
法
方法简述:合并两类的结果使所有的两两项对之
间的平均距离最小。(项对的两成员分属不同类)
特点:非最大距离,也非最小距离
b)Within-groupslinkage组内平均连接法
方法简述:两类合并为一类后,合并后的类中所
有项之间的平均距离最小
C)Nearestneighbor最近邻法(最短距离法)
方法简述:用两类之间最远点的距离代表两类之
间的距离,也称之为完全连接法
d)Furthestneighbor最远邻法(最长距离法)
方法简述:用两类之间最远点的距离代表两类之
间的距离,也称之为完全连接法
e)Centroidclustering重心聚类法
方法简述:两类间的距离定义为两类重心之间的
距离,对样品分类而言,每一类中心就是属于该
类样品的均值
特点:该距离随聚类地进行不断缩小。该法的谱
系树状图很难跟踪,且符号改变频繁,计算较烦。
f)Medianclustering中位数法
方法简述:两类间的距离既不采用两类间的最近
距离,也不采用最远距离,而采用介于两者间的
距离
特点:图形将出现递转,谱系树状图很难跟踪,
因而这个方法几乎不被人们采用O
g)Ward'smethod离差平方和法
方法简述:基于方差分析思想,如果分类合理,
则同类样品间离差平方和应当较小,类与类间离
差平方和应当较大
特点:实际应用中分类效果较好,应用较广;要
求样品间的距离必须是欧氏距离。
谱系分类的确定
经过系统聚类法处理后,得到聚类树状谱系
图,Deminnen(1972)提出了应根据研究的目的来
确定适当的分类方法,并提出了一些根据谱系图
来分类的准则:
A.任何类都必须在临近各类中是突出
的,即各类重心间距离必须极大
B.确定的类中,各类所包含的元素都
不要过分地多
C.分类的数目必须符合实用目的
D.若采用几种不同的聚类方法处理,
则在各自的聚类图中应发现相同的类
实例分析
Pdendrogram
生成树形图Icicle
外AHdusters
生成冰柱图「Specifiedrangeofdusters
GNone
Orientation
凝聚状态表,显
示聚类过程
Er8dmityrn3trbe
QusterMembership
各项间的距离矩阵0None
rSinglesolution:lustci
「Bangeofsolutions:
类成员栏From|througli「dusters
结果分析:(方法选择如下)
ClusterMethod:farcTsmethod
Measure
Glotervai:j£ucttdcandistance
FZ1HootFZ1
「Counts:l,……3
山A
rB1n|/re-3f艮
内*
河
esent||Absent:|0生
河
力
•4T
TransformValuesTransformMeasun
陵
Standardlzo:|Zscores3小
rAbsolutevaluesT
甘
盒
市4
夕ByvariablerChangesignT
京
「BycaserRescaleto01nJt
上4
京
广
t
IXi
IK
A,
案
山
募
讣
M*
SPSS19.。分析软件聚类分析
4.2聚类分析一一系统聚类法
在数据编辑窗口的主菜单中选择“分析(A)»一
“分类(F)”一“系统聚类(H)”(如图・4所示),
分类(D明两步熨类①…
降维因K-均值聚类(K)…
度里(S)
O系统聚类(H)…
非参数检蛤(N)
国树®•.
予硼d)
9判别Q)…
疗右函却治)
弹出“系统聚类分析”对话框,将“地区”变量
选入“标注个案(C)”中,将其他变量选入“变
量框”中,如图-5所示。在“分群”单选框中
选中“个案”,表示进行的是Q型聚类。在“输
出”复选框中选中“统计量”和“图”,表示要
输出的结果包含以上两项。
E系统聚类分析
单击“统计量(S)”按钮,在“系统聚类分析:统
计量”对话框中选择“合并进程表”、“相似性矩
阵”,如图・6所示,表示输出结果将包括这两项
内容。
单击“绘制⑴”按钮,在“系统聚类分析:图,,对
话框中选择“树状图”、“冰柱”,如图-7所示,表
示输出的结果将包括谱系聚类图(树状)以及冰
柱图(垂直)。
罔系统聚类分析:图I-Kial
引树状图©
冰柱
⑥所有果类(0
「票类的指定全距@)
耳楮叩天(
7I*口\
停止聚类史)
排序标准坦)
◎无超)
一方向
⑥垂直包)
O水平(旦)
单击“方法(M)”按钮,弹出“系统聚类分析:方
法”对话框,如下图・8所示。
S系统聚类分析:方法
聚类方法电):组间联接
转换值转换度里
标准化®全诡爪。剥1…□绝对值&)
⑥按照变里包)□更改符号国)
。按个案:重新标度到0-1全距但)
[继续]取画画。
“聚类方法(M)”选项条中可选项包括如图-9所
示的几种方法,本例中选择“组间联接”:
“度量标准-区间(N)”选项条中可选项包括如
图-10所示的几种度量方法,本例中选择“平方
Euclidean距离”:
“转换值-标准化(S)”选项条中可选项包括如
图-11所示的几种将原始数据标准化的方法,本
例中选择“全局从0到1”:
转换值
标准化(£):领觊旦到工工
z得分
全距从-1到1
全距从。到1
1的最大里
均值为1
)标准差为1
冰柱图解释
聚类分析冰柱图形状类似于屋檐上垂下的冰柱,
因此而得名o
横轴:案例(Case)表示被聚类的对象或变量;
纵轴:群集数(Numberofclusters)表示被聚
成几类;
观察冰柱图应从最后一行开始。举例如下:
当聚成6类时X4和X8和X6聚成一类,其他个
案自成一类,用白板将6类一下挡上可以看出如
图;
当聚成5类时X4和X8和X6和X2聚成一类,其
他个案自成一类。
冰柱图的优点是不仅可以显示出不同类数时个
案所属的分类结果,还能表现出聚类的过程步
骤,生动形象;缺点是不能表现出聚类过程中距
离的大小。
若生成的树状图如下,看不清楚。可点击右键导
出文件,生成word文件,然后可以看出聚类过
程。
RescaledDistanceClusterConbine
DendrogiaiiusingAverageLinkage(BetweenGro^s)
RescaledDistanceClusterConbine
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年鄂尔多斯市胜丰种业有限公司科研助理招聘备考题库有答案详解
- 3D打印生物支架在老年皮肤再生中的老化应对策略
- 2025年九江一中招聘备考题库及1套参考答案详解
- 中国信达山东分公司2026年校园招聘备考题库及1套完整答案详解
- 小学教育课程中人工智能的引入与跨学科融合的创新实践教学研究课题报告
- 2025年重庆医科大学基础医学院关于公开遴选系主任10人的备考题库及完整答案详解一套
- 2025年上海当代艺术博物馆公开招聘工作人员备考题库及1套参考答案详解
- 2025年贵州赤水国家粮食储备库面向社会公开招聘8人备考题库及完整答案详解1套
- 2025年涟源市市直医疗卫生机构公开招聘专业技术人员69人备考题库参考答案详解
- 2025年苏州交投新基建科技有限公司公开招聘备考题库及一套答案详解
- JT-T-1221-2018跨座式单轨轨道桥梁维护与更新技术规范
- 24春国家开放大学《知识产权法》形考任务1-4参考答案
- 仓储管理教学课件
- DLT1249-2013 架空输电线路运行状态评估技术导则
- 国家开放大学化工节能课程-复习资料期末复习题
- 液压升降平台安装施工方案
- HXD3D机车总体介绍
- 教科版广州小学英语四年级上册 Module 7 单元测试卷含答案
- 2023年印江县人民医院紧缺医学专业人才招聘考试历年高频考点试题含答案解析
- 基于逻辑经验主义对命题的分析
- 中文介绍迈克尔杰克逊
评论
0/150
提交评论