SPSS软件聚类分析过程的图文解释及结果的全面分析_第1页
SPSS软件聚类分析过程的图文解释及结果的全面分析_第2页
SPSS软件聚类分析过程的图文解释及结果的全面分析_第3页
SPSS软件聚类分析过程的图文解释及结果的全面分析_第4页
SPSS软件聚类分析过程的图文解释及结果的全面分析_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

SPSS软件聚类分析过程的图文解释及结果的全

面分析

SPSS聚类分析过程

聚类的主要过程一般可分为如下四个步骤:

1.数据预处理(标准化)

2.构造关系矩阵(亲疏关系的描述)

3•聚类(根据不同方法进行分类)

4.确定最佳分类(类别数)

SPSS软件聚类步骤

1.数据预处理(标准化)

fAnalyzefClassify-►HierachicalCluster

Analysis-►Method然后从对话框中进行如

下选择

从TransformValues框中点击向下箭头,此为

标准化方法,将出现如下可选项,从中选一即可:

Zscores▼

None

Zscores

Range-1to1

Range0to1

Maximummagnitudeof1

Meanof1

Standarddevia由onof1

标准化方法解释:None:不进行标准化,这是系

统默认值;ZScores:标准化变换;Range-1to

1:极差标准化变换(作用:变换后的数据均值为0,极差为1,且|8;|<1,消

去了量纲的影响;在以后的分析计算中可以减少误差的产生。);Range0to1(极

差正规化变换/规格化变换);

2.构造关系矩阵

在SPSS中如何选择测度(相似性统计量):

fAnalyze-►Classify-►HierachicalCluster

AnalysisfMethod然后从对话框中进行如

下选择

常用测度(选项说明):Euclideandistance:

欧氏距离(二阶Minkowski距离),用途:聚类

分析中用得最广泛的距离;SquaredEucidean

distance:平方欧氏距离;Cosine:夹角余弦(相

似性测度;Pearsoncorrelation:皮尔逊相关

系数;

3.选择聚类方法

SPSS中如何选择系统聚类法

常用系统聚类方法

a)Between-groupslinkage组间平均距离连接

方法简述:合并两类的结果使所有的两两项对之

间的平均距离最小。(项对的两成员分属不同类)

特点:非最大距离,也非最小距离

b)Within-groupslinkage组内平均连接法

方法简述:两类合并为一类后,合并后的类中所

有项之间的平均距离最小

C)Nearestneighbor最近邻法(最短距离法)

方法简述:用两类之间最远点的距离代表两类之

间的距离,也称之为完全连接法

d)Furthestneighbor最远邻法(最长距离法)

方法简述:用两类之间最远点的距离代表两类之

间的距离,也称之为完全连接法

e)Centroidclustering重心聚类法

方法简述:两类间的距离定义为两类重心之间的

距离,对样品分类而言,每一类中心就是属于该

类样品的均值

特点:该距离随聚类地进行不断缩小。该法的谱

系树状图很难跟踪,且符号改变频繁,计算较烦。

f)Medianclustering中位数法

方法简述:两类间的距离既不采用两类间的最近

距离,也不采用最远距离,而采用介于两者间的

距离

特点:图形将出现递转,谱系树状图很难跟踪,

因而这个方法几乎不被人们采用O

g)Ward'smethod离差平方和法

方法简述:基于方差分析思想,如果分类合理,

则同类样品间离差平方和应当较小,类与类间离

差平方和应当较大

特点:实际应用中分类效果较好,应用较广;要

求样品间的距离必须是欧氏距离。

谱系分类的确定

经过系统聚类法处理后,得到聚类树状谱系

图,Deminnen(1972)提出了应根据研究的目的来

确定适当的分类方法,并提出了一些根据谱系图

来分类的准则:

A.任何类都必须在临近各类中是突出

的,即各类重心间距离必须极大

B.确定的类中,各类所包含的元素都

不要过分地多

C.分类的数目必须符合实用目的

D.若采用几种不同的聚类方法处理,

则在各自的聚类图中应发现相同的类

实例分析

Pdendrogram

生成树形图Icicle

外AHdusters

生成冰柱图「Specifiedrangeofdusters

GNone

Orientation

凝聚状态表,显

示聚类过程

Er8dmityrn3trbe

QusterMembership

各项间的距离矩阵0None

rSinglesolution:lustci

「Bangeofsolutions:

类成员栏From|througli「dusters

结果分析:(方法选择如下)

ClusterMethod:farcTsmethod

Measure

Glotervai:j£ucttdcandistance

FZ1HootFZ1

「Counts:l,……3

山A

rB1n|/re-3f艮

内*

esent||Absent:|0生

•4T

TransformValuesTransformMeasun

Standardlzo:|Zscores3小

rAbsolutevaluesT

市4

夕ByvariablerChangesignT

「BycaserRescaleto01nJt

上4

广

t

IXi

IK

A,

M*

SPSS19.。分析软件聚类分析

4.2聚类分析一一系统聚类法

在数据编辑窗口的主菜单中选择“分析(A)»一

“分类(F)”一“系统聚类(H)”(如图・4所示),

分类(D明两步熨类①…

降维因K-均值聚类(K)…

度里(S)

O系统聚类(H)…

非参数检蛤(N)

国树®•.

予硼d)

9判别Q)…

疗右函却治)

弹出“系统聚类分析”对话框,将“地区”变量

选入“标注个案(C)”中,将其他变量选入“变

量框”中,如图-5所示。在“分群”单选框中

选中“个案”,表示进行的是Q型聚类。在“输

出”复选框中选中“统计量”和“图”,表示要

输出的结果包含以上两项。

E系统聚类分析

单击“统计量(S)”按钮,在“系统聚类分析:统

计量”对话框中选择“合并进程表”、“相似性矩

阵”,如图・6所示,表示输出结果将包括这两项

内容。

单击“绘制⑴”按钮,在“系统聚类分析:图,,对

话框中选择“树状图”、“冰柱”,如图-7所示,表

示输出的结果将包括谱系聚类图(树状)以及冰

柱图(垂直)。

罔系统聚类分析:图I-Kial

引树状图©

冰柱

⑥所有果类(0

「票类的指定全距@)

耳楮叩天(

7I*口\

停止聚类史)

排序标准坦)

◎无超)

一方向

⑥垂直包)

O水平(旦)

单击“方法(M)”按钮,弹出“系统聚类分析:方

法”对话框,如下图・8所示。

S系统聚类分析:方法

聚类方法电):组间联接

转换值转换度里

标准化®全诡爪。剥1…□绝对值&)

⑥按照变里包)□更改符号国)

。按个案:重新标度到0-1全距但)

[继续]取画画。

“聚类方法(M)”选项条中可选项包括如图-9所

示的几种方法,本例中选择“组间联接”:

“度量标准-区间(N)”选项条中可选项包括如

图-10所示的几种度量方法,本例中选择“平方

Euclidean距离”:

“转换值-标准化(S)”选项条中可选项包括如

图-11所示的几种将原始数据标准化的方法,本

例中选择“全局从0到1”:

转换值

标准化(£):领觊旦到工工

z得分

全距从-1到1

全距从。到1

1的最大里

均值为1

)标准差为1

冰柱图解释

聚类分析冰柱图形状类似于屋檐上垂下的冰柱,

因此而得名o

横轴:案例(Case)表示被聚类的对象或变量;

纵轴:群集数(Numberofclusters)表示被聚

成几类;

观察冰柱图应从最后一行开始。举例如下:

当聚成6类时X4和X8和X6聚成一类,其他个

案自成一类,用白板将6类一下挡上可以看出如

图;

当聚成5类时X4和X8和X6和X2聚成一类,其

他个案自成一类。

冰柱图的优点是不仅可以显示出不同类数时个

案所属的分类结果,还能表现出聚类的过程步

骤,生动形象;缺点是不能表现出聚类过程中距

离的大小。

若生成的树状图如下,看不清楚。可点击右键导

出文件,生成word文件,然后可以看出聚类过

程。

RescaledDistanceClusterConbine

DendrogiaiiusingAverageLinkage(BetweenGro^s)

RescaledDistanceClusterConbine

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论