第四节 聚类分析.ppt_第1页
第四节 聚类分析.ppt_第2页
第四节 聚类分析.ppt_第3页
第四节 聚类分析.ppt_第4页
第四节 聚类分析.ppt_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四节聚类分析、样本聚类:样本聚类在统计学上也被称为q型聚类。 变量聚类:变量聚类在统订学上也称为r型聚类。第四节聚类分析、第一、系统聚类分析首先将每个样本视为一个类,其中类与类之间的距离是样本间的距离,然后将类之间的距离最接近的两个类合成为新类,并修正新类与另一类之间的距离通过这样重复,在所有样本合并为一个大类之前,每次合并都会减少一个类。 最后,将整个聚类过程作为聚类树图,根据聚类树图的特征选择适当的分类。 第四节聚类分析【例3-8】某地区根据1962年至1988年积累的三化螟相关资料进行聚类分析,以期对历年发生程度进行分类。三化螟种群发生数据、第4节聚类分析、1 .数据准备、2 .启动系

2、统聚类过程,从SPSS主菜单中选择: analyzeclassifyhierarchicalcluster命令、第4节聚类、第4节聚类分析、4 .聚类方法的选择、第4节聚类分析、4 .选择方法、1 )聚类方法的选择、第4节聚类分析、4 .选择方法、1 )聚类方法的选择、betwww 2个聚类结合的结果全部是差动奥尔特的选项。 第4节聚类分析、4 .选择方法、1 )聚类方法的选择、Within-groups linkage组内连接。 如果将两个类合并为一个类,则合并类中所有项目之间的平均距离最小。 第4节选择聚类分析,4 .选择方法,1 )聚类方法,Nearest neighbor最近法。 表示

3、使用两个类之间的最近点距离的两个类之间的距离。 第4节选择聚类分析,4 .选择方法,1 )聚类方法,Furthest Neighbor选择最远的方法。 两个类之间最远的距离表示两个类之间的距离。 也称为完全连接法。第4节选择聚类分析、4 .选择方法、1 )聚类方法、中心聚类方法。 修正两个类别之间的距离,以便修正所有平均值之间的距离。 这个距离随着集群的进展而减少。第4节聚类分析、4 .选择方法、1 )聚类方法、选择Median clustering中位数法。第4节选择聚类分析、4 .选择方法、1 )聚类方法、Wards method最小偏差平方和法。第四节聚类分析、4 .选择方法、2 )距离

4、的测度、Euclidean distance、欧几里得距离。连续变量、第4节聚类分析、4 .选择方法、2 )距离的测度、连续变量、Squared Euclidean distance、欧几里得距离平方、系统差动奥尔特值。第四节聚类分析、4 .选择方法、2 )距离的测度、连续变量、Chebychev、切比雪夫距离。 两项之间的距离使用最大变量值之差的绝对值。第四节聚类分析、4 .选择方法、2 )针对距离的测度、连续变量、Minkowski、明科斯牛鼻子距离。 两项之间的距离是各变量值之差的p次方的绝对值之和的p次方根。第四节聚类分析、4 .选择方法、2 )针对距离的测度、离散量、Chi-squa

5、re measure、卡方值测度的非类似性。 该测度是根据两个定径套度数相等的卡侧检查得出的。 由测度生成的值是卡方值的平方根。 系统差动奥尔特的测度方法。第四节聚类分析、4 .选择方法、2 )针对距离的测度、离散量、Phi-square measure、两组度数间的2个测度。 该测度除以联合度数的平方根,将不相似的卡方测度正规化。第四节聚类分析、4 .选择方法、2 )距离的测度、二值变量、Euclidean distance、二值欧几里得距离。第四节选择聚类分析、4 .选择方法、2 )针对距离的测量、二值变量、Squared Euclidean distance、二值欧几里得距离平方、系统差

6、动奥尔特的测量方法。第4节选择聚类分析、4 .选择方法、3 )数据变换、数据标准化变换、None,不标准化。是系统通货紧缩奥尔特。 第4节选择聚类分析、4 .选择方法、3 )数据变换、数据标准化变换、Z scores,将数值标准化为z分布。 标准化后的变量平均值为0,标准离差为1。 从每个值中减去标准化变量或视图测量的平均值,并除以标准离差。 如果标准离差为0,则将所有值设置为0。第4节选择聚类分析、4 .选择方法、3 )数据变换、数据标准化变换,将数值标准化为-1到1的范围。 如果选中此项,将在每个值的规范化变量或观测到的值范围内移除。 极差的是0时,所有的值都不变。第四节选择聚类分析、4

7、.选择方法、3 )数据转换、数据标准化转换、范围0-to 1,将该数值标准化在0到1的范围中,并且将标准化变量或观测的值减去标准化变量或观测的最小值,并且除以该范围。 极端恶劣时,将所有变量值或观测值设定为0.5。第4节聚类分析、4 .选择方法、3 )选择数据转换、数据标准化转换、Maximum magnitude of 1,将数值淮化为最大值1。 该方法以最大值消除规范化的变量和观测量。 如果最大值为0,则以最小值的绝对值加上1、第4节聚类分析、4 .选择方法、3 )选择数据变换、数据标准化变换、Mean of 1,将值标准化在平均值的范围内,将标准化了的变量或观测值除以标准化了的值的平均值

8、为0时,变量或者选择、第4节聚类分析、4 .选择方法、3 )数据转换、数据标准化转换、标准版本of 1,将数值标准化为单位标准离差。 此方法将每个值除以标准化变量或视图度量的标准离差。 如果标准离差为0,则这些个值保持不变。 第四节聚类分析、4 .选择方法、4 )测度变换、测度变换、距离值为绝对值。 如果数字符号表示相关方向,并且您只对负相关关系感兴趣,请使用此方法。使相似性值为非相似性值或相反。 用求逆的方法反转距离的顺序。 然后减去最小值,再除以范围,从而云推送距离。第四节聚类分析、5 .选择方法、4 )测度变换、第四节聚类分析、6 .输出、输出在“Statistic”对话计程仪框中设定的

9、第四节聚类分析、6 .输出设定、1 )输出统一量设定、聚类、列出汇总为一定类别数的各观测量所属的类别、列出一定范围的各观测量所属的类别、第4节聚类分析、6 .设定输出、1 )设定输出统一修正量、第4节聚类分析、 6 .第四节显示聚类分析,6 .显示输出,其中显示所有聚类的冰柱聚类图,显示指定聚类的冰柱聚类图,显示开始聚类数值、结束聚类数值、阶梯数值、不产生冰柱图的垂直方向的冰柱图,显示水平方向的冰柱图指定等级数,保存指定范围内的聚类结果,开始等级,终止等级数。 例如:在将“3”、“Maximum of clusters:”输入到“Minimum of clusters:”的群集结束时,在数据窗

10、口中新变更名称“CLU4_1”和“CLU3_1”第4节聚类分析、6 .设定输出、3 )设定保存分析结果、第4节聚类分析、7 .设定执行过程、第4节聚类分析、8 .结果分析Agglomeration Schedule (聚类过程)、第4节聚类分析、8 .聚类过程、第四节聚类分析、第四节聚类分析* * * * hierachclusteanalysis * * * * dendrogramusingaveragelinkage (between ge 从Rescaled Distance Cluster Combine、群集树、群集树到1962-1988年的27年间三化螟种群的发生状况分类为3或4

11、种比较合适的第2类是1968、1969、1970 为1975、1976、1977、1979、1980、1981、1983、1984的第3类是1974年、1985年的订正2年。 分为4种时的分类状况,第1种是1962、1963、1964、1965、1966、1967、1978、1982的修正8年。 第二类是1968、1969、1970、1971、1972、1973、1975、1976、1977、1980、1981、1983、1984、1986,第三类是1974年、1985年的订正2年。 第4类是1979年的修订1年。第4节聚类分析、8 .结果分析、聚类流程执行后的SPSS数据窗口、第4节聚类分析

12、、8 .结果分析、3种情况下的各因子的平均值,1 )选择分析流程(摘要分析)2)分析变量的选择和输出平均值的设定第4节聚类分析、8 .结果分析、3种分类时的各因子的平均数的修正计算、3 )执行过程、第4节聚类分析、8 .结果分析5 )修正分类为4种时的各因子平均值,重复以上的分析过程,在选择“grouping Variable”分组变量时得到的修正计算结果如下。 第四节聚类分析、8 .结果分析、6 )结果分析从分为3种的类平均数分析来看,第一类为三化螟中等发生年,第三代发生量偏颇。 二是轻微的发生年。 2代多发型,3代发生期延迟。 第三类是三化螟的严重发生年。 2、3代的发生时间过早。 分为3类的类平均数、第4节聚类分析、8 .结果分析、6 )结果分析,从分为4类的类平均数分析来看,第1类是三化螟中等发生年。 3代

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论