SPSS聚类与判别_第1页
SPSS聚类与判别_第2页
SPSS聚类与判别_第3页
SPSS聚类与判别_第4页
SPSS聚类与判别_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第六章 聚类分析与判别分析介绍:介绍: 1、聚类分析、聚类分析 2、判别分析、判别分析 分类学是人类认识世界的基础科学。聚类分析和判别分析是分类学是人类认识世界的基础科学。聚类分析和判别分析是研究事物分类的基本方法,广泛地应用于自然科学、社会科研究事物分类的基本方法,广泛地应用于自然科学、社会科学、工农业生产的各个领域。学、工农业生产的各个领域。 主要分类主要分类l 系统聚类系统聚类l 快速样本聚类快速样本聚类事先指定用于聚类分析的类数事先指定用于聚类分析的类数不指定最终的类数,结论将在聚类过程中寻求不指定最终的类数,结论将在聚类过程中寻求对样本进行聚类(对样本进行聚类(Q Q型聚类)型聚类)

2、对变量进行聚类(对变量进行聚类(R R型聚类)型聚类)第六章第六章 聚类分析与判别分析聚类分析与判别分析快速样本聚类分析快速样本聚类分析根据被观测的对象的各种特征,即反映被观测对根据被观测的对象的各种特征,即反映被观测对象的特征的各变量进行分类。当要聚成的类数已象的特征的各变量进行分类。当要聚成的类数已知时,使用快速聚类过程可以很快将观测量分到知时,使用快速聚类过程可以很快将观测量分到各类中去,其特点是处理速度快,占用计算机内各类中去,其特点是处理速度快,占用计算机内存少。存少。8.1 8.1 根据下表根据下表1212个地区城市建设指数(用来反映城市风貌的个地区城市建设指数(用来反映城市风貌的

3、一些指数)。请采用快速样本聚类的方法将这些地区的城市一些指数)。请采用快速样本聚类的方法将这些地区的城市风貌归为风貌归为8 8类。(此数据为虚构,仅供演示方法用)类。(此数据为虚构,仅供演示方法用)X1X2X3X4X5X6X7X8地地区区人口指数人口指数绿化指数绿化指数建设指建设指数数信息指信息指数数文化指数文化指数交通指数交通指数收入指数收入指数流通指数流通指数a110.259.768.384.4926.816.441.990.41b82.5850.9813.49.3321.312.369.211.05c83.3353.39117.5217.311.79120.7d71.7247.729.4

4、26.9613.127.96.660.61e68.9143.4122.415.313.8812.429.011.41f107.862.2415.68.883121.0111.80.16g73.1844.5423.915.222.389.6613.91.19h72.2347.319.486.4313.1410.438.31.11i84.6644.0513.57.4719.1120.4910.31.76j 11441.4433.211.248.7230.7714.911.1k74.9650.1313.99.6216.1410.1814.51.21l5.650.885.213.8912.949.49

5、6.771.27每每个个聚聚类类中中的的案案例例数数1.0001.0003.0002.0001.0001.0002.0001.00012.000.00012345678聚类有效缺失n 从聚类结果可知,地区从聚类结果可知,地区a a为一类;地区为一类;地区b b、c c、k k为为一类;地区一类;地区d d、h h为一类;地区为一类;地区e e和和g g为一类;地区为一类;地区f f为为一类;地区一类;地区j j为一类;地区为一类;地区l l为一类为一类系统聚类(分层聚类分析)系统聚类(分层聚类分析)n 由于人们对客观事物的认识是有限的,往往难以由于人们对客观事物的认识是有限的,往往难以找出彼此

6、独立的有代表性的变量,而影响对问题的进找出彼此独立的有代表性的变量,而影响对问题的进一步认识和研究。因此往往先要进行变量聚类,找出一步认识和研究。因此往往先要进行变量聚类,找出彼此独立且有代表性的自变量,而又不丢失大量信息。彼此独立且有代表性的自变量,而又不丢失大量信息。(对变量聚类(对变量聚类R; R; 对样本聚类对样本聚类Q Q)分层聚类分析(系统聚类)分层聚类分析(系统聚类)对变量聚类对变量聚类-R型型分层聚类分析(系统聚类)分层聚类分析(系统聚类)对样本聚类对样本聚类-Q型型判别分析判别分析o判别分析是根据表明事物特点的变量值和它们所属的判别分析是根据表明事物特点的变量值和它们所属的类

7、,求出判别函数。根据判别函数对未知所属类别的类,求出判别函数。根据判别函数对未知所属类别的事物进行分类的一种分析方法。事物进行分类的一种分析方法。o在自然科学和社会科学的各个领域经常遇到需要对某在自然科学和社会科学的各个领域经常遇到需要对某个个体属于哪一类进行判断。如报天气预报时的有雨个个体属于哪一类进行判断。如报天气预报时的有雨和无雨。和无雨。o不同:判别分析和聚类分析不同的在于判别分析要求不同:判别分析和聚类分析不同的在于判别分析要求已知一系列反映事物特征的数值变量的值,并且已知已知一系列反映事物特征的数值变量的值,并且已知各个体的分类(训练样本)。各个体的分类(训练样本)。(Fisher

8、二级判别分析二级判别分析 )(Fisher二级判别分析二级判别分析 )判别分析判别分析根据华北地区和长江中下游降水年变化的不根据华北地区和长江中下游降水年变化的不同特点,根据给定资料,建立新增测站分属同特点,根据给定资料,建立新增测站分属何种降水类型的判别方程。并判别青岛、兖何种降水类型的判别方程。并判别青岛、兖州、临沂、徐州、阜阳等中间地带的测站应州、临沂、徐州、阜阳等中间地带的测站应分属于何种降水类型。分属于何种降水类型。 地区地区测站测站x1x2x3华华北北地地1区区天津天津2.458.912.1北京北京3.469.714.3保定保定3.269.012.5石家庄石家庄3.398.513.

9、0太原太原2.1310.613.3五台山五台山1.8016.418.1兴县兴县3.0110.113.3榆林榆林3.707.812.5张家口张家口1.8211.412.7大同大同2.0511.612.7长长江江中中下下2游游地地区区上海上海0.7413.110.0东山东山1.0112.511.7南京南京0.8710.911.5合肥合肥1.1810.310.1从表中可知,判别方程为从表中可知,判别方程为: : y=-9.3+2.074X1+0.197X2+0.294X3。o计算计算 和和1y2y求均值求均值1y求均值求均值2yo计算计算 0y2122110nnynyny1E-06o计算计算cy3294. 02197. 01074. 23 . 9XXXyc判判别别对对象象测站测站x1x2x3yc青岛青岛1.6813.711.60.29362兖州兖州1.7513.710.50.1154临沂临沂1.6510.012.0-0.3799徐州徐州1.488.31

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论