




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
聚类分析聚类分析和判别分析的区别?样本数据:原始样本点,或样本点之间的距离数据各种距离常用方法:系统聚类法(凝聚的层次聚类),k平均值法2012.10.232DATAGURU专业数据分析聚类聚类和分类判别有什么区别?2012.10.233DATAGURU专业数据分析关键度量指标:距离P469)绝距离的定义常用距离(对值距离欧氏距离距离切
距离马氏距离Lance和Williams距离离散变量的距离计算2012.10.234DATAGURU专业数据分析(凝聚的)层次聚类法思想开始时,每个样本各自作为一类规定某种度量作为样本之间的距离及类与类之间的距离,并计算之将距离最短的两个类合并为一个新类重复2-3,即不断合并最近的两个类,每次减少一个类,直至所有样本被合并为一类适合少量样本的情况2012.10.235DATAGURU专业数据分析各种类与类之间距离计算的方法P476最短距离法最长距离法中间距离法类平均法重心法离差平方和法2012.10.236DATAGURU专业数据分析动态聚类:K-means方法算法:选择K个点作为初始质心将每个点指派到最近的质心,形成K个簇(聚类)重新计算每个簇的质心重复2-3直至质心不发生变化2012.10.237DATAGURU专业数据分析K-means算法的优缺点有效率,而且不容易受初始值选择的影响不能处理非球形的簇不能处理不同尺寸,不同密度的簇离群值可能有较大干扰(因此要先剔除)2012.10.238DATAGURU专业数据分析SAS中实现聚类分析的过程CLUSTER过程:用11种不同的(计算距离的)方法,实现系统聚类FASTCLUS过程:用k平均值法进行快速聚类VARCLUS过程:通过斜交多组分量分析,对变量进行聚类TREE过程:画树状图(谱系图)2012.10.239DATAGURU专业数据分析CLUSTER过程2012.10.2310DATAGURU专业数据分析METHOD选项2012.10.2311DATAGURU专业数据分析例子2139347
2594
2571
0SANFRANCISCO2182
1737
10212408
6780SEATTLE543
597
1494
1220
2300
923205
2442
2329
0WASHINGTON
D.C;2012.10.23书p366程序DATA AGES
(TYPE=DISTANCE);INPUT(ATLANTACHICAGO
DENVER
HOUSTON
LOSANGELMIAMI
NEWYORK
SANFRAN
SEATTLE
WASHDC)(5.)
@51
CITY
$15.;CARDS;0ATLANTA587
0CHICAGE1212
920
0DENVER701
940
8790HOUSTON13740L0S
ANGELES604
11880MIAMI748713
1631
1420
2451
1092
0NEW
YORK12DATAGURU专业数据分析程序proc
print;AGES
METHOD=AVERAGE
PSEUDO;PROC
CLUSTER
DATA=ID
CITY;title
"METHOD=AVERAGE"
;PROC
TREE;RUN;2012.10.2313DATAGURU专业数据分析结果2012.10.2314DATAGURU专业数据分析树形图2012.10.2315DATAGURU专业数据分析例子:鸢尾花数据聚类分析书p3682012.10.2316DATAGURU专业数据分析程序data
iris;infile
'E:\sasdt\iris.txt';input
SepalLength
SepalWidth
PetalLength
PetalWidth
Species
@@;datalines;proc
cluster
data=iris
method=ward
outtree=otree
pseudo
ccc;copy
species;proc
tree
;run;2012.10.2317DATAGURU专业数据分析结果2012.10.2318DATAGURU专业数据分析树形图2012.10.2319DATAGURU专业数据分析FASTCLUS过程2012.10.2320DATAGURU专业数据分析凝聚点的控制书p3722012.10.2321DATAGURU专业数据分析例子2012.10.2322DATAGURU专业数据分析程序2012.10.2323DATAGURU专业数据分析结果2012.10.2324DATAGURU专业数据分析结果2012.10.2325DATAGURU专业数据分析TREE过程2012.10.2326DATAGURU专业数据分析树形控制选项书p3892012.10.2327DATAGURU专业数据分析例子书p391程序DATA
TEETH;TITLE
"MAMMALS'TEETH";INPUT
MAMMAL
$16.
V1-V8
@@;LABEL
V1='上门牙'V2='下门牙'V3='上犬齿'V4='下犬齿'V5='上前臼齿'V6='下前臼齿'V7='上臼齿'V8='下臼齿';CARDS;BROWN
BAT 2
3
1
13
3
3
3
MOLESILVER
HAIR
BAT
2
3
1
1
2
3
3
3
PIGMY
BAT32
10
3
3
3
32
3
1
1
22
3
3HOUSE
BAT2
31
1
1
23
3
REDBAT1
31
1
2
23
3。。。REINDEER0
41
0
3
33
3
ELK0
4
10
33
3
3MOOSE0
40
0
3
3
3
3
DEER0
4
0
0
3
3
3
3;proc
print;2012.10.2328DATAGURU专业数据分析程序PROC
CLUSTER
METHOD=AVERAGE
STD
PSEUDO
NO
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 锚地维护合同协议书模板
- 新零售对传统零售业的冲击
- 项目投资合同协议书模板
- 数化制作创业计划书
- 老年人摄影营销策划方案
- 2025年社区团购行业调研分析报告
- 出租快艇合同协议书模板
- 海洋公园营销策划方案举例
- 欠款房屋抵押合同协议书
- 加盟瑞幸商业计划书
- ZJUTTOP100理工类学术期刊目录(2018年版)
- F0值计算公式自动
- 道路交通事故现场勘查课件
- 门店电表记录表
- 心理学在船舶安全管理中的应用
- JJF(鄂) 90-2021 电子辊道秤校准规范(高清版)
- 超星尔雅学习通《今天的日本》章节测试含答案
- 组态王双机热备
- 餐饮量化分级
- 三一重工SCC2000履带吊履带式起重机技术参数
- [精品]GA38-2004《银行营业场所风险等级和防护级别的规定》
评论
0/150
提交评论