统计分析系统sas与数据分析-速成视频视频教程_第1页
统计分析系统sas与数据分析-速成视频视频教程_第2页
统计分析系统sas与数据分析-速成视频视频教程_第3页
统计分析系统sas与数据分析-速成视频视频教程_第4页
统计分析系统sas与数据分析-速成视频视频教程_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

聚类分析聚类分析和判别分析的区别?样本数据:原始样本点,或样本点之间的距离数据各种距离常用方法:系统聚类法(凝聚的层次聚类),k平均值法2012.10.232DATAGURU专业数据分析聚类聚类和分类判别有什么区别?2012.10.233DATAGURU专业数据分析关键度量指标:距离P469)绝距离的定义常用距离(对值距离欧氏距离距离切

距离马氏距离Lance和Williams距离离散变量的距离计算2012.10.234DATAGURU专业数据分析(凝聚的)层次聚类法思想开始时,每个样本各自作为一类规定某种度量作为样本之间的距离及类与类之间的距离,并计算之将距离最短的两个类合并为一个新类重复2-3,即不断合并最近的两个类,每次减少一个类,直至所有样本被合并为一类适合少量样本的情况2012.10.235DATAGURU专业数据分析各种类与类之间距离计算的方法P476最短距离法最长距离法中间距离法类平均法重心法离差平方和法2012.10.236DATAGURU专业数据分析动态聚类:K-means方法算法:选择K个点作为初始质心将每个点指派到最近的质心,形成K个簇(聚类)重新计算每个簇的质心重复2-3直至质心不发生变化2012.10.237DATAGURU专业数据分析K-means算法的优缺点有效率,而且不容易受初始值选择的影响不能处理非球形的簇不能处理不同尺寸,不同密度的簇离群值可能有较大干扰(因此要先剔除)2012.10.238DATAGURU专业数据分析SAS中实现聚类分析的过程CLUSTER过程:用11种不同的(计算距离的)方法,实现系统聚类FASTCLUS过程:用k平均值法进行快速聚类VARCLUS过程:通过斜交多组分量分析,对变量进行聚类TREE过程:画树状图(谱系图)2012.10.239DATAGURU专业数据分析CLUSTER过程2012.10.2310DATAGURU专业数据分析METHOD选项2012.10.2311DATAGURU专业数据分析例子2139347

2594

2571

0SANFRANCISCO2182

1737

10212408

6780SEATTLE543

597

1494

1220

2300

923205

2442

2329

0WASHINGTON

D.C;2012.10.23书p366程序DATA AGES

(TYPE=DISTANCE);INPUT(ATLANTACHICAGO

DENVER

HOUSTON

LOSANGELMIAMI

NEWYORK

SANFRAN

SEATTLE

WASHDC)(5.)

@51

CITY

$15.;CARDS;0ATLANTA587

0CHICAGE1212

920

0DENVER701

940

8790HOUSTON13740L0S

ANGELES604

11880MIAMI748713

1631

1420

2451

1092

0NEW

YORK12DATAGURU专业数据分析程序proc

print;AGES

METHOD=AVERAGE

PSEUDO;PROC

CLUSTER

DATA=ID

CITY;title

"METHOD=AVERAGE"

;PROC

TREE;RUN;2012.10.2313DATAGURU专业数据分析结果2012.10.2314DATAGURU专业数据分析树形图2012.10.2315DATAGURU专业数据分析例子:鸢尾花数据聚类分析书p3682012.10.2316DATAGURU专业数据分析程序data

iris;infile

'E:\sasdt\iris.txt';input

SepalLength

SepalWidth

PetalLength

PetalWidth

Species

@@;datalines;proc

cluster

data=iris

method=ward

outtree=otree

pseudo

ccc;copy

species;proc

tree

;run;2012.10.2317DATAGURU专业数据分析结果2012.10.2318DATAGURU专业数据分析树形图2012.10.2319DATAGURU专业数据分析FASTCLUS过程2012.10.2320DATAGURU专业数据分析凝聚点的控制书p3722012.10.2321DATAGURU专业数据分析例子2012.10.2322DATAGURU专业数据分析程序2012.10.2323DATAGURU专业数据分析结果2012.10.2324DATAGURU专业数据分析结果2012.10.2325DATAGURU专业数据分析TREE过程2012.10.2326DATAGURU专业数据分析树形控制选项书p3892012.10.2327DATAGURU专业数据分析例子书p391程序DATA

TEETH;TITLE

"MAMMALS'TEETH";INPUT

MAMMAL

$16.

V1-V8

@@;LABEL

V1='上门牙'V2='下门牙'V3='上犬齿'V4='下犬齿'V5='上前臼齿'V6='下前臼齿'V7='上臼齿'V8='下臼齿';CARDS;BROWN

BAT 2

3

1

13

3

3

3

MOLESILVER

HAIR

BAT

2

3

1

1

2

3

3

3

PIGMY

BAT32

10

3

3

3

32

3

1

1

22

3

3HOUSE

BAT2

31

1

1

23

3

REDBAT1

31

1

2

23

3。。。REINDEER0

41

0

3

33

3

ELK0

4

10

33

3

3MOOSE0

40

0

3

3

3

3

DEER0

4

0

0

3

3

3

3;proc

print;2012.10.2328DATAGURU专业数据分析程序PROC

CLUSTER

METHOD=AVERAGE

STD

PSEUDO

NO

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论