(计算机应用技术专业论文)基于som的多维数据可视化研究与实现.pdf_第1页
(计算机应用技术专业论文)基于som的多维数据可视化研究与实现.pdf_第2页
(计算机应用技术专业论文)基于som的多维数据可视化研究与实现.pdf_第3页
(计算机应用技术专业论文)基于som的多维数据可视化研究与实现.pdf_第4页
(计算机应用技术专业论文)基于som的多维数据可视化研究与实现.pdf_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ad i s s e r t a t i o ns u b m i t t e dt og u a n g d o n gu n i v e r s i t yo f t e c h n o l o g yf o rt h ed e g r e eo fm a s t e ro fe n g i n e e r i n gs c i e n c e r e s e a r c ha n di m p l e m e n t a t i o no fm u l t i d i m e n s i o n a l d a t av i s u a l i z a t i o nb a s e do ns o m m a s t e rc a n d i d a t e :c h e nd a n s u p e r v i s o r :p r o f w uw e i m i n m a y2 0 1 0 f a c u l t yo fc o m p u t e r g u a n g d o n gu n i v e r s i t yo ft e c h n o l o g y g u a n g z h o u ,g u a n g d o n g ,p r c h i n a ,5 10 0 0 6 摘要 摘要 随着i n t e m e t 的飞速发展和数据仓库的大规模应用,科学、工程、商业等领 域的多维信息日益增多。由于人类认知能力的固有局限性和信息的复杂性,多维 数据可视化技术作为有效的抽象信息展现工具被广泛地用来辅助知识工作者理 解和分析海量多维数据集。 多维数据可视化技术的基本思想是利用计算机图形学和图像处理技术,将数 据库或数据仓库中的多维数据转换为图形或图像在屏幕上显示出来,并进行交 互。多维数据集的可视化方法主要有两类,一类是对数据的各维进行映射,另一 类是对数据进行降维处理。 针对多维数据可视化和可视化结果聚类分析的相关问题本文在综合分析 各种多维数据可视化方法的基础上,对自组织映射( s e l f - o r g a n i z i n gm a p ,s o m ) 方 法展开研究。主要工作包括两个方面的内容: ( 1 ) s o m 降维可视化的研究。针对s o m 方法仅适用于数值型数据的不足, 提出了一种基于新相似性度量函数的s o m m 方法( s o mf o rm i x e dt y p ed a t a , s o m 蛐,该相似性度量函数结合了数值和分类两种数据类型的度量方法,可以 同时计算数值与分类型数据;采用马氏距离代替传统欧式距离,消除了数据之间 的相关性。实验证明,改进后的算法能有效地处理多维混合型数据,获得更准确 的可视化效果,成功地解决了多维混合型数据的可视化问题。 ( 2 ) s o m 聚类分析的研究。s o m 方法除了具有多维数据可视化功能,还可 以有效地进行大规模的聚类分析,其特点是自动聚类,但缺点是分类的精度不高。 本文提出了将s o m m 与k - p r o t o t y p e s 算法结合的方法,该方法首先利用s o m m 算法获得输入数据的大致聚类情况,然后利用这些信息来初始化k - p r o t o t y p e s 算 法,以此得到优化的聚类结果。实验结果证明,改进后的算法较之改进前具有较 高的聚类精度。 本文最后完成了多维数据可视化系统的设计与开发,该系统包括数据可视化 和聚类分析两个模块:数据可视化模块实现了多种可视化技术,包括平行坐标图、 雷达图和s o m 技术等;聚类分析模块可以对可视化结果进行聚类分析,更有助 于人们掌握信息之间的联系。通过简单的交互操作,用户可以获取感兴趣的信息。 广东工业大学硕士学位论文 关键词:多维数据可视化;自组织映射方法;聚类分析 a b s t i 认c t ii,mh i , i m i _ a b s t r a c t 蚴t h er a p i dd e v e l o p m e n to fi n t e m e ta n dt h el a r g e - s c a l ea p p l i c a t i o n so fd a t a w a r e h o u s e ,m u l t i d i m e n s i o n a lo rh i g hd i m e n s i o n a ld a t ai ns c i e n c e ,e n g i n e e r i n ga n d c o m m e r c i a la r e a sa r ei n c r e a s i n ge o m i n u o u s l y b e c a u s eo ft h ei n h e r e n tl i m i t a t i o n so f h u m a nc o g n i t i v ea b i l i t i e sa n dt h ec o m p l e x i t yo fi n f o r m a t i o n , m u l t i - d i m e n s i o n a l v i s u a l i z a t i o nt e c h n o l o g yi s w i d e l yu s e d a sa ne f f e c t i v et o o lt o d i s p l a ya b s t r a c t i n f o r m a t i o nt oh e l ps c h o l a r su n d e r s t a n da n da n a l y z et h em a s s i v eh i g h - d i m e n s i o n a ld a t a s e t s t h e m a i ni d e ao fm u l t i - d i m e m i o n a ld a t av i s u a l i z a t i o ni st o d i s p l a y t h e m u l t i - d i m e n s i o n a ld a t ai nd a t a b a s eo rd a t aw a r e h o u s ew i t hi m a g e so rg r a p h i c s , a i l d i n t e r a c tw i t hp e o p l eb yu s i n gc o m p u t e rg r a p h i c sa n di m a g ep r o c e s s i n gt e c h n o l o g y t h e r ea r et w ow a y st ov i s u a l i z em u l t i - d i m e n s i o n a ld a t a o n ei st om a pd i f f e r e n t d i m e n s i o n s ,a n dt h eo t h e ri st or e d u c ed i m e n s i o m b a s e do nv a r i o u sm u l t i - d i m e n s i o n a ld a t av i s u a l i z a t i o nm e t h o d s ,w eh a v ee x p l o r e d t h es e l f - o r g a n i z i n gm a p ( s o m ) n e t w o r kf o rt h ei s s u e so fh i g h - d i m e n s i o n a ld a t a v i s u a l i z a t i o na n dc l u s t e r i n gv i s u a l i z a t i o n o u rw o r ki n c l u d e st h ef o l l o w i n gs u b j e c t s : ( 1 ) r e s e a r c ho ns o m v i s u a l i z a t i o n f o rt r a d i t i o n a ls o mw o r k so n l yo nn u m e r i c v a l u e dd a t a , an e ws i m i l a r i t ym e a s u r ei sp r o p o s e da st h et r a i n i n gf u n c t i o no fs o m w h i c hc o m b i n e st h er l l e a s u r eo ft h ec a t e g o r i c a lv a l u e dd a t aa n dt h em e a s u r eo ft h e n u m e r i c a lv a l u e dd a t at oh a n d l et h e s et w ov a l u e dd a t a s e t s f u r t h e r m o r ea st h e m a h a l a n o b i sd i s t a n c er e p l a c e st h en u m e r i c a lp a r t , t h er e l e v a n c eb e t w e e nd a t ac a nb e e l i m i n a t e d e x p e r i m e n t a lr e s u l t ss h o wt h a ts o m - ma l g o r i t h mc a ne f f e c t i v e l yh a n d l e m u l t i d i m e n s i o l l a lm i x e dd a t as e tw i t hm o r ea c c u r a t ev i s u a l i z a t i o na n di ts u c c e s s f u l l y r e s o l v e dt h ep r o b l e mo fh i g h - d i m e n s i o n a lm i x e dv a l u e dd a t av i s u a l i z a t i o n ( 2 ) r e s e a r c ho i lc l u s t e r i n ga n a l y s i s o fs o m s o mi sam a i nm e t h o do f h i g h - d i m e n s i o n a ld a t av i s u a l i z a t i o nw h i c hi sa b l et od e a lw i t hl a r g e s c a l ec l u s t e r i n g a n a l y s i s ,i ti sa b l et oa u t o m a t i cc l u s t e rb u tw i t ht h el o wa c c u r a c y w ei m p r o v e dt h e t r a d i t i o n a ls o ma l g o r i t h mb yc o m b i n i n gk - p r o t o t y p e sa l g o r i t h mw i t hs o m - m f i r s t l y , w eu t i l i z e ds o m mt oo b t a i nt h er o u g hc l u s t e r i n go fi n p u td a t a , a n dt h e nu s e dt h i s i n f o r m a t i o nt oi n i t i a l i z ek - p r o t o t y p e sa l g o r i t h mt oo b t a i nm o r eo p t i m a lc l u s t e r i n g r e s u l t s e x p e r i m e n t a lr e s u l t ss h o wt h a tt h ei m p r o v e da l g o r i t h mi sb e t t e rt h a nt h e m 广东工业大学硕士学位论文 s o m 。ma l g o r i t h m i nt h el a s tp a r to ft h ep a p e r , t h em u l t i - d i m e n s i o n a ld a t av i s u a l i z a t i o ns y s t e mi s d e s i g n e da n dd e v e l o p e dw h i c hi n c l u d e st w om o d u l e s :d a t av i s u a l i z a t i o nm o d u l ea n d c l u s t e r i n ga n a l y s i sm o d u l e d a t av i s u a l i z a t i o nm o d u l er e a l i z e sv a r i o u sm e t h o d so f v i s u a l i z a t i o n 疵l u d 吨p i e c h a r t ,r a d a r c h a r ta n ds o m c l u s t e r i n ga n a l y s i sm o d u l e h e l p sp e o p l eg e tm o r ei n f o r m a t i o nb yt h ec l u s t e r i n ga n a l y s i so fd a t av i s u a l i z a t i o n r e s u l t s b ys i m p l ei n t e r a c t i o n , p e o p l ec a r lo b t a i nt h e i ri n t e r e s ti n f o r m a t i o n k e y w o r d s :m u l t i - d i m e n s i o n a ld a t av t s u a l i z a t i o n ;s o m ;c l u s t e r i n g i v 目录 目录 摘要i a b s t r a c t i i i 第一章绪论1 1 1 数据可视化1 1 1 1 数据可视化的产生1 1 。1 2 数据可视化的分类1 1 1 3 数据可视化的发展和现状3 1 2 多维数据可视化的基本技术4 1 2 1 传统的2 d 3 d 显示技术5 1 2 2 基于几何的技术5 1 2 3 基于图标的技术7 1 2 4 基于层次的技术9 1 2 5 面向像素的技术l o 1 3 多维数据可视化的降维映射技术1 1 1 3 1 主成分分析法1 l 1 3 2 多维标度法1 2 1 3 3 自组织映射法1 2 1 4 多维数据可视化技术的比较1 5 1 5 多维数据可视化的聚类与交互技术1 6 1 5 1 聚类分析1 6 1 5 2 交互技术1 6 1 6 多维数据可视化存在的问题1 7 1 7 本文的研究内容18 1 8 论文的组织一1 9 第二章基于s o m 的多维数据可视化方法研究2 0 2 1 自组织映射( s o m ) 2 0 2 1 1s o m 基本原理2 0 2 1 2s o m 算法步骤2 2 2 1 3s o m 的可视化方法2 2 v 广东工业大学硕士学位论文 2 2 一种面向混合数据的s o m 算法2 4 2 2 1 基本定义2 4 2 2 2 相似性度量函数2 4 2 2 3 基于新的相似性度量的s o m 算法描述2 6 2 3 可视化实验结果2 7 2 3 1 实验数据2 7 2 3 2 参数设置一2 8 2 3 3 实验结果2 9 2 4 本章小结3 2 第三章基于聚类分析的s o m 算法研究。3 3 3 1 算法问题分析一3 3 3 2k - p r o t o t y p e s 算法。3 4 3 2 1 算法描述3 4 3 2 2 算法的缺陷3 5 3 3s o m - m - k - p r o t o t y p e s 聚类算法3 6 3 4 实验结果与分析3 7 3 5 本章小结4 l 第四章可视化系统的设计与实现4 2 4 1 系统的体系结构4 2 4 2 系统的逻辑功能4 2 4 3 系统的实现4 4 4 3 1 系统开发环境4 4 4 3 2 数据来源4 4 4 3 3 功能模块的实现4 4 4 4 本章小结51 结论5 2 参考文献5 4 攻读硕士学位期间发表的论文5 9 独创性声明6 0 致谢6 l v i c o n t e n t s co n t e n t s c h i n e s ea b s t r a c r 1 e n g l i s ha b s t r a c t i i i c h a p t e r1p r e f a c e 1 1 1d a t av i s u a l i z a t i o n 1 1 1 1g e n e r a t i o no f d a t av i s u a l i z a t i o n l 1 1 2c l a s s i f i c a t i o no f d a t av i s u a l i z a t i o n 1 1 1 3d e v e l o p m e n ta n dc u r r e n ts i t u a t i o no f d a t av i s u a l i z a t i o n 。3 1 2b a s i ct e c h n o l o g yo f m u l t i d i m e n s i o n a ld a t av i s u a l i z a t i o n 4 1 2 1t r a d i t i o n a l2 d 3 dd i s p l a yt e c h n o l o g y 5 1 2 2g e o m e t r y - b a s e dt e c h n o l o g y 5 1 2 3i c o n - b a s e dt e c h n o l o g y 7 1 2 4h i e r a r i c a l b a s e dt e c h n o l o g y 9 1 2 5p i x e l s - b a s e dt e c h n o l o g y 1 0 1 3d i m e n s i o nr e d u c t i o nm a p p i n go fm u l t i d i m e n s i o n a ld a t av i s u a l i z a t i o n 11 1 3 1p c a t e c h n o l o g y 1 1 1 3 2m d s t e c h n o l o g y 1 2 1 3 3s o mt e c h n o l o g y 1 2 1 4c o m p a r i s o nb e t w e e nm u l t i d i m e n s i o n a ld a t av i s u a l i z a t i o nt e c h n o l o g y 一1 5 1 5c l u s t e r i n ga n di n t e r a c t i o no f m u l t i d i m e n s i o n a ld a t av i s u a l i z a t i o n 1 5 1 5 1c l u s t e r i n ga n a l y s i s 16 1 5 2i n t e r a c t i o nt e c h n o l o g y 17 1 6p r o b l e m so f m u l t i d i m e n s i o n a ld a t av i s u a l i z a t i o n 1 7 1 7c o n t e n t sa n ds i g n i f i c a n c eo f p a p e r 1 8 1 8o r g n i z a t i o no f p a p e r 1 9 c h a p t e r 2r e s e a r c ho i ls o m b a s e dm u l t i d i m e n s i o n a ld a t av i s u a l i z a t i o n 2 0 2 1i n t r o d u c t i o no fs o m 2 0 2 1 1t h eb a s i cp r i n c i p a l so fs o m 2 0 v 广东工业大学硕士学位论文 2 1 2p r o c e d u r e so f s o ma l g o r i t h m 2 2 2 1 3r e s e a r c ho f s o mv i s u a l i z a t i o n 2 2 2 2an e ws o ma l g o r i t h mf o rm i x e da t t r i b u t e sd a t a 2 4 2 2 1b a s i cd e f i n i t i o n 2 4 2 2 2s i m i l a r i t ym e a s u r e m e n tf u n c t i o n 2 4 2 2 3d e s c r i p t i o no f t h en e ws o ma l g o r i t h m 2 6 2 3v i s u a l i z a t i o na n da n a l y s i so f t h ee x p e r i m e n t s 2 7 2 3 1d a t as o u r c eo f e x p e r i m e n t s 2 7 2 3 2p a r a m e t e rs e t t i n gp r o b l e m 2 7 2 3 3r e s u l t so f e x p e r i m e n t s 2 7 2 4 s u m m a r y 3 2 c h a p t e r3c l u s t e r i n ga n a l y s i sb a s e ds o ma l g o r i t h m 3 3 3 1p r o b l e ma n a l y s i so f a l g o r i t h m 3 3 3 2k - p r o t o t y p e sa l g o r i t h m 3 5 3 2 1d e s c r i p t i o no f a l g o r i t h m 3 5 3 2 2e f f e c t i v e n e s so f a l g o r i t h m 3 6 3 3s o m - m k - p r o t o t y p e sa l g o r i t h m 3 7 3 4r e s u l t sa n da n a l y s i so fe x p e r i m e n t s 3 7 3 5 s u m m a r y 4 1 c h a p t e r 4d e s i g na n di m p l e m e n t a t i o no fv i s u a l i z a t i o ns y s t e m 4 2 4 1d e s i g no fs y s t e m 4 2 4 2f u n c t i o no fs y s t e m 4 2 4 3i m p l e m e n t a t i o no fs y s t e m 4 2 4 3 1d e v e b p m ge n v i r o m e n to fs y s t e m 4 4 4 3 2d a t as o u r c e 4 4 4 3 3i m p l e m e n t a t i o no f f u n c t i o n a lm o d u l e s 4 4 4 4s u t m n m 了5 1 c o n c l u s i o n 5 2 r e f e r e n c e s 5 4 p u b l i c a t i o nd u r i n gm a s t e r ss t u d i e s 5 9 v t c o n t e n t s o r i g i n a lc r e a t i o nd e c l a r e 6 0 a c k n o w l e d g e m e n t s 6 1 i x 第一章绪论 第一章绪论 人类认识事物是一个综合运用视觉、听觉、嗅觉、触觉和抽象思维能力的复 杂过程,其中视觉是人们获取信息的最主要、最快速的渠道,人类8 0 以上的信 息是通过视觉获得的。因此,用图形图像方式来展示信息特征,可以利用人类视 觉系统的特点帮助人们更快速、更深刻地理解信息,并可以便捷地进行信息空间 的导航,快速地检索信息。可视化便是基于这种需求而产生的,并成为当今信息 科学领域的发展趋势之一。 1 1 数据可视化 1 1 1 数据可视化的产生 可视化( v i s u a l i z a t i o n ) 是利用计算机图形学和图像处理技术,将数据转换 成图形或图像在屏幕上显示出来,并进行交互处理的理论、方法和技术。 科学技术可视化是可视化领域最早的应用,主要应用在工程计算领域1 。可 视化对象是空间数据场,涉及标量、矢量及张量等不同类别的空间数据。其基本 思想在于运用计算机图形学或者一般图形学的原理和方法,将科学与工程计算等 产生的大规模数据转换为图形、图像,以直观的形式表示出来,帮助科学家发现 和理解科学计算过程中各种现象。 随着数据仓库技术、网络技术、电子商务技术等新技术飞速发展,给人类社 会带来了巨大的变化。社会信息及数据量急剧膨胀,面对这些浩如烟海的数据, 人们迫切需要更快捷、更方便的方式获取信息,了解数据之间的相互关系及发展 趋势。数据可视化正是在这样的背景下产生的,它是可视化领域中的一个重要研 究内容,是可视化技术在非空间数据领域的应用,使人们不再局限于通过关系数 据表来观察和分析数据信息,还能以更直观地方式看到数据及其结构关系田。 1 1 2 数据可视化的分类 数据的可视化会涉及到数据类型、可视化技术及数据的交互和变形技术,所 广东工业大学硕士学位论文 有的三个要素构成了对数据的可视化嘲。下面依次介绍这三个要素所包含的内容。 可视化的数据类型 一维数据 二维数据 多维数据 文本曲 层次,图形 算法,软件 2 第一章绪论 研究论文、书籍、数字图书馆、多媒体网页等。这些数据类型没有维的概念,不 能用数量来描述,因此通常情况下,对这些数据进行处理之前先转换成可描述的 向量,再应用可视化技术。文本信息可视化可以分为两类:类是对单个文本本 身的可视化;另一类是对大型文本几何的可视化。对于大型文档集合而言,文档 之间的主题或内容相关性对于使用者而言是非常重要的嘲。 另外,还有一些数据类型,如图形、层次数据、算法和软件。图形可以表示 一般数据之间的内部依赖关系;算法和软件的可视化目的是为了帮助对算法的理 解,以此来支持软件的开发,例如流程图、代码结构图等p 一。 1 1 3 数据可视化的发展和现状 国外从2 0 世纪8 0 年代末提出可视化技术以来,对它的研究取得了一些相当 大的进展。国际上,每年都有两个由“电气与电工工程师学会i e e e 组织的比 较有影响的可视化国际研讨会,展示和交流可视化最新的研究成果和进展。可视 化技术已成功应用到科学研究、工程、军事、医学、经济等各个领域唧。 我国可视化技术始于2 0 世纪9 0 年代初。至今,我国不论在算法方面,还是 在石油勘探、气象、计算力学、医学等领域的应用方面,都已取得了一大批可喜 的成果。但总体上,国内在应用方面与国外先进水平差距甚大,特别在商业软件 方面。 目前,全世界各高校及科研单位中有5 0 多个数据可视化的研究组,1 0 多 个专门的期刊和杂志,每年都有多个数据可视化或可视化数据挖掘的国际会议或 国际论坛,如i e e e 在1 9 9 5 年以后每年都举办一次信息可视化国际会议。目前 研制和开发的数据可视化产品也有数十种。比较完善的产品及其开发研究组包 括:( 1 ) v t s d b ,由m u n i c h 大学开发,采用面向像素的技术,运用颜色和距离反 映数据之间的相似度q 。( 2 ) x g o b i ,由贝尔实验室开发,是多种技术的集成,提 供动态的人机交互功能o 。( 3 ) d b m i n e r 及c v i s ,由加拿大s i m o nf r a s e r 大学开 发的可视化数据挖掘系统,集成了数据仓库技术、数据挖掘技术和可视化技术刁。 国内一些大学也相继开展了数据可视化技术方面的研究,并取得了一些成 绩,如浙江大学研究和开发的基于数据流机制的通用的可视化平台g i v e n s ;中 科院软件所在可视化方面的研究成果;清华大学在频域体绘制技术方面的研究成 果等。在实际应用领域,一些研究机构和公司也开始着手研制和开发数据可视化 广东_ y - :1 1 :大学硕士学位论文 工具3 1 ,比较有代表性的有:b r i o 公司的b r i o e n t e r p r i s eh y p e r i o n 公司的w t r e d f o ro l a p ;b o 公司的可视化展示工具b u s i n e s s o b j e c t s 以及m i c r o s o t t 公司的 a n a l y s i ss e r v i c e 。这说明数据可视化工具的开发和应用逐渐成为一种趋势。 多维数据可视化是数据可视化的主要内容和热点研究方向,国外在该领域研 究比较活跃,新的研究成果不断出现,国内目前也开始了这方面的研究,但仍处 于起步阶段。比较完善的产品及其开发研究组包括:有m u n i c h 大学所做的大型 数据库可视化v i s d b ,u cb e r k e l e y 的t i o g a 系统,以及m a r y l a n d 大学所做的动 态查询( h o m e f i n d e r ,f i l m f i n d e r ,s p o t f i r e 等等) 。x e r o xp a l oa l t o 研究中心的用 户界面研究组的r a o 和c a r d 提出的t a b l el e n s 技术t a b l el e n s 是一种很好的多 维数据可视化结构。目前,这种技术也已经有了相应的产品( i n x i g h t 软件公司) 目前,多维数据可视化已成功应用于数据挖掘领域中,成为数据挖掘的重要 工具。利用多维数据可视化技术可以直观形象地表达多维数据,显示挖掘结果, 动态演示挖掘过程,并通过反馈交互操作,引导整个数据挖掘过程的进行,贯穿 数据挖掘的全过程。这样,人们就可以发现大量金融、通信和商业数据中隐含的 规律,从而为决策提供依据。多维数据可视化技术与数据挖掘技术的结合已成为 数据可视化技术中新的热点n 4 1 。 1 2 多维数据可视化的基本技术 数据仓库或数据库中的数据大多具有多个属性,多维数据可视化就是对数据 集中含有3 个及以上属性的数据可视化,其研究重点在于对关系数据库中数据的 可视化。这些数据以关系表的形式存在,每一个数据被看作是表中的一行,数据 有多个属性,在关系表中以列表示,每一列代表一个属性。将每一个属性看作一 个变量,关系数据库成为一个多变量数据库。多维数据可视化将每一个变量看作 多维空间中的一维,变量的值即数据的属性值表示数据在这一维上的坐标,数据 库中的数据被映射为多维空间中的点,这些点也被称为多维矢量,矢量坐标由属 性值确定,这样数据的分布空间可以被看作是一个多维空间。 多维数据可视化不是简单的图形映射,而是通过在二维或三维的可视空间中 尽量反映数据的各属性信息及其特性,可以帮助用户实现的功能如下卯: ( 1 ) 能够容易发现数据的变化趋势,如数据的暴涨暴跌等; ( 2 ) 能够容易识别数据的歧义点和边缘点,如最大值、最小值、边界数据等; 4 第一章绪论 ( 3 ) 能够显示数据的分类和总体分布结构,并发现不同类数据的特征; ( 4 ) 能够方便地进行数据的比较,从而发现数据之间的差别和联系; ( 5 ) 能够提供丰富的人机交互功能,帮助用户准确地找到特定的数据,并实 现对数据的选择、缩放、过滤等基本功能。 目前,国内外学者已经提出了相当数量的数据可视化方法,这些方法根据其 可视化的原理不同可以划分为以下几种:传统的2 d 3 d 显示技术、基于几何的 技术、面向像素的技术、基于层次的技术、基于图标的技术和降维映射的技术。 1 2 1 传统的2 d 3 d 显示技术 目前常用的可视化方法包括条形图、饼图、直方图、折线图、分位数图、散 点图、局部回归曲线图、时序图、盒图和数据立方体等,这些图形被经常用于 统计图形中,在显示数据汇总和分布方面非常强大,多用于低维数据的显示,但 是却不能适应多维数据可视化的需求。 直方图是通常用于比较离散数据维和连续数据维的交叉点的值,饼图用于描 述量、频率或百分比之间的相对关系;两者在商业领域和大众媒体中几乎无处不 在,在一些特定情况下,这种统计图可以很有效地对信息进行展示,如图1 2 。 1 0 0 0 0 8 0 枷0 2 0 0 0 o 2 0 1 0 年1 月- 4 月产品零售数据 2 0 z o , lf l 4 月a 型产品月零售占比 i 剥手1 :i 1 月2 月3 月4 月 ( a ) 直方图 嗣 i m b m i 倒 图l - 2 直方图和饼图 f i g u r e l - 2a a r g r a p ha n dp i e c h a t t 1 2 2 基于几何的技术 ( b ) 饼图 嗣 i 一2 月i 口3 月 孺 b 剑 基本思想是以几何画法或几何投影的方式将数据库或数据仓库中的多维数 广东工业大学硕士学位论文 据映射到低维空间中,以点、曲线或折线来表示多维信息对象,适用于数据量小 但是维数较多的数据集,比较容易观察多维数据的分布并发现其中歧义点。基于 几何的可视化技术包括平行坐标法【1 6 1 、散列图矩阵旧、雷达图1 8 1 等。 1 平行坐标法 平行坐标法( p a r a l l e lc o o r d i n a t e s ) 的基本思想是将1 1 维数据属性空间通过n 条 等距离的平行轴映射到二维平面上,每一条轴线代表一个属性维,轴线上的取值 范围从对应属性的最小值到最大值均匀分布。这样,每一个数据项都可以根据其 属性值用一条折线段在1 1 条平行轴上表示出来,折线与坐标轴的交点是相应对象 在该属性维上的值,如图1 3 。 图1 3 平行坐标图 第一章绪论 数据维进行比较。 j 熬:黎 :+,气+ :f :辫 ji :,黔 + t + , + 。寸 羹+ 势:秘+ ji 1 2 3 基于图标的技术 图

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论