(计算机科学与技术专业论文)平行坐标可视化技术的度量模型研究.pdf_第1页
(计算机科学与技术专业论文)平行坐标可视化技术的度量模型研究.pdf_第2页
(计算机科学与技术专业论文)平行坐标可视化技术的度量模型研究.pdf_第3页
(计算机科学与技术专业论文)平行坐标可视化技术的度量模型研究.pdf_第4页
(计算机科学与技术专业论文)平行坐标可视化技术的度量模型研究.pdf_第5页
已阅读5页,还剩67页未读 继续免费阅读

(计算机科学与技术专业论文)平行坐标可视化技术的度量模型研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 随着可视化技术的发展和应用,在可视化种类越来越多的同时,能够定量评价 可视化技术应用效果的度量模型的出现,已经成为可视化研究领域中最迫切的需 求之一。 本论文以平行坐标可视化技术为例,通过对平行坐标可视化以及度量模型理论 的研究,建立起一个基于平行坐标的可视化技术度量模型,并将此模型在m i c r o s o f t v i s u a lc + + 6 0 环境下加以实现。 本论文的研究工作主要体现在以下三个方面: 1 、通过收集和整理可视化技术度量领域的国内外研究现状,总结了该领域到 目前为止的研究成果和不足之处。 2 、在对平行坐标可视化技术的特征及优缺点进行充分分析的基础上,提炼出 了影响平行坐标可视化效果的主要因素,并根据这些影响因素设计和实现了数据 交度、数据叠度、分布失衡率等指标算法,利用层次分析法确定出各项指标的权 重,最终建立起一个基于平行坐标可视化的定量度量模型p v m 。 3 、对p v m 模型进行系统实现,系统不仅可以对数据集的平行坐标可视化效果 进行定量评价,给出指标体系,还实现了两个基于p v m 模型的实际应用:最优可 视化选择及指标阈值控制。系统中还设计了实验验证功能,通过科学合理的方式 对理论模型进行了正确性验证。 基于平行坐标的可视化技术度量模型的提出,有助于通过主观感受来认识和 确定可视化应用效果,对平行坐标可视化方法的应用起到了一定的推动作用。不 同的可视化方法有不同的特点,本文仅仅研究了平行坐标可视化技术的度量模型, 对于其他可视化方法、甚至对于所有可视化方法共同的定量度量,还有很大的研 究空间。 关键词:平行坐标技术;可视化技术;度量模型;层次分析法 分类号:t p 3 9 a bs t r a c t a sm ev i s u a l i z a t i o nt e c h n i q u e sd e v e l o p i n gf a s t e ra n df a s t e r , t h e r eh a v eb e e nm o r e a n dm o r en e wk i n d so fv i s u a l i z a t i o nt e c h n i q u e s t h ea p p e a r a n c eo faq u a n t i t a t i v e m e a s u r e m e n tm o d e lf o rv i s u a l i z a t i o n sa p p l i c a t i o nb e c o m e so n eo f t h em o s ti m p e r a t i v e d e m a n d si nt h er e s e a r c hf i e l do fv i s u a l i z a t i o n t h i sp a p e rt a k e sp a r a l l e lc o o r d i n a t e sa sa ne x a m p l e a f t e rr e s e a r c h i n gt h e p a r a l i e l c o o r d i n a t e sv i s u a l i z a t i o n t e c h n i q u ea n dt h et h e o r yo fm e a s u r e m e n t m o d e l ,a m e a s u r e m e n tm o d e lf o rv i s u a l i z a t i o nt e c h n i q u eb a s e do n p a r a l l e lc o o r d i n a t e sw a ss e tu p i nt h i sp a p e r , w h i c hw a sc a r r i e do u tu n d e rm i c r o s o f tv i s u a lc + + 6 0 e n v i r o 衄e n t t h er e s e a r c hw o r ko ft h ep a p e ri sm a i n l ye m b o d i e db yt h et h r e ea s p e c t sb e l l o w : 1 a f t e rc o l l e c t i n ga n da r r a n g i n gt h er e s e n tr e s e a r c hi na n do u to f c h i n a ,t h ep a p e r s u m m a r i z e dt h ea c h i e v e m e n t sa n dl i m i t a t i o n si nv i s u a l i z a t i o nm e a s u r e m e n tf i e l d 2 t h e p a p e ra n a l y z e d t h em e r i t sa n dd r a w b a c k so f p a r a l l e lc o o r d i n a t e s v i s u a l i z a t i o n t h o r o u g h l y , a n da b s t r a c t e d t h em a i n d e c i d i n gf a c t o r so fp a r a l l e l c o o r d i n a t e s a p p l i c a t i o n a f t e rt h a t ,s o m ei n d e xa l g o r i t h m sw e r ed e s i g n e da n dc a r r i e d o u t ,s u c ha si n t e r s e c t i o n - d e g r e e ,o v e r l a p - d e g r e ea n dd i s t r i b u t i o n u n b a l a n c e d e g r e e t h eq u a n t i t a t i v em e a s u r e m e n tm o d e lp v m w a sf i n a l l ys e tu pa f t e rw e i g h t so fi n d e x e s w e r ed e c i d e db ya h p 3 t h ep v mm o d e lw a sc a r r i e do u ti n c h d a t a s e t sp a r a l l e lc o o r d i n a t e s v i s u a l i z a t i o nc a l lb ee s t i m a t e di nt h es y s t e m ,w i t hat o t a ls c o r ea sw e l la sv a l u e so f o m e r i n d e x e s a l s o ,t h es y s t e mc a r d e do u tt w oa p p l i c a t i o n so fp v m :c h o o s i n gt h eb e s t v i s u a l i z a t i o na n dt h ei n d e xt h r e s h o l dc o n t r 0 1 t h e r ei sa l s oa ne x p e r i m e n tf u n c t i o n d e s i g n e di nt h es y s t e m ,w h i c hp r o v i d e sas c i e n t i f i cw a yo f t e s t i n go u rm o d e l t h ep u tf o r w a r do fm e a s u r e m e n tm o d e lo fv i s u a l i z a t i o nt e c h n i q u e sb a s e do n p a r a l l e l c o o r d i n a t e sm a k e su pf o rt h e s h o r t c o m i n g st h a tp e o p l ec a no n l ym a k e s u b j e c t i v ej u d g m e n t so fv i s u a l i z a t i o n sa p p l i c a t i o n ,a n dm o t i v a t e sp a r a l l e lc o o r d i n a t e s v i s u a l i z a t i o nt e c h n i q u e sa p p l i c a t i o n d i f f e r e n tv i s u a l i z a t i o nt e c h n i q u e sh a v ed i f f e r e n t f e a t u r e s ,a n dt h i sp a p e rf o c u s e do nt h er e s e a r c ho f p a r a l l e lc o o r d i n a t e sv i s u a l i z a t i o n a s t oo t h e rk i n do fv i s u a l i z a t i o n t e c h n i q u e s ,t h e r ei ss t i l lm u c hr o o mf o rr e s e a r c h i n g k e y w o r d s :p a r a l l e lc o o r d i n a t e s ;v i s u a l i z a t i o n t e c h n i q u e ;m e a s u r e m e n tm o d e l : a h p c l a s s n 0 :t p 3 9 l 独创性声明 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研 究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表或 撰写过的研究成果,也不包含为获得北京交通大学或其他教育机构的学位或证书 而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作 了明确的说明并表示了谢意。 学位论文作者签名:南钙 签字r 期:孔,d 7 年b 月倍日 学位论文版权使用授权书 本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特 授权北京交通大学可以将学位论文的全部或部分内容编入有关数据库进行检索, 提供阅览服务,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。 同意学校向国家有关部门或机构送交论文的复印件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 学位论文作者签名: 南鸣 签字日期:细习年6 月f 拥 刷醛轹硐位 一l ,ll 厶 签字日期:研年易月夕 致谢 本论文的工作是在我的导师胡俊副教授的悉心指导下完成的,胡俊副教授严 谨的治学态度和科学的工作方法给了我极大的帮助和影响。在此衷心感谢两年来 胡俊老师对我的关心和指导。 胡俊副教授悉心指导我们完成了实验室的科研工作,在学习上和生活上都给 予了我很大的关心和帮助,在此向胡俊老师表示衷心的感谢。 瞿有利老师对于我的科研工作和论文都提出了许多的宝贵意见,在此表示衷 心的感谢。 在实验室工作及撰写论文期间,陈思勇、卢晓露、陆吴天等同学对我论文中 的可视化评测等研究工作给予了热情帮助,在此向他们表达我的感激之情。 另外也感谢家人和朋友,他们的理解和支持使我能够在学校专心完成我的学 、i k 。 引言 1 1 选题背景和意义 1 引言 由于人类接受数字信息的能力很差, 间往往是计算时间的十几倍甚至几十倍, 由人工处理数据十分繁琐,所花费的时 有时还会丢失大量的原始信息。这已经 成为提高科学计算质量和效率的主要瓶颈。人接受图像信息的能力较强,在人脑 大约1 0 0 亿条神经元中,有一半是为视觉系统服务的。将复杂的数据以图像的形 式表现,把原来没有空间属性的数据形象化,这样容易为视觉系统所接受,人脑 也很容易理解。可视化技术把原来难以直接解决的问题变换到另一个领域中,成 为容易理解和解决的问题。 可视化技术是利用计算机图形学和图像处理技术,将数据转换成图形或图像 在屏幕上显示出来,并进行交互处理的理论、方法和技术。近年来,可视化技术 发展得十分活跃,它把计算机图形学、图像处理和计算机视觉等技术结合到一起, 并应用到计算科学中。当数据非常复杂或是抽象的时候,可视化技术可以让这些 数据更加容易被理解。 随着理论、技术的发展和应用领域的扩大,产生了越来越多的可视化技术。 它们在形式上有很大不同,在应用目的和表现方法上也各有侧重,不同的可视化 技术有不同的特点,每种技术都有自己的适用范围。如何对它们进行综合的科学 评价,已经成为推广已有技术和开发新技术的关键。 从查阅的文献资料来看,在可视化技术的评价研究方面,不管是国外还是国 内,专家们常常只研究实验情形,进行一些定性的分析工作,而具有指标体系的 综合评价工作则比较少。 在可视化技术种类繁多,应用情形千变万化的大背景下,进行可视化技术定 量度量的研究无疑有着非常重要的作用。可视化技术的定量度量不仅可以通过精 确的数据评价和反映可视化技术的应用效果,而且还可以指导可视化技术的应用, 在一定程度上为用户选择实用、适用的技术提供指导工具。 9 0 年代初期提出的平行坐标可视化技术是基于几何可视化技术的典型代表, 是最早提出的以二维形式表示n 维空间的数据可视化方法之一。平行坐标作为对 多维数据的两维显示,给多维数据的研究带来了很大帮助,它对数据的各种处理 技术使得隐藏在大量数据中的规律更容易被发现,使人们能够更加直观地掌握多 维大数据集的变化规律。因此,平行坐标可视化技术如今在各个领域中都得到了 北京交通人学硕士学位论文 广泛的应用。 任何一种可视化技术都有它的局限性,在平行坐标可视化技术的应用过程中, 也有一些制约其可视化效果的因素,如数据量大小、折线交叠的复杂程度等等。 在这些因素的影响下,可能会出现人们对数据信息的理解障碍,不利于发现数据 间的变化规律。 本论文将通过对平行坐标可视化技术的研究,建立一个基于平行坐标可视化 技术的度量模型,该模型可以对平行坐标可视化技术在某一具体数据集上的应用 效果给出量化的评价,对指导平行坐标可视化技术的实际应用有着重要的参考价 值。 1 2 国内外研究现状 可视化技术度量模型,指的是针对某种可视化技术建立起来的一个定量的度 量体系,这个体系可以用来评价该可视化技术应用在某一具体数据集时的效果。 通过对大量文献资料的阅读、归纳和整理,从整体上对之前的研究和成果有 了把握。总的说来,可视化技术的理论研究已相对成熟并在逐渐进步。一方面, 已经有多种实际中经常应用的较为成熟的可视化技术,如平行坐标可视化技术、 各种基于像素的可视化技术等。另一方面,近年来,可视化技术不断有创新和发 展,出现了交互技术、虚拟技术等一些新技术。不同的可视化技术往往适用于不 同的地方,对可视化技术的应用建立度量模型并进行评测,对于我们更好的掌握 和应用可视化技术、推动可视化技术更快地进步是十分必要的。在可视化技术的 评测方面,从文献资料来看,目前的研究大致可分为两个方向,一个是对可视化 技术本身的定性评价,一个是对可视化软件产品进行的测评。定性评价往往由于 缺乏必要的数据信息而大大降低了其准确度和可信度,从而在应用时有一定的局 限性。对可视化软件产品进行的测评,通常把研究的重点更多的放在用户测试和 界面友好程度评价等方面,与本论文的研究内容有较大偏离,故暂不作为参考。 1 2 1 可视化技术的理论研究 可视化技术是利用计算机图形学和图像处理技术,将数据转换成图形或图像 在屏幕上显示出来,并进行交互处理的理论、方法和技术。人类的眼睛和大脑具 有强大的结构探测能力,数据可视化是数字型数据转换成有意义的图像的过程。 可视化技术主要有数据可视化和科学计算可视化两个分支,目前数据可视化 已经提出了许多方法,这些方法根据其可视化原理的不同可以划分为基于几何的 2 引言 技术、面向像素的技术、基于图标的技术、基于层次的技术、基于图像的技术和 分布式技术等等ii 。 近几年来可视化技术取得了很多新的进展,如失真技术、交互技术和协同 技术、钻过技术、虚拟技术等。9 0 年代初,i n s e l b e r g 和d i m s d a l e 提出了平行坐标 技术,它是基于几何的可视化技术的典型代表。平行坐标对多维数据的表达是数 据可视他的重要方法之一,它实现了多维数据在二维平面上的表示。平行坐标可 视化的基本思想是将n 维数据属性空间通过1 1 条等距离的平行轴映射到二维平面 上,每一条轴线代表一个属性维。这样,每一个数据项都可以根据其属性值用一 条折线段在n 条平行轴上表示出来。平行坐标可视化的效果如图1 - 1 所示,图中左 边是一个维数为6 ,数据条数为6 的数据集的平行坐标可视化效果;右边为用不同 颜色标识的某数据集的平行坐标可视化。 滁 图1 - 1 平行坐标可视忧技术 f i g1 - ip a r a l l e l c o o r d i n a t e s v i s u a l i z a t i o n t e c h n i q u e 利用平行坐标法开发的系统包括p a r a l l e lv i s u a le x p l o r e r ( r a m ) 、x m d v ( m a t t w a r d ) 、a v s e x p r e s s ( v a nw i j k ) 等等。这个方法的优点在于,对于较少的数据集能 使用户在二维平面上看到每个数据的n 维属性,对于大型的数据集能反映出各维 属性之间的关系和数据在各维属性之间的走向趋势。2 0 0 1 年,j i mxc h e r t 和 s h u a n g b a ow a n g 提出了一种平行坐标技术应用在多维数据集上时的有效的降维方 法【2 j 。 在平行坐标可视化技术应用得越来越广泛的同时不断有增强平行坐标技术 可视性的新技术出现,如用颜色比例区分相交的折线、在普通平行坐标可视化基 础上进行分层处理等。 1 22 可视化技术的应用研究 随着可视化技术的发展,数据挖掘可视化已经成为数据挖掘技术的发展趋势。 可视化可以使数据和挖掘结果更容易理解,允许对结果进行比较和检验,也用于 北京交通大学硕士学位论文 指导数据挖掘算法,使用户参与到决策分析的过程中1 3 1 。可视化数据挖掘对处理不 均匀的、有噪声的数据尤其有效【4 】。2 0 0 2 年,m a t t h i a sk r e u s e l e r 和h e i d r u ns c h u m a n n 提出了一个灵活的可视化数据挖掘框架【5 】,把数据的预处理和可视化结合起来,使 得数据挖掘的过程更加便捷。 可视化技术还可以用在聚类分析过程中,以平行坐标可视化方法为例,在聚 类分析中,首先对数据通过平行坐标进行可视化分析,这往往可以帮助确定大致 的聚类范围及个数,可实现对数据的定性分析【6 j 。对数据集的聚类分析还可以采用 普通平行坐标与分层平行坐标相结合的方式,将普通平行坐标和分层平行坐标的 优点都利用起来【7 j 。 随着可视化技术的发展和进步,可视化技术的应用范围也越来越广。优秀的 可视化技术不仅能使我们更容易感知信息和知识,而且还可以感知更多的信息和 知识。可视化在知识管理领域的具体应用形式可以分为知识发现的可视化、知识 表示的可视化以及知识的可视化组织三个方面。 可视化技术在其他的很多领域中都发挥着重要的作用,如矿产资源勘探、气 象数据分析、信号和图像处理、仿真建模技术等。 1 2 3可视化技术的评测研究 随着理论、技术的发展和应用领域的扩大,产生了越来越多的可视化技术。 它们在形式上有很大不同,在应用目的和表现方法上也各有侧重,如何对它们进 行综合的科学评价,成为推广已有技术和开发新技术的关键。 信息可视化的本质是从抽象数据到可视结构的映射。最早,人们用表现力和 有效性两个标准来评价信息可视化的效果。表现力是指可视化的结果使所有的数 据得到表现,而且没有其他的东西被引入;有效性是指可视化能够使用户充分发 现数据之间的关系并理解数据 8 】。研究合适的可视化模型是充分体现表现力和有效 性的最佳方法。 在可视化技术的发展历程当中,曾有研究者提出了信息可视化的基于经验的 主观评价【9 1 。到目前为止,人们在信息可视化评价上做出的尝试主要有四类【1 0 】:对 比设计元素的控制实验,可视化工具的可用性评估,对比两种以上可视化工具的 控制实验,在实际应用下的可视化工具的案例研究。在评价过程中遇到的挑战和 难点主要有三处:把可视化工具与用户、任务、实际问题相匹配,改进用户测试, 让更多的普通用户也可以使用。另外,也有人提出,在信息可视化评价的尝试中 常常遇到以下几个问题:新界面执行时总有b u g ,测试用户群不合适,测试用户 对传统界面存在依赖,测试的任务不合适【1 1 】等等。专家观察和有代表性的用户测 4 引言 试是当前常用的两种评测方法。 从文献资料中可以看出,目前的研究工作主要集中在对应用了可视化技术的 工具的评测,以及对可视化技术的定性评估上,对可视化技术的定量评测研究的 还较少。 1 2 4 度量模型研究 在建立度量模型的过程中,需要确定各个指标及其权重。常见的指标处理技 术有模糊评价法、灰色评价等;常见的权重算法有层次分析法、主观赋权法、客 观赋权法、频度标度法掣1 2 】。 在指标的选取上,首先要通过收集资料,了解各项指标的重要性程度,然后 再明确指标的数量和含义,以及指标之间的关系。选取的指标应该具有较高的区 分度,各项指标可以独立存在。 层析分析法可以利用较少的定量信息使决策的思维过程数学化。层次分析法 是一种定性分析与定量分析相结合的多因素决策分析方法,将决策者的经验判断 给予数量化。 1 3 各章内容介绍 本文共分为七章,各章内容安排如下: 第一章为引言,介绍了论文的选题背景,从宏观上把握论文的研究方向和研 究意义,并对目前的国内外研究现状进行了介绍。 第二章介绍了与本论文研究密切相关的两部分理论:可视化技术以及度量模 型研究。具体从可视化技术、可视化技术的评估、平行坐标可视化技术及常用权 重算法四个方面进行了介绍。 第三章在介绍了度量模型研究背景和适用范围之后,按照指标选取、算法设 计、权重确定的步骤逐步建立起了p v m 模型。 第四章介绍了基于p v m 模型的可视化评价系统p v s y s t e m ,描述了系统的主要 功能和模型设计。 第五章对p v s y s t e m 系统的详细设计进行了介绍,重点对p v s y s t e m 系统的指标 体系算法模块、对比实验设计模块以及p v m 模型的应用模块进行了详细描述。 第六章通过在实际数据集上的应用和对比实验,从横向、纵向两个角度验证 北京交通人学硕+ 学位论文 了p v m 模型的正确性,总结了其优点和不足,并研究了p v m 模型中各度量指标间 的关系,指出了后续研究的发展方向。 第七章总结了本文的研究内容和成果,并对未来的研究工作进行了展望。 6 可视化技术及度量模型研究 2 可视化技术及度量模型研究 2 1 可视化技术概述 2 1 1 可视化技术 随着科技的发展,现代社会中的信息量越来越大,其中,相当一部分的信息 以多维数据的形式出现。由于人类认知能力的局限性,多维海量数据往往不能被 及时、准确地理解。因此,在知识发现、信息认知和信息决策的过程中,多维可 视化技术作为有效的抽象信息展现工具被广泛地用来辅助知识工作者理解和分析 海量高维数据集【l3 1 。通过在低维可视空间中对多维数据分布进行可视化展现,知 识工作者可以准确快速地发现数据集中隐藏的特征信息、关系信息、模式信息、 趋势信息及聚类信息等,并针对特定任务目标进行可视化分析,帮助其验证提出 的假设性结论,引导其做出新的预见和更高效的决策。 可视化的本质是在人的头脑中建立起多维抽象信息的意象,并在此意象的基 础上对其进行认知。多维可视化技术不是简单的图形映射,而是要尽量反映多维 信息及其各属性之间的关系信息,力图在低维可视空间中展现多维抽象信息的多 属性数据特征【1 4 】。信息可视化的参考模型如图2 1 所示。 用户交互 图2 - 1 可视化参考模型 f i g 2 1a r e f e r e n c em o d e lo f v i s u a l i z a t i o np r o c e s s 可视化技术对人们在知识理解和信息认知上的贡献是十分巨大的。由于人们 接受图像信息比接受数字信息要容易得多,用可视化技术对数据进行展现后,人 们能够对原数据信息产生更强的直观认识,从而大大降低了数据及其隐藏规律的 认知复杂度。可视化技术让数据更容易被理解的同时,也让特殊数据更容易被发 现,有助于下一步研究的开展和进行。 可视化技术还可以通过与其他技术的结合来发挥作用,例如可视化数据挖掘 7 北京交通人学硕士学位论文 技术。数据挖掘是指从大量的历史数据中抽取出潜在的、有价值的知识的过程, 从数据挖掘的前期准备到中间的挖掘过程,再到挖掘后的信息处理,可视化技术 都可以融入其中。可视化技术让用户与整个数据挖掘的过程更紧密的结合了起来, 使得数据挖掘的过程更加透明、更加易于理解。可视化数据挖掘的技术模型如图 2 2 所示。 图2 - 2 可视化数据挖掘技术模型 f i g 2 - 2t h et e c h n i c a lm o d e lo fv i s u a l i z a t i o nd a t am i n i n g 从美学意义上考虑,一种可视化效果可以是一种美的享受,以数字形式出现 的信息却相比之下显得单调乏味。从这个角度上来讲,可视化给数字信息赋予了 艺术的特征,这个意义也是不可忽视的。 2 1 2 可视化技术的分类及应用 目前,国内外的研究者已经提出了很多种多维可视化方法,这些方法根据其 可视化原理的不同可以划分为基于几何的技术、面向像素的技术、基于图标的技 术、基于层次的技术和基于图形的技术等等。 下面主要介绍一下基于几何的可视化技术、面向像素的可视化技术和基于图 标的可视化技术的原理及应用。 ( 1 ) 基于几何的可视化技术 基本思想是以几何画法或几何投影的方式将高维数据映射到低维空间中,以 点、曲线或折线来表示多维信息对象。 基于几何的可视化技术适用于数据量不大但是维数较多的数据集,较容易观 可视化技术及度鼍模型研究 察出多维数据的分布并发现其中的隐藏规律。 常见的基于几何的可视化技术有平行坐标可视化技术、散点图矩阵、a n d r e w s 曲线法等等。 ( 2 ) 面向像素的可视化技术 基本思想是按照数据的维数将高维空间划分为多个子窗口,每一个子窗口对 应着数据的一维。 面向像素的技术利用递归模型、螺旋模型、圆周分割模型等方法分布数据, 其目的是在屏幕窗口上展示尽量多的数据,适合可视化大型的数据集。 ( 3 ) 基于图标的可视化技术 基本思想是用具有多个可视特征的图标来表达多维信息,图标的每一个可视 特征都可以用来表示多维信息的一维,用户可以根据图标的显示更准确地理解各 个属性的意义。 2 1 3 可视化技术的评估 随着可视化技术的发展和应用领域的不断扩展深入,人们研究开发了大量形 式各异的可视化技术来满足实际的需要。这些可视化技术有着不同的目的和侧重 点,有些擅长于表现高维数据,有些侧重于表现数据的结构。研究人员对常见的 可视化技术进行过几方面的分析比较【l 引,每种可视化方法都有自己的特点,因此, 如何判断一个具体技术的好坏及其适用环境,就显得尤其重要。 早期对于可视化技术的评价工作主要可以分为两个阶段【l9 】:首先是一些设计 者或开发部门对技术进行的局部测试,随后一些学者给出了某些评价的角度,他 们往往根据当时的研究背景着重强调了一个或几个方面。 在技术的局部测试阶段,主要是一些信息可视化技术的设计者或开发部门针 对可能的需求,在不同环境下测试他们的技术的实用情况。随着可视化技术的发 展,人们发现必须确定一些标志来判断一项技术的好坏。最早,人们用表现力和 有效性两个标准来判断可视化技术的好坏,表现力是指可视化的结果使所有的数 据得到表现,而且没有其它的东西被引入;有效性是指可视化能够使用户充分发 现数据之间的关系和理解数据。 b r a t h 提出了一种评价可视化技术的三维静态表示效率的定量标准,主要是关 于曲线图的功能,但是,他没有涉及到可视化技术的交互功能。对每一个显示, 他测量数据点的数量( 反映数据密度) 、维的数量( 反映认知复杂度) 、闭塞率和 数据点的可识别程度。f r e i t a s 等的研究将b r a t h 的研究结果总结为认知复杂度和空 间组织两个标准。 9 北京交通人学硕十学位论文 与图形、图像有关的技术大都有美学上的要求,不同的图表绘制算法都遵循 各自的美学标准。可视化技术是以图形图像为基础的,其美学效果自然也受到关 注。历史上,研究者们制定出了一些可视化图表绘制算法的美学标准,具体内容 如表2 1 所示。 表2 - 1 可视化图表绘制算法的美学标准 f i g 2 1a e s t h e t i cs t a n d a r do fv i s u a l i z a t i o nc h a a ss c a l i n ga l g o r i t h m f r e i t a s 等认为已经出现的信息可视化技术的评价标准可以分为两大部分,首 先是可视化技术的视觉表现,其次是交互机制的问题。除此之外,还涉及到信息 可视化技术的使用数据的可用性。 从国内外的研究成果来看,关于可视化评价方面的研究已经有一些成果,这 些成果集中在对可视化方法的定性评价以及对可视化工具的评测研究上。 2 1 4 平行坐标可视化技术 平行坐标可视化方法是基于几何可视化技术的代表,也是最经典的以二维形 式表示多维数据的可视化方法之一。它的基本思想是在二维空间中采用等距离、 竖直的1 1 条平行坐标轴表示1 1 维空间,每条轴线对应于一个属性维度,坐标轴的 取值范围从对应属性的最小值到最大值均匀分布,将所有数据值在属性轴上用点 表示出来,再将n 条属性轴上的点用折线连接起来,即完成了原数据的平行坐标 可视化。 平行坐标的优点是表达数据关系非常简单、直观,易于理解。平行坐标技术 可以在有限的二维坐标平面上显示多维数据,并且没有数据丢失。另外,平行坐 标技术可视化速度快,有较高的效率。 平行坐标在应用上也有它的局限性,首先,对大数据集进行可视化时,由于 折线密度的增加,会产生大量交叠线,大大增加了认知复杂度。平行坐标能够表 达的维数取决于屏幕的水平宽度,维数的增加会引起垂直轴的相互靠近,此时辨 认数据的结构和关系就有些困难了。此外,平行坐标间的依赖关系很强,平行轴 的安排次序也是影响发现数据之间关系的重要因素。 1 0 可视化技术及度量模型研究 m , h m 图2 - 3i f i s 数据集的平行坐标可视化 f i g 2 3 t h e p a r a l l e l c o o r d i a a t c s v i s u a l i z a t l o a o f i r i s d a t a s c t 因此,学者们对平行坐标法进行了很多改进,这些改进有的是在原技术基础 上增加了功能和特性,有的是通过用户交互增强了其适用性,有的是增加了可视 化数据的进一步处理,使得可视他结果更加清晰。所有的这些改进都在一定程度 上弥补了平行坐标的局限性,扩大了其应用范围。 从平行坐标可视化技术的提出到现在在平行坐标应用得越来越广泛的同时, 人们也越来越清楚的意识到其缺点和局限性的存在。因此,研究者们陆续提出了 很多种平行坐标的改进技术,大大增强了平行坐标技术的应用能力。 ( 1 ) 分层技术嘲 分层平行坐标采用分层显示模式对数据集进行多种层次的显示,克服平行坐 标中数据显示混乱的缺点。 如图2 - 4 所示,分层平行坐标是由普通平行坐标演变而来的,其中显示的是聚 簇而不是像普通平行坐标一样显示单独的数据项。聚簇的平均值是一条穿过所有 坐标轴的拆线。折线周围的带表示聚簇覆盖的范围,带与坐标轴相交的上边缘是 簇中数据在该维上的最大值,下边缘为最小值。 北京交通太学硕士学位论文 。1 l 、】 酗2 - 4 分层平行坐标效果囤 f i 9 2 m h i e r a r c h i c a lp a r a l l e l c o o r d i n a t e s ( 2 ) 交换坐标轴技术 交换坐标轴技术是指,可以通过交换属性轴的位置改变其排列顺序,进而对 可视化的效果进行改变。 交换坐标轴可以更好的体现属性之间的关系,同时,通过试探性的调节坐标 轴之间的次序,也可以发现不同属性之间隐含的内在联系。 交换坐标轴可以改变可视化的效果因此,也带来了维度捧列的问冠。尽管 人们能够追踪平行坐标图里每一个个体的属性值,但揭示位置不相邻的属性之间 的关系是比较困难的。2 0 0 4 年,h u r l e y 提出了一种属性最优排列算法,这种算法 会把那些相似的属性轴耜邻排列。 ( 3 ) 圆形平行坐标技术 圆形平行坐标是对普通平行坐标的一个简单变换,在圆形平行坐标中属性 轴从圆心出发,向圆周扩展,可视化的效果看起来像是重叠的星形。如图2 5 所示。 蝉 圈2 - 5 圆形平行坐标的可视化效果 f i 9 2 - 5c i r e u l a f p a r a l m c o o r d i n a t e s 圆形平行坐标有这样的特点:越是靠近圆心的地方。线的分段越短;越是远 可视化技术及度量模型研究 离圆心的地方线的分段越长。小数值的数据会映射到靠近圆心的位置,大数值 的数据会映射到远离圆心的位置。正是由于这种小数值数据与大数值数据的不对 称性,数据集中的某一些特殊关系很容易通过圆形平行坐标这种方式发掘出来。 ( 4 ) 曲线技术【嘲 普通平行坐标与z 字形模式类似,其可视化效果在一定程度上受到了限制和 影响。为了减轻这个问题,有研究者提出用近似光滑的曲线替代直线,连接各个 数据点。这些近似光滑的曲线是建立在牢固的几何学基础上的,采用了曲线技术 的平行坐标可视化效果如图2 - 6 所示。 0 e c 。i k 图2 - 6 州曲线替代直线的平行坐标技术 f i 9 2 - 6 p a r a l l e l c o o r d i r l a t e 8 w i & a m i n s t e a d o f s l r a i s h t l i n e ( 5 ) 基于维约束的平行坐标技术【1 1 维约束条件下的平行坐标可视化本质上就是在数据读取的过程中设置一定的 约束条件,通过人机交互让用户参与到维的选择和属性阈值的设定中,利用约束 条件对数据进行过滤,从而使用户有选择地对数据进行可视化操作。维约束条件 下的可视化流程见图2 7 。 图2 - ? 维约柬条件下的可视化流程图 f i & 2 - 7 v i s u a l i z a t i o n p r o c e s s c a d e t a 拊i 州o n _ e $ 研c t i o n 维约束的限制主要体现在两个方面:一是对平行坐标中属性的选择,一是对 属性阈值的设定。对属性的选择是指可以选择属性全集的一个子集来进行可视化, 这样可以更快更清晰的认知数据。设定属性的阈值是指设定平行坐标中所选属性 北京交通人学硕士学位论文 的阈值,当某数据的对应属性值落在设定好的阈值范围内时,该数据将被可视化, 否则,将被过滤。可以通过改变属性阈值的大小来过滤要可视化的数据,从而有 效控制可视化数据的数量和质量。 2 2 常用权重算法简介 常见的确定权重的方法可以划分为三大类:主观赋权、客观赋权以及主客观 相结合的赋权。目前常用的权重算法主要有主观赋权法、客观赋权法、频度标度 法、层次分析法,这些算法各有其优点和缺点。下面以层次分析法为主,对这些 权重算法做介绍。 2 2 1 层次分析法 层次分析法( a h p ) 是美国运筹学家t l s a a t y 教授于上世纪7 0 年代中期提出 的一种定量与定性相结合的多目标系统决策方法。其基本思想是把一个复杂问题 分解成多个影响因素,再根据其相关性建立层次结构模型,接着对每一层次各元 素的相对重要性给出判断,构造判断矩阵;再进行层次单排序和层次总排序,最 后计算出各指标层的方案相对于目标层的相对重要性权型2 0 1 。 层次分析法将决策者的经验判断数量化,在目标因素结构复杂且缺乏必要数 据的情况下使用更为方便,因而在实践中得到广泛应用。 层次分析法的四个基本步骤如下: ( 1 ) 在确定决策的目标后,对影响目标决策的因素进行分类,建立一个多层 次结构。 ( 2 ) 比较同一层次中各因素关于上一层次的同一个因素的相对重要性,构造 成对比较矩阵。 ( 3 ) 通过计算,检验成对比较矩阵的一致性,必要时对成对比较矩阵进行修 改,以达到可以接受的一致性。 ( 4 ) 在符合一致性检验的前提下,计算与成对比较矩阵最大特征值相对应的 特征向量,确定每个因素对上一层次该因素的权重;计算各因素对于系统目标的 总排序权重并决策。 在应用层次分析法解决实际问题时,首先要把问题条理化、层次化,构造出 一个有层次的结构模型。在这个模型下,复杂问题被分解为元素的组成部分,这 些元素又按其属性和关系形成若干层次。上一层次的元素作为准则对下一层次的 相关元素起支配作用。 1 4 可视化技术及度量模型研究 在层次结构构造出来之后,需要对每一层的元素分别构造形如图2 8 的矩阵, 这里称为成对比较矩阵。 f 口l l 口1 2 口1 月1 彳笠l x 一2 l 玄a 2 2 二a 2 月l k 口一i2 a 栅 图2 8n 阶成对比较矩阵示意图 f i g 2 8p a i r i n g - c o m p a r i s o nm a t r i xw i t hnd e g r e e 在矩阵a 中,表示因素i 相对于因素j 的重要性程度,a = 1 a 玎,关于如 何确定的值,s a t t y 等人建议引用数字1 - 9 及其倒数作为衡量尺度,表2 2 列出 了1 - 9 各尺度的含义。 表2 2 层次分析法中各尺度的含义 t a b 2 - 2t h em e a n i n go f n u m b e r si na n a l y t i ch i e r a r c h yp r o c e s s 霍要尺度 含义 l 表示两个因謇相比。具有麓i 同重娶性 3 表示睡个因素相比。前者比詹者张重要 5 表示两个因素相比,前者比后者明显重要 7 表示两个因象糨沈,前者比后者强烈煎要 9 表示两个瞩紊相比,前嚣比后者极端鬟要 2 ,4 ,6 ,8表示上述相邻判断的中同值 这里应该指出的是,对同一层次的因素,每两个因素都做一次判断是必要的, 有人认为只需把所有因素都和某一因素比较就可以判断出所有因素间的重要性关 系,这种做法的弊病在于,任何一个判断的失误都可能导致不合理的排序,而个 别判断的失误对于难以定量的系统往往是难以避免的。对所有因素进行一次两两 比较可以从不同角度提供更多的信息,从而可以导出一个更加合理的排序。 在确定了成对比较矩阵a 之后,需要对其进行一致性检验,对矩阵进行一致 性检验的步骤如下: ( 1 ) 计算一致性指标c i a :生二! n l ( 2 1 ) 北京交通人学硕+ 学位论文 公式2 1 中,k 。是矩阵a 的最大特征值,1 1 为矩阵a 的阶数。 ( 2 ) 查找相应的平均随机一致性指标r i 从表2 3 中可以查出检验成对比较矩阵a 一致性的标准r i ,r i 称为平均随机 一致性指标,它只与矩阵阶数n 有关。 表2 3 矩阵阶数与r i 对照表 t a b 2 - 3c o m p a r i s o no f m a t r i x sd e g r e ea n dr i 矩阵阶数1234567891 0 r i 000 5 2o 8 91 1 21 2 61 3 61 4 11 4 61 4 9 ( 3 ) 计算一致性比例c r c r := c i r i ( 2 2 ) 当c r o 1 时,认为成对比较矩阵a 的一致性是可以接受的,否则应对判断 矩阵作适当修正。 综上所述,由于层次分析法在处理复杂的决策问题上的实用性和有效性,目 前,层次分析法在经济计划和管理、能源政策和分配、运输、教育、医疗、环境 保护等领域都得到了广泛的应用。 2 2 2 其他权重算法 除了层次分析法之外,常用的权重算法还有主观赋权法、频数标度法和主成 分分析法等。 主观赋权法的特点在于集中专家的经验与意见,确定各项指标的权数,而不 是随意设想的;频数标度法虽然应用方便,但会造成至少两个因素的重要性程度 没有区别,导致评价结果失真;主成分分析法客观性强,避免了人为赋权所造成 的偏差,缺点是新指标不可能完全反映原来指标的信息,有一定的偏差,适用于 有数据的样本。 1 6 平行坐标可视化度量模型p v m 的建立 3 平行坐标可视化度量模型p v m 的建立 本章通过对影响平行坐标可视化效果的因素进行分析,提取出了模型中的度 量指标,在研究并设计出各指标的算法之后,利用层次分析法确定各层指标的权 重情况,最终建立起了平行坐标可视化度量模型p v m 。 3 1 度量模型的研究背景及适用范围 3 1 1度量模型p v m 的研究背景和目标 目前,可视化技术在各行各业中都有着广泛的应用,然而,不同的可视化技 术有不同的特点,每种技术都有自己的适用范围。到目前为止,相关的研究工作 主要集中在对应用了可视化技术的工具的评测,以及对可视化技术的定性评估上, 对可视化技术的定量评测研究得还较少。 平行坐标可视化是数据可视化的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论