(检测技术与自动化装置专业论文)gis及空间数据挖掘技术在流程工业中的应用.pdf_第1页
(检测技术与自动化装置专业论文)gis及空间数据挖掘技术在流程工业中的应用.pdf_第2页
(检测技术与自动化装置专业论文)gis及空间数据挖掘技术在流程工业中的应用.pdf_第3页
(检测技术与自动化装置专业论文)gis及空间数据挖掘技术在流程工业中的应用.pdf_第4页
(检测技术与自动化装置专业论文)gis及空间数据挖掘技术在流程工业中的应用.pdf_第5页
已阅读5页,还剩73页未读 继续免费阅读

(检测技术与自动化装置专业论文)gis及空间数据挖掘技术在流程工业中的应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

浙江大学硕士学位论文 摘要 流程工业在国民经济的发展中扮演重要角色。随着市场竞争的日益激烈,越 来越多的流程工业企业开始实施c i m s ( c o m p u t e ri n t e g r a t e dm a n u f a c t u r i n g s y s t e m ) 。目前大多数c i m s 系统以实时数据库和关系数据库为核心,提供信息 服务、统计分析和决策支持等各种功能,但是这些服务往往缺乏直观性,而企业 的很多数据都是与地理( 空间) 位置有关的信息,原有的数字、文字、表格等形式 难以直观地描述地理位置信息,具有一定的局限性和不足。 针对流程工业c i m s 的特点,结合g i s 和空间数据挖掘技术在描述和处理空 间信息时强大的表达和处理能力,将g i s 和空间数据挖掘技术运用于流程工业 c i m s 信息服务和决策支持系统,是实现流程工业c i m s 的信息查询、分析、预测、 评价和决策的一种新的、有效的途径,对促进流程工业c i m s 的发展具有重要的 意义。 本文的主要内容包括: 对g i s 、空间数据挖掘理论以及流程工业c i m s 做了相关的介绍,提出了基 于g i s 的g - c i m s 模型,对该模型的组成以及实现做了探讨,同时讨论了g i s 以 及空间数据挖掘在该模型的各个模块中的应用。 将g i s 与空间数据挖掘技术应用到流程工业c i m s 中,并结合流程工业的特 点,讨论了利用r o u g hs e t 理论对数据进行预处理的方法;另外,针对大数据量 下传统的最短路径算法d i j k s t r a 算法比较慢的特点,结合m a p x 对空间数据处理 的强大能力,提出了基于m a p x 的改进d i j k s t r a 算法,经验证,该方法可以明显 得提高最短路径算法的速度。 在应用方面,将g i s 与空间数据挖掘应用于流程工业,开发了基于g i s 的流 程工业g c i m s 系统,该系统在直观性,方便性以及可扩展性方面都显示出了良 好的特性,能够对整个厂区的状况进行全局掌握,在更好地应对突发事件的发生 的同时,还可以结合空间数据挖掘实现辅助决策功能。对该系统从设计理念到功 能实现做了详细的介绍并将实际项目中遇到的关键问题以及相应的解决方法做 了论述。 最后,针对本文中所提到的系统的缺点和不足对g i s 及空间数据挖掘技术在 流程工业中进一步的应用前景做了展望。 关键词:g i s 空间数据挖掘流程工业c i m s 粗糙集最短路径算法 塑笙奎兰堡主堂堡丝苎 a b s t r a c t t h ep r o c e s si n d u s t r yp l a y sa l le s s e n t i a lr o l ei nc o u n t r ye c o n o m yw i t ht h ed e v e l o p m e n to f e c o n o m y , c i m si sa p p l i e di nm o r ea n dm o r ep r o c e s si n d u s t r yc o m p a n i e s n o w a d a y s ,m o s to f c 1 m si sc o r e dw i t hr e a lt i m ed a t a b a s ea n dr e l a t i o n a ld a t a b a s ea n dp r o v i d e sf u n c t i o n si n c l u d i n g v a r i o u so fi n f o r m a t i o ns e r v i c e s ,s t a t i s t i c sa n da n a l y s i s ,d e c i s i o n - m a k i n ga s s i s t a n c e b u tt h ed e f e c t o f t h e s e f u n c t i o n s i s l a c k o f v i s i b i l i t y i n f a c t ,m o s t o f d a t a o f t h ec o m p a n y i sr e l a t e d t os p a t i a ld a t a a n dn u m b e r , c h a r a c t e ra n dc h a r ti sh a r dt oe x p r e s st h ei n f o r m a t i o na b o u ts p a t i a ld a t a , s ot h e c u s t o m a r ys y s t e mi si n s u f f i c i e n c y a i m e da tt h ec h a r a c t e r i s t i co fp r o c e s si n d u s t r y , c o m b i n e dw i t ht h ep o w e r f u la b i l i t yo fg i s a n ds p a t i a ld a t am i n i n gw h i c he x p r e s sa n dp r o c e s ss p a t i a ld a t a , i ti san e ww a yt or e a l i z et h e i n f o r m a t i o nq u e r y , a n a l y s i s ,p r o g n o s t i c a t i o na n dd e c i s i o n - m a k i n gf u n c t i o n so fc i m sw i t hg 1 s a n ds p a t i a ld a t am i n i n ga p p l i e di ni n d u s t r yc i m sa n dm a k e ss e n s et op r o m o t et h ed e v e l o p m e n to f c i m s f o l l o w i n ga r et h em a i nc o n t r i b u t i o n so f t h i st h e s i s : g i s ,s p a t i a ld a t am i n i n ga n dp r o c e s si n d u s t r yc i m sa r ei n t r o d u c e da n dan e wm o d e lo f c i m sw i t hb a s e do ng i sc a l l e dg c i m si sp u tf o r w a r d t h ef o r ma n dr e a l i t yo ft h em o d e la r e d i s c u s s e da n dt h ea p p l i c a t i o no f g i sa n ds p a t i a ld a t am i n i n gi ne a c hm o d u l eo f t h em o d e li sa l s o i u t r o d u c o d a p p l i e dw i t hg i sa n ds p a t i a ld a t am i n i n gi nc 1 m sa n da i m e da tt h ec h a r a c t e r i s t i co fp r o c e s s i n d u s t r y , t h em e t h o dw i t hr o u g hs e tt h e o r yw h i c hi su s e dt od a t ap r e p r o c e s s i n gi sd i s c u s s e d a l s o w i t ht h ep r o b l e mo ft h a tt h es p e e do ft h ec l a s s i c a ls h o r t e s tp a t ha l g o r i t h mc a l la d a p tt ot h e r e a l - t i m er e q u e s ti ng i sw h e nt h e ya r eu s e dt od e a lw i t ht h eh u g ed a t a , a 1 1i m p r o v e dd i j k s t r a a l g o r i t h mi sp u tf o r w a r du s i n gt h ep o w e r f u la b i l i t yo fm a p xt op r o c e s ss p a t i a ld a t a t h e a l g o r i t h mi sr e a l i z e da n dt h er e s u l ti ss a t i s f i e d i na p p l i c a t i o na s p e c t ,an e ws y s t e mc a l l e dg - c i m si sd e v e l o p e dc o m b i n e dg 1 sa n ds p a t i a l d a t am i n i n gw i t hp r o c e s si n d u s t r yc i m s t h ev i s i b i l i t y , c o n v e n i e n c ea n de x t e n d i b i l i t yo ft h e s y s t e mi ss a t i s f i e d t h ei n t e g e ro f t h ec o m p a n yc a nb ec o n t r o l l e d a n di ti sm o r ec o n v e n i e n tt o d e a lw i t hs u d d e ne v e n 乜a l s ot h ef u n c t i o no fd e c i s i o n - m a k i n ga s s i s t a n c ew i 也s p a t i a ld a t am i n i n g i sr e a l i z e d t h ed e s i g nc o n c e p t i o na n dt h ew a yt or e a l i z eo f t h es y s t e mi si n t r o d u c ei nd e t a i l ,a l s o t h e p r o b l e m sa p p e a r e d i n t h e p r o c e s s o f d e v e l o p m e n t a n d t h e w a y t os o l v e t h e m a r e d i s c u s s e d i nt h ee n d ,t h ef o r e g r o u n do f o l sa n ds p a t i a ld a t am i n i n ga p p l i e di np r o c e s si n d u s t r yc i m si s d i s c u s s e dt os o l v et h ed e f e e to f t h es y s t e m k e yw o r d s :g i ss p a t i a ld a t am i n i n gp r o c e s si n d u s t yc i m sr o u g hs e t s h o r e s tp a t h a l g o r i t h m 浙江大学硕士学位论文 第一章绪论 i i 引言 流程工业包括了石化、冶金、电力、轻工、制药、造纸、环保等在国民经济 中占主导地位的行业,我国流程工业企业年产值占全国工业企业年总产值的6 6 ( 1 9 9 9 年) 。流程工业的发展状况直接影响国家的经济基础。随着市场竞争 的日益激烈,越来越多的流程工业企业开始实施c i m s ( c o n t e m p o r a r yi n t e g r a t e d m a n u f a c t u r i n gs y s t e m ,综合自动化系统) ,通过建立集监督控制、在线优化、 生产调度、企业管理、经营决策等功能于一体的流程工业c i m s ,形成节能降耗、 少投人多产出的高效生产模式,已成为流程工业自动化发展的一个必然趋势“。 目前大多数c i m s 系统以实时数据库和关系数据库为核心,提供各种信息服务、 统计分析和决策支持等功能,但是这些服务往往缺乏直观性,而企业的很多数据 都是与地理( 空间) 位置有关的信息,原有的数字、文字、表格等形式难以直观描 述地理位置信息,其有一定的局限性和不足。 地理信息系统g i s ( g e o g r a p h ic a li n f o r m a ti o ns y s t e m ) 是一个以地理数据 为研究对象,以空间数据库为核心,采用多种数据分析和建模方法,实时提供多 种空间和动态资源与环境信息,为科研、管理与决策服务的计算机应用系统,它 将数据库和地理分析优势结合在一起,用平面图或者立体图描述分析对象的空间 关系“1 。g i s 技术目前已在国防、城市规划、交通运输、消防应急、防汛指挥、 环境监测和保护等与国民经济乃至国家命脉相关的重要领域取得了成功的应用, 极大地推动了社会生产力的发展,目前已成为世界各国激烈竞争的高科技热点之 一。 空间数据挖掘( s p a t i a ld a t am i n i n g ,s d m ) ,或称“从空间数据库中发现知 识”( k n o w l e d g ed i s c o v e r yf r o ms p a t i a ld a t a b a s e ) ,是指从空间数据库中提 取用户感兴趣的空间模式与特征、空间与非空间数据的普遍关系及其它隐含在空 间数据库中的普遍的数据特征。空间数据挖掘对于理解空间数据,寻找空间与非 空间数据之间内在关系,以简洁方式表达空间数据规律起着重要作用。s d m 可 广泛地应用在智能g i s 、遥感影像处理和气象预报等领域。 针对流程工业c i m s 的特点,结合g i s 和空间数据挖掘技术在描述和处理与 空间相关的信息时强大的表达和处理能力,将g i s 和空间数据挖掘技术运用于流 程工业c i m s 信息服务和决策支持系统,是实现流程工业c i m s 的信息查询、分析、 预测、评价和决策的一种新的、有效的途径,对促进流程工业c i m s 的发展具有 浙江大学硕士学位论文 重要的意义。 1 2g i s 及空间数据挖掘技术简介 1 2 1g i s 技术 地理信息是指表征地理系统要素的数量、质量、分布特征、相互联系和变化 规律的数字、文字、图像和图形等的总称。地理信息属于空间信息,其位置的识 别是与数据联系在一起的。地理信息系统( g i s ) 是以地理空间数据库为基础,在 计算机软硬件的支持下,对空间相关数据进行采集、管理、操作、分析、模拟和 显示,并采用地理模型分析的方法,适时提供多种空间和动态的地理信息,为地 理研究和地理决策服务而建立起来的计算机系统,简而言之,地理信息系统是有 关空间数据管理和空间信息分析的计算机系统。 g i s 技术主要具有如下一些功能特征: ( 1 ) 空间信息的可视化 信息的传统表现方法局限于数字、文字、表格等枯燥形式。g i s 技术提供了 对现实世界空间关系的模拟,将空间信息和属性信息集成管理,它可以将空间数 据之间隐含的关系和发展趋势清晰直观地表现出来,通过图形可视化来表达资源 的数量、质量、分布、特征和开发条件,分析研究资源的合理开发利用,为工厂 管理决策提供科学依据,为生产实践提供信息和指导,而这是传统的表格和数据 库无法表达的。 ( 2 ) 空间信息的查询 空间查询是g i s 的基本功能,g i s 的操作查询对象是数字化地图中表示地理 实体的对象化符号,及其各自的空间和属性信息,区别于其他信息系统,可对空 间数据库中的记录按属性字段、空间位置等要求进行双向查询,一是根据单位、 名称等关键字检索数据库,以图标的方式定位显示查询结果,并以列表方式显示 其属性,二是根据属性信息对应醒目显示图形信息,使属性信息与图形一一对应。 ( 3 ) 空间信息的统计 g i s 的信息统计功能指在各种不同条件下的各类信息的统计功能,这些条件 包括:特定地理位置、行政区划、时间、特定属性等。通过设定时间、空间、属 性条件进行统计,并将统计结果以图文一体的报表输出。g i s 中的专题图技术能 提供基于地图的多种样式的专题图显示,如点密度、等级符号、独立值、标签、 柱状图、饼状图等等。 ( 4 ) 空间信息的分析 空间信息的分析是g i s 的核心功能,也是有别于其他信息系统的突出特征。 6 i s 的空间分析可分为三个不同的层次:空间检索、空间拓扑叠加分析和空间模 2 浙江大学硕士学位论文 型分析。空间索引是空间检索的关键技术,如何有效地从大型的g i s 系统数据库 中检索出需要的信息,是影响g i s 分析能力的重要因素。空间拓扑叠加实现了输 入要素属性的合并以及要素属性在空间上的连接,其本质是在空间意义上的布尔 运算。空间模型分析是在g i s 的支持下,分析和解决显示世界中与空间相关的问 题,它是g i s 应用深化的标志。 1 2 2 空间数据挖掘技术 空间数据挖掘是数据挖掘的一个重要分支,随着大量数据从遥感、地理信息 系统、多媒体系统、医疗和卫星图像等多种应用中收集出来,这些数据的复杂程 度和数据量都远远超出人脑的分析能力,由用户对这些数据进行详细的检测试 按规的,也是不现实的。空间数据库具有保存这些由空间数据类型和对象的空间 关系来表示的空间对象的能力,空间数据挖掘就在这种背景下产生了。 空间数据挖掘不同于一般的数据挖掘。关系型数据挖掘的算法假定数据是独 立的,而在空间数据库中一个对象可能会受其邻近若干对象的影响,数据之间也 许相互依赖。因此,必须利用诸如空间数据结构、空间推理、计算几何学等已有 的技术,将传统的数据挖掘技术拓展至空间数据挖掘领域,以便更好的分析复杂 空间现象和空间对象。 空间数据挖掘的目的正式这样一个知识发现的过程自动化。它在以下方面起 着重要的作用:抽取有意义的空间模型和特征;获取空间数据和非空间数据之间 的内在的,固有的联系;在高级概念层上简明地描述数据的规则性:有助于重新 组织空间数据库,以适应数据的语意,获得更好的性能。 空间数据挖掘可以辅助我们更好的游览空间数据库,理解空间数据,发现空 间联系以及空间数据与非空间数据之间内在地隐含关系,重组空间数据库,构建 空间知识库,优化空间查询等。因此,空间数据挖掘技术在地理信息系统、信息 融合系统、城市规划与建设。国土资源管理、导航、军事指挥、图像数据库、医 疗图像处理等使用空间数据库的领域具有非常广泛的用途m j 。 1 3g i s 和空间数据挖掘的研究现状 1 3 1g l s 的研究现状 地理信息系统的发展始于2 0 世纪6 0 年代,当时国外从空间数据的地学处理入 手,开始了对其技术与方法的研究。世界上第一个g i s 是1 9 6 3 年t o m l i n s o n 等人 建立的加拿大地理信息系统c g i s ,用于自然资源的管理与规划。到7 7 0 年代,由 浙江大学硕士学位论文 型分析。空问索引是空间检索的关键技术,如何有效地从大型的g i s 系统数据库 中检索出需要的信息,是影响g i s 分析能力的重要因素。空间拓扑叠加实现了输 入要素属性的合并以及要素属性在空间上的连接,其本质是在空间意义上的布尔 运算。空间模型分析是在g i s 的支持下,分析和解决显示世界中与空间相关的问 题,它是g 1 s 应用深化的标志。 1 2 2 空问数据挖掘技术 空间数据挖掘尾数据挖掘的一个重要分支,随着大量数据从遥感、地理信息 系统、多媒体系统、医疗和卫星图像等多种应用中收集出来,这咎数据的复杂程 度和数据量都远远超出人脑的分析能力,由用户对这些数据进行详细的检测试 按规的,也是不现实的。空间数据库具有保存这些由空间数据类型和对象的空间 关系来表示的空间对象的能力,空间数据挖掘就在这种背景下产生了。 空间数据挖掘不同于一般的数据挖掘。关系型数据挖掘的算法假定数据是独 市的,而在空间数据库中一个对象可能会受其邻近若干对象的影响,数据之间也 许相互依赖。闻此,必须利用诸如空间数据结构、空间推理、计算几何学等已有 的技术将传统的数据挖掘技术拓展至空间数据挖掘领域,以便更好的分析复杂 空间现象和空间对象。 空间数据挖掘的目的正式这样一个知识发现的过程自动化。它在以下方面起 着重要的作用:抽取有意义的空间模型和特征;获取空间数据和非窄间数据之间 的内在的,固有的联系;在高级概念层上简明地描述数据的规则性:有助于重新 组织空间数据库,以适应数据的语意,获得更好的性能。 空问数据挖掘可以辅助我们更好的游览空问数据库,理解空间数据,发现卒 间联系以及空间数据与非空间数据之间内在地隐含关系,重组空间数据库,构建 空间知识库,优化空间查询等。因此,空间数据挖掘技术在地理信息系统、信息 融合系统、城市规划与建设。国土资源管理、导航、军事指挥、图像数据库、医 疗图像处理等使用空间数据库的领域具有非常广泛的用途【3 7 l 。 1 3g i s 和空间数据挖掘的研究现状 1 3 1g i s 的研究现状 地理信息系统的发展始于2 0 世纪6 0 年代,当时国外从空间数据的地学处理入 手,开始了对其技术与方法的研究。世界上第一个g i s 是1 9 6 3 年t o m l i d s o n 等人 建立的加拿人地理信息系统c g i s ,用于自然资源的管理与规划。到了7 0 年代,由 建立的加拿大地理信息系统c g i s ,用于自然资源的管理与规划。到了7 0 年代,由 浙江大学硕士学位论文 型分析。空间索引是空间检索的关键技术,如何有效地从大型的g i s 系统数据库 中检索出需要的信息,是影响g i s 分析能力的重要因素。空间拓扑叠加实现了输 入要素属性的合并以及要素属性在空间上的连接,其本质是在空间意义上的布尔 运算。空间模型分析是在g i s 的支持下,分析和解决显示世界中与空间相关的问 题,它是g i s 应用深化的标志。 1 2 2 空间数据挖掘技术 空间数据挖掘是数据挖掘的一个重要分支,随着大量数据从遥感、地理信息 系统、多媒体系统、医疗和卫星图像等多种应用中收集出来,这些数据的复杂程 度和数据量都远远超出人脑的分析能力,由用户对这些数据进行详细的检测试 按规的,也是不现实的。空间数据库具有保存这些由空间数据类型和对象的空间 关系来表示的空间对象的能力,空间数据挖掘就在这种背景下产生了。 空间数据挖掘不同于一般的数据挖掘。关系型数据挖掘的算法假定数据是独 立的,而在空间数据库中一个对象可能会受其邻近若干对象的影响,数据之间也 许相互依赖。因此,必须利用诸如空间数据结构、空间推理、计算几何学等已有 的技术,将传统的数据挖掘技术拓展至空间数据挖掘领域,以便更好的分析复杂 空间现象和空间对象。 空间数据挖掘的目的正式这样一个知识发现的过程自动化。它在以下方面起 着重要的作用:抽取有意义的空间模型和特征;获取空间数据和非空间数据之间 的内在的,固有的联系;在高级概念层上简明地描述数据的规则性:有助于重新 组织空间数据库,以适应数据的语意,获得更好的性能。 空间数据挖掘可以辅助我们更好的游览空间数据库,理解空间数据,发现空 间联系以及空间数据与非空间数据之间内在地隐含关系,重组空间数据库,构建 空间知识库,优化空间查询等。因此,空间数据挖掘技术在地理信息系统、信息 融合系统、城市规划与建设。国土资源管理、导航、军事指挥、图像数据库、医 疗图像处理等使用空间数据库的领域具有非常广泛的用途m j 。 1 3g i s 和空间数据挖掘的研究现状 1 3 1g l s 的研究现状 地理信息系统的发展始于2 0 世纪6 0 年代,当时国外从空间数据的地学处理入 手,开始了对其技术与方法的研究。世界上第一个g i s 是1 9 6 3 年t o m l i n s o n 等人 建立的加拿大地理信息系统c g i s ,用于自然资源的管理与规划。到7 7 0 年代,由 浙江大学硕士学位论文 于计算机处理能力的飞速发展和环境、资源等问题日益突出,g i s 技术开始进入 实用阶段,出现了g i s 应用系统。8 0 年代是g i s 大发展的时期,技术逐渐走向成熟, 专业制造商开始出现,商业化的实用系统进入市场,应用领域迅速扩大”。国外 地理信息系统现已进入了产业化阶段,涌现出一大批以g i s 为核心的信息技术产 业公司。目前具有代表性的较著名的国# f g i s 软件有:a r c i n f o ,t i g r i s ,s p a n s , m a p i n f o ,g e n a m a p ,e r d a s 等。 我国g i s 的研究起步于2 0 世纪8 0 年代初期,早期以引进国外的地理信息系统 软件为主。随着国内g i s 基础研究的发展以及应用领域的不断扩大,基于国内g i s 应用领域的广阔市场和良好发展前景,国内开始独立研制开发适合i 雪情的g i s 软 件产品。9 0 年代相继有一些国内的g i s 软件产品问世,国内较著名的m a p g i s , g e o s t a r ,c i t y s t a r ,s u p e r m a p ,m a p e n g i n e 等。虽然中国地理信息系统事业起步 较晚,但取得了重大的进展。目前地理信息系统现正在向产业化方向发展,并已 成功地应用于众多个领域。 1 3 2 空间数据挖掘的研究现状 人们关注从空间数据库中发现只是仅仅是近几年的事情,所作的研究工作业 主要集中在扩充关系数据库挖掘的方法上。国内外专家对一些由较成熟、完善的 数据挖掘技术延伸而来的空间数据挖掘技术作了大量讨论。但以上这些工作、讨 论都较多的偏重于理论,而在实现上较为薄弱,其中较成功的是g e o m i n e r 系统 的建立。 加拿大s i m o n 大学计算机系的h a n j i a w e i 教授领导的小组曾在m a p l n f o 、 e s r i o r a c l es d e 平台上以及该小组所研发的关系型数据挖掘系统d b m i n e r 基础 上,建立了空间数据挖掘的原型系统g e o m i n e r ,但到目前为止该系统已实现的 知识发现模块只有空间特征规则发现( c h a r a c t e r i s t i cr u l e s ) 、空间比较规则 发现( c o m p a r i s o nr u l e s ) 以及空间关联规则发现( a s s o c i a t i o nr u l e s ) 三大 模块。 另外,在挖掘图像数据库的空间数据挖掘方法上国外专家也作了许多实质性 的研究,在框架的研究以及区分图像上都获得了一定的成果。相继研究了卫星图 像的星系分类、火山分类等应用,在专业领域发挥了预想作用。 1 4 本文的主要工作 基于以上的分析,本文围绕g i s 和空间数据挖掘在流程工业中的应用展开。 g i s ( 地理信息系统) 是地域空间信息分析处理的有效的武器,空问数据挖掘技 浙江大学硕士学位论文 术可以从得到的大量的非空问信息和空间信息中寻找到有用的知识来支持决策, 而随着流程工业的高速发展,生产厂区和生产过程日益复杂化,如何将g i s 和空 间数据挖掘有机的结合起来,对流程工业的生产和安全提供有益的决策和保障, 对流程工业中的突发事件提供快速的响应和救援成为当前的一个课题。针对这个 课题,本文对以下问题做了论述: 1 、g i s 和空间数据挖掘的基础理论。 2 、集成g i s 的流程工业g c i m s 模型以及g i s 在该模型中各个模块中的应用。 3 、针对流程工业中数据的不确定性,讨论了用r o u g hs e t 理论对数据进行 预处理的方法。 4 、为快速、高效地应对流程工业中突发事件,提出了基于m a p x 的改进的 d i j k s t r a 最短路径算法,并与传统算法在效率上进行了比较。 5 、一个具体的开发实例,即g - c i m s 系统的设计与实现,以及一些开发过程 中的关键技术以及方法。 浙江大学硕士学位论文 第二章g i s 和空间数据挖掘 2 1g i s 技术 地理信息系统( g e o g r a p h i ci n f o r m a t i o ns y s t e m 简称g i s ) 是以空间地理分布 的数据为研究对象、利用空间数据库进行存储,采用空间分析和建模的方法,为 科研、管理以及决策提供动态的、空间的资源以及环境信息服务的计算机技术系 统。g i s 可以从视觉、计算和逻辑上对现实空间从功能上进行模拟,通过计算机 程序的运行和各类数据的变换对各类信息变化进行仿真。具有一定地学知识的用 户还可以在地理信息系统的支持下提取现实空间不同侧面、不同层次的空间和时 间特征,快速模拟自然过程的演变或思维过程的轨迹,取得预测或“试验”的结 果,选择最优方案。 2 1 1g i s 的定义 对于g i s 的定义,有三种观点,即地图、数据库与空间分析的观点。地图观 点的定义侧重于制图有关的内容,因此地理信息系统被视为一个地图分析与处理 系统;数据库观点的地理信息系统定义则侧重于数据库设计与实现的完美性,一 个复杂的数据库管理系统被视为地理信息系统不可分割的一部分;空间分析观点 的定义则侧重于分析和建模,地理信息系统被视为一门空间信息科学而不仅是一 门技术。 按照1 9 9 8 年美国国家地理信息与分析中心的定义,地理信息系统 ( g e o g r a p h i ci n f o r m a t i o ns y s t e m 简称g i s ) ,是一种为了获取、存储、检索、 分析和显示空间定位数据而建立的计算机化的数据库管理系统。此定义由两部分 组成。一方面,地理信息系统是一门学科,是描述存储、分析和输出空间信息的 理论和方法的一门新兴的交叉学科;另一方面,地理信息系统是个技术系统, 是以地理空间数据库( g e o s p a t i a d a t a b a s e ) 为基础,采用地理模型分析方法, 适时地提供多种空间的动态的地理信息,为地理研究和地理决策服务的计算机系 统。g i s 的基础是空间数据库,而空间数据挖掘的挖掘对象又是空间数据库中的 空间对象,因此共有的空间数据库为空间数据挖掘与g i s 的结合提供了最为基本 也是最为重要的先决条件。自从1 9 6 3 年由加拿大测量学家r f t o m l i s o n 提出并建 立起第一个g i s 系统后,g i s 以“星火燎原”之势,在世界各地迅速发展起来,特 别是近几年,g i s 发展非常迅猛,各种g i s 应用软件包层出不穷,并在功能上更强 大,应用上更方便,界面上也更友好,这些改进使得g i s 的优点更加明确,与各 种系统的结合更加高效,并且可以使这种有效的集成所适用的领域更广泛以尽可 6 浙江大学硕士学位论文 能满足不同用户的需求。g i s 这种自身较好的发展势头,为空间数据挖掘与g i s 的结合提供了良好的可行性。 在现代信息社会里,g i s 作为一种把地理空间特征和各种统计信息集成为一 体的特殊信息系统。是信息高速公路上的重要组成部分,受到全社会的广泛关注, 也成为目前国内外地学领域热门的研究课题。其应用领域也随着该学科的发展而 不断扩大、完善,已经从传统的自然资源管理、土地规划等领域向商业、交通、 军事等领域进一步扩展,在城市交通规划管理、地方政府部门以及城市基础设施 管理等越来越广泛的领域发挥其重要的作用。空间数据挖掘需要大量的空间数据 作为挖掘对象,更为重要的是空间数据挖掘需要通过实际的应用来体现其辅助决 策的强大作用,g i s 所涉及的应用领域的蓬勃发展,为空间数据挖掘的实用性提 供了可靠的保障。 2 1 2g i s 的组成 地理信息系统主要由四部分组成,即计算机硬件系统、计算机软件系统、地 理空间数据和系统开发、管理与使用人员。 2 1 2 1 计算机硬件系统 地理信息系统的硬件系统一般由计算机与一些外围设备组成( 见图2 1 ) 。计 算机是硬件的核心,用作数据和信息的处理、加工与分析。外围设备包括数据的 采集设备,如数字化仪、扫描仪、解析测图仪等。数字化仪用来将地图转换成数 字形式( 矢量格式) ,扫描仪用来扫描输入栅格数据,或再经计算机矢量化处理后 成为数字形式。解析测图仪可从遥感影像上采集空间数据。数据可以通过以上这 些外围设备以计算机联机方式输入,也可由数字测图部门直接提供。g i s 的输出 和存储设备也是标准的计算机外围设备。输出设备有绘图仪及高分辨率显示器 等,而大容量硬盘、光盘则可用来存储大量的空间地理数据。 浙江大学硕士学位论文 图2 - 1g i s 的主要硬件组成 网 络 2 1 2 2 计算机软件系统 计算机软件系统是指g i s 运行所必须的各种程序及有关资料。主要包括计算 机系统软件、地理信息系统软件和应用分析软件三部分。 计算机系统软件:它是由计算机厂家提供的为用户开发和计算机使用提供方 便的程序系统。通常包括操作系统、汇编程序、编译程序、数据库管理系统以及 各种维护手册等。 地理信息系统软件:地理信息系统软件应包括5 类基本模块,即数据输入和校 验、数据变换、数据存储和管理、数据输出和表示、用户接口等。将遥感数据、 地图数据、统计数据和文字报告转换成计算机识别的数字形式,数据存储和数据 库管理涉及地理元素( 表示地物的点、线、面) 的位置、连接关系以及属性数据如 何构造和组织,使其便于计算机和系统用户理解。从数据库中消除错误,更新数 据与其他数据库进行匹配以及对大量的数据进行分析,将原始数据以及分析处理 过的数据按照客户的需求进行显示。 应用分析软件:应用分析软件是指系统开发人员或用户根据地理信息或区域 分析的模型编制的用于某种应用任务的程序,是系统功能的扩充和延伸。应用程 序作用于地理专题数据或区域数据,构成g i s 的具体内容,这是用户最为关心的 真正用于地理信息分析的部分,也是从空间数据中提取地理信息的关键。用户进 行系统开发的大部分工作是开发应用程序,而应用程序的水平在很大程度上决定 一个地理信息系统实用性的优劣。 2 1 2 3 地理数据 地理数据是g i s 的操作对象,它实质上就是指以地球表面空间位置为参照, 浙江大学硕士学位论文 描述自然、社会和人文经济景观的数据,主要包括数字、文字、图形、图像和表 格等。这些数据来自室内地图数字化、遥感图像解析、外景采集或从其他数据转 换。地理数据类型可分为空间数据和属性数据,并与关系数据库相互连接。 2 1 2 4 系统的管理与使用人员 g i s 应用的关键是应用g i s 来解决现实问题的人员的素质,包括从事g i s 系统 和应用系统开发的专业人员,也包括采用g i s 完成日常工作的最终用户。 2 1 - 3g i s 的功能和应用 国际上g i s 的开发己进入专业化、商业化的阶段。尽管目前g i s 应用软件包的 优缺点各不相同,而且其实现g i s 功能所采用的技术也各有各法,但是大多数g i s 应用软件包都提供了如下功能:数据的获取( d a t aa c q u i s i t i o n ) 、数据的存储及 检索( s t o r a g da n dr e t r i e v a l ) 、数据的初步处理( p r e l i m i n a r yd a t a p r o c e s s i n g ) 、图形的显示与交互( d i s p l a ya n di n t e r a c t i o n ) 以及数据的查询与 分析( s e a r c ha n da n a l y s i s ) 五大功能。图2 2 说明了这些功能之间的关系,以及 它们操作( m a n i p u l a t i o n ) 数据的不同表现。 图2 - 2g i s 功能概述( 椭圆) 以及它们的表现( 矩形) 9 浙江大学硕士学位论文 从图中可以看出,数据获取是指从现实世界的观测以及从现存文件或地图中 来获取空间数据。有些数据虽然己经是数字化的形式,但是一般需要进行数据预 处理,将原始数据转换为结构化的数据。使其能够被系统查询和分析。查询分析 是求取数据的子集或对其进行转换,并交互显示结果。在整个处理过程中,都需 要数据存储检索以及交互表现这两大功能的支持,换言之,这两项功能贯穿了地 理信息系统数据处理的始终。 地理信息系统目前在各行各业都碍到了应用。例如:资源清查、灾害监测、 城乡规划、城市管网、土地调查等。而且随着社会信息化的发展以及g i s 自身的 优势,g i s 必将会得到更为广泛的应用。 2 1 4g | s 的发展趋势 近年来地理信息系统技术发展迅速,计算机领域的许多新技术,如面向对象 技术、三维技术、虚拟现实技术、图象处理和人工智能等都开始直接应用到地理 信息系统中,当前地理信息系统研究中的热点领域有以下几个方面: 1 、c o m g i s 的研究:c o m g i s 当前是一种全新的g i s 软件技术体系,鉴于c o m 技术具 有语言无关性、进程透明性、可重用性等优点,使得目前基于c o m 的a c t i v e x 技术与可视化语言成为g i s 软件开发的主流。应用这种开发方式可以对应用程 序的局部进行更新,保持其它功能不变,而不必对整个系统进行升级。它的 开发不需要专门的g i s 语言,可以直接嵌入至t j m i s 开发工具中。 2 、面向对象g i s ( o o g i s ) 的研究:o o g i s 研究的兴起缘于o o g i s 能使g i s 系统能更 好地反映现实地理空间各种空间要素及其相互关系,甚至空间现象与过程。 面向对象的g i s 中所有的地物以对象形式封装,用户可以在现有抽象数据类型 和空间操作箱上定义自己所需的数据类型和空间操作方法,增强了系统的可 扩充性,为g i s 的智能化发展奠定了基础。 3 、分布式,w w w 技术与g i s 的结合:目前随着i n t e r n e t 技术的迅猛发展,其应用 已经深入到各行各业,作为与我们曰常生活息息相关的地理信息系统也不例 外。它们的结合产生了w e b g i s ,这主要是由于大多数的客户端应用采用了w _ l l w 协议万维网,它的基本思想就是在万维网上提供空间信息,让用户通过浏览 器获取和浏览一个空间信息系统中的数据。 4 、虚拟实现、三维可视化g i s 研究:虚拟现实技术与计算机网络技术和地学相结 合可以产生虚拟地理环境,由于虚拟地理环境为地学工作者提供了可重复的 信息模拟实验的可能,任何一个地学分析模型都可以由其他人在虚拟地理环 境中运行模拟,受到检验,从而加速地学理论的发展与成熟,在某种意义上 来讲,也极大地推动了地理信息系统的迅猛发展。在三维可视化领域,支持 0 浙江大学硕士学位论文 真正的三维矢量和栅格数据模型及以此为基础的三维空间数据库,将解决三 维空间操作和分析问题,极大提高g i s 的空间分析功能。 5 、g i s 与g p s 及r s 的集成:g i s 、g p s 与r s 是目前对地观测系统中空间信息获取、 存储管理、更新、分析和应用的三大支撑技术,是现代社会持续发展、资源 合理规划利用、自然灾害动态监测与防治等的重要技术手段,也是地学研究 由定性化走向定量化方向的科学方法之一。 2 2 空间数据挖掘技术 2 2 1 数据挖掘的基本概念 空间数据挖掘是数据挖掘的一个分支,这决定了两者在挖掘任务、挖掘对象 等方面有一定的关联。因此,在接触空间数据挖掘理论前,有必要系统地了解 下数据挖掘理论。下面是对数据挖掘的定义、任务及技术这些基础性的概念的一 全面而简要的概述。 定义 数据挖掘( d a t am i n i n g ,筒称d m ) ,或称从数据库中发现知识( k n o w l e d g e d i s c o v e r yf r o md a t a b a s e s ,简称k d d ) ,定义为“从数据库中发现隐含的、先前 不知道的、潜在有用的信息”。k d d 侧重于目的和结果,d m 侧重于处理过程和方 法,研究者们经常把它们等同起来,或放在一起使用。d m 和k d d 的定义还有一些 不同的表达形式,但其本质是一样的,即从数据库中提取隐含的、人们感兴趣的、 高水平的模式。 随着计算机信息处理技术的飞速发展,数据和数据库急剧膨胀,而数据库中 隐藏的丰富知识远远没有得到充分的挖掘和利用,数据的急剧增长与人们对数据 库处理和理解的困难之间形成了强烈的反差。d m 和k d d 技术就是在这种状况下产 生的,这也是人工智能、机器学习技术发展的结果,其目的是为数据库理解与应 用提供一种自动化、智能化的手段。尽管这项技术刚刚起步,但已显示了诱人的 前景。同时,该技术具有相当大的难度,是一项极具挑战性的课题。 任务 通常的数据挖掘任务有:统计( s u m m a r i z a t i o n ) 规则挖掘、关联( a s s o c i a t i o n ) 规则挖掘、分类( c l a s s i f i c a t i o n ) 规则挖掘、聚类( c l u s t e r i n g ) 规则挖掘、预测 ( p r e d i c t i o n ) 分析、趋势( t r e n d ) 分析、偏差( d e v i a t i o n ) 分析、序列模式 ( s e q u e n t i a lp a t e r n

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论