(控制理论与控制工程专业论文)电厂管理信息系统中异构数据的集成及安全机制的研究.pdf_第1页
(控制理论与控制工程专业论文)电厂管理信息系统中异构数据的集成及安全机制的研究.pdf_第2页
(控制理论与控制工程专业论文)电厂管理信息系统中异构数据的集成及安全机制的研究.pdf_第3页
(控制理论与控制工程专业论文)电厂管理信息系统中异构数据的集成及安全机制的研究.pdf_第4页
(控制理论与控制工程专业论文)电厂管理信息系统中异构数据的集成及安全机制的研究.pdf_第5页
已阅读5页,还剩56页未读 继续免费阅读

(控制理论与控制工程专业论文)电厂管理信息系统中异构数据的集成及安全机制的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

查查盔兰堡主兰垡堡茎 一! 坚 电厂管理信息系统中异构数据的集成及安全机制的研究 研究生: 指导老师: 学校名称: 吴正友 严洪森教授 邵家玉副教授 东南大学 摘要 随着网络、数据库和通信技术的发展,管理信息系统( m a n a g e m e n t i n f o r m a t i o n s y s t e m ,m i s ) 在大型火力发电厂中得到了广泛的应用。针对大型火力发电厂的管理 信息系统,本文从理论和实际应用上对异构数据的集成及安全机制问题进行了研 究。 本文首先介绍了管理信息系统在大型火力发电厂中的应用情况,并指出存在的 两个问题:异构数据集成和系统安全问题。由于火力发电厂管理信息系统的改造升 级,电厂的数据环境是异构的,为了达到信息共享的目的必须实现异构数据集成。 本文介绍了三类异构数据集成方法:o d b c 技术、传统的模式集成手段以及新时期的 异构数据集成技术,结合某火力发电厂的实际环境,给出了电厂管理信息系统数据 集成方案,设计了相应的基于o d s c 的通用数据转换软件并实现了其主要算法。数据 集成使得信息共享更加方便,但同时带来了信息共享的安全性问题。为此,本文讨 论了计算机系统安全问题的特点,提出了建立电厂安全系统的原则及保证系统安全 所应遵循的安全性要求规范。最后,根据电厂的实际情况,提出了带有约束条件的 角色控制模型,同时给出了存取控制的设计方案及电子签名技术。 本文最后对研究的问题以及研究中存在的问题做了总结。 关键宇:管理信息系统( m i s ) ;开放数据库互连( o d s c ) ;异构数据集成 d c o m c o r b a ;x m l ;计算机安全模型;电子签名 查堕查堂堡土兰焦堡奎 一j ! ! ! ! 翌 r e s e a r c ho nh e t e r o g e n e o u sd a t ai n t e g r a t i o n a n ds e c u r i t y m e c h a n i s mf o rt h e so f p o w e r p l a n t s a u t h o r :w uz h e n 舒o n s u p e r v i s o r :p r o f y a nh o n g s e n a s s o c i a t ep r o f s h a oj i a - y u s c h o o l :s o u t h e a s tu n i v e r s i t y a b s t r a c t w i t ht h er a p i dd e v e l o p m e n to fn e t w o r k 、d a t a b a s ea n dc o m m u n i c a t i o nt e c h n o l o g y , m a n a g e m e m i n f o r m a t i o ns y s t e m ( m i s ) i sw i d e l yu s e di nl a r g ep o w e rp l a n t s a i m i n ga t t h em a n a g e m e mi n f o r m a t i o ns y s t e mo fl a r g ep o w e rp l a n t s ,t h i s p a p e r s t u d i e st h e h e t e r o g e n e o u s d a t ai n t e g m t i o na n ds e c u r i t ym e c h a n i s mo nt h e o r i e sa n d a p p l i c a t i o n s f i r s t l y , t h es i t u a t i o no f t h em i sa p p l i c a t i o ni nl a r g ep o w e rp l a n t si si n t r o d u c e di n t h i sp a p e r s e c o n d l y , t w op r o b l e m sa r ep u tf o r w a r d :h e t e r o g e n e o u sd a t ai n t e g r a t i o na n d s y s t e ms e c u r i t y ;b yt h er e a s o no f p o w e rp l a n t s m i sa l t e r i n ga n du p g r a d i n g ,t h em i s h a s t ob e h e t e r o g e n e o u s s o i ti s n e c e s s a r yt oi n t e g r a t e t h e h e t e r o g e n e o u s d a t a s o m e t r a d i t i o n a lm o d ei n t e g r a t i o nt e c h n i q u e sa n ds o m em o d e mm o d ei n t e g r a t i o nt e c h n i q u e s a r ei n t r o d u c e di nt h ep a p e r u n i v e r s a ld a t ac o n v e r s i o ns o f t w a r ea n dm a i na l g o r i t h m b a s e do no d b ci sd e s i g n e da n di sa d o p t e dt oi m p l e m e n t h e t e r o g e n e o u s d a t ai n t e g r a t i o n i np o w e rp l a n t s m i sa l t e r i n ga n du p g r a d i n g t h es h a r e di n f o r m a t i o nf o rm u l t i - u s e r s p r o d u c e st h es e c u r i t yp r o b l e m t h ep r i n c i p l e so fh o w t oc r e a t eas a f em i sb a s e do na c e r t a i np o w e r p l a n t sm i s a r ed i s c u s s e d ,a n da s e c u r i t ym o d e lw i t hr e s t r i c tc o n d i t i o n si s c o n s t r u c t e d ,a tt h es a n l ct i m e ,t h ea c c e s sc o n t r o ld e s i g na n de l e c t r o n i c a ls i g n a t u r ea r e d e s c r i b e d a tt h ee n do f t h e p a p e r , t h ep r o b l e m se x i s t i n gi nt h es t u d i e sa r es u m m a r i z e d k e yw o r d s :m i s ( m a n a g e m e n ti n f o r m a t i o ns y s t e m ) :o d b c ( o p e n d a m b a s e c o n n e c t i v i t y ) h e t e r o g e n e o u sd a t ai n t e g r a t i o n ;s e c u r i t ym o d e h e l e c t r o n i c a ls i g n a t u r e l i 东南大学学位论文独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得 的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含 其他人已经发表或撰写过的研究成果,也不包含为获得东南大学或其它教育机构 的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均 已在论文中作了明确的说明并表示了谢意。 研究生签名:丞垂基日期:型4 ,f 东南大学学位论文使用授权声明 东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学 位论文的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本 人电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外,允许 论文被查阅和借阅,可以公布( 包括刊登) 论文的全部或部分内容。论文的公布 ( 包括刊登) 授权东南大学研究生院办理。 研究生签名:苤垂煎导师签名研究生签名:丞亟丛导师签名 日期:? 。吐4 东南大学硕士学位论文 第一章绪论 1 1课题背景 第一章绪论 1 1 1 管理信息系统的概念及作用 企业管理系统是包括供、产、销、人、财、物在内的由生产、经营、管理等业务高度集成 的系统。企业管理业务大致分为:决策计划、管理控制、操作控制三层。与管理层次相适应, 管理信息也可分为:综合、管理、基础三种类型。基础信息来源于企业的日常业务;对基础信 息加以汇总,得到供管理部门制定计划、监督管理用的管理类信息;在以上两种信息基础上分 析、综合,得到供企业决策者使用的综合类信息。企业的管理系统实际上是综合各种信息的处 理系统。管理信息的处理能力成为企业管理水平的重要标志。 随着计算机技术的发展,计算机己成为信息处理的重要工具。因此用计算机处理信息在企 业的管理中得到充分应用。管理信息系统正是计算机处理信息技术和企业管理结合的产物。管 理信息系统( m i s ,m a n a g e m e n ti n f o r m a t i o ns y s t e m ) ,是一个由人、计算机等组成的能进行信 息的收集、传送、储存、维护和使用的系统,能够实测企业的各种运行情况,并利用过去的历 史数据预测未来,从企业全局的角度出发辅助企业进行决策,利用信息控制企业的行为,帮助 企业实现其规划目标。这里给出的定义强调了管理信息系统的功能和性质,也强调了管理信息 系统中的计算机对企业管理而言只是一种上具。管理信息系统是信息系统的重要分支之一,经 过3 0 多年的发展,已经成为一个具有自身概念、理论、结构、体系和开发方法的覆盖多学科的 新学科。“1 管理信息系统是综合了管理、运筹、计算机网络和数据库等多学科知识与技术的现代化系 统,是企业提高其现代化管理水平的有力手段。它对企业的有效运行有着重要的作用。管理信 息系统的功能主要有如下几条: 1 准备和提供统一格式的信息,使各种统计工作简化,使信息成本最低: 2 及时全面地提供不同要求不同详情的信息,以期做到分析解释现象最快,及时产生正 确的控制; 3 全面系统地保存大量的信息,并能很快地查询和综合,为企业的决策提供信息支持; 4 利用数学的方法和各种模型处理信息,以期预测未来和科学地进行决策。 管理信息系统是一个一体化的集成系统。因此,必须从企业的全局出发,全面考虑,保证 各种职能共享共同的数据,减少数据的冗余性,保证数据的兼容性和一致性。具有集中统一规 划的数据库是管理信息系统成熟的重要标志,它象征着管理信息系统是经过周密的设计建立的, 标志着信息作为资源,为各种用户所共享。 管理信息系统在企业的生产与经营中,能够发挥重要作用,其实现的主要目标体现在如下 的几个方面: 1 合理安排生产,提高产品的生产率; 2 降低产品的生产成本: 3 提高对客户的服务质量: 4 提高企业的管理水平和管理质量; 5 增强企业的应变能力和竞争能力。 1 1 2 管理信息系统在大型火力发电厂应用中存在的问题 随着我国电力行业“厂网分开,竞价上网”电力市场的起步和发展,五大发电集团的成立, 电厂、电力集团成为独立企业,参与市场竞争。作为一个发电企业,在安全性、可靠性约束条 件_ f ,追求利润的最大化是它的主要目标。冈此电厂的管理重点从传统的计划生产,逐步过渡 查堕查堂婴主兰垡丝苎;丝二皇! i 堡 到基于科学调度和竞价决策的市场化生产。 追求发电企业的最大化利润的方法,从宏观来看,无非就是两条路:开源和节流a 开源是 指在每天的电力市场交易竞价中,通过科学的分析本厂的发电成本,预测电网的需量,估计同 类电厂的报价,从而报出最有竞争力的价格,实现电厂售电和电价的最大化。节流是指加强电 厂的内部科学管理、深挖潜力、降低成本、节能降耗、合理安排机组的启停和检修,将机组的 启停次数、机组的检修时间尽量地缩小,实现电厂的成本的最小化。当企业的销售收入最大化, 成本最小化时,利润也就趋于最大化。 在电力市场环境下的电厂m i s 建设总体目标,应该同绕企业利润最大化这个企业目标,为 这个企业目标服务。将这个企业目标落实到m i s 的管理和技术上,通过m i s 系统,为电厂的经 营管理者服务,在管理和技术上提供开源和节流手段和工具,使电厂m i s 能真正为发电企业提 高效益这个目标服务。 随着计算机技术的发展,特别是近几年网络技术的发展,计算机系统可以为用户提供良好 的远程计算、资源共享和电子数据传输等方面的服务,给人们的工作与生活带来了极犬的方便。 但是,利用计算机犯罪的事件也日益增多。我国大连市某银行办事处的一名计算机管理员,利 用由他通过计算机控制的“银行收贷利息”的专用科目和“到期未归贷款利息”科目,将客户 交来的贷款利息1 l 万元截留,并通过计算机转到同伙的帐上,汇出套取现金。1 9 9 6 年4 月1 6 日,美国金融时报报道,据权威机构统计,平均每2 0 秒就发生一起入侵i n t e r n e t 计算机网络 的事件。 从上面的事例可以得出这样一个观点:计算机系统存在着安全问题。管理信息系统是一个 由人与计算机组成的系统,管理信息系统的发展离不开计算机系统的发展。近几年来,随着计 算机技术的进步,许多企业已经建立了管理信息系统,并深入到企业的各个部门。在这些企业 中,信息是以数据的形式在计算机系统中存储与传输。有些信息关系到企业的生产与商业的机 密,它们对企业生存与竞争来讲,具有十分重要的价值。如果计算机系统存在安全问题,造成 管理信息系统中的数据丢失、破坏与泄密,对企业的正常生产与运营都将造成不可估量的损失, 这将违背企业建立管理信息系统的初衷。所以,计算机系统的安全性问题,是建立管理信息系 统需要考虑的一个重要问题。 由于企业生产性质,决定了大型火力电厂安全生产的重要性。电厂的管理信息系统必须遵 循“安全第一”的方针,按照电厂的安全规程,完成有关工作的信息管理。大型火力电厂的管 理信息系统必须保证电厂的安全生产。而计算机系统存在一定的脆弱性,所以必须讨论大型火 力电厂管理信息系统的安全性问题。另一方面,电厂中一些部门在管理信息系统建设前,已经 实行了计算机管理,并在计算机中保存了有价值的历史数据。这些数据和电厂的管理信息系统 是不同类型的,又不可能全部转化为现有系统的数据。为了信息共享,必须实现异构系统信息 的集成。因此必须讨论大型火力电厂管理信息系统的数据集成问题。 1 2 课题意义 电厂管理信息系统中异构数据集成及安全机制的研究,能够把先进的异构数据源集成模式 和一系列的安全方案引入到企业的m i s 中,使得电厂完成一项工作时,能够需要安全地访问分 布在网络不同位置上的多个数据管理系统中的数据。 另外,组件化技术的引入,使得m i s 的可扩展性,可维护性大大增强,不仅能够更加灵活 的实现与其它管理系统的交互( 如e r p 等) ,而且可以适应术来企业需求的变化。 由此可见,本课题的研究,是当前电厂生产经营活动的需要,也是电厂适应瞬息万变的市 场变化,不断寻求进一步发展的需要。 2 东南大学硕士学位论文 第一章绪论 1 3 论文主要结构 第一章绪论,主要阐述了课题背景,火力发电厂m i s 的应用情况以及在应t ;i j 中存在哪些问 题,从而进行课题研究的意义。第二章电厂管理信息系统中异构数据集成技术分析,介绍了电 厂异构数据源的现状与目标,并对各种数据集成技术进行了分析。第三章介绍了火力发电厂管 理信息系统中异构数据集成方案。第四章介绍了火力发电厂m i s 中安全需求分析及安全内容。 第五章提出了火力发电厂m i s 安全方案的解决方法。第六章提出了火力发电厂m i s 安全访问控 制模型。第七章是对全文的总结并提出了有待于进一步研究的内容。 3 东南大学硕士学位论文 第二章电厂管理信息系统中异构数据集成技术分析 第二章电厂管理信息系统中异构数据集成技术分析 随着信息量的飞速膨胀,数据集成的范畴会越来越广,对各种数据进行集成的要求也会越 来越迫切。异构数据集成必将继续成为信息技术的一个重要的发展方向。火力发电厂应根据本 身可接受的程度,有选择的将适合自己的异构数据源集成方案应用到m i s 中。 2 1电厂异构数据源的现状与目标 今天,越来越多的应用需要访问各种异构数据源。对于企业应用来说,这既是企业内部发 展的需要也是企业适应外部环境的需要。 企业在发展过程中积累了大量数据,并为存储和管理这些数据不断投资。然而,由于实施 数据管理系统的阶段性、技术性以及其它经济和人为因素的影响,以至即使在一个单独企业, 采用的数据管理系统也大不相同,从简单的文件数据库到复杂的网络数据库,它们构成了企业 的异构数据源。尽管这些数据管理系统能够满足数据存储和管理要求,但是在许多情况f ,为 完成一项j _ = 作,企业应用可能需要访问分布在网络不同位置上的多个数据管理系统中的数据。 例如,某公司需要了解一套型架的生产和使用情况,那么,相关应用首先必须访问生产准备科、 工装所、以及使用车间的不同的数据库系统来提取相关数据,然后进行处理。很显然,原有的 数据管理系统并不能提供这种支持,需要一个强大的系统能够集成存在于分布数据源的数据。 不仅如此,随着生存环境的不断变化,企业在把握机遇的同时也面临着许多挑战。网络的 发展使企业逐渐从一个孤立节点发展成为不断与网络交换信息和进行商务事务的实体,企业数 据集成也从企业内部集成走向了企业间集成。现在的企业比以往任何时候都需要将内部数据进 行发布和交换,这必然导致越来越多的企业应用需要访问各种异构数据源,并且这些数据源可 能分布在网络上任何地方。为了满足这种需求,必须有一种系统能够支持异构数据源的数据集 成。 所以,无论是从企业自身发展角度还是从企业间数据集成的角度来看,越来越多的企业应 用需要一种异构数据集成系统作为访问异构数据源的支撑,那么,在当前的情况下,建立企业 异构数据的集成系统必须解决哪些问题呢? 面临的问题 异构数据源集成是数据库领域的经典问题+ 。单从集成角度看,企业异构数据源集成,与 普遍的异构数据源集成问题没有本质区别,具有同样的共性问题。然而,从为企业应用构建支 撑系统的角度米讲,必须考虑企业异构数据在集成过程中所遇到的特殊问题。总的来看,作者 认为在构建企业异构数据源集成系统时,主要会面对以下几方面问题: 1 异构性 异构性是企业异构数据集成必须面临的首要问题,其主要表现在两方面: 1 ) 系统异构,数据源所依赖的应用系统、数据库管理系统乃至操作系统之间的不同构成 了系统异构。 2 ) 模式异构,数据源在存储模式上的不同。一般的存储模式包括关系模式、对象模式、 对象关系模式和文档嵌套模式等几种,其中关系模式为主流存储模式。需要注意的是,即便是 同一类存储模式,它们的模式结构可能也存在着差异。例如o r a c l e 所采用的数据类型与s q l s e r v e r 所采用的数据类型并不是完全一致的。 2 完整性 异构数据源数据集成的目的是为应用提供统一的访问支持。为了满足各种应用处理( 包括 发布) 数据的条件,集成后的数据必须保证一定的完整性,包括数据完整性和约束完整性两方 4 查直盔堂堡土兰垡兰塞 苎三主皇 篁里堕:垦墨竺主墨塑塑塑墨堕垫i ! ! :塑 面a 1 ) 数据完整性,是指完整提取数据本身,一般来说,这一点较容易达到。 2 ) 约束完整性,约束是指数据与数据之间的关联关系,是唯一表征数据间逻辑的特征。 保证约束的完整性是良好的数据发布和交换的前提,可以方便数据处理过程,提高效率。 3 性能 网络时代的应用对传统数据集成方法提出了挑战,提出了更高的标准。一般说来,当前负 责集成的应用必须满足:轻量快速部署,即系统可以快速适应数据源改变和低投入的特性。 ( 注:这里的性能是对系统本身的要求,为了强调其重要性,作者也将其列为问题之一。) 4 语义冲突 信息资源之间存在着语义上的区别。这些语义上的不同可能引起各种矛盾,从简单的名字 语义冲突( 不同的名字代表相同的概念) ,到复杂的结构语义冲突( 不同的模型表达同样的信息) 。 语义冲突会带来数据集成结果的冗余,干扰数据处理、发布和交换。所以如何尽量减少语义冲 突也是数据集成的一个研究热点。 5 权限瓶颈 由于数据库资源可能归属不同的单位,所以如何在访问异构数据源数据基础上保障原有数 据库的权限不被侵犯,实现对原有数据源访问权限的隔离和控制,就成为连接异构数据资源库 必须解决的问题。作者将该问题定义为权限瓶颈问题。 6 附加约束 集成两个或多个数据源的时候,数据源的数据之间可能存在着某种联系,例如,前面所提 到的例子,显然,保存在不同资源库中的关于同一套工装的信息之间存在着一定的逻辑联系。 那么,把这种逻辑联系附加到集成结果中的过程就称为附加约束。 7 , 集成内容限定 多个数据源之间的数据集成,并不是要将所有的数据进行集成,那么如何定义要集成的范 围,就构成了集成内容的限定问题。 上面列举了在构建企业异构数据源集成系统时所必须面对的几个主要问题,其中,异构性、 完整性、性能、语义冲突问题为异构数据集成中的共性问题,权限瓶颈、附加约束和集成内容 的限定则属于企业异构数据集成的特性问题。值得指出的是,尽管作者对问题进行了分类,但 事实上,这些问题是相互联系、相互制约的,不应该简单的孤立对待。 2 2 电厂异构数据集成技术分析 计算机自诞生以来,被大量用于数据处理工作。由于在选择数据处理系统时存在时间和空 间上的差异,使得人们使用的数据源千差万别,这就相应的带来了数据集成的问题。例如:一 个集团内部的各个子公司分别根据自身要求选用了不同的数据库,当要在集团内进行跨公司的 数据处理时,就将牵涉到多种异构数据库,这是空间上的异构;而一个企业在发展的过程中也 往往需要随着情况的变化,升级选用更适合其的新系统,这则属于时间上的异构。近来,随着 社会合作国际化的加强,数据集成的要求愈发强烈。对异构数据进行集成已成为一个不可回避 的问题摆在我们面前。早期的数据来源主要是各种关系型数据库,因而集成主要针对关系数据 库进行。像o d b c 方法和传统的模式集成方法都是典型的对关系数据库进行集成的方法。随着信 息技术的迅速发展,数据的存储超出了关系数据库的范畴,相应的也就产生了跨平台对多种类 型的数据进行集成的要求。新出现的技术例如:微软的通用数据访问结构、三层集成方案、 d c o m c o r b a 和用) 加。进行集成等都可以对多种异类的数据进行集成。数据集成技术还在进一步 的发展之中。 奎堕= ;苎兰堡主堂垡笙塞 苎三童皇 笪堡笪星墨堕生墨塑墼塑薹堕垫查坌堑 2 2 10 d b c 法 谈到对异构数据进行集成,不能不提到o d b c 。o d b c 最初是由制定u n i x 标准的x o p e n 财团 和s q la c c e s sg r o u p 提出的。m i c r o s o f t 是o d b c 的实现者,目前o d b c 已被确定为w o s a ( t h e w i n d o w so p e ns y s t e ma r c h i t e c t u r e ,即w i n d o w s 开放系统体系结构) 的主要部分。”“o d b c 之 所以得到广泛的应用,首先在于它具有良好的数据独立性。使用o d b c 编写的应用更改起后台数 据库来非常方便只要更改相应的驱动程序就可以了,在实现上即表现为简单地装入不同的 d l l 文件。这一点也使得利用它可以缩短开发时间。比如说开发一个客户数据库系统,爿j 其他 方法必须等平台d b m s 到货后才能进行,而运用o d b c 技术则可以先在p c 机上开发,平台和o d b c 到货后再进行简单移植。o d b c 使用层次的方法来管理数据。即在数据库通讯结构的每一层对可 能出现产品依赖的地方都引入一个公共接口以解决潜在的不一致性。o d b c 有一个非常独特的基 于d l l 的结构,它使用一个小的高层d l l 0 d b c d l l 定义麻用的程序设计借口。程序执行时 将调用相应的数据库的d l l ( 即驱动程序) 以完成对数据的操作。w i n d o w s 的o d b c 管理模块还 将维护一个叫做o d b c i n i 的文件,其中记载有可以得到的数据库的驱动程序。通过这种机制, 整个系统就被模块化了。 典型的o d b c 结构如图2 - 1 所示: 图2 1 典型的o d b c 结构 从结构上看o d b c 的驱动程序可以分为单束式和多束式两种。单束式类似于一个独立的d b m s 系统,它是数据库引擎,介于应用和数据库之问,可独立完成数据操作的任务。多束式则是在 应用和数据库间传递数据和命令的中转站,本身并不执行任何数据处理工作。多束式驱动程序 的功能常常比单束式驱动程序要强。 2 2 2 传统的模式集成手段 模式集成指的是将各个数据库中的信息在逻辑上用同样的概念模式表示以形成一个统一的 异构数据库,达到数据共享的目的。数据库的集成一般可分为两步进行:第一步是将各个异构 的局部数据库通过翻译器映射成局部集成模式;第二步是用集成器将多个局部集成模式集成为 一个统一的全局概念模式a 其中第二步又可细分为预集成、比较、同化、合并和重构这四个步 骤。传统的模式集成手段可以分为有全局模式和无全局模式两种。后者就是我们常说的联邦数 据库法。 1 有全局模式的集成系统 有全局模式的集成系统的结构图可以表示如图2 - 2 。每个参与集成的数据库有自身的局部 概念模式,用户可以通过建立在局部概念模式上的局部外模式访问本地库。在所有局部概念模 6 东南大学硕士学位论文 第二章电厂管理信息系统中异构数据集成技术分析 式的基础上建立了全局概念模式,用户通过建立在全局概念模式上的全局外模式访问集成系统 中的其他数据库。在全局概念模式上可以使用多种语言也可只使用一种语言。前者可以使得每 个局部用户都可以用本局部库的语言透明访问整个系统,但全局库的处理逻辑设计略微复杂一 些;后者实现起来较简单,但用户必须学习全局库的语言才能访问系统中其他的数据库( 访问 本地库时使用局部数据库的语言,访问全局数据时使用全局库的语言) 。 凸谗瓣赫辩簿八鳓 图2 2 有全局模式的集成系统结构图 丸口 2 联邦数据库系统 联邦数据库系统作为一种异构数据源集成的方法,有求做到以下几点: ( 1 ) 能够方便的共享各个局部数据库的数据。联邦系统中的用户应能透明的访问各个局部数 据库a 这就要求联邦系统提供对多种数据模型和多种数据操作语言的支持能力,并能在他们之 间自由的进行转换。 ( 2 ) 局部数据库自治。各局部数据库要能对自身的完整性和安全等问题进行控制,不能因为 参与联邦而破坏了自身的自执行。 ( 3 ) 提供合理有效的数据访问和并发控制手段,能对数据进行正确高效的共享。联邦数据局 系统的体系结构如图2 3 所示。 图2 3 联邦数据库系统的结构 如图所示,联邦系统大体上可以分为两层:下层由备个局部数据库系统组成;上层是一系 列定义在某个或某几个局部模式上的外视图。 联邦数据库系统的实现方法有以下两种: ( 1 ) 数据库转换法 这是一种真实的转换数据库的物理方法。他首先将源数据库转换为用户可以使用的等价数 据库,而后装入数据,提供给用户已实现数据共享。数据库转换的方法可以用图2 - 4 的流程表 7 查堕查堂堡圭兰垡堡苎 苎三童皇 笪望笪星至堕主墨塑茎塑墨些苎! ! 坌笪 骶冷i i i : 撼羲攀 潦脯锋情辩嗣蜷棼捌襻 图2 4 数据库转换方法的工作流程 数据库转换的方法能够实现对数据的透明访问。因为用户看到的并不是源库,而是源库的 等价目标数据库。这个目标库和用户熟悉的数据库没有两样,用户可以用自己熟悉的数据操作 语言书写事务,对数据进行处理。例如:用户使用的是r d b ,要访问的是一个对象数据库,那 么在数据库转换的方法中,我们就先拷贝对象数据库并将副本转换为关系型的目标库,用户和 目标库打交道,自然可以使用关系数据语言,就像访问本地库一样。数据库转换方法的多模型 和多语言能力主要体现在数据库转换器上。目前商用的产品主要采用使用多对支持双模型和双 语言的转换器的方法来实现系统的多模型和多语言能力。理论上已经证明,语义丰富的模型和 语义缺乏的模型之间的互相转化都是行的通的,因而数据库转换的方法是可行的。但他很难做 到局部数据库自治。因为采用这种方法将产生一个数据库的多个副本,而在多个副本间很难维 护数据的一致性和保证安全性限制,除非连完整性、安全性限制一起转化,但这样做的代价又 太大,并且要求编程人员非常了解数据库的内部结构。 ( 2 ) 模式转换的方法 模式转换是一种逻辑方法,它是将异构数据模型转化为用户熟悉的数据模型,然后用户用 自己熟悉的数据操作语言书写事务,事务通过事务翻译后直接对异构数据进行处理。模式转换 的方法并不产生数据的副本。因为在模式转换的方法中,并没有产生数据副本,而仅仅产生了 不同的数据模式,操作最终还是要在源异构的局部库上进行,而这些局部库并不能识别其他语 言书写的事务,因此需要对事务进行翻译。这一点不同于数据库转换法,后者已实际地将异构 库转化为了和用户同构的目标库,操作在目标库上进行,所以不需要事务翻译。 根据模式转换器功能的不同,模式转换的方法可以分成四种:( a ) 1 对1 映射;( b ) 1 对 多映射;( c ) 多对i 映射( 即核心数据库系统) :( d ) 多对多映射。其中多对1 映射是一种逻辑 上异构,物理上同构的集成系统,所有操作都在核心库上进行;另三种对数据的访问归根结底 总是要转化为对系统中某一局部数据库的操作,所以模式转换的方法不会产生完整性和安全性 方面的阀题各局部数据库可以自治。 2 2 3 新时期异构数据集成技术的发展与应用 随着技术的进步,在数据集成领域旧的方法得到了进一步的发展,同时又出现了许多新的 集成思想和策略。 1 通用数据访问结构 通用数据访问结构( u n i v e r s a ld a t aa c c e s sa r c h i t e c t u r e ) 是m i c r o s o f t 公司继o d b c 后推 出的新一代的数据访问组件,它是m i c r o s o f t 公司的d n a 架构( w i n d o w sd i s t r i b u t e d i n t e r n e t a p p l i c a t i o na r c h i t e c t u r e ) 的一个中心部分,它提供了w i n d o w sd n a 应用的数据访问服务。 通用数据访问结构实际上是一组软件组件,这些组件之间通过o l ed b 定义的一组共同的系统级 界面进行互操作。通用数据访问的软件组件包括三种。下层是数据提供者,它们储存并储存数 防k i j ii里 镕目 查壹盔兰堡主堂垡堡苎 釜三皇皇! :笪翌焦:垦墨竺史墨塑墼塑塞堕垫查坌堑 据;上层时数据消费者,是使用数据的;两层中问是一系列服务组件,用以对数据进行备种处 理。通用数据访问结构是建立在o l ed b 的基础上的,o l ed b 访问数据有以下几种情况 如图2 5 所示。 图2 5 通过o l ed b 访问数据的结构 ( i ) 有o d b c 的p r o v i d e r ,但没有专门的n a t i v ep r o v i d e r ,这时应用将通过a d o r n 面向o d b c 的 0 l ed bp r o v i d e r 建立对话,然后通过装入o d b c 驱动程序来访问d b m s ; ( 2 ) 有专门的n a t i v ep r o v i d e r ,例女n s q ls e r v e r ,这种情况下,应用通过a d o 直接和n a t i v e p r o v i d e r 建立对话访问数据; ( 3 ) 有o l ed b 的p r o v i d e r ,但没有自己的查询引擎,例如m se x c h a n g es e r v e r ,这时应用通过a d o i i m se x c h a n g es e r v e r 建立对话,同时调用o l ed b 的查询处理器操纵查询。 2 三层结构的处理方式 三层结构是最近几年才出现的新技术,在数据源集成方面也有着良好的应用前景。相对于 两层结构,三层架构的不同之处在于他在客户端和服务器端之间设立了一个中间层,对数据的 一切访问都要通过中间层进行。这样做的好处很多:首先,在两层结构中,如果要想若干个客 户端都具有访问某个数据源的能力,就必须在每个客户端都进行相应的配置,而如果每个客户 又要求访问多个服务器,叉会造成系统的大量冗余和浪费;而在三层结构中,可以把访问多个 异种数据源的能力配置在中间层上,每个客户端只要具有访问中间层的能力就可以了,这使得 系统大为简单化。另外,两层结构中,一旦对s e r v e r 端提出数据的访问要求,真正的集成就将 在客户端上进行,而在三层结构中,集成可以在中间层上进行,只把最终的结果返回给用户, 这将减少不必要的网络传输,大大改善网络性能。如图2 - 6 所示。 9 东南大学硕士学位论文 第二章电厂管理信息系统中异构数据集成技术分析 图2 6 三层结构处理方式的结构 3 基于视图的集成技术 严格地说,基于视图集成不能算是一种新技术,它实际上还是一种模式集成手段。在这种 方法中,集成视图被定义成虚类的集合,这些虚类定义了一个视图模式,他们的虚对象则构成 虚数据库。基于视图集成技术的过程如下:即先建立空的集成视图,然后各个异构的数据库将 自身想要参与集成的类( 即共享信息) 输入到集成视图中,集成系统通过语法、语义的分析解 决各输入类之间的冲突,并进行类的派生操作,从而建立适宜于数据共享的集成视图。如图2 7 所示。 建赢鬻黧溅槐罔 横式输积 袭袖 ; l 转藏赣 饕藿椅。 l 躺糖姥式冲寓 i 翻囊谶澎撵掺爵 l 莓燮构、建立攀 l 裁视雕 图2 7 基于视图的集成方法的工作流程 类的派生最典型的做法是根据需要合并不同对象中的共有部分。例如有以下两个参与集成 的类( 如图2 - 8 ( a ) ) :这里两个类中划圈内的部分拥有相同的结构和语义,我们就可以把这个 部分统一起来,派生出类i n d i v i d u a l 来统一描述这些信息,派生后的类结构如图2 - 8 ( b ) 。类 派生操作很重要,派生的好坏将直接影响到系统的处理效率。 图2 8 ( a ) 类派生操作前的两个 1 0 查童盔堂堡主兰垡丝兰 笙三童皇! :篁望笪皇墨堑主墨茎堂堂堡型型望! ! 堕 m 删。越 三 僦= 1 “讨酬姆 4 ,d c o m c o r b a 九十年代以来,分布对象技术d o c 得到了迅速的发展,随着研究的深入和应用的日益广泛, d o c 形成了两个阵营,一个是m i c r o s o f t 公司,使用d c o m 技术;另一个是o m g 组织,使用c o r b a 技术。i ) c o m 是组件对象模型c o l , i 的进一步扩展。c o i v 定义了组件和客户之间的相互作用方式, 它使得组件和客户端之间无需任何中介组件就能相互联系。客户可以通过组件对象提供的接i z l 直接访问组件中的方法。d c o m 技术只适用于w i n d o w s 平台,现在虽然在u n i x 平台上有了一定 的扩展,但效果仍不理想。但是,因为它和w i n d o w s 都是微软的产品,因而可以和操作系统紧 密相关,从而大大提高了它的运行效率。“ c o r b a 是o m g 的对象管理体系结构中的一个关键组成部分,利用它用户可以在异种平台上 开发分布式面向对象应用,而不必考虑各种平台的细节和差异。目前已经有很多家公司开发了 基于c o r b a 的应用。c o r b a 的跨平台能力非常优秀,但正因为此,所有与操作系统之间的交互 必须通过中介代理进行,这使得它的运作效率不如d c o m 。d c o m 和c o r b a 的运作结构非常相似, 都采用远程进程调用的方式,只是各部分的名称不同而已。分别如图2 - 9 ,图2 1 0 所示。 图2 9d c o m 的调用结构 图2 1 0c o r b a 的调用结构 在d c o m 中,对组件的透明访问是通过服务控制管理员( s e r v i c ec o n t r o lm a n a g e r ) 实现 的。客户要调用一个组件对象时,会向s c m 提出请求,如果对象服务器是本进程内的或是本地 的,s c m 会查询注册服务器以定位对象服务器,并将其装入和激活:如是远程的则s 咧与远端 的s c m 建立联系,由远端的s c m 负责服务的装入和激活。这样,组件对象的变化只要更改相应 查童查堂堡圭兰垡丝壅 苎三至皇 竺矍笪旦墨竺宣墨塑塑蒸茎堕茎:! 坌塑 的注册就可以了,程序可以保持不变。c o r b a 则将对象实现的信息存储在实现仓库中,由o r b 负责查询实现仓库以实现对象的装入和激活。因为d c o m 和c o r b a 都采用了包装的思想,以统 一的接口的方式向外提供调用,并且二者也都实现了对对象的透明访问,这就给我们对数据集 成提供了极大的便利。我们可以利用d c 0 m 或c o r b a 将对源数据进行操作的部分进行统一的包 装,而后就可以很容易的在此之上建立集成模块,对包装过的数据进行集成,再提交给用户如 图2 一1 1 所示。 国啐匿 国印匿 图2 一l l 用d c o m c o r b a 进行集成 5 利用x m l 对数据进行集成 近年来,互联网得到了迅猛的发展,w e b 实际上已经成为最大的数据来源。而且互联网的 用户数和网页的数量仍然在e 速增加,在这种情况下,对网页上的数据进行集成势在必行。但 是由于现在的网页大多用h n f l 编写,而h t m l 缺乏必要的结构和语义信息,这就给数据集成带 来了很大的困难,甚至使得儿乎没有可能设计出一种集成h t m l 页面上的信息的通用的方法。为 了便于以后人们共享网上的数据,在3 w c ( w o r l dw i d ew e bc o n s o r t i u m ) 带头下,建立了正式的 x m l 规范。x m l 代表扩展表示语言( e x t e n s i b l em a r k u pl a n g u a g e ) ,它是一个定义其他语言的 系统。它采用将结构、内容和表现相分离的办法,同一个x m l 源文档只写一次,就可以用不同 的方法表现出来。所以x m l 不仅可以用于i n t e r n e t ,而且可以用于需要制作多种媒体文档的应 用上( 例如:出版界) 。相应的,利用x m l 进行数据集成的方法也就对相应的领域都适用。瑚l 具体的工作过程如图2 一1 2 所示。 h t m l 睦键 圈啐匦型鸟 台 臣困 图2 1 2 捌l 的工作机制 x m l 使用d t d 和s c h e m a 来定义数据的结构,利用它可以确认文档中数据是否有效,但更重 要的是它们还能够定义数据的类型和数据间的关系,这就使得d t d 和s c h e m a 的功能类似于数据 库的元数据。充分利用二者的相似性,我们就可以将传统的数据集成的策略以d t d - - s c h e m a 为 桥梁移植到对x m l 文档的集成上来。从而实现对x m l 所写的w e b 页面的集成。其实,) ( m l 对数 据集成的贡献远不止此。我们完全可以利用它对很多类型的信息进行高级集成。如图2 - 1 3 所示。 1 2 困困囫 骛吣 困矜 东南大学硕士学位论文 第二章电厂管理信息系统中异构数据集成技术分析 图2 1 3x m l 对多类型信息的高级集成 包括r d b 在内的各种信息来源,我们都可以为其设计相应的包装器,将其包装成统一的x m l 格式的数据。而后对这些x m l 数据进行集成,再将集成后的结果数据以l 文档的形式发送到 各个应用客户端或是更高级的数据集成器上去。 东南大学硕士学位论文 第三章电,一管理信息系统中异构数据集成方案 第三章电厂管理信息系统中异构数据集成方案 随着计算机网络和数据库系统的发展,管理信息系统在电厂的应用发展很快e 在过去十几 年中,电厂管理信息系统主要是基于x b a s e 的桌面数据库系统,在企业的信息管理中发挥重要 作用。如今随着基于u n i x 平台的o r a c l e 等以及基于w i n d o w s 平台的s q l s e v e r 等关系数据库管 理系统应用的成熟,许多基于这些类系统的大型管理信息系统正逐步的开发和使用。在开发这 些类管理信息系统过程中,经常会遇到为保护企业原有的投资和开发成果,必须将企业正在使 用的效果良好的应用软件的数据和新开发的系统相联结的问题。由于种种原因,设计人员不能 修改这些原有应用软件的源代码。为了实现数据共享,又不改变原有应用程序,充分利用这些 资源,我们需要实现异构数据集成。本章我们根据电厂的异构数据集成需求分析,设

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论