(计算机软件与理论专业论文)企业信息网格资源共享的研究.pdf_第1页
(计算机软件与理论专业论文)企业信息网格资源共享的研究.pdf_第2页
(计算机软件与理论专业论文)企业信息网格资源共享的研究.pdf_第3页
(计算机软件与理论专业论文)企业信息网格资源共享的研究.pdf_第4页
(计算机软件与理论专业论文)企业信息网格资源共享的研究.pdf_第5页
已阅读5页,还剩97页未读 继续免费阅读

(计算机软件与理论专业论文)企业信息网格资源共享的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一 一 一 一 一 一 一 一 卫 r tk * t 全 学 位 耸 l -伞 业 fa a r 格 资 派 共 享 的 研 究 . 企业信息网格资源共享的研究 计算机软件与理论 专业 研究生段武明指导教师唐宁 九 信息网格是利用网格技术实现信息资源的共享、 管理和提供信息服务的系 统。 本文是基于国 家 8 6 3 专 项:面向网 格的高 性能 计算 机一 曙光4 0 0 0 , 并结 合中科院计算所织女星信息网格计划的研究工作,研究了企业信息网格解决资 源共享的一些关键问题。 织女星信息网格的指导思想是通用服务、辅助智能、全局一体和自 主控 制。本文根据织女星信息网格的指导思想和信息网格的需求特点详细讨论了 企 业信息网格系统的资源的表示问 题,提出了元数据对象的表示、分类、建立的 方法。 本 文 提出 了 企 业 信 息 网 格 资 源 的 组 织 管 理 的 机 制 , 讨 论 了l d a p 在 信 鼻 网 格中的 应用。并提出了 在企业信息网格中获取资源的 方法,提出了 存储资源代 理的概念,讨论了s o a p 协议的应用。 本文分析了中 科院计算所智能中心开发的企业信息网 格的访问控制机制, 这也是信息网格研究比较重要的领域,本文还提出了企业信息网格中用户管 理、角色管理以 及权限管理的策略。 论文由 企业信息网 格的实践进一步提出了 信息网格访问控制需要解决的一些问题. 本文还以中 科院计算所智能中 心开发的企业信息网 格为实例,结合本文提 出的 几个关键问 题, 讨论了 如何实现企业信息的资 源共享问 题。 关健词:织女星信息网格,资源共享, 企业信息网格,资源管理 四川大学硕士学位论文企业信息网 格资源共享的研究 r e s e a rc h o n r e s o u rc e s h a r i n g o f e n t e r p r i s e i n f o r m a ti o n g r i d d u a n wu m i n g ( c o m p u t e r s o f t w a re 统一的信息发布、浏览、编辑和安全管理。比如, “ 十一”期间,你想找一个你满意的旅游景点去旅游。你可以打开你的计算 机,进入到信息网格系统,告诉他你想干什么 ( 输入旅游或点击一个旅游链 接),你将获得整个网格上有关旅游的全部景点的详细信息,便可以选择你想 去的地方。你不需知道该信息位于哪儿,它可能来自 九沟的某个服务器,也可 能来自 北京故宫的某个服务器。 共享资源的信息网格是因特网的下一代,也是信息服务的未来平台。一般 而言,信息网格是在全国 ( 全世界)范围内 对各行业和社会大众提供各种一体 化的 信息服务的信息基础设施. 用户可以 通过网 格门 户透明的使用网 络上的 信 息资 源。 信息网格与目 前的 w e b服务的 主要不同 是一体化。 它将分布在全国甚 至全世界的计算机、数据、信息、 知识 ( 软 件) 等组织成一个逻辑整体,各行 业可以 在此基础上运行各自 的应用服务网格,通过信息服务基础平台,可以实 现上层服务的互联互通与互操作。 信息网格要解决的一个最为关键的问 题是资源共享, 信息网格的资源共享 问 题主要包括资源的表示、管理、资源的访问以 及权限控制。本文主要讨论中 科院织女星企业信息网格的资源共享机制和策略。 文中 首先介绍网格的研究背景以 及几个大的网 格项目 ,以 及中 科院织女星 网 格的 介绍。 在第三章讨论了 织女 星信息网 格的框架结构, 第四章详细讨论了 企业信息网格关于资源共享的 几个问 题, 第五章介绍了中科院计算所国家智能 计算机研究开发中心的一个信息网 格研究项目 企业信息网 格的资源共享的 原理与实现. 四川大学硕士学位论文企业信息网格资源共享的研究 2 .网格的研究背景 网格技术及实践 什么是网格? .j.卫 .1l 21 简单地讲,网格是把整个因特网整合成一台巨大的超级计算机,实现计算 资源、存储资源、数据资源、信息资源、知识资源、专家资源的全面共享。当 然,网格并不一定非要这么大。我们也可以 构造地区性的网格 ( 如中科院计算 所网 格)、企事业内 部网格、局域网网格、甚至家庭网格和个人网格。网格的 根本特征并不一定是它的规模,而是资源共享,消除了资源孤岛。 网格 ( g ri d )是近年来在学术界和产业界逐渐兴起的一个研究领域,当前 的i n t e rn e t 技术实现了计算机硬件的连通,w e b技术实现了网页的连通,而网格 技术将把整个i n t e rn e t 整合成一台巨 大的 超级计算机,实现资源的全面连通。随 着网 络化和智能化趋势的发展,网 格计算已 经成为越来越重要的研究方向。 随着高性能计算应用需求的迅猛发展,单台高性能计算机已经不能很好胜 任一些超大规模应用问题的解决,同时,大量己经存在的计算资源和科学仪器 的利用率还不高。 这就需要将地理上分 布的、系统异构的多 种计算资 源通过高 速网络连接起来,以共同解决科学计算等大型应用问题,即需要广域的高性能 的网格技术,网格有时也称为网格计算 ( g ri d c o m p u t in g )、计算网格 ( c o m p u t a ti o n a l g r id ) 或 元 计 算 技 术( m e ta c o m p u t in g ) 等。 网格计算技术在产生的初期主要集中 在高性能科学计算领域中,现在网格 计算不局限 于此,出 现了 使用于不同 应用领域的网 格技术。图2 - 1中 根据不同 类型的应用给出了 对现有网格技术的分类。 四 川 大 学 硕 士 学 位 论 文 企 业 信 息 网 格 邀 遮 些到h 丝匕一一一一一一一一 g g g ( g r e a t g l o b a l g r i d) . d u t i n g 图2 - 1网 格技术的分类 2 . 1 .2 .网格技术特征 网格系统具有分布式系统和并行系统的特征,但是又与分布式系统和并行 系统有着非常重要的区别。与分布式系统类似, 位于多个管理域下的超级计算 机通过不可靠的网络进行连接,并且需要对广域分布的动态资源进行集成。 但 是网格系统对高性能的要求使其编程模型及接口 与分布式系统有极大的差别。 同时,网格系统作为并行系统还需要进行超级计算机之间的通信调度以满足应 用对性能的要求。然而,由 于网格系统的异构性以 及动态性使得现有的并行计 算技术的应用受到很大的限制。为此美国从 9 0年代初开始进行国家计算网格的 预 研。目 前 美国 正 在 兴建的网 格项目 包 括: n a ti o n a l t e c h n o l o g y g r id . n a s a i n f o n n a ti o n p o w e r g r i d a s c i d i s tr i b u t e d r e s o u r c e m a n a g e m e n t ( d r m) t e s tb e d 等。同时,美国军方也有一个由美国国防部支持的网格项目 一一g l o b a l i n f o n n a t i o n g r i d ( g i g ), 这是一个全球连通的端到 端信息系统, 联合了 各 种过 程和人员以 收集、 处理、 存储、发布和管理信息,以 满足战场人员、决策者和 支持人员的需求。 网格所解决的关键问题是 “ 在动态、多机构的虚拟组织中协作式的资源共 享和求解问 题”.网格关心的共享并不仅仅指是文件交换,而是对计算机、 软 件、数据和其它资源的直接访问,这正是出 现在工业、科学、工程中的许多合 作式解决问 题和资源代理策略所需要的.这种共享必须被高度控制:资源提供 者和消费者清楚并小心的定义共享什么,允许谁共享及共享发生的条件。这样 四川大学硕士学位论文企业信息网格资源共享的研究 的共享规则定义的一组个人及机构形成了 所谓的一个 “ 虚拟组织” ( v i r t u a l o r g a n iz a t i o n , 简称v o )。 以下是虚拟组织的例子:汽车厂商为规划建造一个新工厂而进行的方案评 估所雇佣的 应用服务提供商 ( a p p l i c a t io n s e r v i c e p r o v i d e r s , 简称 a s p ) 、 存储 服务提供商 ( s t o r a g e s e r v i c e p r o v i d e r s , 简称 s s p ) 、 c p u周期提供商和顾问 们;一个工业财团的 成员们投标一架新飞机;一个危机处理组和他们在紧急情 况下做出反应时使用的数据库和模拟系统;一个庞大的、具有多年历史的国际 高能物理合作组织的 成员们。这里的每个例子都表现了基于计算和数据密集型 环境中的合作的一种计算和求解问题的方式. 正如这些例子说明的,虚拟组织的目 的、范围、大小、持续时间、结构、 成员和组织方式等方面差别很大。但是,通过仔细研究我们可以确定虚拟组织 许多共同关心的问 题和需求。比如说,需要高度灵活的共享关系,范围从客户 机一 服务器到 对等模式 必p ) 和代理模式; 需 要 共享资 源使用上复杂和高级的 控 制,包括细粒度的访问控制和本地及全局共享策略的应用;需要共享各种资 源,从程序、文件到计算机、传感器和网络的数据;及需要不同的使用方式, 从单用户到多用户, 从关心性能到关心成本,而且还包括服务质量、调度、 共 同分配和记账。 当前的各种分布式计算技术并没有具有针对性的处理解决上文列出的这些 问 题和需求。 例如,当前的 i n t e rn e t 技术所关心的是计算机间的通信和信息交 换,而不是在多个站点上以计算目的而协同使用资源。电子商务 ( b u s i n e s s - t o - b u s i n e s s )交易注意力主要集中在信息的共享 ( 通常通过集中式的服务器)。 虚 拟企 业 ( v i rt u a l e n t e r p r i s e ) 技术也 是 这 样, 尽管 这 里的 共 享 可能 最终 扩 展到 应 用 程 序 和 物 理 设 备 。 企 业 分 布 式 计 算 技 术比 如c o r b a 和e n t e r p r is e j a v a 的 注 意 力 集中 在实 现单个组 织内 的资 源共享。 s s p和a s p允许一些机构满足其他合作 伙 伴的 存储和计算需求, 但使用的 是很勉强的 方式:比如, s s p的资源一 般通过 一个虚拟专用网络 ( v i r t u a l p r i v a t e n e t w o r k ) 与用户连接。新生的“ i n t e rn e t 计 算 ( i n t e r n e t c o m p u t in g )” 公司想设法利用全世界范围内 的空闲计算机, 但是, 到目 前为止还只是支持对那些资源的高 度集中 式的访问。总之,当 前的 技术或 者没有容纳众多范围的资 源类型, 或者没有提供建立虚拟组织必需的 灵活性和 对共享关系的控制。 四川大学硕士学位论文企业信息网格资源共享的 研究 随着虚拟组织这一概念的提出,网 格技术进入了 我们的视野。在过去的几 年中,网格领域的研究和开发工作己 经提出一些协议、 服务和工具,它们明确 面对在设法建立可扩展的虚拟组织研究和实践中出现的挑战。这些技术包括当 计算跨越多个机构时支持证书管理和策略管理的安全方案;支持对于计算和数 据资源的安全远程访向以 及多种资源的共同分配的资源管理协议和服务;提供 关于资源、组织和服务的配置和状态信息的信息查询协议和服务;以及在存储 系统和应用程序之间定位和传输数据集的数据管理服务. 因为网格的注意力集中 在动态的、跨组织的共享,网格技术补充而不是与 现有的分布式计算技术竞争。例如:企业分布式计算系统可以使用网格技术完 成跨越机构边界的资源共享; 在 a s p / s s p领域,网 格技术可用于建立计算和存 储器资 源的动态市场,从而克服现在静态配置的限制。 我们相信虚拟组织有改变我们使用计算机解决问 题的方式的潜能,就像网 络技术已 经改变我们交换信息的方式一样。 如同这里给出的例子说明,许多的 学科和活动都需要参加合作式的处理过程,不仅仅限于科学,工程和商业活 动。实际上正是因为虚拟组织概念非常具有实用性,网格技术才显得如此重 要。 网 格技术对于解决大规模应用问 题具有非常重要的 意义。近年来网格技术 也 有了 多 种应用实践, 其中比 较典型的 例子包括: 美国 的m e t a n e o s项目 利用 1 0 0 0 台 ( 总 共 2 5 1 0 个处 理 器) 分 布 在不同 地点的 计 算 机 共同 完 成了n u g 3 0问 题; 美国的 i - w a y实验, 连接了 北美 1 7个不同 地点的超级计算机资源,完成 了包括科学模拟,项目 协同及科学仪器共享等应用。 2 . 1 .3 . g l o b u s 网格研究项目 g lo b u s项目是由美国的 d a r p a ( d e f e n s e a d v a n c e d r e s e a r c h p r o j e c t s a g e n c y ),能源部 ( u .s . d e p a r tm e n t o f e n e r g y ), n s f ( n a ti o n a l s c i e n c e f o u n d a t io n ) , n a s a ( n a t io n a l a e r o n a u tic s a n d s p a c e a d m in i s tr a t io n ) 等 机 构 共 同 资 助 的 网 格 研 究 项目 . 项 目 研 究 的 承 担 单 位 是 阿 岗 国 象 实 验 室 的 数 学 和 计 算 叭 二 机分部 ( a r g o n n e n a t i o n a l l a b o r a t o r y s m a t h e m a t i c s a n d c o m p u t e r s c i e n c e d iv i s i o n )以及南加州大学的信息科学所 ( u n i v e r s i t y o f s o u t h e rn c a l i f o rn i a s 四川大学硕士学位论文一一 企业信息网格资源共享的研究 a e r o s p a c e e n g in e e r in g s y s t e m t o o ls 设备的自 动接入。 . 自 我:自 我描述、自 我 路由、自 知 ( 知道自 己 是谁【 s e l f a w a r e , 在 什么环境里【 c o n t e x t s e n s i t i v e ) 等。 . 动态:可编程、可扩展、可重构、自 适应,动态功能部署,动态页 面等。 . 交互: 可写、 可控制、 软实时 等。 . 织女星本身不是提供智能的主体, 而是辅助人去提供智能。 . 织女星提供了一些支持, 使人和其它软件、其它系统能够提供增强网 格 的智能。 遵循 w e b的经验, 织女星应该找出并提供最小、最简单的 共 性智能支持技术。 2 .2 . 1 . 3 . 全局一体 ( g l o b a l u n if o r m i t y ) 织女星网格的全局一体有三个含义,即连通性、单一系统映像、互操作 性。 连通性。假如去除了 用户有意加入的限制 ( 如访问 控制、安全、收费、 隐私等),网格的所有资源对用户而言都是连通的。从系统论的角度 说, 对任何用户, 任何资源都可观察 ( 可读、 可使用)与可控制 ( 可 写、可操作)。 单一系统映 像。 简单地讲,网 格对用户而言是 “ 一台” 计算机。网 格有 四 种 “ 用户”:最终用户,网 格管理员,网格平台设计人员,网格服务 开发人员 ( 如 a s p平台上的 i s v )。这些人需要不同的单一系统映 像。 四川大学硕士学位论文企业信息网格资源共享的研究 . 互操作性。由 于网 格往往是一个异构平台, 互操作性就很必要。 即 使在 貌似同构平台 ( 如同样的硬件和操作系统),也可能因为中间件、应用 软件、界面、格式等原因造成不可互操作。缺乏互操作性也是造成不连 通的一个重要原因。 2 .2 . 1 .4 . 自 主控制 ( a u t o n o mo u s c o n t r o l ) 尽管织女星提供全局一体化,但它同时也强调自 主控制.自 主控制的含义包 含如下几个方面: . 织女星是人民的网 格。因此, 要尽量把门 槛降低,吸引同 行合作伙伴加 入,吸引同行使用。简单地讲,自 主控制是对微软做法的反向思维。要 反对锁定用户 ( l o c k - i n )的做法,而是要吸引用户自 愿参与。自 主控制 是指,让别人能自 主控制他的资源和使用方式。 . 以人为中心。要让用户自 主地使用网格,而不是让网格控制用户。要把 决 策 权 ( p o l i c y , d e c i s io n , r e q u e s t 等) 交 给 用户 制定, 网 格 则提 供实 现 这些决 策的 支持 机理 ( s u p p o r t i n g m e c h a n i s m , e n f o r c in g m e c h a n i s m ) 。 . 自 主控制相关的技术包括: 可定制、可重构、可编程、安全、访问控 制、隐私等。 2 . 2 . 2 .社区原理 织女星网格的社区原理是: “ 通过用户与资源组成的社区,提升表示抽 象,降低知识结构需求,变无界为有界、变无序为有序,利用上下文,实现放 大 效 应 , 从 而e m p o w e r u s e r . ” 网格社区的概念以及社区原理是织女星网格的一个重要发明。它正在演 化, 还 有 很多 创 新 机 会. 网 格 社 区 的 英 文 暂 名 为g r id c o m m u n it y , 还可以 考 虑 k u n ta( 芬兰语社区) 或劝 e q u e 社区原理是解决网格开放、无序问 题的一种方法。这个原理的根据是下述 两个假设: . 有限假设:每个用户只需要使用很小一部分网 格资源。在特定时刻, 用 四川大学硕士学位论文企业信息网 格资源共享的研究 x miv ii . . h t i p组成了 一个从上到下的多 层次的协议栈, 各个层次协作服务实现 了 跨越 w e b的信息分布和集成应用程序逻辑。 信息网 格体系结构研究重点集中 在从底层的信息存储、表示、 对外发布、统一的呈现给用户的各层应用程序逻 辑具体分层、实现和集成,包括各中间层的数据存储、它们之间的接口界面、 通讯机制的研究。 织 女星 信息 网 格 ( v e g a i n f o n n a ti o n g r i d , v e g a i g ) 是中 科院 计算 所 织女 星 网格研究计划的一个组成部分。它的目的是在数据库技术、因特网技术、网格 技术、万维网服务等技术的基础上,研究信息网格的机制和体系结构,进而指 导信息网格系统及应用的开发。 织女星信息网格并不强调网格的地理规模, 而 是强调信息资源的有效共享与管理。因此,织女星网格的技术可用于构造从局 域网 环境下的小型企事业到 城域网或广域网 环境下的 大中型企业、 政府信息系 统。 织女星信息网格继承了 织女星网格通用服务、辅助智能、全局一体及自 主 控制的指导思想。 3 . 2 . 织女星信息网格的体系结构 织女星信息网 格的通用服务是指织女星信息网 格提供所有信息网格应用都 需要的共性技术,即信息网格应用需求的最小交集.同时, 织女星信息网 格应 该有一种可扩展的 机制,以 便于增加特定用户所需要的 功能。因此, 织女星信 息网格采用了图3 - 2 所示的可扩展体系结构。 用户 户界面点mi-xim v3ix6ii 信息网 格内 核 系统接口 圈 3 - 2 v a l a - i g体系结构 1 9 四川大学硕士学位论文企业信息网 格资潭共享的研究 在织女星信息网格的研制过程中, 我们通过研究和开发共性技术,包括织 女星信息网格的内核、系统接口、公共操作平台和用户界面;研究和开发可扩 展技术; 针对特定应用领域, 研制织女星信息网格的原型这三个方面的工作来 实现通用服务的指导思想. 3 .3 . 织女星信息网格面向行为的时空模型 为了 实现辅助智能和自 主控制的功能, 在织女星信息网 格的 研究中 提出了 一种面向 用户行为的 信息网 格时空 模型。 这个模型以 用户为中心, 用户控制着 信息的共享、管理和信息服务。同时,用户只需发出操作指令或服务请求 ( 这 种请求也可由 其他 w e b服务发出), 指令的实现以 及与此相关的信息一致性等 维护细节,则由 信息网格自 动完成. 织女星信息网格的面向 行为的时空模型包含四 个基本概念,即主体、信息 空间 ( 客体)、时间、操作,以及两个导出概念,即上下文和访问控制。其中 主体涉及用户身份和他所扮演的角色;信息空间是由所有原始信息和元数据的 集 合以 及 它 们 之间 的 关 系 构 成 , 信 息 拿 间 具 有 状 态 和 结 构; 时 间 是 单 调 增 长 的 量,它有一个起点,通过一个操作到达下一个时间点:操作是行为的基本单 位。 点、 用户所有可能的会话构成主体的行为。 上下文 ( c o n t e x t )由 主体、时间 空间点构成。因此,同样的用户,执行同样的操作,但如果扮演不同角 在不同时间点或不同空间点,效果是不一样的。 全局一体 色3.4. 全局一体的含义是:从任意用户行为的角度看, 如果忽略访问 控制, 信息 网 格是一个整体。织女星信息网格采用四 种技术来实现全局一体:连通性、单 一信息源、单一系统、互操作性。要强调的一点是,织女星信息网格的全局一 体特性是一种行为特性,只需要用户的行为能 看到全局一体,并不强求实现上 的全局一体。 . 连通性是指信息空间是连通的,而不是多个孤岛。 四川大学硕士学位论文 企业信息网格资源共享的研究 单一信息源是指信息空间 是非冗余的,即任何信息在信息空间中只占 据 一点 单一系统是指信息网 格看起来是一个系统,就像单个服务器系统一样。 互操作性是指信息网格的多个结点上信息的存贮和表示可以多种多样, 但从用户行为角度看都可以互操作。 : 3 . 5 . 访问控制 信息网格要解决的一个关键问题是信息共享的安全控制。信息网格可以跨 越多企业、多系统或个人,它们对安全控制的需求和采用的安全策略可能完全 不同,因此,信息网格的安全控制机制应该是通用的,全局的安全策略需要与 本地的安全策略协调和交互,既要满足全局控制的需要,又可以满足用户自主 控制的需求。信息网格的这些特点及其指导思想决定了信息网格的安全控制比 一般的信息系统的安全控制复杂的多. 信息网格的安全控制机制主要包括了身份认证机制、信息访问控制机制和 审计机制。在本文中,我们讨论的织女星信息网格的安全控制主要集中在信息 的访问控制机制,这是本文研究的主要问题。 织女星信息网格采用基于角色的访问控制, 通过角色的继承和职责分离 ( s e p a r a ti o n o f d u t y ) 等约束条件来表达和支持多种安全策略。 例如, 通过配 置,基于角色的访问控制机制即可以具有强制访问控制 ( ma c )的性质,也可 以 具有自 主访问 控制 ( d a c ) 的性质。并且,相对于通过直接对用户授权进行 权限管理,通过角色来管理授权简化了 授权的管理。 根据织女星信息网 格自 身的 特点, 我们在织女星信息网 格的 研究中 提出了 在织女星信息网 格的 ( u , i s , o p ) 空间 研究信息网格访问 控制的 理论方法, 提 供了 一个形式化的研究 信息网 格 访问 控制的手段。 并且, 在 ( u , i s , o p ) 空 间,我们提出了一个信息网格基于角色的访问控制模型一 一 - i g - r b a c模型。 在下文的 讨论中,我们所述的 信息网 格的概念都是建立在织女星信息网 格 的 研究基础之上,我们所指的 信息网 格在下文中 特指织女星信息网 格。 四川大学硕士学位论文 企业信息网 格资 源共享的 研究 4 。企业信息网格资源共享的关键问题 织女星企业信息网 格是在计算所织女星信息网 格理论研究的基础之上的一 个具体实 现, 它是以 织女星信息网格作为理论指导的. 织女星企业信息网格技术研制根本目 标则在于实现企业信息资源和系统平 台的一体化共享、管理以 及服务,为用户提供单一系统映像环境. 随着企业的发展, 在企业内 部出 现了 各种各样的 应用系统, 这些系统可能 是在不同的时间由 不同的公司开发, 互不相通, 给企业的综合分析、决策支持 等带来很大困难。一般来说这些系统都是基于不同的系统平台或编程环境开发 的, 都有自己的用户系统、资源库、权限管理,是 相对孤立的信息孤岛。虽然 可以 在一定程度上共享这些系统资源, 但是这种共享相对来说是静态的、 局限 于 某个系统中,需要专人维护, 通常是客户端与服务器之间的交互作用而不是 多 种资 源的 共享, 用户每进入一个系统都需要进行登录或身份验证,多个系统 的同时并存也给管理员带来很大的 麻烦。同时由 于这样的 企业信息框架结构可 扩展性不好,企业信息系统的升级换代也很困难,开发信息系统的成本很高。 我 们 提出 的 织 女 星 企 业 信 息 网 格( v e g a e n t e r p ri s e i n f o r m a t io n g ri d ) 则 可以 很 好地解决以 上所提出的问 题, 真正实 现信息共享, 为 用户提供单一的系统映 像 环境。其中 v e g a是通用服务 ( v e r s a ti l e s e r v i c e s )、辅助智能 e n a b l i n g in t e ll ig e n c e )、全局一体 ( g lo b a l u n if o r m ity )、自主控制 ( a u to n o m o u s c o n t r o l ) 开 始的一个单词的 英文 缩写, 是中 科院 计算 所提出 的网 格研究 项目 的主 要设计原理, 也是我们的设计的 指导思想。 在本章将详细介绍企业信息网 格中资源共享的 几个关键问 题。 4 . 1 . 资源的表示和元信息 信息的表 示体 现 在两个方面: 一是 将信息 存储于 数据 库或其他 存储介 质中 的表示, 二是将其呈现给用户在界面中的表示。 信息网 格是应 用 层的 软 件基础设 施, 各行 各业都有 将该 行业的 数据信息 放 到网格的需要,因此在信息网格上出 现的信息种类是多种多样的,包括结构 四川大学硕士学位论文企业信息网格资源共享的研究 化、半结构化和非结构化的数据,如何将它们映射成数据库或其他存储机制 ( 比 如文件系统)的数据实体是信息网格的首要问 题。元信息抽象化了 数据对 象的描述,使得各种信息可以通过一些元素属性和值之间的关系对来表达。我 们将元信息叫做数据表示的中间层。 数据的表示可以 建立多个中间层,在各个 应用程序逻辑层中都有其处理的相应的数据中间层。 4 . 1 . 1 .现有的信息表示方式 i n t r a n e t 信息系统的信息表示就是将企业内部的各种信息以w e b的形式对外 进行发布。 w e b页面是一种普通的 文本文件, 其内 容和格式相对固 定。 虽 然其中 可以 包含声音、图 像甚至活动的影视片段, 但这是由 设计者预先编制好的 , 客户 每次浏览到的都是同一内容画面, 除非w e b 管理员对其不断修改更新。那么,在建 立w e b 服务时 , 我们如何向 客户提供实时的 动态信息 , 如何同客户交流信息、 记录 资 料呢? 这需要把 w e b服务同 应用系统的 数据库链接起来,接受客户请求提供实 时 变化的 数据信息, 再 返回 给客户的浏览器, 而且能够 搜集客户提供的资料,并记录 到 适 当 的 数 据 库 中 . 因 此 , i n tr a n e t 中 信 息 的 表 示 往 往 主 要 体 现 在 各 种 结 构 化 信 息、 报表、文件如何在现有的数据库服务器中的表示问题。现在的大多数数据 库都是基于关系型的 数据库系统, 对一些结构化的 数据信息可以 通过建立的 数 据表的 形式来存放数据信息, 这些数据表的结构往往是预先已 经建立好的, 用 户对 w e b页面访问时, w e b服务器将与数据库服务器建立请求连接,数据库服 务器将请求处理完后将结果 信息返回到 w e b服务器, w e b服务器再将结果返回 到用户。而对于一些文件、报表等非结构化的数据往往是通过 web页面的链接 功能,实现页面的切换。 这种信息的 表示方式能 够存储现在大量 w e b信息的 发布问题, 但明 显的 缺 陷是它的灵活性很有限,数据之间的关系查询是预先定义好的。当信息的发布 的内容稍有变化时, 必须更改应用程序和重新定义关系型数据库结构,系统的 通用性能较差,不能满足现在企业信息的快谏变化的需要。 四少 ” 大学硕士学位论文 企业信息网 格资派共享的研究 4 . 1 .2 ,基于元数据的数据的定义模型 4 . 1 . 2 . 1 . 元数据概念 元数据即是 “ 关于 信息的信息, 关于 数据的数据( t h e d a t a a b o u t d a t a ) , 是 对对象属性的描述,也可译为描述数据或诊释数据。 当 我们利用数据库在计算机上 进行检索查询、 数据处理、辅助管理决策和 科技工 程计算时, 经常要通过数据库的注释或说明,了 解我们所用到的 数据库 的意义、 性质、存储格式及检索查 询方法等内 容, 这时我们已自 觉或不自 觉的 用到了 我们这里所论 元数据” 。通常,我们多把它们称之为描述性数据、说明 性数据、数据库简介、数据库档案或数据库的数据等。因此,常常把元数据定 义为 关 于 数 据库 ( 数 据属 性、 数 据 集 或 数 据 仓库 等 ) 中 数 据的内 容、 质量、 条 件、 查询和其它有关性质的描述性数据。 元数据的具体内 容将随学科不同 和应用领 域不同而异。 元数据一般分为 三层: 元数据子 集、 元数据实体和元数据元素。 元数据元素是元数据的 最基本的 信息单元。 元数据实体是同类元数据元素的集合。 元数据子集是相互关联的 元数据实体和元素的 集合。 在同 一个子集中,实体可以 有两类即简单实体和复 合实体, 简单实体只包 含元素,复合实体既包含简单实体又包含元素,同时复合实体与简单实体及构 成这两种实体的元素之间具有继承关系。 4 . 1 .2 .2 . 元数据对象的建立 企业信息系统建设面临的主要问 题:由 于业务的复 杂性涉及的 信息种类繁 多, 类型不一, 数据的表示和作 用方式都不一样。 从信息的作用上将数据分为 元 数 据 伽e ta d a ta ) 和 基 本 数 据 ( b a s e d a ta ) 。 从 信 息的 存 储 方 式 和 描 述 方 式 上 分 为 结构化数据和数据文件。 元数据利用结构化数据方式描述数据本身的属性. 基 本数据的描述包括结构化数据和数据文件的分别描述。文档对象所对应的结构 化描述称为数据集对象。因此,利用元数据的理论和面向对象思想,通过将各 四川大学硕士学位论文一企业信息网 格资潭共享的研究 种信息实体抽象成对象的方式保证可管理信息的可扩展性和统一性。 这就是基 于元数据对象管理的概念的由 来。 建立i n t r a n e t 不仅涉及组织大量的纯数据信息 ( 各种报表,文件等),以一种有效的模型组织这些信息既能带来高效的管理 又能有效的进行信息的安全控制.建立数据对象的模式定义一般需要下列步 骤。 i . 数据信息的分类 对象的组织数据的基本方法就是将数据信息用元数据进行表示,一个数据 对象就是一个元数据实体。 元数据又是由 元素组成的,因此对象也是由多个元 素组成的实体。由于企业中信息的 种类和数量的繁多,必须将信息进行分类管 理, 具有共同元素属性的信息归为一类,这样方便对象和元数据元素或者属性 的定义。 i i .数据信息的元素提取 将信息分类以 后,属于某一类信息的数据往往是由多个属性表示的,这些 属性就是元数据的元素。提取数据属性时既要考虑通用性还要注意可扩展性。 不同地区、企业、部门的人员对同一类信息元素的分类标准往往不一样,可以 将数据的元素进一步分成基本元素和扩展元素。 基本元素描述的是同 一类信息 的基本特征, 它是信息分类的主 要参考对象。 扩展元素往往只是对基本元素描 述的信息的补充,主要是为了 满足不同群体的人员对数据的不同要求,让他们 可自由 扩展信息的表示,而不更改数据的本来意思.基本元素和扩展元素的分 类标准可以 是根据数据类型的 本身 特征,也可以 根据权限 访问的需要来划分, 这种情况比 如有些数据的某些元素的 信息只有具有一定权限的 用户才能访问, 如公司员工的隐私信息。 m。 对象的 元数据特征定义 对象的元数据的特征由下列基本定义组成: 氏 名称赋给元数据实体或元素的标记. b .标识码一一计算机中 使用的 定义每个元数据实体和元素的唯一代码。 c . 定义对元数据实体和元素的说明。 d .性质 说明 元数据实体或元素是基本属性还是扩展属性。 e .条件 说明 何种条件下元数据子集、 实体或元素是必选的。 如果 对所说 明的 条件回 答是肯定的, 那么该子集、实体或元素就是必选的。 一一一一一一一三些竺望醚登竺丝匕兰 业 1 xi .s m 修 tk 源 -a 事 的 研 究 数据类型 一一表示元数据元素的一 组不同的 值, 例如 文本” 、 “ 整型” 、 “ 短 语” 、 “ 坐标串” 、 “ 实型” 和“ 日期 a b .值域 一 指定每个元数据元素的 取值范围。 任意长文本表示所 述内 容不 受 长 度 限 制, 实 型 数 和 基 于 代 码 的 整 型 数 等 只 能 使 用 一 个 限 定 的( 闭 合 的 ) 值 域内的值。 h .取值类型 一 说明 元数据的 实体的 取值方式, 如 用户输入、 选择、 相关文 件对象等。 i .优先级 一一 表示元数据的 元素在元数据中的重要性特征, 或者代表基本 属 性还是扩展属性。 j .关 联 一 一定 义 对象 之间的 关联 关系。 4 . 1 . 2 .3 . 非结构化数据的 表示 显然, 上面提出的对象化的数据表示对结构化数据很适合, 而在i n t r a n e t 系 统中 一般将数据分为元数据 ( m e t a d a t a ) 和基本数据 ( b a s e d a t a )。基本数据分 为结构化数据和数据文件。 通过元数据将物理上分布在不同的数据源中的基本 数据逻辑上成为统一的单一数据源。系统需要文件系统、全文检索系统和关系 数据库系统三者的支持。 文件属于非结构化的数据,文件往往是存储于文件系统,对文件的管理就 是要建立与数据库之间的关联, 通过建立文档数据对象的 元数据描述+ 文件本身 实现。 将文档对象所对应的结构化描述称为数据集, 给出相应描述。其中数据 文件对象的 操作主要指增加、 删除、 修改、 上载 ( 或叫发布)、 在线浏览和打 印 。目 前 这 些 在 企 业中 比 较 流 行的 应 用 针 对 所 产 生 的 数 据 文 件 都 提 供 了 在w e b 上的 流览工具或h t iv 几的转化功能, 因 此方便了 在w e b 上进行信息发布。 如图 4 - 1 表示产品的 对象与文档对象之间的关联 四川大学硕士学位论文一 ,企业信息网格资源共享的研究 图4 - 1文件数据的表示示例 4 . 1 .3 .对象间关联 企业门 户的数 据 仓库是 对企业 遗留 系 统 进行 信息 抽取后, 并结 合新的 系 统 需求基础上建立的企 业信息数据库。为 保证企业信息的可扩展性,同时 保证企 业中信息原有的逻辑意义,门户系统对企业信息的 描述面向企业中业务实体, 例如产品、 客户、 定单及合同等。 每个独立的 信息实体称为对象.同时 这些对 象间 存在数据上的 依赖关系, 称为关联。图村 是一个以 对象方式描述的 企业 信息模式, 其中产品、 客户、时间以 及合同间存在取值上的关联,定义这些对 象时.也要指定他们之间通过元数据元素建立的关联关系。 这样,针对这样一个查询:s e l e c t *f r o m s a le s , 从查询结果中可以 包含四个 s e l e c t 子查询, s e l e c t * f r o m s a l e s : 一 s e l e c t * fr o m p r o d u c t w h e re p r o d u c t i d = $ c u r r e n t_ p r o t id s e l e c t * fr o m p r o d u c t w h e r e t i m e i d 二 $ c u r r e n t im e t i d s e l e c t * fr o m p r o d u c t w h e r e o r d e re d = $ c u n -e n t o r d e r ti d s e l e c t * fr o m p rod u c t w h e r e c o n t r a c t i d = $ c u r re n t e o n t r a c ti d 其中 的 叭 _ p r o t i d , c u r r e n t im e t id , c u r r e n t o r d e r tid , c u r re n t c _ o n t ra c ti d 分 别针对前面父查询的相应属性结果, 这种包含关系非常适合用 , d e b来加以 描 述。 四川大学硕士学位论文 企业信息网格资源共享的研究 图4 - 2对象之间关联示意图 4 . 1 . 4 .元数据表示数据的 模型的形式化表示 通过元数据的描述和定义以 及对象模型的建立,相当于维护了一个系统所 能管理对象的扩展数据字典, 用户可以 方便的向 对象字典中 增加对象和定义对 象的 属性, 从而扩展己 定义对象的属性, 每个实体数据都是该对象池中 某个对 象 ( 系统定义对象或者是用户定义对象)的一个实例。同时企业门 户是建立在 w e b 平台基础上, 所以,必须使这种描述适合于w e b 上进行操作。结合w e b 中 的数据表示方式,我们对信息的关联类型做了分类,分类如表 4 - 3所示。在数 据仓库中 的数据对象间 关系 分为 七 类, 并分别约定与h t iv i l表示的绑定规则。 其中, d a t a s e t 类型将结构化描述 ( 基于属性描述的) 和非结构化描述 ( 基于文 档描述的) 结合到属性描述上, 从而统一在一个框架下。 这样, 在定义数据的 同时, 又定义 h t m l的 描述方式, 从而能 够根据不同 的 对象关联类型提 供相对 应的界面表示. 四川大学硕士学位论文企业信息网格资源共享的研究 类型n o .类型名称h t ml控件名称描述 1 i n p u ti n p u th t m l 中 的in p u t 组 件 类型 2s e l e c ts e l e c t h t m l 中的s e l e c t 组件类型 3da t a s e tf i l e h t m l 中的 文件类型 4url i n p u th t m l中的 卿u t组件类型 田rl) 类型 5t e x t a r e at e x t a r e a h t m l中的t e x t a r e a 组件类型 6ba t c h厂i f 批处理类型 7 i ma g e加a g e输入或显示一张图片 图4 - 3在w e b 中的信息来源类型 结合这种描述,进一步给出对象属性的元数据结构如图 4 一 所示。其中 c a t t r i n a m e 和a t t r i n a m e 解决了中英文相互映射问 题, 将用户表示和数据库存储分 别 表 示, 便于 控制, p r i o r i t y 将元素 属 性按 照安 全 级别 分 类, 便于 信息的 安 全 控 制。 在这样的数据结构基础上,对于对象的增加、删除、修改和关联能够在 h t m l中统一的进行处理, 而且能够方便地生成 h t t p连接,从而进行相关检 索,提供传统的查询方法不能找到的信息,将 w e b的连接与内部连接统一起 来。 四川大学硕士学位论文一 一企业信息网格资源共享的研究 t y p e d e f s t r u c t f l n t a t t r i l e n g t h ; c h a r * a t t r i n a m e ; c h a r * c a t t r i n a m e ; i n p a t t 抓 祀 i t 打 ) e ; 八属性名称* / 八属性中文名称* / 加信息输入的 方式: i n p u t t y p e i n p u t , s e l e c t , d a t a s e t d a t a s e t , u r l t e x t a r e a , b a t c h i n , b i n d i 耐 : */ e n t i t y * r e l a t e d en t i t y ; a t t r i r e l a t e d a t t r ; f 相关的属性* f d e f a u l t v

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论