(计算机软件与理论专业论文)norm驱动的网格工作流建模关键技术研究.pdf_第1页
(计算机软件与理论专业论文)norm驱动的网格工作流建模关键技术研究.pdf_第2页
(计算机软件与理论专业论文)norm驱动的网格工作流建模关键技术研究.pdf_第3页
(计算机软件与理论专业论文)norm驱动的网格工作流建模关键技术研究.pdf_第4页
(计算机软件与理论专业论文)norm驱动的网格工作流建模关键技术研究.pdf_第5页
已阅读5页,还剩63页未读 继续免费阅读

(计算机软件与理论专业论文)norm驱动的网格工作流建模关键技术研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 随着网格技术的飞速发展,网格工作流在越来越多的领域得到应用,使得 网络上的分布式异构资源得到了更有效的利用。网格工作流建模技术能够灵活 定义、修改删格应用的执行流程,设定任务动态分配机制,优化网格资源利用 率,冈此,成为了网格工作流研究中的关键技术之一。 在分析当前网格工作流建模技术研究现状的基础上,结合组织符号学中 n o r m 分析方法,针对工作流在网格环境下出现的新特点,本文对网格工作流建 模中的跨组织活动组合模型,动念角色分配方法进行了研究,丰要内容包括: 支持跨组织定义的网格工作流动态模型。提出了用n o r m 来描述组织内部 活动与活动之间的关系,以及一套网格工作流与组织间交流活动的规则。通过 工作流与组织间的规则的相互作用,可以出筛选合适的活动,并在组合规则的 作用下动态组合出高效的网格工作流子流程提供网格工作流使用。 组织内部活动的组合算法以及规则的校验算法。提出了网格工作流动态模 型中活动组合、发布、申请规则的校验算法,保证这些规则在建立过程中的合 法性与有效性。此外,还提出了组织内部活动的组合算法,保汪在符合组合规 则的f 睛况卜- ,组合出执行效率最高的子流程。 网格工作流中角色分配的n o r m 方法。提出了用n o r m 来描述网格工作流 中的角色与实体的关系,以及基于n o r m 的状态驱动的角色分配规则。达到网 格工作流管理者与网格资源所有者对网格资源共同管理的目的,优化网格资源 在网格工作流中的利用率。 基于n o r m 的网格工作流建模工具原型。支持基于n o r m 的网格工作流建 模,并且支持模型的模拟运行,在模拟运行过程中允许用户对网格资源的属性 与状态进行实时监控。 关键词n o r m ,网格 作流,建模,活动组合,角色分配 n o r m 驱动的叫格t 作流建横关键技术训究 a b s t r a c t w i t ht h er a p i dd e v e l o p m e n to fg r i dt e c h n o l o g y ,g r i dw o r k f l o wi sb e i n ga p p l i e dt o m o r ea n dm o r ea r e at om a k eu s eo f t h ed i s t r i b u t e dn e t w o r kr e s o u r c e sm o r ee f f i c i e n t l y t h eg r i dw o r k f l o wm o d e l i n gt e c h n o l o g yc a nf e x i b l yd e f i n e ,m o d i f y ,a n da p p l yt h e w o r k f l o wp r o c e s si ng r i d ,a n dt h ed y n a m i ct a s kd i s p a t c h i n gm e c h a n i s mm a k et h eg r i d r e s o u r c eu s e dm o r ee f f i c i e n t l y a sar e s u l t ,i tb e g i n st ob eo n eo ft h ek e yo r i e n t a t i o n s o f r e s e a r c hf o rg r i dw o r k f l o w i nt h i sp a p e r , b a s e do nt h ec u r r e n tr e s e a r c ho fg r i dw o r k f l o wm o d e l i n gt e c h n o l o g y , i t r yt of i n dt h es o l u t i o nt om e e tt h er e q u i r e m e n to ft h en e ww o r k f l o wf e a t u r e si nt h e g r i dc i r c u m s t a n c eu s i n gt h eu o r l l la p p r o a c h m yr e s e a r c hm a i n l yf o c u s e so nt h ec r o s s o r g a n i z a t i o na c t i v i t i e sc o m b i n a t i o na n dr o l ea s s i g n a t i o ni ng r i dw o r k f l o w , l i s ta s f o l l o w i n g : c r o s so r g a n i z a t i o ns u p p o r t e da c t i v i t i e sc o m b i n a t i o nm o d e l i n g t h i sp a p e rt r i e st ou s e n o r l nt od e s c r i b et h er e l a t i o n s h i pb e t w e e na c t i v i t i e si nas a m eo r g a n i z a t i o n ,a sw e l la s as e to fr u l e st oa f f e c tt h e s ea c t i v i t i e s t h r o u g ht h er u l e sb e t w e e nt h ew o r k f l o wa n d t h eo r g a n i z a t i o n s ,p r o p e ra c t i v i t i e sc a nb ep i c k e do u tt ob em e r g e di n t oa ne f f i c i e n t s u bw o r k f l o w a l g o r i t h m sf o ra c t i v i t i e sc o m b i n a t i o na n dn o r mr u l ev a l i d a t i o n t h e s ea l g o r i t h m sc a n m a k es u r et h en o r mr u l ei nt h eg r i dw o r k f l o wm o d e li s v a l i d ,a n dt h es u bw o r k f l o w p r o d u c e db yt h ed y n a m i cm o d e l i n gi sm o s te f f i c i e n t n o r ma p p r o a c hf o rr o l ea s s i g n a t i o ni ng r i dw o r k f l o w t h i sp a p e rt r i e st ou s en o r mt o d e s c r i b et h er o l ea n dt h ee n t i t y , a sw e l la st h en o r md r i v e nr u l e sf o rr o l ea s s i g n a t i o n , i no r d e rt om e e tt h er e q u i r e m e n to fd u p l i c a t e dg r i dr e s o u r c em a n a g e m e n t ,a n dm a k e u s eo ft h ef i d er e s o u r c e sm o r ee f f i c i e n t l y n o r mb a s e dg r i dw o r k f l o wm o d e l i n gt 0 0 1 t h i st o o lc a nb eu s e dt om o d e lt h eg r i d w o r k f l o wu s i n gt h en o r mt e c h n o l o g y ,g i v e nt h em o d e l i n gd a t a , i tc a na l s os i m u l a t e t h eg r i dw o r k f l o w , a n dl e tt h eu s e r sm o n i t o rt h es t a t eo f g r i dr e s o u r c e k e y w o r d sn o r m ,g r i dw o r k f l o w , m o d e l i n g ,a c t i v i t i e sc o m b i n a t i o n ,r o t e a s s i g n a t i o n 论文独创性声明 本论文是我个人在导师指导下进行的研究工作及取得的研究成果。论文中除 _ 特别加以标注和致谢的地方外,不包含其他人或其它机构已经发表或撰写过的 研究成果。其他同志对本研究的肩发和所做的贡献均已在沦文中作了明确的声明 并表示了谢意。 作者签名: i 囊鱼。呈 h 期:丝z : 论文使用授权声明 本人完全了解复旦大学有关保留、使用学位论文的规定,即:学校有权保留 送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内 容,可以采用影印、缩印或其它复制手段保存论文。保密的论文在解密后遵守此 规定。 作者签名:整鱼,丝导师签名:丝同期:垫1 21 : n o r m 驱动的m 格t f r 流建模关键技术i d f 究 1 1 研究背景 第1 章绪论 随着科学技术的进步、计算机和网络技术的迅猛发展,人们对信息的处理 量和处理能力的要求达到了一个新的高度。传统的单机或者工作站的计算能 力,已经很难满足人们对海量信息的处理需求。而网格,这种构建于互联网之 上的新兴技术,能将地理上分散的资源按人们的需要逻辑地结合在一起,作为 一个整体而工作,从而满足为了人们满足对计算能力迅速增加的需求。并且随 着i n t e m e t 和w w w 持续增长,通信带宽的不断增加,强大计算能力的计算机 和低成本组件的广泛应用,网格应用得到了快速的推广。由于网格应用越来越 复杂,时白j 、空间和资源方面的约束越来约多地被包含其中,很多网格项目开 始用工作流技术来管理,以提高网格的效率和管理力度。并且随着对网格研究 和应用的不断深入,迫切需要有支持动态建模和调度的工作流方案的出现,以 方便地构建和管理复杂的网格应用,使性能得到优化。因此大量的对网格工作 流以及它的建模方法的研究工作也被纷纷展丌。 1 1 i 网格与网格工作流 网格是科学家于9 0 年代初针对当今的一些科学难题提出的新概念。它将分 布在不同地理位置的计算资源包括c p u 、存储器、数据库等,通过高速的互联 网组成充分共享的资源集成,从而提供一种高性能计算、管理及服务的资源能 力。人们用这些资源就像用电源一样,不必计较这些资源的来源和负载情况。 伊安福斯特( 美国计算网格项目的领导人之一) ,在1 9 9 8 年主编过的题为网 格:2 1 世纪信息技术基础设施的蓝图【l 】一书中,这样描述网格:“网格是构 筑在互联网上的一组新兴技术,它将高速互联网、高性能计算机、大型数据 库、传感器、远程设备等融为一体,为科技人员和普通老百姓提供更多的资 源、功能和交互性。互联网主要为人们提供电子邮件、网页浏览等通信功能, 而网格功能更多更强,能让人们透明地使用计算、存储等其它资源。” “网格”( g r i d ) 一词来源于人们熟悉的电力网( p o w e rg r i d ) 。目前对计算 力的需求正在持续不断地增长。高速网络、功能和性能更加强大的大规模计算 系统、高性能存储系统以及高级数掘分析软件的应用为解决商业领域和科学领 域的计算问题带来了希望。但是利用这些新的能力意味着应付不断增加的工作 负荷要求所带来的空前挑战。当一个组织机构在努力保持竞争力的时候他们面 临许多前所未有的挑战:减少计算费用、增加计算吞吐量、加快对市场的响 应、改进生产服务质量和产品创新等都是非常重要的。一个组织机构在硬件方 n o r m 驱动的州格t 仟流建模关键技术州宄 面的投资需要谨慎地进行权衡,并且必须找到利用可得资源完成更多工作的方 法。尽管对计算力的需求是非常大的,但是许多现有的系统都没有得到充分利 用。其中一些单个服务器也许满负荷工作,但是大多数系统却不是满负荷工作 的,使许多计算周期没有使用,而实际上这些计算周期可以用于满足不断增长 的计算资源需求。网格计算使组织机构可以更加有效地和灵活地用他们的分布 式计算资源,从现有的系统中获取更加有用的计算力,帮助组织机构获得竞争 优势。 由于网格应用越来越复杂,时间、空间和资源方面的约束越来约多地被包 含其中,很多网格项目,例如p h y g r i d n 4 和g r i d a n t 5 开始用工作流和具有工 作流特征的服务来管理应用,以提高网格的效率和对它的管理力度。一些国际 组织和研究机构也提出了一些关于网格工作流的规范建议,如g s f l ( g r i d s e r v i c ef l o wl a n g u a g e ) 6 ,g l o b a lg r i df o r u m 的g r i dw o r k f l o w 7 等。由于在资 源管理和调度方面的特殊性,网格工作流和传统工作流相比主要有如下特点 【2 】 3 】: ( 1 ) 分布性与资源共享:在传统的工作流中,所涉及的资源,如硬件设 备,人员等相对集中,比较容易统一管理。而在网格环境中,资源都是分布 的,因为网格本身就是通过集中分散的资源束完成所交付的任务的,而其目的 是达到最大限度的资源共享,也就是这些资源不仅能在同一个网格工作流内共 享,还能在不同的网格工作流之间共享。所有的资源高度抽象成为用户可见的 “电源接线板”,其它的东西对用户透明。 。 ( 2 、动态性与多样性:和电力网格一样,用户的需求是变化的,所以动态 性是网格需要考虑的一个基本问题。原来拥有的资源或者功能,在下一时刻可 能出现故障或不可用,而原来没有的资源,会随着时间的推移逐步的加入进 来。这就要求网格管理必须充分考虑资源的动态变化,对于网格资源的动念减 少或者资源出现故障的情况,要求网格能及时采取措施,实现任务的自动迁 移,做到对高层用户透明或者尽可能减少用户的损失。 ( 3 ) 自治性与多重管理:网格上的资源,首先是属于某一个组织或者个人 的,因此网格资源的拥有者对该资源具有最高级别的管理权限,网格应该允许 资源拥有者对他的资源有自主的管理能力,这就是网格的自治性。但是网格资 源也必须接受网格的统一管理,否则不同的资源就无法建立相互之间的联系, 无法实现共享和互操作,无法作为一个整体为更多的用户提供方便的服务。因 此网格的管理具有多重性,一方面它允许网格资源的拥有者对网格资源具有自 主性的管理,另一方面又要求网格资源必须接受网格的统一管理。 n o r m 驱曲的嘲格t 作流建模关键技术研究 1 1 2 组织符号学与n o r m 符号学【8 】是一门研究符号( s i g n ) 和符号系统( s i g ns y s t e m ) 的科学。从符 号学的角度来看,世界上的一切都可以称为符号,符号无所不在,它的存在形 式可以是字、词、图像、声音、气味、滋味、行为、手势、信号、物体等等。 但是如果这些事物没有内在含义的时候,还不是符号。只有当我们赋予它们内 在含义以后,他们爿能成为符号。符号学就是分析这些符号的意义以及它们所 表示的功能,这种过程并不是孤立进行的,而是要在符号所处的社会环境中进 行。所以说,符号学的本质就是一个分析工具,主要的目的就是从本质上解释 和说明已经发生的符号的处理过程。 符号学在计算机系统上的应用是从二十世纪九十年代初开始的,是一个全 新的研究方向。它研究的是基于计算机的符号及其功能,主要分为三个分支: 接口符号学【9 】、计算符号学【l o 】和组织符号学【1 1 1 2 1 1 3 。 组织符号学是从社会和组织的角度来分析系统需求,为提高信息系统的适 用性提供了一个新思路。其基本观点是:系统是由各种自主体组成的,自主体 的行为受到在系统中存在的各种强制力的影响,这种强制力来源于组织中或者 社会团体中公共的行为规范。在行为规范的控制下,自主体通过信息的交流和 解释产生了行为。人们采用组织符号学的方法从语义和语用的角度来看待整个 信息系统的,并且增加了社会和组织的影响因素,把信息系统作为了社会和组 织的一个组成部分。在信息系统的内部和外部存在许多的自主体,这些自主体 都可以根据信息系统提供的信息和系统规范以及自己的角色和任务来实现自己 的行为,同时这些行为也影响了信息系统的状态。 自从1 9 7 3 年r o n a l ds t a m p e r 首次使用组织符号学来设计信息系统f “】以 来,很多专家学者都丌始研究组织符号学在信息领域中的应用。后来,r o n a l d s t a m p e r 总结了组织符号学在分析和描述系统需求方面的成果,形成了一整套分 析方法一一m e a s u r 。刘科成教授在专著 1 4 】中详细的描述了这套方法。 m e a s u r 方法是一套全新的面向n o r m 的方法集合,适用于软件开发过程中的 系统建模和需求分析,该方法的基础是:组织是一种信息系统,n o r m 是组织规 范中的重要组成部分。 n o r m ( 规范) 是符号学中研究语义、语用和社会行为的主要工具,描述了 不同组织、不同文化背景、不同社会、同一个组织内部不同的部门和行为主体 之间如何进行交互协作的。这些规范是根据特定的社会背景而产生的,规定了 行为主体和组织之问应该采取哪些行为才能实现它们之问的协作,从而完成一 定的社会目标。n o r m 的分析和描述为复杂系统和组织的分析设计提供了一套标 n o r m 驱曲的m 格t 作流建挺夭链技术锄f 究 准化的方法,利用n o r m 丰富的语义来描述行为主体之间的相互依赖和协作关 系,可以容易地实现复杂系统和组织的建模和分析。 n o r m 是组织中的行为准则,它以书面的或者非书面的形式表现出来,直接 地或者间接地指导、协调和控制组织成员的行为方式,规定组织成员之间的沟 通方式。n o r m 的功能是判断人们的行为方式是否符合组织环境的要求,并且还 有指示性的、说明性的功能。 n o r m 对组织成员的行为起到了指导作用,成员都是根据自身所处的状念来 使用和他的行为相关的n o r m 。这种状态评价过程和n o r m 选择过程可能是完全 主观的,也就是说,n o r m 和组织成员的行为没有预定好的关系,所以组织成员 可以利用规范,也可以忽略规范。 1 2 网格工作流建模技术的研究现状 网格工作流建模技术的研究,是伴随着对具体网格项目和系统丌发和研究 进行的。一方面,由于各个网格项目的侧重点和目标不同,所采用的网格工作 流建模技术也风格不同,各有各的针对性;另一方面,由于传统工作流建模技 术长期发展和相对成熟,网格工作流建模技术又会受到传统工作流建模技术的 影响,融合传统建模技术于其中。本节将分析目静比较有代表性的网格工作流 建模技术,指出这些技术所存在的优缺点。 d i r e c t e da c y c l i cg r a p h d a g ,即有向无环图,是一种比较直观的图形化流程描述方式。由于它简 洁易懂,所以被应用到很多流行的网格工作流应用之中。比如c o n d o r 1 5 1 , p e g a s u s ,g r i d a n t 1 9 ,和g r i d f l o w 2 0 。因此d g a 是目前最流行的一种网格 工作流建模技术。下面结合具体项目来分析一下d g a 是如何应用到这些流行 的网格应用中的。 c o n d o r :是一个基于网格的资源调度系统,它聚集从个人电脑到大型服 务器的各类异构计算资源,以提供一个大吞吐率的计算环境。在c o n d o r 中有一 个叫d a g m a n 的组件,它充当了c o n d o r 的作业调度单元。d g a m a n 在处理工 作流中任务的相互依赖关系时,就是以d a g 作为流程描述的数掘结构。每一 个任务相对于d g a 中的一个节点,通过有向图形成一个拓扑结构,规定了任 务之间的时序关系。当一个任务还没有结束时,它出边所指向的后续任务就不 会被d a g m a n 所调度。而且由于d a g m a n 不支持循环,所以有向图中不存在 环,因为循环会导致计算资源调度过程中发生死锁。当作业失败的时候, d a g m a n 会根据d a g 和当前任务的执行情况,分析并创建一个新的d a g 作业 n o r m 驱动的州格t 作流建模关键寺支术研粤【 图,并重新丌始提交和调度作业。c o n d o r 是最早的网格工作流原型之一,只具 备基本的工作流建模能力,因此它所采用的d a g 建模技术虽然简单易,但已 经满足了这个网格项目的基本需要。 p e g a s u s :是项目g r i p h y n 4 1 1 6 1 1 7 虚拟数据系统( v i r t u a ld a t as y s t e m ) 的 一部分,和c h i m e r a 结合实用。c h e m e r a 是让用户描述数据导入和导出的虚拟 数据v d l ( v i r t u a ld a t al a n g u a g e ) 。而p e g a s u s 是一个配置系统,在网格中映射 和执行工作流。他从c h i m e r a 接受抽象工作流描述,产生一个具体的工作流, 然后提交给c o n d o r - - g d a g 1 8 1 执行,所以它也是采用有向无环图来d a g 来 对工作留建模。为了在网格环境中定位输入数据,p e g a s u s 采用r l s ( g l o b u a s r e p l i c al o c a t i o ns e r v i c e ) 。输入文件由d a g 中的逻辑文件名指定,p e g a s u s 用 r l s 为这些文件发现具体的物理位置列表。因此,在p e g a s u s 中,d a g 除了标 示流程中任务的拓扑关系外,还增加了对文件的定位,以支持虚拟数据系统这 一应用,比c o n d o r 单一的计算资源调度更进了一步。 g r i d a n t :它定义了一个可以由网格用户扩展的开放式工作流管理体系。 整个运行环境建立于g l o b u st o o lk i t3 1 2 1 之_ 1 2 ,其中的任务调度模块是独立 的,不依赖于g t 3 ,而是采用了目前流行的丌源任务执行引擎,a p a c h e 的 a n t 2 2 。所有的任务都封装成g r i d a n tt a s k ,交给a n t 来调度,如图l 所示。 幽1g r i d a n t 系统架构图 这样做的好处是,一方面a n t 本身是由j a v a 实现的,因此它可以成为一个 跨平台的工作流调度引擎。另一方面,a n t 任务是由x m l 文件定义的,用户可 n o r m 驱曲的州格t 仃流建模关键手上术研究 以很方便的定义自己的a n t 任务模板,组装自己的任务。a n t 的中任务之阳j 的 相互依赖关系是有每个任务的d e p e n d 关键词定义的,如 。而是一种与d a g 等价的流程定义方式,即一个a n t 脚本中 的所有任务可以用一个d a g 来等价的表示。和前两个网格应用相比,g r i d a n t 的任务问拓扑关系的概念没多少改变,只是就单个任务来说,它的描述由于使 用了a n t ,使其形式更加丰富,定义起来更加自由,而且扩展性非常好。所以 这是一个灵活性比较高的d a g 网格工作流模型。 g r i d f l o w :该项目引入了网格工作流的层次结构,它包括一个用户门户和 全局网格工作流管理系统服务,局部网格子工作流调度服务。模拟、执行和监 控工作流在全局网格层提供,在基于代理的网格资源管理系统层次上工作 【2 3 1 。在每个局部网格,自工作流调度和冲突管理在任务调度系统的性能预测 上处理【2 4 】。而无论在全局还是局部的工作流建模中,仍旧采用了d a g 来描 述。所以它的最大贡献在于引入了层次的网格工作流体系结构,但在建模技术 本质上并没有带来进步。 综合上述的工作流建模应用,可以发现,d a g 的应用是相当广泛的。 d a g 的直观性和易用性得到了各个网格应用的认可。但是,这些网格应用只是 丰富了各自的网格工作流中的任务的描述,对于任务之间依赖关系的处理只停 留在普通的d a g 拓扑关系上。这就受到了d a g 本身所带来的工作流建模上的 限制:首先,d a g 不支持环路,这虽然减少了工作流执行过程中死锁的发生机 会,但缺少了对复杂流程的表示能力;其次,d a g 重点描述的是任务问的关 系,对每个网格资源的状态的表示能力较弱,不便于通过网格工作流的当前状 态对其进行控制;再次,d a g 不能检验整个网格工作流模型的有效性,仅仅着 眼于任务和任务之| 日j 的依赖关系;最后,使用d a g 的网格工作流模型在高动 态的网格工作流中执行时,很有可能失败,导致整个流程暂时瘫痪,要继续执 行必须重新分析和建立d a g 。总之,d a g 在工作流建模上方便易用,但对网 格工作流的特性支持上还不够。因此在复杂的网格工作流建模中,人们开始寻 求其他的建模技术。 p e t r in e t p e t r in e t 是在传统网格工作流建模中常用的技术。p e t r i 网的原理恰当地描 述了异步并发的网格环境,它既有严格的形式定义,又有直观的图形表示,更 有丰富的系统描述手段和系统行为分析技术。所以有的网格项目就把这种技术 应用在网格工作流建模中,如f r a u n h o f e rr e s o u r c eg r i d 。它用p e t r in e t 中的场 所,变迁和有向弧束对网格工作流进行建模。用场所束表示每一个任务,只有 n o r m 驱动的州格1 - 作流硅模关键控术研究 当一个变迁的每个输入场所的任务完成时,这个变迁才能发生,这个变迁所指 向的输出场所的任务刁能丌始执行。与d a g 相比,这种描述方式支持了任务 的异步并发执行,更适合于网格环境。但是p e t r in e t 自身也有不少缺点。首 先,它是一种静态的流程描述方案,所以很难适应网格的动态性,比如网格中 的资源经常会变化,某些服务会突然实效,而新的服务会不断加入进来,所 以,使用p e t r in e t 建模的网格工作流一般会比较封闭,很少与大的网格环境交 互,这就失去了网格本身所带来的优势;其次,当工作留中资源很多,关系复 杂的时候,由p e t r in e t 的模型会非常庞大,而在复杂的网格环境中,资源量庞 大是很讵常的;再次,模型不能反映时间方面的内容,不支持构造大规模模 型,如自顶向下或自底向上等,会对网格的嵌套层次结构支持较差。 u m l 是当前最流行的建模语言之一,它有种类丰富的视图,可以从不同 侧面不同深度去表现一个系统,广泛应用于软件工程中的设计阶段的系统建 模。网格工作流自然也是它适合描述的对象之一。最适合用柬描述工作流的是 其中的活动视图( u m la c t i v i t yd i a g r a m ) 。在“t o w a r d so , l lu m lb a s e dg r a p h i c r e p r e s e n t a t i o no f g r i dw o r k f l o wa p p l i c a t i o n ”中,用原类型定义了工作流概念, 并定义了工作流的嵌套u m l 表示以及“c o m p u t e ”,“t r a n s f e r d a t a ”和“v i e w ” 三种原操作。并在这基础上,用u m l 活动图表示出分置,循环和并发三种流 程控制模型,以及一种数据传输模型。 有了这些元素结构,流程控制和数据传输的定义,就可以表示出对各种网 格工作流进行建模。但对于u m l 在网格工作流中的使用仅停留在研究和试验 阶段,缺少在大规模网格工作流项目中的应用。原因是虽然它对网格工作流有 很强的描述能力,但对网格的动态性支持不够;而且和软件工程中的m o d e l d r i v e na r c h i t e c t u r e 相比,缺少了模型图到数据结构的映射,难以让工作流执行 引擎理解。 e c a 具有深厚理论基础的e c a ( e v e n t c o n d i t i o n a c t i o n ) 规则已被应用到工作 流领域中,在灵活控制工作流程方面显示出优势。由于它在工作流建模方面已 经有了比较多的研究和实践,它的思想很值得网格工作流建模加以借鉴,因此 在这里加以分析。 e c a 具有如下三个方面的特征:( 1 ) 当所指定的某些事件发生时才对流程 的状念进行探测。允许的事件通常为对特定活动的执行、结束或意外中断。或 n o r m 驱动的m 格丁作流建模关键技术研究 者,作为一个事务的一系列活动的类似事件的产生。( 2 ) 由工作流引擎对条件进 行测试。如果条件不满足,则什么也不做,否则,为响应该事件就会进行与该 触发有关的处理。( 3 ) 如果触发条件得到满足,就由工作流执行引擎执行与该触 发相关的动作。于是该动作可能制止事件的发生或撤销事件。实际上,动作可 能是工作流中活动的任何序列,或者是某些流程全局上的操作,甚至可能是和 触发事件完全无关的操作。因此e c a 规则的描述虽然简单,但它的表达能力非 常丰富,通过规则的组合,能描述出复杂的流程,并在过程选择上,对不同的 条件智能地的跳转到不同的活动去执行。 在诸多的基于e c a 的工作流建模应用过程中,人们总结出两条实践经 验:第一,在定义规则时要写很多非常细致的规则,这是e c a 本身特点所确定 的,遗漏了某些规则,就会导致整个模型不完整,工作流不能被f 常驱动:第 二,需要对规则进行维护,由于建模的需求,会使很多规则并存,难免这些规 则发生冲突。或者规则整体的完整性不足。因此,这说明e c a 有这样的一些不 足:对工作流建模需要有大量的规则,这些规则是独立定义的,因此规则之问 会有冲突的存在;缺少规则的验证,即一旦工作流有改动,不能确定到底需要 在原有的规则集合上增加多少新规则,新规则的有效性和完整性也不能得到确 保;此外,当有事件发生的时候,由于是根据条件来确定流程的走向,所以没 有定义工作流中各个资源的状态,因此对工作流整体状态的表述能力较弱。 1 3 存在的问题 鉴于网格工作流建模技术的研究现状以及它与传统工作流建模技术的差 异,可以发现当前的网格工作流建模技术存在如下的缺陷: 不能适应网格工作流中活动的分靠性。当前的网格工作流应用中,活动的 分布性尚不明显,大多数的活动都处在一个组织内部执行,只是在物理上呈现 出分布性。所以大多数网格工作流能直接把传统的工作流建模技术迁移过来使 用,如d a g 等。但是,如果网格工作流中的活动是分布在不同的组织中的, 那么网格工作流中的活动组合是无法静态确定的,因为其他组织可以随时去改 变他们所提供的活动。以此,需要在网格工作流建模中引入一种组织之间协调 活动的机制,才能模型适应活动的分布性。 忽略了网格资源的双重管理性。网格中的资源隶属与某个组织或者个人, 资源的所有者对其有最高的管理权,比如让该网格资源撤出网格,导致该资源 在网格中不可用。另一方面,网格资源一旦加入到网格工作流中,它又要受到 网格工作流管理者的调度,去与其他网格资源合作,共同完成工作流中的任 务。但是,目前的网格工作流建模中只从工作流管理者角度出发,没有考虑到 n o r m 驱动的叫格t 作流建模关键技术纠f 究 网格资源所有者可能对网格工作流的干涉。这可能是由于现实中网格工作流管 理者同时也是网格资源所有者的现象引起的。 没有体现出网格资源的动念性。在网格工作流中,角色所对应的网格服务 的实体是在动态变化中的,不断有的网格资源退出网格环境,也可能有新的网 格资源加入到网格中可以被网格工作流使用。因此,网格工作流中角色的实际 承担者是动态变化的,一旦角色承担者的状态不能适合网格工作流的需求,它 就可能被重新分配。 1 4 本文工作与贡献 针对网格工作流建模中存在的上述问题,本文根据网格工作流的新特点, 结合组织符号学中的n o r m 技术,对网格工作流跨组织的活动组合模型以及角 色分配方法进行了研究,主要研究内容和贡献如下: 支持跨组织定义的网格工作流动念模型。针对网格工作流中的活动可能在 不同组织中被执行的特点,提出了用n o r m 来描述组织内部的活动之间的关 系,以及一套网格工作流与组织间进行活动交互的规则。基于这套规则,在模 型实际的形成过程中,就可以通过工作流与组织问的规则的相互作用,筛选合 适的活动,并在组合规则的作用下动态组合出最适合的网格工作流子流程。 组织内部活动的组合算法以及规则的校验算法。提出了上述网格工作流动 态模型中,活动组合、发布、申请规则的校验算法,保证这些规则在建立过程 中的合法性与有效性。此外j 还提出了组织内部活动的组合算法,保证在符合 组合规则的情况下,组合出执行效率最高的子流程。 网格工作流中角色分配的n o r m 方法。提出了用n o r m 来描述网格工作流 中的角色与实体的关系,以及基于n o r m 的状态驱动的角色分配规则。到达网 格工作流管理者与网格资源所有者对网格服务的共同管理目的,优化网格资源 在网格工作流中的利用率。 基于n o r m 的网格工作流建模工具原型。使用c 撑实现了一个网格工作流建 模工具。支持基于n o r m 的网格工作流建模,并且支持模型的虚拟运行,让用 户对网格资源的状态进行实时监控。 1 5 本文结构 本文的剩余部分组织如下: 第二章介绍n o r m 驱动的网格工作流活动组合模型,包括模型的形式化定 n o r m 驱动的埘格t 作洫建模关键手上术研究 义,以及支持跨组织活动组合的各类规则定义。 第三章介绍各种规则的验证算法,保证模型中规则的有效性。还介绍了组 织内部活动的组合算法,保证在符合组合规则的情况下,组合出执行效率最高 的子流程。 第四章介绍了基于n o r m 的网格工作流角色分配方法,包括基于n o r m 的 网格工作流角色与实体描述,基于n o r m 的驱动规则以及角色分配算法。 第五章介绍了基于n o r m 的网格工作流建模工具,包括总体设计与主要功 能模块介绍。并结合一个实例来介绍它的使用。 第六章对全文进行了总结,并结合目前研究情况和网格工作流建模技术的 发展趋势,提出了进一步的研究工作和方向。 n o r m 驱动的| 叫格t 作洫建模关键技术研究 第2 章n o r m 驱动的网格工作流动态模型 网格工作流模型是对网格系统和工作流过程的抽象。在实际系统应用中, 工作流模型由特定的建模工具创建,并会被转换成流程脚本。工作流管理系统 中的工作流调度引擎将会分析用户提交的流程脚本,并将其中的任务提交到具 体的网格资源中去执行。 对于工作流建模的理论研究已经有了相当长的历史,各种建模技术也比较 成熟并且有了广泛的应用。例如在绪论中提到的d a g ( d i r e c t e da c y c l i c g r a p h ) 、p e t r in e t 、活动网络图、e c a 等。d a g 语意简明,容易理解,支持大 多数的流程控制,在绪论可以发现,当前流行的网格工作流系统基本都使用 d a g 来对自己的网格工作流进行建模。p e t f in e t 是一套形式化的过程模型,它 能有非常高的过程表达能力,但是由于p e t r in e t 本身易用性不佳,所以在理论 研究方面比较多,在实际应用方面较为少见。其他的建模技术和p e t r in e t 类 似,多处于研究和试验阶段,没能大规模地被应用到现实的网格工作流中。 在网格工作流建模领域d a g 一支独秀主要有两个原因:第一,当前的网 格工作流系统规模还不够复杂,某个系统一般只为一项具体的应用所服务,特 别是在网格计算方面,通过将异地的计算资源联合起束以提供强大的计算服 务。因此,所设计的建模对象的流程控制相对简单,不需要太复杂的建模技术 来支持。第二,绪论中所提到的网格的所有特征一般还未全部在具体的网格系 统中得以体现,不同资源提供者之日j 的交互还不够,所以网格工作流一般不会 跨组织,其表现会近似与传统工作流。因此,d a g 技术所带来的瓶颈还没体现 出来。 在本章中,先简单介绍一下工作流管理联盟给出的工作流模型定义。然后 分析一下,在网格环境下,工作流模型所面临的新问题。针对这些新问题,将 提出基于n o r m 的跨组织的网格工作流动态模型 3 4 3 5 1 。其中将给出模型的形 式化定义,各类规则的定义。 2 1 传统工作流模型 工作流管理联盟( w o r k f l o wm a n a g e m e n tc o a l i t i o n ) 2 5 】给工作流的定义 是:工作流是商业过程部分或全部地计算机化或自动化。换言之,工作流是为了 达到一定的商业目的而根据一组定义的规则将文本、信息和任务在工作过程参 与者之间传送的过程自动化。既然是一种流,那么工作流模型就是以一种过程 的形式表现出来的。工作流模型是以过程为核心集成了以事务处理相关的其他 n o r m 驱动的蜊格t 作洗硅模关键技术研究 信息的集成化过程模型。而这种模型中的集成化是体现在组成过程的单元上, 也就是在活动上。因此,过程是由活动单元组成的,活动之自j 的关系决定了事务的 处理过程。而活动在执行过程中与角色、执行者、资源、信息等其他信息联系 起来。 w f m c 推出一个如图l 所示的工作流的元模型( m e mm o d e l ) 2 6 束描述工作 流定义中的对象、对象关系和属性,以此来形成一个工作流信息交换的格式集 合的基础。工作流元模型中定义了以下一些关系,工作流类型定义( w o r k f l o w t y p ed e f i n i t i o n ) 由活动( a c t i v i t y ) 来组成,而活动中会使用某些工作流相关数据 ( w o r k f l o wr e l e v a n td a t a ) ,这些相关数据会出现在活动之间的迁移条件( t r a n s i t i o n c o n d i t i o n ) ,迁移条件决定了活动之间的关系,活动的执行是由某种角色( r o l e ) 来分担的,在执行过程中会调用一些可调用的应用( i n v o k e da p p l i c a t i o n ) 来完成相 应的任务。这样的元模型集中反映了工作流定义中包含的对象之问的关系,但 是没有针对各对象的属性与实现进行讨论。为了让这种模型可以执行 ( e n a c t m e n t ) ,必须对此模型进行形式化定义。要达到这个目的,必须 螽i & 棚拈 参f # 仕川,7 ”。毒 j5 明。7 图2 w f m c 工作流元模喇 2 2 网格对工作流模型的新要求 在网格环境下,工作流具备了新的特征,相对应的模型也会发生改变。下 面针对网格的特点来分析一下到底网格工作流对建模技术提出了什么新要求: 网格的分布与资源共享特性,要求工作流模型中的活动能在分布式的环境 n o r m 驱动的州格t 作流建模关键技术研究 下执行。因为工作流中的资源是分布在异地,通过共享加以利用的,所以网格 工作流中的任务不仅可能在本地环境中被执行,而且更可能被调度到远程的设 备上去执行。而在传统的工作流模型中,所涉及的资源相对集中,对活动的控 制相对容易。因此,网格工作流模型需要支持分布式的活动。本章将要阐述动 态模型就可以针对跨组织的分布式工作流建模技术。 网格的自相似表示网格的整体和局部之间存在着一定的相似性,局部往往 在许多地方具有全局的某些特征,而全局的特征在局部也有一定的体现。传统 工作流建模方面已经有了子工作流方面的研究,所以可以对网格工作流的这一 特点提供直接的支持。因此,本文不再将这个特点列在研究范围之列。 网格的动态性与多样性意味着原来拥有的资源或者功能,在下时刻可能 出现故障或不可用,而原来没有的资源,会随着时间的推移逐步的加入进来。 这就要求网格管理必须充分考虑资源的动态变化,对于网格资源的动态减少或 者资源出现故障的情况,要求网格能及时采取措施,实现任务的自动迁移,做 到对高层用户透明或者尽可能减少用户的损失。因此在对网格工作流建模时, 要充分考虑到活动中任务的执行者是随时会发生变化的,为了是整个工作流在 执行过程中获取最大的性能,需要在角色分配时加以权衡。关于网格工作流的 角色分配技术将在第三章中介绍。 自治性与管理的多重性意味着网格上的资源,首先是属于某一个组织或者 个人的,因此网格资源的拥有者对该资源具有最高级别的管理权限,网格应该 允许资源拥有者对他的资源有自主的管理能力,这就是网格的自治性。但是网 格资源也必须接受网格的统一管理,否则不同的资源就无法建立相互之间的联 系,无法实现共享和互操作,无法作为一个整体为更多的用户提供方便的服 务。因此网格的管理具有多重性,一方面它允许网格资源的拥有者对网格资源 具有自主性的管理,另一方面又要求网格资源必须接受网格的统一管理。这就 要求对网格中资源的利用,各个资源所有者都有这自己的要求。资源所有者可 以将某些资源开放出去,参加其他网格工作流的调度,也可以暂时保留下来进 行维护,或者在开放的同时绑定某些服务,增加某些约束。要在网格环境下建 立工作流,就需要同其他的组织进行协作,遵循各个组织间的合作规范,才能 够将分布在不同组织中的资源联合起来,组成一个大的网格工作流。因此,网 格工作流要求在建模时能考虑到活动的执行者在不同的组织问的合作。本章的 基

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论