(管理科学与工程专业论文)基于svm的工作流异常预测方法研究.pdf_第1页
(管理科学与工程专业论文)基于svm的工作流异常预测方法研究.pdf_第2页
(管理科学与工程专业论文)基于svm的工作流异常预测方法研究.pdf_第3页
(管理科学与工程专业论文)基于svm的工作流异常预测方法研究.pdf_第4页
(管理科学与工程专业论文)基于svm的工作流异常预测方法研究.pdf_第5页
已阅读5页,还剩59页未读 继续免费阅读

(管理科学与工程专业论文)基于svm的工作流异常预测方法研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 随着经济全球化和信息技术的发展,社会活动中产生的事务和信息变得日益 庞大和复杂,从而对信息的处理能力提出了更高的要求,实现业务流程的自动执 行己成为当前信息化需求和建设的热点。现有研究在此领域的最新进展即是工作 流技术的产生和应用,工作流作为一种现代管理思想和最新信息技术的结合,已 经深入信息化建设的各个领域。特别是具有灵活性、动态性和自适应性的柔性工 作流的提出和发展,符合了现在复杂多变的市场和竞争环境下的需求,引起更多 学者的关注。柔性工作流研究的一个重要分支就是工作流异常研究,目前已提出 了很多异常处理方法,但在异常预测方面却没有形成相对成熟的理论和方法,这 也使得异常处理方法得不到有效的推广和应用。本文即是在这种背景下,对如何 建立准确、高效的工作流异常预测方法进行了相关研究。 在分析了工作流异常类型和现有异常处理方法的基础上,本文指出异常处理 研究成果难以得到推广应用的根本原因在于系统本身没有建立有效的异常预测 方法和机制。而建立准确有效的预测方法需要有新的工作流建模方法和有较强学 习能力的预测算法,预测的基础即是可量化描述的业务流程活动节点的执行状态 信息。因此,本文在传统p e t r i 网建模方法基础上,通过增加状态标识和能力标 识,形成了可量化描述工作流运行实例状态信息的标识p e t r i 网建模方法,并对 该方法的性质和正确性进行了定义和分析。在该建模方法的基础上,结合工作流 异常的特点,本文提出运用统计学习最新成果支持向量机( s u p p o r tv e c t o r m a c h i n e ,s v m ) 理论去构建工作流异常预测方法,并对该方法的可行性和具体实 现过程进行了分析说明,形成了本文提出的基于s v m 的工作流预测方法。在此 基础上,结合异常处理中的e c a 规则法,本文设计了基于a g e n t 和知识管理的 工作流异常处理系统模型,分析了该模型中异常的预测、识别、处理和反馈过程, 使异常处理更具针对性和科学性,为异常处理研究提供了一个有价值的参考模 型。 最后,本文通过一家纸包装企业的供应链工作流实例,说明了本文提出的标 识p e t r i 网建模方法和基于s v m 的异常预测方法在实际中的应用,并对异常预测 过程、参数选择和预测结果进行了详细分析。利用本文提出的异常预测方法,该 工作流实例执行中的异常预测准确率平均达到8 0 以上,证实了本文提出的方法 对于提高工作流异常预测精度的可行性和有效性。 工作流异常预测是异常处理和柔性工作流研究的基础,本文以此为背景,提 出了标识p e t r i 网建模方法和基于s v m 的异常预测方法,为工作流量化建模和异 a b s l t a b s t r a c t w i t ht h ed e v e l o p m e n to fe c o n o m i c9 1 0 b a l i z a t i o na i l di n f o 肌a t i o nt e c l l i l o l o 既t h e r e a r em o r ea 1 1 dm o r e1 a r g ea 1 1 dc o m p l e xb u s i n e s sa 脑i r sa n di 1 1 f o m a t i o nc a u s e db y s o c i a la c t i v i t i e s ,w m c hp u tf o r w a r dh i g h e rr e q u i r e m e n t st 0i n f o r m a t i o nh a n d l i n g c 印a c i t y s o ,r e a l i z i n ga u t o m a t i ci m p l e m e n t a t i o no fb u s i n e s sp r o c e s s e sh a sb e c o m ea h o tf l e l do fi n f o m a t i o ns y s t e mr e s e a r c ha n x a b 鼓f a e t i d e n t 主蠡】c a t i o n ,t r e 雏m e l l ta n d 受e d b a c kp r o c e s so ft ks y s t e 擞赫o d e l 。弧i sm o d e l p r o v i d e sav a l u a b l er e f e r e n c em o d e l t or e s e a r c ha i l dd e v e l o pw o r k j l o we x c 印t i o n 纛褫d l i 稚gs y s 话黻。 f i n a l l y ,as u p p l ye 董l a i nw o r k 露o wc a s ea b o u tap a c 薹( a g i n ge n t e r l 蜥s e s h o w s 饿e a p p l i c a t i o no fl 出e lp e t r in e tm o d e l i n gl n e t h o da n de x c e p t i o _ nf o r e c a s t i n gm e t h o d p r e s e n t e di nt h i ss t u d y t h i st h e s i sd e s c r i b e sc o m p u t i n gp r o c e s sa n da n a l y z e s d i f 瓷r e n t e 董3 隆e l f o r e c a 豉i 廷ga c e 疆f a e y 娥hv 蕊o u sk e 嫌e l 钒袋i o 致s 强dp 缀燃论r s 。t k c a l c u l a t i o nr e s u h ss h o wt h a tt h ea v e r a g ef o r e c a s t i n ga c c u r a c yr a t er e a c h e s8 0 o r 瓣o r e ,w h i c 蠡蠢e 嫩。致s 专j 磁e s 惫a s 主b i l 童专ya 芏遗e 羝e t 主v e n e s so f 氇i sm e t h o di nf o r e e a s t i l l g w o t k n o we x c e p t i o n a st h ee x e e p t i o 堇lf o 翔c a s t i n gr e s e a r c 量li sm eb a s i so fe x c e p t 主o nh a n d l i n ga n dn e x i b l e 、o r k n o wr e s e a r c h ,a n dt h e r ei sn o tm a t u r ef o r o c a s t i n gt h e o r yo rm e t h o dn o w t h i s s u d y 如v e | o p s 糙w 墩o d e l i 纛gm t 量抡文l 曲e | p e 砸n e 毛馘d 南瓣e a 羹i 鹚m e t 幻db a s 甜 o ns v ma l g o r i t l l i i l ,a 1 1 dd e s i g n sn e ww o r k f l o we x c e p t i o nh a n d l i n gs y s t e mm o d e l 骶l e s er e s e a r c ha c h i e v e m e n t sp r o v i d eac e r t a i nv a l u 鑫b l er e f e r e n e ef o r 如t u r er e s e a l h i nq u a n t i t a t i v cm o 如l i n gf i e l d ,e x c e p t i o nf o r e c a s 衄g 矗e l da n dn e x i b l ew o r k n o w e x c e p t i o nh a n d l i n gs y s t e m k 锣w o r d s :l a b e lp e t r in e t ,s u p p o r tv e c t o rm a c h i n c ( s v m ) ,n e x i b l ew o r k f l o w e x c e p t 至。歉f o f e e 氇s t 主堇l g ,e x e e p 耄i o 毪h a 穗d l i n g ,a g e 越,嚣c a 蹦e s i v 中国科学技术大学学位论文相关声明 本人声明所呈交的学位论文,是本人在导师指导下进行研究工作 所取得的成果。除已特别加以标注和致谢的地方外,论文中不包含任 何他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究 所做的贡献均已在论文中作了明确的说明。 本人授权中国科学技术大学拥有学位论文的部分使用权,即:学 校有权按有关规定向国家有关部门或机构送交论文的复印件和电子 版,允许论文被查阅和借阅,可以将学位论文编入有关数据库进行检 索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 保密的学位论文在解密后也遵守此规定。 作者签名:孝毫茑l 舡 舻少月日 第l 章绪论 过程中每一个步骤的定义、步骤间的执行顺序、条件以及数据流的建立、每一步 骤由谁负责以及每个活动所需要的应用程序。 国际工作流管理联盟( w b r k n o wm a n a g e m e n tc o a l i t i o n ,w f m c ) ( 1 9 9 9 ) 将工作 流定义为一类能够完全或者部分自动执行的业务过程,根据一系列过程规则、文 档、信息或任务能够在不同的执行者之间传递、执行。 综合上述主流的观点,本文认为工作流是一系列相互衔接、能够完全或部分 自动执行的业务活动或业务过程;工作流管理即是为了实现业务过程自动化而对 业务过程进行的抽象、建模、分析、执行、监控和优化等操作;工作流管理系统 ( w b r k n o wm a n a g e m e n ts y s t e m ,w f m s ) 则是一个工作流运行的平台;实现工作流 系统的自动化运行除计算机管理系统外,还需要人和各种系统资源的参与,这就 形成了广义范围上的工作流系统。 1 2 2 工作流参考模型 随着工作流研究的不断深入和影响范围的扩大,工作流技术得到了快速发 展,但也产生了很多相互不一致、不兼容的技术格式和标准,亟需一个权威的组 织机构来制定统一、标准化的工作流系统模型和技术规范,协调众多厂商利益, 引领研究向正确的方向发展。因此,在1 9 9 3 年,工作流技术的标准化组织一 工作流管理联盟w f m c 成立,w n c 的成立标志着工作流技术的发展进入到更 加成熟的阶段。该组织随后制定了工作流的参考模型、流程定义语言、接口定义 规范等一系列工作流技术标准,直接推动工作流的研究和应用进入更加规范、繁 荣的阶段。 目前,w f m c 定义的工作流参考模型已经成为工作流技术研究和开发领域的 设计标准( 1 9 9 5 ) 。该参考模型如图1 1 所示,它定义了工作流系统的各个组成部 分( 组件) 及其之间的5 个接口( i n t e 血c e ) ,并指出3 种需要处理的数据。 第1 章绪论 工作流控制数据:这种数据是指业务过程或活动实例的状态信息,这类数据 只能由工作流引擎进行控制,用户、应用程序或外部的工作流引擎都不能直接对 其进行操作,但可以通过向工作流引擎发送请求来得到工作流控制数据。 工作流相关数据:这类数据是指工作流过程或实例状态转移的条件,工作流 引擎通过这类数据选择下一个将要执行的活动。工作流相关数据可以被工作流应 用程序访问并修改,并在活动实例之间传递。 工作流应用数据:这类数据是指那些被外部应用程序操作和处理的数据,它 们不能被工作流系统访问,但能在工作流活动( 任务) 之间传递。这些数据是应 用程序用来完成某个具体的业务目标所必须的,如产品结构、订单内容等都属于 工作流应用数据。 1 3 研究现状 1 3 1 工作流研究与应用现状 自工作流管理联盟w f m c 成立以来,工作流研究和技术开发逐步走向了统 一、标准化的道路,以工作流参考模型为标志的行业标准的确立推动了工作流研 究的快速发展。目前为止,已经形成了很多相对成熟的工作流软件产品,按任务 项传递机制,可将现有工作流产品分为4 类( 周建涛,史美林,2 0 0 5 ) :即基于文件 的工作流系统( 表产品如f i l e n e t 的s u a lw b r k n o 、i b m 的f l o w m a r k 、i n c o n c e i r t 的i n c o n c e r t ) 基于消息的工作流系统( 代表产品有n o v e l l 与f i l e n e t 合作开发的 e n s e m b l e 、j e t f o 肌的i n t e m p o 、k e y f i l e 的k e y n o w ) 、基于、e b 的工作流系统( 代 表产品有a c t i o nt e c h n o l o g y 的a c t i o n w 6 r k sm e t r o 、u l t i m u s 的u l t i m u s ) 和群件与 套件系统( 代表产品有i b m 的l o t u sn o t e s 、m i c r o s o r 的o m c e 与e x c h a i l g e 、 n o v e u 的研o u p w i s e ) 。特别是随着开源项目的兴起,工作流开源项目在工作流 领域内独树一帜,为工作流的发展及繁荣做出了重要贡献。开源工作流项目按功 能可分为两类:工作流定制工具和工作流引擎,前者的代表有j a w e 、n e z h a 等, 它们都支持w 舢c 定义的x p d l 规范;开源工作流引擎则是遍地开花,备受关 注的有o f b i z 、o b e 、s h a r k 、o p e n e b x m l 、b o n i t a 、t w i s t e r 、a c t i v e b p e l 、o p e n w f e 、 j b p m 、o s w b r k n o w 、w i l l o w 等,其中w i l l o w 为国内的一个开源项目。 随着网络技术的迅速发展,企业之间的分工更加细致和专一,但又密不可分; 顾客的多元化和需求的多样性又加剧了企业生产、服务和管理的难度,传统基于 单一业务过程的信息管理技术已经难以适应现有的需求,工作流管理作为一种新 的管理理念和方法,提供了一套系统化、强调整体性的管理技术,通过工作流把 第1 章绪论 程、活动资源、工作人员等组成要素。造成工作流系统缺乏柔性,不仅在系统内 部缺乏应有的应变能力,而且也缺乏对现代复杂生产环境和瞬息万变的市场环境 的应变能力。正是由于传统工作流研究在系统柔性方面的不足,工作流系统柔性 的研究在理论和实践上更有重要的现实意义。 现有研究对工作流柔性定义上还有一定分歧,但多数学者认为柔性的工作流 系统应该具有较好的灵活性、动态性和适应性等传统系统不具有的特点。目前柔 性工作流的研究主要集中在以下几个方面:柔性工作流建模方法研究、模型正确 性分析、动态修改和异常处理机制研究等( 周建涛,史美林,2 0 0 5 ) 。其中异常处理 能力是反映柔性工作流系统适应性的主要指标,针对此问题,已经提出了很多异 常处理方法( 李伟平,范玉顺,2 0 0 4 ) ,如:s a g a 方法、基于e c a 规则、基于模式、 基于知识和基于多层日志的方法等。但对异常判断和预测方面,没有给予足够的 关注,部分学者简单地认为工作流的异常只能根据人们的经验和现场观察判断, 并没有从异常产生的根源和异常本质的角度认识,致使目前仍没有建立有效的异 常判断和预测理论和方法。综合上述认识,本文提出了一种基于统计学习算法的 工作流异常预测方法,为异常处理机制设计和柔性工作流系统研究提供理论基础 和现实依据。 1 4 本文的研究工作 本文针对柔性工作流研究中在异常预测和判断问题上存在的不足,提出了一 种基于统计学习算法一支持向量机( s p p o r tv e c t o rm a c h i n e ,s v m ) 作流异常预测方 法,该方法利机器学习原理,通过对工作流执行状态数据进行训练,建立异常预 测判断函数,并据此对新的工作流状态数据进行分析、判断,从而实现对工作流 异常的判断、预测和检测。该预测方法的建立对发展柔性工作流系统,提高工作 流的适应性和动态性有重要意义。 为实现本文提出的异常预测方法,需要建立新的工作流建模方法。传统的工 作流建模方法多是注重以图形化符号描述业务过程,尽可能准确、全面、方便地 反映业务过程的全貌,而忽视了对流程中各节点状态信息的描述,特别是对信息 的量化描述。这使得传统的建模方法成为一种可行的流程描述工具,而不是一种 有效的流程分析工具。而本文提出的工作流异常预测方法的基础则是工作流执行 中各时刻不同业务节点的状态信息,该预测方法即是建立在对大量样本数据的学 习和训练过程中形成的。因此,本研究需要首先建立能够对工作流状态信息进行 量化分析的建模语言和方法,为异常预测提供数据支持。在综合比较现有的工作 流建模语言和方法基础上,本文选择p e t r i 网为基础,通过扩充和改进该建模语 7 第l 耄绪论 言的功能,增加定量化描述工作流运行状态的能力标识和状态标识元素,形成标 识p e i 薹i 网方法:l 釜釜e lp e i 耋in 鸯;,从而为异常预测研究提供数据支持。在此基础 上,剩用基于统计学习的数据挖掘方法支持蠢量机( s v m ) ,建立了对工作流 异常状态进行预测的新方法。运用s v m 算法建立的工作流异常预测方法避免了 样本训练中的“过学习”闯题,以最小化系统结构风险为目标,保证了异常分类、 预测的快速性和准确性。在此异常预测方法基础上,结合现有工作流异常处理方 法和机制方面的研究成果,本文提出了基于a g e 囊;的柔性工作流系统异常处理机 制和系统结构,为髯常处理研究提供了参考模型。最后本文以一家纸包装企业的 供应链工作流为实例,分析了其工作流中常见的异常类型,说明了本文提出的标 识p e 撼网建摸理论在实际中的应用,并通过对大量样本的学习训练,建立了该 工作流运行状态异常预测模型,通过对预测结果的综合分析,证实了本文提出的 方法对提高工作流异常的精确度和及时性的作用和价值。同时,结合该实例,分 析了该异常预测方法计算过程中s v m 算法参数、核函数的选择问题,并对其计 算效率和预测的精度进行了深入分析。 本文的研究工作和内容结构如图量2 所示。 1 5 论文结构 异常处理异常预测 凇s 系统模型| 应受实例 基于s ¥疆兹工作漉冥誉该溺方法 标识p 瞰i 髓建模方淫疆茛撩向量枧s v m 异鬻预测与处理 柔性工俸流技米 图薹2 论文研究工作与内容 本文主要包括以下七个章节 第一章为绪论,介绍了本文的选题背景亵意义,并对工作流概念与发展、标 准参考模型、研究现状以及柔性工作流等方面进行了概述,引出了柔性工作流研 究中一个没有弓| 起足够关注但又是其核心闻题之一的异常预测方法研究。在此基 础上对本文工作和研究方法做了介绍。 第二章为柔性工作流与异常处理,详细介绍了柔性工作流基本概念、研究和 8 第2 章柔性工作流与异常处理 综合现有文献和研究进展,目前柔性工作流的研究主要集中在以下几个方面: 柔性工作流建模方法研究、模型的正确性分析、动态修改的实现策略和方法、异 常处理机制研究以及柔性工作流人机交互等方面,特别是作为柔性工作流基础性 技术的动态修改和异常处理研究,是目前研究的热点。本文即是针对异常处理中 的异常预测问题建立了一套可行的预测方法。 2 2 异常定义和类型研究 工作流的柔性很大程度上体现为系统处理变更和异常的能力。变更是指在工 作流过程定义或执行阶段出现,以工作流演进和优化为目标、相对原业务过程定 义的更改,多数是正面的、主动的和可预知的系统完善过程,类似于工作流的选 择柔性或静态柔性。而工作流异常则与变更相反,异常多具有负面性、被动性和 不可预知性。关于异常的定义有多种观点,m 破e i n ( 2 0 0 0 ) 认为异常是对“理 想”业务过程的任何偏离,这种偏离主要指工作流实例运行状态与其原始定义的 不一致,在某些特殊情况下( 如工作流模型动态演进) ,也可能指与所期待状态的 不一致;f a b i oc ( 1 9 9 9 ) 定义异常为在工作流过程执行中,偏离了正常的过程定义、 可能造成工作流执行障碍的状态,但不一定是错误。总的来说,普遍认为异常产 生的原因有三个方面:( 1 ) 工作流定义阶段不能准确描述执行中可能遇到的所有事 件和状态;( 2 ) 定义好的流程执行中会出现不可预知的变化和偏差;( 3 ) 对部分工 作流执行状态无法提前预知并采取相应措施。 研究人员在异常处理的研究中,从各自不同的角度对异常进行了分类,主要 有以下几种分类方式: ( 1 ) 按异常来源分:d i e k s o nk w ( 2 0 0 0 ) 等人从产生异常的来源将异常分为两 类,即外部应用和工作流本身( 内部) 两种。外部的异常来源于参加工作流系统的 外部组成部分,如软硬件故障等;内部异常( 即工作作流本身) 指诸如不能找到解 决问题的代理、得不到执行一个任务所需要的资源等。内部异常又分为工作流过 程之间的异常( 指2 个和2 个以上的活动争夺资源等出现的异常) 和工作流内异常 ( 指在一个工作流实例中出现的异常) 。 ( 2 ) 按异常类型划分:j e d e r 和w l i e b h 撕( 1 9 9 5 ) 将异常分为4 类,即普通 的故障、应用故障、可预测的异常和不可预测的异常。普通的故障指工作流管理 系统执行时出现的故障或执行环境的故障;应用故障指的是工作流调用的应用程 序出现的故障。故障是工作流系统从传统的信息系统( 如数据库系统) “继承”而 来的,也是由这些系统负责处理的。可预测的异常指可以预见的对工作流正常流 程的偏离,通常对出现的异常情况有充分的了解,并明确地定义了异常处理方法 1 3 第2 章柔性工作流与异常处理 和过程;不可预测的异常指在模型定义阶段无法预知的异常情况,通常需要在异 常发生时通过人工参与处理该类异常。在研究工作流的异常处理时,更注重的是 工作流系统本身出现的异常,前两类异常的研究超出工俸流本身的研究范围。 ( 3 ) 按对系统产生的影响划分:p e t e rj k a m m m e r ( 2 0 0 0 ) 等人根据异常处理对 工作流建模的影响将异常分成三类:嗓音、特殊异常和演变异常。嗓音指异常的 出现可以被容忍或忽略;特殊异常指异常只出现在某个工作流实例中;演变异常 指异常的出现要求原来的工作流模型进行变化,这些异常的产生一般是随着时间 的推移工作过程发生了变化,要求以后的工作流实例全部进行变化。 ( 4 ) 按组织结构角度分:n i a l lh a y e s ( 2 0 0 0 ) 将工作流中的异常分为:理解差别 ( 不同组织、不同角色) 、定义错误( 系统错误、对象错误) 、环境改变( 业务流程的 改变) 和资源竞争( 时间、资源的不满足) 。 从实用的观点看,一般从以下两个角度对异常进行分类:一个角度是从可预 测和不可预测焦度;另一个是从需要对工作流定义修改还是对运行实例修改的角 度。本文所指的异常主要是针对不可预测、需要对运行实例进行修改的工作流内 部异常,通过对此类异常的预测和处理,提高工作流的适应柔性。 2 3 异常处理研究 异常处理是指在异常发生后,由工作流系统提供一套机制,通过人工和自动 处理楣结合的方式,使工作流重新恢复到正常流程或预期状态的方法。通常,异 常处理过程可能采用的操作包括( 孙瑞志,2 0 0 3 ) : ( 1 ) 忽略:若一个活动在执行过程中出现异常,该活动已经执行所产生的行 为和没有执行的部分都不影响其他活动的执行,则可以采用忽略策略,这种情况 下系统可以由异常状态直接回到正常运行状态; ( 2 ) 重试:若某次异常只是偶然发生,再次执行本操作时,这种异常不会再 发生,则可采取重试策略,重试过程中用户可以采取其他一些外部操作,从而改 变执行条件; ( 3 ) 取消:若异常使得整个流程不能继续执行下去,且已执行的行为不需要 进行补偿或没有办法补偿,只熊采取取消整个流程的措施; ( 4 ) 替代:若异常使得活动不能继续,但存在另外一个可选的活动或另外一 条执行路径,使得执行过程可以继续,则可采用替代策略; ( 5 ) 回滚:当执行至l 一个活动实例出现异常时,可通过圆滚操作来恢复本次 操作的数据; ( 6 ) 补偿:异常发生后,若已执行的活动实例已经产生了一些影响,为了使 1 4 第2 章柔性工作流与异常处理 ( 5 ) 基于多层尽志的方法:基于“多层圜志”的方法是在工作流系统原有的 结构上,加进了多层日志,保证工作流能够恢复到失败前的“最近一致状态”。 此方法在处理方式上属于盘动处理,并使用了重试方法。该方法通过建立工作流 失败模型,提出了四种工作流基本失败,f = e ,m ,a ,c ,其中,e 表示工作 流执行雩| 擎失败;m 表示应用管理器失败;a 表示应用a g e n t 失败;c 表示通信 失败。通过在工作流数据库、应用管理器、应用封装器建立目志,针对每种失败 提出了相应的基于日志的工作流异常处理方法。 ( 6 ) 基于过程原子性的方法:c h a g e 1 9 9 8 ) 考虑了工作流过程的原子性, 在过程发生异常或失败时利用恢复机制,回滚到活动执行前的状态。该方法把工 作流管理系统中的活动从原子性角度分成原子任务、半原子任务和非原子任务, 当工作流实例在运行过程中发生异常时,根据不同任务采用不同的恢复措施,从 而保证活动状态的一致性。 现有的这些工作流异常处理机制都侧重于某一方面,没有完全覆盖所有出现 的异常。e c a 规则虽然涉及到各种处理方法但目前所能够处理的异常情况不完 整,只楚针对部分异常,有的偏重于系统异常,有的适合予任务异常。可见,对 工作流异常处理机制还需要进一步研究,需要考虑各种异常情况,并综合运用各 种处理方法给出符合工作流执行实际情况的一整套机制。丽选择正确可靠的异常 处理机制和方法的基础是对异常类型的准确判断和预测,但这一领域还没有引起 研究人员足够的重视,直接影响了异常处理研究的发展。 2 4 异常预测研究 虽然工作流异常处理方面已有深入研究,并建立了多种处理方法和处理机 制,但纵观现有研究论文,关于异常预测方面的研究很少,并没有弓l 起学术界足 够的重视。分析这一现象的原因,我们认为主要有以下几个方面:1 ) 工作流异常 类型较多,对应的预测和处理方法也不尽相同,且部分异常需要人为判断、排除, 造成很多人产生一种误解,误认为异常只有靠人为预测、预测,而这是不完全正 确的;2 ) 现有工作流建模理论和方法强调对业务流程的系统化、图形化描述,且 倾向于定性描述,而忽视了工作流定量化表达,这使得对工作流异常的判断和预 测成为“无源之水 ;3 ) 各个工作流实例运行环境和系统设计于差万别,需要根 据具体实例分别建立异常预测机制,这就要求异常预测理论和方法必须有较强的 盘学习、适应能力,能通过对历史数据的挖掘建立异常判断规则,这对于现有研 究提出了更高的要求。以上三个方面的原因和困难造成了现有工作流异常预测研 究的滞后,也直接影响了异常处理机制和柔性工馋流研究的发展,从某种意义上 1 6 第2 鲳留耻萋翔淄孽蓁器羹撼 | 冀 蠢! :鲜要萋预测囊理;琶落量屏箍蓁黜妻薹鹳霎岢瓣髓篓翥耗携蒜锑瓣 甄三国;q 纂囊张椒墓哺羹矬榴凌曼融暇型甚艘删掣馏罐“斟髓舶潜i ! 于i 2 ; 靖嘎强吃婵五琊蚴缯冀曦薹罄笾骘i 麓闻盟萋雾幽觜魁;括理冀蛰翌攀萧黜襄撬 剃坚而巍j 编藿辇薹爱僻塑霾冀髂熊薹j 薹一| 墓。攀= 霎;囊l i 鐾姜i 霎涮泻摧褥 尚筹翰零! 鹱迫搓i 蚓璎犁囊烈基需戳鲥骷i 羹淄础删踹鋈蓁羲薹! 黼醚i 攀塑萎囊茎 薹蓥:羹霉尘王售婧烈堡蓁:垂仆宁茫涮。腻签弑奢羟蓁丽誉篓j 蓁薹西绺辔翠 柘薹篓麓飘婴鬟霉霎童霉枣丽囊型黪限甜差剀。 ;季i 此汐睡萋碰世焉搭重壅t 蓥囊雾雾宦焉l 秀耋笔| 猫筘酬耀摹慈赫骺雕衙畦新; 裴薹磊影副勰骈彰列鼎承鹾蒜鞘载聪! 丐莱吾毒篇得鎏霞麓绣赋。螋型莆新基 鐾蕻连戆霞囊羹警薪鳞矧鞠斜繇划窝些萋百“錾比。鐾攀# 喾基圳妊断燮黟务i x 第3 章基于p e t r i 网的工作流建模方法的改进 嵩,影响了该建模方法的实际应用。 3 。1 2p e 拄i 网建模理论 p e t r i 网是目前常用的一种图形化和数学化的建模工具,自六十年代由德囡 学者c a p e t r i 提出以来,经过四十多年的发展,己被广泛应用于各个领域进行 系统的建模、分析和控制。它不仅能描述系统的静态结构,也箍撼述系统的动态 行为;它既有易于理解的可视化表达,也有严格的数学基础,因此,p e t r i 网很 适合于模拟和分析以资源( 物质,数据,信息等) 流动为特征的异步并发系统。相 比其它建模理论,p 积网模型可以从理论上对流程定义的正确性、合理性进行 检验,同时也形成了一些基于p e t r i 网的流程分析工具。在基本p d r i 网基础上, 为了简化系统模型以及丰富模型的表达能力,人们提出了高级p e 纽网,主要有 着色p e t r i 网、时间p e t r i 网和模糊p e t r i 网等。、v d e r a a l s t ( 1 9 9 8 ) 则在p e t r i 网的 基础上定义了w f n 跌( w o 呔f l o 静n & ) ,强器工作流网,在工作流耀中变迁被用来表 示活动,而库所则表示活动的使能条件,同时将工作流管理联盟在规范中提出的 几种基本的工作流原语映射成为相应的p e t r i 网模型,由此建立了工作流网的基 本组件与触发机制,直接推动了p e 衄网建模方法在工作流中的应用。 相比其它建模方法,p e t r i 网是完全从过程的角度出发为复杂系统的描述与 分析丽设计的一种有效模型工具,具有形式化步骤与代数、圈论褶支持的理论严 密性,有良好的抽象机制和丰富的分析技术,更有直观的图形表达能力和便于编 程实现的技术特点,能方便地对流程进行精确的描述,适合工作流领域的建模需 要。随着相关理论和技术研究的发展,p e t r i 网已成为现有工作流建模方法中最 具代表性和综合优势的方法,并将发展为未来工作流建模的主流方案。 3 2p e t r i 网的基本概念和定义 3 。2 。呈基本概念 系统论认为任何系统都由两类元素组成:表示状态的元素和表示状态变化的 元素。在p e t r i 网中前者用库所( p l a c e ) 表示,后者用变迁( 仃a 1 1 s i t i o n ) 表示。变迁的 作用是改变状态,库所的作用是决定转移是否发生,两者闻这种依赖关系用弧( 箭 头) 表示。p e t r i 网基本成分定义如下( 袁崇义,1 9 9 8 ) : 定义3 1 :p e t r i 网可以表示为三元组删( 只r ,f ) ,满足以下条件 1 ) p uz 乒o ,p nz = 囝; 2 ) d d ? i z ( ,) u ( 1 d d ( f ) = p u r ; 第3 章基于p e t r i 网的工作流建模方法的改进 3 ) d d m ( f ) u c 移口( f ) = p u r 。 其中p = a ,仍k ,以 是p 的有限库所集合,r = ,乞,k ,乙 是p 的有 限变迁集合,f 是由p 中的一个p 元素到丁元素组成的有序偶的集合,即连接 库所与变迁的弧的集合,d d m ( ,) 和c ( ,) 分别为f 的定义域和值域。 作为系统建模工具,p e t r i 网除以上描述的静态结构外,还应包括库所容量 ( t o k e n ,托肯) 和变迁触发对库所容量的影响信息。库所容量可用大于零的整 数表示,变迁触发对库所中标记数的影响用弧上的整数表示,于是具有动态特性 的p e t r i 网可表示为: 定义3 2 州= ( p ,丁,f ,置,m ,) , 1 ) 只lf 含义同定义3 1 ; 2 ) 眉:p 专,是库所上的容量函数,其中= 1 ,2 ,3 ,k ; 3 ) 形:f 专,是弧集合上的权函数,它是关系集f 到自然数集的映射, 其中= 1 ,2 ,3 ,k ) ; 4 ) m :p 专肼,为删的状态标识,是集合到非负整数集的映射,其中 肌= o ,1 ,2 ,k ) ;坳p 必须满足膨( p ) 眉( p ) ,眠为初始标识; 符号说明: 网( 刚,眠) 被称为p e t r i 网系统,在网的各个库所中引入了托肯;状态标识 m 为一个向量,其元素均为非负整数,代表网的相应序号库所中所含有的托肯 数量,反映了“托肯”在网的库所中的分布情况,初始标识向量抵反映初始托 肯在网中的分布。 3 2 2 变迁的触发规则 p e t r i 网本身一般只能描述离散事件系统的静态结构,系统的动态结构是由 状态标识的变化迁移过程来表征的。状态标识能否变迁和变迁结果,是由p e t r i 网中变迁的触发规则所决定的。标识p e t r i 网的有关变迁触发的主要两条规则为: 规则1 :变迁触发的使能 p e t r i 网的一个变迁节点f 被认为是具有发生权的,即变迁f 的触发是使能的, 如果其满足如下条件: ( 1 ) 对变迁f 的每一个输入库所鼽f ,库所n 中包含的托肯数m ( n ) 不 少于对应有向弧( n ,f ) 的权重( 只,f ) ,即有m ( 所) 形( 易,f ) ; ( 2 ) 对变迁f 的每一个输出库所p ,f + ,库所p ,的容量k ( p ,) 足够再加入 新的托肯,即有k ( p f ) m ( p ,) + ( f ,p ,) ,其中m ( 尹,) 为库所p ,中包含的托肯 数,( f ,p ,) 为有向弧( f ,p ,) 的权重; ( 3 ) 对变迁f 的每一个既为输入又为输出的库所以f 厂、广,库所所同时 2 l 第3 章基于p e 撼网的工作流建模方法的改进 满足上述两个关系式,即艇( 热) 驴( 热,f ) 和髫( p ,) 嬲( p ) + ( f ,夕,) 。 规则2 :变迁触发后完成的操作 当p e 越嬲中的一个使能变迁节点爹完成触发蜃,将完成如下操作: ( 1 ) 从变迁节点f 的各个输入库所中减去托肯,且减去的托肯数等于各输入库 所至交迁节点f 的输入有向弧的权值; ( 2 ) 在变迁节点f 的各个输出库所中加上托肯,且增加的托肯数等于变迁节点 f 至各个输出库所的输出有向弧的权值。 由此,在变迁节点f 完成触发后,库所尹的状态标识即托肯数艏( 尹) 将按如下 规则变化到新的托肯数肘( p ) : l 膨( p ) 一矽( p ,f ) 膨孙,一 :篡;二孑:岩+ 。厶p , 3 2 3p 砸i 网的基本性质 当p f f + 当p ,一+ f 当p f r 、+ f 当p 诺广门+ f p 舐网模型有很多行为特性,包括可达性、活性、有界性、可逆性、可覆 盖性、持久性、同步距离和公平性等,但对于一个工作流p e 妞网模型来说,可 达性、活性和有界性是最为重要的特性。 1 ) 可达性:对给定初始标识即初始托肯分布螈的个p 砸i 网( 斛,豫) ,可 达集r ( 州,眠) 定义为此p e t r i 网在初始状态标识眠下按照触发规则可达的所 有状态标识的集合。它反映了系统运行过程中畿达到指定的状态。 此定义表明,一个p e t r i 网的可达集露( 刚,鸠) ,既取决于网的结构,也取 决于网的初始状态标识眠。对给定的一个p e t r i 网州和其初始状态标识豫, 任意指定的一个托肯分布始,它是由初始托肯分布坂可达的,当且仅当满足 肘r ( 刷,眠) 。 2 ) 有界性:对给定初始标识馨初始托肯分布瞩的一个p e 越网( 斟,纸) ,称 此p e t r i 网为厝有界的,如果对任一可达状态标识m r ( 州,眠) 和任库所节 点磊,相应于状态标识膨下的p 嘶网,库所节点岛中的托肯数满足掰( 肛) 根据s v m 理论,存在最优超平面x w 十6 = o ,使得工作流中的异常和非 异常状态输入分另l 位于该超平面的两侧,且分类间隔最大。由样本点训练集可求 得参数对( w ,6 ) ,构造异常预测函数: ( x ) = s 朋 ( 桫x ) + 6 依据该预测丞数,对工作流运行中其它状态实例,均可判断和预测是否发生 第4 章基于s v m 的工作流异常预测方法的建立 选取训练样本作为输入向量 选择不同核函数进行比较 越里鳌曼少 | 否 。,。! l :,。一 设置参数范围按步长循环计算 壅奎 否 雳交叉验证法绷练样本 记录特定参数对应的识别率 求解该核函数下的最优参数 获取袋优核函数和参数 建立最优预测灏数 图4 4 最优预测函数及其对应参数的计算过程 虽然为选择最优核函数和参数,系统需要定的计算量和计算时间,但待最 铙核蘧数和参数确定并建立最优预测函数后,进行异常预测时专 算的工作量将大 幅降低,并有利于取得较好的预测准确率。 4 4 本章小结 本章首先介绍了橇器学习领域的统计学习理论,着重分析了该理论三个核心 概念:v c 维、推广性的界和结构风险最小化;在此基础上引出了统计学习理论 研究的最新成采支持向量机( s v m ) 理论,详细介绍了s v m 理论褶关的概 念、原理和计算过程,并结合工作流异常预测的特点,得出s v m 方法以严密的 数理基础和较好的分类精确性完全适合于工作流异常预测判断的研究,最后本章 对基于s v m 的工作流异常预测方法进行了详细论述,并分析了最优分类预测函 数和相应参数、核函数的选择计算过程。 3 6 第5 鲤靼季竖萋霎毒! 弼r 司制割囊臻跨萎琵趟需纛程嚣 瑟鎏娶溅辫霎蘩蠢黎蚕冀岩田滴窿错礴嚣濯壅囊, 塞一霎冀雾冀萎羹鬟蒌 溺嘲疆耩雨葫摧蘼星瓣戳囊鸯i 毒i 曩馥麓燮蚕琴匿塑冀辩譬鞘霪襄瀚i 羹薹 曩甄蓊引羹弱酬粹鞣瓣嚣鲴菲箬巍烈黼曼鞫;看羹。师样孵衍”髓行捱嚣困窘矿 一醛辨舅薹嚣堡蓁j 魁眺雾鞘戮翥翼瑶凋氆薹一u 斟彦囊名锅裂蕊筐。静蹦魏弼 群畿娶豸薹| 臻潘苓毳i 蠹;葡橥瓣鞲惑弦掣萎圳眇;琴;嚣冀刿察震割霹别秀 ! 霸誉陧圈镧嘲嗷弹夼蒸皤鹾薄懒鬻攀赢; 薹疆j i 露照蒌羹e ;蠹薹冀谢强臻囊囊蕊搿爨纛髫努鋈震龚裂黝黠幽融黔缴 篓型驰塑霎雾恻必譬嘉猫陵挺鞋面上:;酎魁耗韵h 主薹薹羹熟引美罄营墨藕蓁粪 璧霸, 雾奏耄哟搿薅i 复囊蚕题提供羹鍪壁i 霪雾随肴蚕鬟系统薪羹嘉冀黧篓登;蠢 瓣汰对匿参雾移誊强筻。旦量薹墅喜羹雾翟麓鼎i 珑l

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论