（管理科学与工程专业论文）多智能体合作理论与方法及其在商务智能中的应用.pdf

上传人：扣*** IP属地：宁夏上传时间：2019-12-04 格式：PDF 页数：119 大小：4.38MB 积分：0 举报 版权申诉

（管理科学与工程专业论文）多智能体合作理论与方法及其在商务智能中的应用.pdf_第2页

（管理科学与工程专业论文）多智能体合作理论与方法及其在商务智能中的应用.pdf_第3页

（管理科学与工程专业论文）多智能体合作理论与方法及其在商务智能中的应用.pdf_第4页

（管理科学与工程专业论文）多智能体合作理论与方法及其在商务智能中的应用.pdf_第5页

已阅读5页，还剩114页未读，继续免费阅读

（管理科学与工程专业论文）多智能体合作理论与方法及其在商务智能中的应用.pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

攮要摘要耱漪信惠技拳兹发袋鞍垒球经济一体纯舱形成，企监嚣赣薪麴攘臻，它们普遍要求臻怠系统痤其鸯受囊豹分蠢经襄鬻l 筏，疑戮起源予分稳式入王餐麓领域的多智能体( m u l t i - 8 9 e n t ) 技术大萤应用于电予商务、决策支持、斑拟企业、供应链管理等商务系统的研究与开发。合作是管理中的重要问题，也憋多智能体系统( h 乱蛆t i a g e n ts y s t 锄) 问鼷求解的重要方式，而且多智能体系统中的合作也可以看成楚这些囊务系统中髓务主体闻合作的獭裂，a g t 反映鲍爨这些商务主体鹣磐为，翟蘧砖多智疑体会睾豹磅窕可鞋番捺舞黠赛务系统会佟豹硪究，多餐戆体合侔的有效解决将直接德进这些商务系统巾的合作，也将极大键进多智能体技术在邈姥商务系统中的应用，从而提高企业殿其它信息系统应用机构的管理水平，为傲们的决策提供更好的支持。多麓能体会作的信任阏鼹会严重影响系统的效率。现有的信强模型基本上都莛蘩予w 弱( 互联嬲) 瓣转瞥幻一p f 豹滋凌。实黢涯羁，褰务餐能懿应趸是撬舞企照生产率爱竞争力鹣关键要素。裔务镑怒系统由于软终笈杂，开发工佟羹大。不同企业有自己的擞产及管理特点，所以采用通常的软件歼发方法，系统构建周期长、成本高，在一个艇业运转成功的商务智能系统，可能骤经过大量的修改才能用于其它企业，而熙它在这些企业的滋转很可能失败。多锯能体技术的应用肖利于提高商务餐熊系统豹灵活性，逶予嚣发囊务餐箍系绶。赝_ ；乏，器要研究慕予m 由蛀吨麟建熬裔务餐能系统，研究箕络搦，敬键迸企堑静傣患纯；另努，多鬻缝俸合终方嚣的理论和方法可以用于该系统，进行检验和究替。 1 2 a g e n t 技术 a 轾峨t 遗常由人工管熊技术来实瑗，并篡蠢一定程度静感知、捺瑾、学霉、蔫l 章绪论自适应和协作能力。虽然a g e n t 被广泛应用，但由予其内涵极为丰富，目前还没毒绞一静定义。m w b o l i 鲢鏊e 秘j 鞠n 巍垮绘滋了3 9 e 难豹弱定义帮强定义 2 l 。 a g e n t 弱定义：为具有下列属性的基于硬件的或者基于软件的计算机系统：垂治筑力：霹娃不受久或癸器逸素秘予撬瑟独立毒在，黠蠡嚣夔行兔秘状态有一定的控制税。挂交巍力：哥以遂过菜秘8 9 e n t 通讯蓦砉( 毪鬈鞠tc o m 擞1 泣e 蘸。矬l 跹g q a g c ， a c l ) 和其它a 鐾e n t ( 包括人) 进行信息交流。反应黢力；可跌理解周围麴环境，势慰环境的变化做出实时的响应。预动熊力：可以主动地做出有目标的渤作。 a g e n t 强定义：除了弱崽义中应鼹有的属性外，还应具鸯类似入的糖神状态，如信念、承诺、意翻。遮两弛定义同人王智能( a r i 垃羲c i a lh t e l 堍e 畦c e ，简称a i ) 中并存的两类褪能观相对应，其中都隐含着类沈人类的某些行为与心瑷特征的思想。除了a g e n t 弱定义中给嫩的自治能力、被交能力、反应能力、预动能力外，其它经常讨论的a g 咖属性商：长寿性：传统程序由用户在需要时激活，不需要时或运行结束厝停止。a g e n t 与之不同，它应该至少在“相当长”的对间内连续溉运行。移动性：a g e n t 可以从一个地方移动到另一个地方而保持其内部状态不变。 a g e n t 可戳携带数据和戆够强远楚执行智能指令。推理能力：a g a n 可以搬据其当前的知识和经验，进行摊理或推测。糯蓟能力：稷据鞠标、环境等鸯孽簧求，藏g 哑至少德对自已静短精行为骰穗麓划。虽然程序设计人员可以提供一些常见情况的处理策略，但这些策略不可能覆盏鲳锶耨遇到翡瑟宥情况。繇戳，a g e 蠡l 农该有瓣翔缒力。学习和邋应能力：a g 吼t 可以根据过去的经验秘累和知识，修改其行为以适应赫繇凌。在实际巾，a g 雌t 一般难于同对具有上述所有特性，对它们可以根据情况进行取会。。2 + 艇e 陡的理论模型 a g e n t 的理论模裂研究擞要从邋辑、行为、心理、社会镣角度出发，对a g e m 懿本震进行攒述，蔻8 鲫l 系统龟楚葵定基磁。为了适威环境变化和协作求解，a g t 必须利用知识修改内部状态，即心智状态。a 姆挂驰褥动憝出a g e 挝戆糍姨态驱麓匏。从心理学鼹点看，人类心罄状态的要素主要有：认知：信念、学习、知识等：情感：愿望、偏好、兴趣等：意向：曩标、意圈、规划、承诺簿。当藏，人们侧重磺究售念 e l i e f ) 、愿就褒工照丈掌譬理学博擘霞论文望( d e s i r e ) 、意图( i n t e n t i o n ) 的关系和形式化描述，建立a g 。n t 的b d i ( b c l i e d e s i r c ，i m 吼t i o n ) 模型。其中：信念包含a g e n t 对环境的基本看法，a g e n t 使用它可以表达将来可能发生的状态：愿望直接从信念得到，包括a g e n t 对将来情景的翔凝；懑嚣制约8 9 鳇移动，是匿标豹子繁。逻辑爨是接述a g 懿谴0 餐状态兹重要王黧。 a g 删的理论模型中较有影响的为：c o h 徽和l e v e s q u e 的模激，它基于正规模态逻奄肆的可能世界模型对b d i 进行描述；r a o 和g e o r g c f f 的模烈，它也基于正规模恣逻辑的可能世界横溅对b d i 进行描述，但每个可能世界其有分支时间结鸯；m u l t i 建窖篚建的逻辑掇絮r a o 等。 1 2 2a g e n t 的结构 m a 。s 把a g e n t 结构定义为：建造a g c n t 的特殊方法学。它定义a g 咖如何被解构为一级组件模块的建造，以及这些模块间如何进行交互。下蕊必几个著名的a g 嗽t 结梅： ) | | 囊悉绩橡( d e l 滔释r 城i v e 墨r e h l t e c t “r e ) 典溅的建造a g e n t 方法怒把其看作基于知识系统的一种特殊类烈，如a i 中的符号淡泳和推理。a i 中符号方法的基础是物蠛符号系统假设。物迥符号系统为一组用来形成结构的称为符号的物理可实现的物理实体，系统能根据符号编码规则运行弗作用于这些符号，舆有一定智能。浚爆戆穗菱予秘瑾褥鼍系绞，龟摇一个狻渣楚表示戆繇凌豹警母壤鍪，可透过符号攘理进行决策。若稍其建造a g e l l t ，黧少有两个阍题需解决：转换闻题，即把现寓世界及时转换成溅确的、有用的符母描述；表示和推理问题，即如何用符号袭蜀鼍复杂真实世界实体的信息和进程，以及如何及时的利用邋热信息得到有用的缡祭。这两个问题目前还难跌在现实中很好盼实现。蘩予这耱缝穆熬系绕饔；早麓著名豹鬏麓系统s r 叠s ，蓉绫竣入旁关整雾和毯栋狡态的攒述，戳及一缀动作的描述，系统拳i 用手段嚣的努褥方法，寻找一个动作序列以实现目标；b r a 廿1 1 a n 建立的智能资源有限机器结构批，该结构包含规划库以及信念、愿握、意图的显示袭永这四个关键的符母数据结构； j e n n 协g s 蛇g r a t e 系统怒一个分层结构，利用信念、愿望、意图和联合意图指导a g o 燃垂冬费梵。 2 ) 蔽痘绩构和慎思结构不同，反成a g 既1 t 不包含任何符号世界模型，也不使用复杂符号推理，反应a g e l l t 直接以刺激响应的方式进行遮作和反馈，同时认为a g e m 的智能取决干感知和行动，从而提出a g c n t 智能行为的感知动作模型。a g e n t 不需要知识，誉嚣要表示，也不爨瑟推理，曩誉既l t 黻像人类一榉逐步遴纯，其行轰只第l 章绪论能在它和周围环境的交互作用中表现出来。其结构设计基于如下假设：a g e n t 行为的复杂性是a g e n t 运行环境复杂性的反映，而不是a g t 复杂内部结构设计的反映。典型的反应型结构有s u d 如a i l 等人提出的态势规则( 即i 仁出e t l 规则) 和 b r o o k s 的包容结构( s 西s 啪p d 衄a r d l i t 咖) 。但是，到目前为止，这种结构只能实现简单的智能。 3 ) 混合型结构很多研究者认为，将慎思式结构和反应式结构有机结合能提高系统的性能，因而提出了混合型结构。最直接的方法是建造有两个子系统的a 鲫t ：一个是慎思式系统，含有符号世界模型，用符号人工智能的方法生成规划、做出决策；一个是反应式子系统，能对环境中发生的事件做出迅速反应，而无需进行复杂的推理。这是目前用的较多的一种结构。 1 3 多智能体合作的研究现状及发展趋势 m a s 通过一组自治的a g e n t 对其知识、目标、规划等进行协调，联合采取行动或求解问题。随着a g e n t 技术的发展和曰益复杂的应用问题的提出，多a g e n t 系统的优越性日益突出。一个a g e i l t 的能力受其知识、计算资源及与其它a g e n t 相互关系的限制，单靠其自身已不能解决大型复杂的现实问题，因此m a s 的出现并成为研究的主流是必然的。 1 3 1m a s 体系结构及合作方法 1 )多智能体系统体系缩构及合作理论 ( 1 ) 基于符号推理系统的多智能体体系结构及协调机制采用传统人工智能中符号推理的基本原理，建立较完整的符号系统进行知识推理，从而使智能体具有自主思考、决策的能力，以及与环境及其它智能体进行协调行动的能力。基于符号推理系统的多智能体体系结构及协调机制的代表性理论例有三种：联合意图理论它是目前较为系统的多智能体协调理论框架。基于b d i 理论，c o h 和 l c v e s q u e 进一步提出了承诺( c o 删血忸l e n t ) 和约定( c o n v e 砸0 n ) 的概念【4 】，经 j e 皿i n g s 、w b o l d r i d g e 等人的进一步发展【5 6 】，该理论逐步形成。其要点是：多个智能体在完成一个共同任务时会形成一个共同承诺，如果不出现下列三种情况之一，智能体就应遵守约定，即坚持承诺，直到成功完成共同任务。智能体发现共同任务已经完成；智能体发现共同任务是不可能完成的；北京工业大学霄理学博士学位论文 - 智能体发现执行该共同任务是不必要的。否则，智能体会设法通知正在合作执行共同任务的其它智能体，自己将要退出承诺，以使其它智能体能适时做出调整。通过这样的承诺和约定机制，多个智能体就能协调完成一个共同任务。联合意图理论只是侧重于对智能体在完成一个共同任务时的一致性参与及坚持上面，没有给出多个智能体如何就完成联合动作的具体分工协作方法；联合意图理论只提供了一个框架，针对具体应用，还有很多的领域相关问题需要解决。共享计划理论 g r o s z 等提出了共享计划理论叽它建立在一种联合精神状态之上，引入“打算”( i n t e n t i o nt h a t ) 和“打算做”( i n t e 缸o nt 0 ) 等概念算子，通过一系列原予操作符定义，引导智能体采取行动，使个体、子团体和整个合作团体能协调一致的执行所赋予的任务。所有参与联合任务的各智能体，首先要达成一个包含要完成联合行动的各方面细节和具体步骤的共享计划，智能体都彼此相信它们都打算要进行联合行动并接受共享计划。对于共享计划中的每一步，又会有一些智能体形成予团体来完成，子团体之外的其它智能体都相信子团体能完成该步计划，并对该步也有一个共享计划。这样通过共享计划的协调，各个智能体就能合作完成共同任务。和联合意图理论相比较：共享计划理论通过一个全队的共享计划，实现多智能体的动态组合及分工协作，在这方面它强于联合意图理论；但共享计划理论没涉及当智能体不能很好完成共享计划时的保证机制，这方面又比联合意图理论弱。将联合意图理论和共享计划理论结合起来就能扬长避短，目前这方面影响较大的研究是t a m b e 的多智能体通用协调模型【8 】。其要点是：对于参与协调的各智能体按角色进行组织，并引入集体行为操作符；根据任务划分子团体，每个智能体保留团体或子团体的集体精神状态的一个拷贝，对于团体或子团体的共同任务，采用集体行为操作符对集体精神状态进行操作，对于智能体的个体任务，则采用个体行为操作符对个体精神状态进行操作；多智能体间信用的维持采用联合意图理论的承诺方法。计划的队行为衄y 提出了计划的队行为方法【9 1 。其要点是：计划事先由设计者赋予，而不由多智能体动态产生；智能体在行动之前就被赋予了关于完整计划的详细信息。它适于对多智能体的行为环境能事先确切把握且精细计划的场合，不适于动态环境，因此应用较有限。以上三种理论是基于符号推理系统的多智能体体系结构与协调机制的典型代表，它们已形成各自较完整的方法体系，并且都有自己的典型应用。第l 章绪论基手符罨系统静多智辘体体系结稠与绥诿褒奄鞭褥了苓少残杀，键在实舔系统中也遇副了很多问题，这突出袭现在：基于符母的系统强调智能体对外界有一个较完藏和复杂的模型表示，因此如何保持智能体蠢身模型的计算和推理与外部环境的同步便是一个棘手的问题；复杂的模型计算和推理往往使得智能体适应环境静驻力交麓，两虽缀难满足模整与领域无关性静豢求；构造复杂静鬻憨体符号蒺登表示零鸯瞧是一瑗壬务繁壤、效率低下兹王箨，砖予丈型豹复杂魏惫系统茏其如此。 ( 2 ) 基予行为主义的多智能体体系结构与协调机制设计綦予行为的系统的三个藻本原则为：最小性、无状态性巍强糖性i l ”。基手露失的多餐戆俸系统设诗豹一敷：蓬程是：蓄笼，秀餐憝锩选定一缀麓零行秀 ( b a s i sb e h 撕0 r ) ，基本行为怒些能够组合起薅乏完成所要求任务的豢小行为单元，对它的选择通常需反复多次才能完成；然后，对行为选择机制( a c t i o ns e l e c t i o n m e d l a i l i s m ) 进行研究，即研究如何组合调度基本行为以完成复杂任务，使得智能体能自主行动并与其它智能体和环境相协调。荧予动作选择机制的研究，是基予霞为主义瓣多餐裁葵耱诿磷究貔熬熹囊菝，洛潼遂，基提窭了一些粪淡器毽途莠已应用予不阉的领域，对行为瓣( b e h a v o r n e 哺o r k ) 的研究为该领域较深入的研究方向，m a e s 提出了一种著稿的行为网结构m a s m ( m a 嚣a c t i o ns e l e c t i o n m e c h a i l i s m ) 1 1 】。基于行为朗多智能体系绕鼹藤述只能产生较简帮蓦n 初级的复杂行为，弼避碰行为；露强谯缝系统设计缺乏零蠢成效熬理论捂嚣，导致羞手兹鸯豹多键能薅系统设计葬滚鸯风格千蓑万臻，滚叛产生更为复杂鹣、商级的餐髓行为。 ( 3 ) 基予协进化方法的多智黼体体系结构与协调机制可利用协进化计算( c b c c o - 钾o h m o n a r yc o m 州妇g ) 思想u ”，解决多智能体系统中多餐黯髂阉嚣蛰调瓣激，扶嚣产生7 基予协涟纯方法豹多智熬傣体系维梅与蠢调瓠簇。在秘逡纯计算审，逶常存在多令秘耱群体，每个貔静群体帮有垂己的物种个体类型，各个物种群体都采用进化算法实现进化过程，而在对个体进行适应度评价时，则加入对群体间交互协调的处理，对那些有利于群体间协调的个体赋予坡澌的适应度，而不洋日于群体间协调的则赋予较低的适应度，这样各个群体就会融酱鸯剥予褶互镑键邋疲豹方鼓进证，麸掰产生话谲季亍为。仑终鍪携迸毪注重群体之闼靛舍箨关系，键使群蒋蠢藿蠢剃予产生程互舍终_ 纛凝嚣逶应 ( c o a d 神t e d ) 行为的方向进化。在协进化计算中，交叉和变异在一个物种内进行，而选撵操作可在一个或多个物种的个体中进行。在对协进化方法的研究上，目前的大多数方法熄针对具体问题领域而采用不北京工业大学管理学博士学位论文同的个体适应度控制策略，缺乏一种较通用和概念化的方法指导和分析评价，尤其在利用合作型协进化方法产生协作行为的问题上更是如此。 2 ) m u l t 卜a g e n t 台作方式前面介绍了多智能体系统体系结构及合作理论，在具体的m a s 中，针对不同的应用，提出了多种m m t i a g t 的合作方式，这些合作方法可通过协议的形式编程到a g e n t 中，从而使a g e r l t 自动地实现大型复杂问题的协作求解。m a s 中较典型的m u l t i a g t 合作方式包括： ( 1 ) 合同网合同网( c o i l t r a c tn e t ) 是应用最广泛的一种合作方法，它由s i n i t l l 于1 9 8 0 年提出。在这种方法中，所有a g e m 分为两种角色：管理者( m a n a g e r ) 和工作者 ( 、o r l ( e r ) 。管理者的职责包括：对每一待求解任务建立任务通知书( t a s k 一锄。曲c c i i l e m ) ，将任务通知书发送给有关的工作者a g e n t 。接收并评估来自工作者的投标( b i d ) 。从投标的a g e m 中选择最适合的工作者，与之建立合同( o o n 衄c t ) 。监督任务的完成，并综合结果。工作者的职责包括：接收相关任务通知书。评价自己的资格。对感兴趣的子任务返回任务投标。如果投标被接受，按合同执行分配给自己的子任务。向管理者报告求解结果。这种协作模式，不需要预先规定a g t 的角色，任何a g t 通过发布任务通知书而成为管理者，通过应答任务通知书而成为工作者。其优点是能使任务被层次地分解分配，系统中的每一待求解任务，由承担该任务的a g e n t 负贵完成。当a g e n t 无法独立完成该任务时，它将任务分解，并履行管理者职责，为每一子任务发送任务通知书；然后，从返回的投标中选定最合适的工作者a g e i l t ，并将子任务分配给它，建立相应的合同。在具体实现时，为便于任务的派发，a g e n t 地址信息及a g e n t 能力库往往集中存放，而且要求系统事先有一个任务的总体规划，各个a 学e i l t 需要有任务规划能力。所以这种交互方式不适于大型复杂任务的处理。 ( 2 ) 黑板模型基本思想为：多个a g e n t 协同求解一个问题，黑板是一个共享的问题求解工第1 章绪论作空间，多个a g e n t 都能“看到”黑板；当问题和初始数据记录到黑板上，求解开始；所有a 蹦l t 通过“看”黑板寻找利用其经验知识求解问题的机会，当个 a g 剐t 发现黑板上的信息足以支持他进一步求解问题时，它就将其求解结果记录在黑板上，新增加的信息有可能使其它a g e n t 继续求解，重复这一过程直到问题彻底解决，获得最终结果。黑板模型的三个基本组成成分为：知识源：根据求解应用领域问题专门知识的不同划分成若干相互独立的专家，这些专家称为知识源。知识源即为a g e 丑t 。每一知识源独立完成一种特定的任务或特定领域的任务。黑板：即共享的问题求解工作空间。一般以层次结构的方式组织，主要存放知识源所需的信息和求解过程中的解状态数据，如初始数据、部分解、替换解、最终解等，有时也存放控制数据。在问题求解过程中，知识源不断地修改黑板。知识源间的通信和交互只能通过黑板进行。监控机制：根据黑板上的问题求解状态和各知识源的求解技能，依据某种控制策略，动态的选择和激活合适的知识源，使知识源能适时的响应黑板变化。其优点是：系统事先并不需要对任务有个完整的规划，实现简单。缺点是：集中控制由调度程序完成，调度程序的复杂性和性能往往成为整个系统的瓶颈；共享数据结构难以灵活地使用异构数据源；黑板系统的可靠性差，所以一些可靠性要求很高的系统中难以采用黑板结构作为其基本结构。 ( 3 ) 市场机制这种m 1 1 l t i a g 豇1 t 合作方式的基本思想是：针对分布式资源分配的特定问题，建立相应的计算经济，以使a g 锄t 通过最少的直接通信来协调多个a g 即t 问的活动。在该方法中，对a g e n t 关心的所有事物( 如技能资源等) 都给予标价。系统中只存在生产者和消费者两种a g e n t 。生产者能提供服务，即将某一商品转换为另一商品；消费者能够进行商品交换。a g e n t 以各种价格对商品进行投标，但所有的商品交换都以当前市场价格进行，每一a g e n t 通过投标以获得最大的利益或效用。在计算市场中所采用的具体市场机制有多种，如各种拍卖协议( a u c t i o n 舯o t o c 0 1 ) 、协商策略等。优点是：基于计算，能找到最满意的合作方。但其局限是：计算量太大，而且当任务复杂时，很难对所有商品标上合理的价格。 ( 4 ) 基于承诺和约定的协作方法它由n r j n i n g s 提出，其基本思想为【1 3 】：采用分布目标搜索的形式化方法模型化多a g e n t 系统，承诺指a g e n t 对承担个特定的行为序列所作的保证，约定指在变化的环境中监控承诺进展状态的手段。承诺提供了一定程度的可预见北京工业大学臂理掌博士学位论文性，使a g e n t 能够在处理a g e m 间依赖关系、全局约束和资源冲突时，估计其它 a g e n t 的活动；约定为多a g e n t 系统在动态环境下的协作提供了灵活性。一些学者在此基础上做了迸一步的讨论，文献【1 4 】研究了社会机制的生成机制。但总起来讲，约定的表示及作用机制至今没有很好的解决，所以这种合作方式在实际应用方面尚需完善。 ( 5 ) 多a g e n t 规划规划是连接精神状态与动作执行之间的桥梁，有关动作和规划的研究一直是 a g e n t 研究的活跃领域。m a s 中韵规划“”与经典规划不同，属于适应性规划 ( 化a c t i v ep l a n n i n g ) ，需要反映出环境的持续变化。对m a s 中规划的研究主要从两个不同的角度进行：将规划看作是一种可以在世界状态间转换的抽象结构，如与或图；将规划看作是一类复杂的a g e n t 精神状态。这两种方法都在一定程度上降低了经典规划中解空间的搜索代价，从而有效地指导了资源受限a g e n t 的决策过程。前一种方法的应用更广，常用的方法是将a g e m 的规划库定义为一个与或图结构，每一条规划包括四部分：( 1 ) 规划目标，表示该规划能达到的目标：( 2 ) 规划前提，表示该规划被执行前必须满足的环境或状态条件；( 3 ) 规划体，是规划的程序部分，由规划序列和规划子目标组成；( 4 ) 规划结构，表示执行规划后对环境或状态的更新结果。其不足之处为：多a g e n t 规划不太适应动态变化的环境；很多形式化较好的理论与实际距离太远；如何更好地解决多a g e m 规划中的资源冲突；如何在多 a g e m 中引入质量因素等问题目前尚未很好解决。由于这些不足，这种合作方法目前还主要集中在理论研究阶段。通过上面的介绍分析，已提出了多种多智能体系统体系结构及合作理论和合作方式，它们各有优缺点及应用局限。在实际系统中，a g t 间合作的性能往往决定系统的成败。从总体上看，m a s 中a g e m 间的合作仍不理想，这在很大程度上限制了m a s 的应用。要完成合作，一般需合作参与方都尽力合作，如何保证参与合作的各a g e n t 都尽力，也有待于进行有效的研究。 1 3 2a g e n t 问合作的信任 m a s 靠a g e i l t 的信息交互相互合作完成任务，系统中建立有效的信任模型及欺骗检测机制能使合作更顺畅，同时也为系统的安全提供保证。一般，m a s 处在基于w 曲的开放的分布式环境中，a g e i l t 间的信任和欺骗是内容相关的，它和本次交互涉及到的a g e n t 能力相关。传统的访问控制列表( a c c e s sc o n 缸d ll i s t ，简称a c l ) 和密码机制在封闭的环境中有效，能为实体提供信任和安全，但不适于开放的分布式m l l l t i a g e n t 环境。第l 章绪论基于公钥系统的证书体系，如x 5 0 9 、p g p 等，也不能很好地满足分布式环境中的信任安全需求。r l a r e 等人【l6 】指出了层次式证书体系的不足：( 1 ) 认证中心仅担保一般意义上的个体标识，并不去证实个体的能力或赋予其权限；( 2 ) 完全依靠认证中心，弱化了个体的自我信任，而盲目信任大范围内的认证中心，则往往无法解决个体间的利益冲突；( 3 ) 难以集中维护证书撤消列表，证书很可能被滥用。为了解决w 曲环境中的信任问题，1 9 9 6 年m b l a z e 等人提出了信任管理( t m s t m a n a g e 加e n t ) 的概念【1 7 j 。信任管理为采用统一的方法描述和解释安全策略 ( s e c l l r i qp o l i c y ) 、安全凭证( s e c u r i t yc r e d e n t i a l ) 以及用于直接授权关键性安全操作的信任关系( 臼u s tr e l a t i o n s l i p ) 【”。基于该定义，信任管理包括：制定安全策略、获取安全凭证、判断安全凭证集是否满足相关的安全策略等。信任管理的功能可描述为：安全凭证集c 是否能证明请求r 满足本地策略集p 。在典型的 w 曲服务访问授权中，服务方的信任安全策略形成本地权威的根源，服务方既可使用安全策略对特定的服务请求进行直接授权，也可将这种授权委托给可信任第三方。可信任第三方则根据其具有的领域专业知识或与潜在的服务请求者之间的关系判断委托请求，并将结果以签发安全凭证的形式返回给委托请求方。最后，服务方判断收集的安全凭证是否满足本地安全策略，并做出相应的安全决策。为了使信任管理独立于特定应用，m b l a z e 等人提出了基于信任管理引擎( 咖s t m a n a g c m e n te 1 1 9 i e ，简称n 伍) 的信任管理模型，如图1 1 所示。t m 匪是整个信任管理模型的核心，体现了通用的、应用独立的一致性证明验证算法，根据输入的三元组( 请求- r ，安全凭证集- c ，本地策略集p ) ，输出信任安全策略是否被满足的判断结果。 i 信任 l i i 磊矗再三蕃画迈界 f i g u m1 11 砒m 锄a g m e l l tm o d e l 设计信任管理引擎需涉及以下主要问趔1g 】：( 1 ) 描述和表达安全策略和安全北京工业大学管理学博士学位论文凭证；( 2 ) 设计策略一致性证明验证算法；( 3 ) 划分信任管理引擎和应用系统间的职能。几个典型的信任管理系统p o l i c y m a k 一17 1 ，k e y n o t e 嘲和r e f e r e e 在设计和实现信任管理引擎时采用不同的方法处理上述问题。信任管理提供了一种w 曲环境下信任及安全问题的解决框架，目前几个已实现的信任管理系统的不足之处集中体现在：( 1 ) 安全分析主体单一，仅考虑服务方的安全保护，没考虑服务调用方的安全问题；( 2 ) 安全度量的绝对化，采用策略一致性证明验证的方法进行信任度量和决策，过于精确，不能很好地适应内容相关的多变性和不确定性：( 3 ) 无法实时地满足动态环境的变化，安全信任策略验证的能力和效率有限，并且大部分信任管理系统在策略一致性证明验证前必须收集足够的安全凭证；( 4 ) 安全策略的制定过程较为繁复。所有这些都阻碍了信任管理系统的应用。后来，一些学者认为信任是非理性的【2 1 丑】，是一种经验的体现，不仅要有具体内容，还应有程度的划分，并提出了一些基于此观点的不同于信任管理的信任度评估模型。它主要涉及：( 1 ) 信任的表述和度量；( 2 ) 由经验推荐所引起的信任度推导和综合计算。以下为两个较有代表性的信任度评估模型： 1 ) b e t h 信任度评估模型在b e m 信任度评估模型【1 1 9 】中，引入经验来表述和度量信任关系。这里，经验为一实体对其它某个实体完成某项任务的情况记录，它对应于任务被完成的成败，分为肯定经验和否定经验。若实体任务成功完成，则对其的肯定经验记数增加；若实体任务失败，则对其的否定经验记数增加。经验可由推荐获得，而推荐经验的可信度同样是信任问题，模型将信任分为直接信任和推荐信任。设有两个实体p 和q ，若p 对q 的包括直接的或由推荐获得的所有经验均为肯定经验，则称p 对q 存在直接信任关系：若p 愿意接受 q 提供的关于目标实体的经验，则称p 对q 存在推荐经验关系，定义为p 对q 存在推荐信任关系。当q 被p 信任时，用q 能成功完成任务的概率来评价p 对q 的直接信任关系。公式( 1 1 ) 描述直接信任度与肯定经验记录的关系：匕( p ) = l 一口口 ( 1 1 ) 其中，p 是p 所获得的关于q 的肯定经验数；a 为p 对q 成功完成一次任务的可能性期望。公式假设，q 完成一次任务的可能性在 o ，l 】上服从均匀分布。模型采用肯定经验与否定经验相结合的方法来描述推荐信任度。推荐信任度与经验记录的关系用公式( 1 - 2 ) 描述：第l 章绪论 r1 一口p 一，矿p n 咋( b 哪。1o ，p 括g ( 1 2 ) 其中，p 为p 所获得的关于q 的肯定经验数；甩为p 所获得的关于q 的否定经验数。对于同一个信任关系，多个不同的经验推荐者可能形成多条不同的推荐路径，所以，需有一个计算方法能推导并综合所有推荐路径的经验信息，以获得一致的信任度。设，系统中存在4 个实体，a 、b 、c 和d ；进一步假设，a 对b 的推荐信任度为n ，b 对c 的直接信任度为巧，b 对d 的推荐信任度为玛。则a 对c 的直接信任度定义为公式( 1 3 ) ：巧巧= 1 一( 1 一) “ ( 】- 3 ) a 对d 的推荐信任度定义为h 与巧的乘积，即玎巧。模型还给出了推荐信任度的综合计算公式： 1 门 d m = 二 ( 1 4 ) 仃l = l 。其中k 是由单个推荐路径而推导出的信任度。设只( f _ 1 ，m ) 是推荐路径上各不相同的最终推荐实体，k 表示其最终推荐实体为马的各条推荐路径的信任度，直接信任度综合计算公式定义为：。r 一 = 1 一m 、兀( 1 一) ( 1 5 ) 捌 y 户i 式( 1 - 5 ) 考虑了同一个经验推荐者出现在不同推荐路径上的情况。从模型的定义可以看出，它对直接信任的定义较严格，仅采用肯定经验对信任关系进行度量；从给出的信任的有关计算公式看，模型无法很好地消除恶意推荐所带来的影响，还会产生偏心现象( 信任值偏向刚加入信息系统的用户) 。另一方面，信任的表述和度量的合理性也有待于进一步验证。 2 ) j o s a n g 信任度评估模型 j o s 锄g 等人用事实空间( e v i d c es p e ) 和观念空间( o p i l l i o ns p a c e ) 来描述和度量信任关系，并提供了一套用于信任度的推导和综合计算的主观逻辑 ( s u 巧e c t i v el o g i c ) 运算子田吨6 】。事实空间由一系列实体产生的可观察到的肯定事件( p o s i t i v ee v e m ) 和否定事件( n e g a t i v ee v e n t ) 组成。 j o s 锄g 定义了由观察到的肯定事件数和否定事件数决定的概率确定性密度函数p c d f 并用它来计算实体产生某个事件的概率的可信度。设随机变量为护，r 表示观测到的实体所产生的肯定事件数，s 表示观测到的实体所产生的否定事件数，p c d f 定义为：伊( 口ir ，s ) = 亍黼占7 ( 1 一占) 5 ，。s p l ，2 。，s 。( 1 6 ) 观念空间由一系列对陈述的主观信任的评估组成。主观信任度定义为三元组 = 伯，吐“) ，这里： 6 + d + ”= 1 ， 6 ，d ，【0 l 】 ( 1 7 ) 其中，6 描述对陈述的信任程度，d 描述对陈述的不信任程度，“描述对陈述的不确定程度。j o s a n g 进一步定义了用事实空间中肯定事件数r 和否定事件数s 计算6 ，正“的公式： b i 专 1 d2 而 ( 1 8 ) l “= ! j o s a l l g 认为可通过事实空间的统计事件来描述主观信任度，并认为与p c d f 在主观信任度的表达上是等价的。 j o s a i l g 信任度评估模型还提供了合并( c o i q l l l l c t i o n ) 、合意( c o n s e 璐u s ) 和推荐( r e c o m m e i l d a t i o n ) 等主观逻辑算子，以进行信任度计算。合并用于不同信任内容的信任度综合计算；合意用于对多个相同信任内容的信任度综合计算；推荐主要用于信任度的推导计算。其详细描述参见文献 2 4 。从模型的描述可以看出，j o s a n g 的信任模型和b e m 的信任模型不同，它用事实空间中的肯定事件和否定事件对信任关系进行度量，但没有明确区分直接信任和推荐信任，对信任的定义显得较为宽松。该模型同样无法有效地消除恶意推荐带来的影响，另外，信任的表述和度量的合理性也有待于进一步验证。 m b l a z e 提出的信任管理模型及b 甜l 、j o s a n g 的信任度评估模型奠定了目前 w 曲分布式环境下信任研究的基础。从上面的分析可以看出，这方面的研究还远未完善，模型及信任度量算法的合理性还有待于验证推敲。在它们的基础上，一些学者在某些方面做了进一步的研究。文献【2 7 】给出了一个基于“承诺”机制的代理交互安全信任模型，它是为防止代理在交互过程中的欺骗行为而提出的，“承诺”机制是指在代理的交互过程中，要求代理提供一定数量的利益保证，利用该利益保证值可以实现对代理恶意行为的抑制。文献 2 8 】给出了一种基于模糊集合论的主观信任管理模型，指出p o l i c y m a k 一1 7 】，i 耐n 0 t e 实现的信任管理模型的不足之处在于，简单地用概率模型对主观信任进行建模，实际上是将信任的主第1 章绪论观性和不确定性等同于随机性，这是不合理的；另外，在对多个推荐信任进行综合时，简单地采用了取均值的方法，因而无法反映信任的真实情况，文献 2 8 】用模糊集合论作为工具来描述信任的度量，作为信任管理模型的一种实现。同样，他们提出的观点及算法的合理性同样有待于研究验证。文献 2 8 以模糊集合论为工具来描述信任的度量，其主要思想为：设论域为非空集合五z 为z 中的元素，对于任意的工尼给定映射：卜 o ，】，工卜p 。( 力 o ，1 ( 1 8 ) 则称由序偶组成的集合a 早缸iu 一( ，v 工x 为x 上的模糊子集。u 。( 力为j 对a 的隶属度函数。 x 上的一切模糊集的集合记为f ( 的。用多个模糊子集合乃f ( 习( ，= l ，2 ，m ) 定义具有不同信任度的主体集合。用主体对各乃的隶属度所构成的向量来描述主体的信任度。为了描述信任，将复杂的概念分解为概念树，最简单的概念称为属性，为叶节点。在将信任类型定义为概念树后，以概念树为框架对主体的信任知识进行评价和综合，可判断出主体的信任度，即主体的信任向量。其理论基础是模糊变换。当所讨论的信任类型的概念树高度为1 时，在对信任的综合评价中，有4 个基本要素：因素集五量 e ，“) ；评价集d = d l ，如，如；因素评价矩阵r = 粕) 。m ；各因素的权重分配肛 w l ，w 2 ，w n ) 。则评价结果信任向量y 三 v l ，v 2 ，v m ) 为： ( v l ，v 2 ，y m ) = ( w l ，w 2 ，w n ) o 眠k ( 1 9 ) 对于复杂的信任类型( 多级概念树) 来说，需要采用多层次综合评判对主体信任进行评价。由于概念树按照信任类型的内在结构将构成信任的子因素分类组成了多级结构，并指定了它们间的权重分配，所以概念树就构成了信任的多层次评判的依据。他们对信任的描述方式及初始信任的获得进行了探讨，但对于信任类型概念树如何分解，权重的分配，以及模型的合理性仍需进一步的探讨。其它模型中存在的恶意推荐等问题也没有从根本上解决。另外，文献 2 9 3 7 也描述了一些信任模型和信任方法，但信任的度量和模型构建的合理性、恶意推荐、偏心现象等仍没有根本的改善。通过上面的分析，目前对于m a s 环境下a g t 交互的信任研究还有很多工作要做，突出表现在：研究基本上在w 曲的p e e r - t o p r 环境下进行；模型构建、北京工业大学管理学博士学位论文信任的度量及计算还不合理；存在恶意推荐和偏心现象。因此，有必要对它进行研究。 1 3 3a g e n t 问合作的欺骗当合作的a g e n t 间存在利益冲突时，出于自身利益的考虑，a g e n t 可能提供虚假的消息欺骗对方。p 或e rf 锄1 ( 1 1 a u s e r 【3 蜘给出了谎言的定义和分类：把a g e n t 虚报自己处理能力的行为称为撒谎，它所宣布的虚假信息称为谎言。如果在a g 曲t 合作过程中，不能很好地识别各类谎言，就不能实现合作的可靠性和有效性。功效值定义为：每个a g e n t 赋予其每个动作( 能力) 一个期望被选中的值，它表达了这个候选动作被执行后它所能取得的利益的大小。可以把几种常见的谎言进行分类：根据a g e n t 是否知道竞争对手所报功效值的情况，谎言可分为： 1 ) 消息灵通的谎言 a g e n t 在知道对手所报功效值的情况下，再谎报自己的功效值。这就是消息灵通的谎言。 2 ) 非消息灵通的谎言在不知道对手所报功效值的情况下，谎报自己的功效值。又可分为：贪婪的谎言( 乒d yl i e ) a g e n t 虚报某个动作的功效，将它置为最大值，而将其它的动作的功效值置为最小值。目的是增加最好动作被选中的概率。因此，贪婪的谎言会立即得到结果。半贪婪的谎言( s 锄i 蓼e e d yl i e ) a g e n t 对期望选中的动作赋予较高的功效值。根据谎言对自己的影响和对对手的影响，谎言可分为： 1 ) 受益的谎言这种谎言能使撒谎a g e m 从中受益( 提高自己期望的动作被选中的机会) 。 2 ) 恶意的谎言谎言对对手的损害比对自己的损害要更多一些，即通过牺牲自己的利益而去破坏对手的利益，加大自己与对手的功效值之差。文献 3 9 】对几种抑制欺骗的协议进行了分析，它们是：拍卖机制；双边协商机制；有优先权的决定论选择协议；带权值的决定论选择协议；概率论的选择机制。这些协议能在一定程度上限制合作中的欺骗行为，但不能消除欺骗，更不能识别欺骗。文献 4 0 ，4 1 】给出了欺骗的种类：以言欺骗；以行欺骗；言行不一致的欺骗。同时给出了欺骗对策：1 ) 基于修改信任度的惩罚机制，分为：无通讯的惩罚第1 章绪论机制；基于广播的惩罚机制；2 ) 基于控制的惩罚机制，分为：基于欺骗容量的控制机制；基于交易值的中间控制机制。在传统的商务活动中有很多欺骗识别技术【4 2 】。事实监测、非语言行为【4 3 。基于标准的内容分析1 4 7 垮，由于m a s 环境不同于人类环境，这些技术较难用于 m a s 。文献 4 8 从信任角度给出了在m a s 中，当一个蹭e n t 发现它自己被欺骗时，如何处理的问题，但没有针对如何发现欺骗展开讨论。另外一些人工神经网络等数据挖掘方法也被用于欺骗识别，如文献 4 9 】在对商业环境中用户的信用确认中，给出了基于案例推理的欺骗识别的联合算法，这些方法比较适合于存在大量数据的商务环境，并取得了很好的效果，由于m a s 中不同系统有自己的合作方式和特点，数据量也往往达不到要求，较难使用数据挖掘方法来进行欺骗识别。文献 5 0 】给出了m a s 中a g t 的反诽谤模型，它基于线索进行诽谤欺骗的识别，其线索是：a g e n t 信誉值的大的改变，或某些a g e l l t 的卖价的大的改变。系统根据这些线索发现诽谤的嫌疑者，进一步发现诽谤者。这种方法能进行一定程度的欺骗识别，问题是改变量的域值设定，但不管如何设定，总会有一部分欺骗者遗漏或误判，同时线索的跟踪会耗费大量的系统资源。文献 5 1 】对a g e n t 欺骗进行了逻辑分析，将欺骗识别分为三类：基于知识的欺骗识别：基于推理的欺骗识别；混合欺骗识别。它以基于推理的欺骗识别为例进行了阐述，对于两个a g e n tp 和 q ，首先对p 和q 所使用的推理规则进行识别标示，若p 和q 所用的推理规则不一致，则认为p 和q 间可能存在欺骗。这种方法对欺骗的理论分析进行了有益的探讨，但它只能发现可能存在欺骗，如何发现欺骗仍没解决。文献【5 加5 4 】对欺骗进行了探讨，也没有给出欺骗的识别方法。冒名欺骗不只在m a s 中存在，在计算机应用的其它领域也广泛存在。冒名欺骗的解决其实质是身份确认问题，目前在计算机应用环境中主要有两类身份确认方法：1 ) 基于对称密钥【驺瑚】的身份确认，即通常的口令方式，这种方式由于密钥对称，在分布式系统中密钥的传输、管理比较困难，所以不太适于开放的 m a s 环境；2 ) 基于非对称密钥的身份认证，它具有两个密钥，即公钥和私钥，由于公钥公开，较适于分布式系统，一般认为采用基于公钥密码技术构建的公钥基础设施( p ) 是解决大规模、分布式开放网络环境下信息安全问题的有效方法【5 蛳】，但它需要一个集中的认证中心或密钥分发中心，容易成为系统的瓶颈，

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（管理科学与工程专业论文）多智能体合作理论与方法及其在商务智能中的应用.pdf

文档简介

温馨提示

最新文档

评论

（管理科学与工程专业论文）多智能体合作理论与方法及其在商务智能中的应用.pdf

文档简介

温馨提示

最新文档

评论

相关文档