（计算机应用技术专业论文）robocup中多智能体系统协作的研究与实现.pdf

上传人：扣*** IP属地：宁夏上传时间：2019-12-13 格式：PDF 页数：59 大小：1.57MB 积分：0 举报 版权申诉

（计算机应用技术专业论文）robocup中多智能体系统协作的研究与实现.pdf_第2页

（计算机应用技术专业论文）robocup中多智能体系统协作的研究与实现.pdf_第3页

（计算机应用技术专业论文）robocup中多智能体系统协作的研究与实现.pdf_第4页

（计算机应用技术专业论文）robocup中多智能体系统协作的研究与实现.pdf_第5页

已阅读5页，还剩54页未读，继续免费阅读

（计算机应用技术专业论文）robocup中多智能体系统协作的研究与实现.pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

摘要多智能体系统足分布式人工智能的个前沿学科，它研究的核心问题是寻求建立一种有效的l 办作机制使功能独立的智能体通过f ! ! j j 、作完成复杂的控制任务或解决复杂的问题。本文以r o b o c u p 仿真比赛为检验平台，以多智能体系统为研究对缘，选择智能体m i j 【j j 、作为目标任务，在对已有的仂、作策略进行研究的基础上，分别从防守和进攻的角度出发，提出了基于亲密度模型和基于合作意愿矩阵的阱作策略。本文提出亲密度的概念来表示智能体协作完成仟务的依赖性i 。綦于亲密度模型的胁作策略将智能体的亲密度作为眺竹：f l j 依拟i ，要求鹤能体完成自己任务的同时还要协助与其亲密度大| ，f 勺智能体焚同完成任务，实现了分：c 与合作的统一，很好地解决了m1 二料能休之m j 人盯人防i ) 二和区域。人防守中的盯人失败导致防线窬易被突破的问题。针对r o b o c u p 仿真比赛无法依赖通信实现合作的情况，本文提了通过合作意愿矩阵来建立智能体之问的协作关系，为控球 j i i | 体选择传球目标、非控球智能体接应判断和l 动作选择提供了依j ：l i 。丛j 二合作意愿矩阵的协作策| | l 成功地实现了多智能体系统中 j 阳体m j 默契配合，可以满足r o b o c u p 仿真比赛的实时性和灵活性要求，为多智能体系统提供了一种不依赖通信的显式合作。本文捉l 向多智能体胁作策略已成功应用到中南大学的r o b o c u p 仿真球队c s uy u n l u 中，实际比赛中对抗的结果，证实了以上协作策略是可行、有效的。关键词多科能体系统，阱作，亲密度模型，合作意愿矩阵 a b s t r a c t m u l t i a g e n ts y s t e m ( m a s ) i sf o r e h e a do fd i s t r i b u t e da r t i f i c i a l i n t e l l i g e n c ei nw h i c ht h ec o r ec o n t e n tf o rr e s e a r c hi st oc o n s t r u c tak i n d o fe f i e c t i v ec o o p m + a t i o nm e c h a n i s mw h i c he n a b l e sf u n c t i o nd e p e n d e n t a g e n tt oa c h i e v eac o m p l e xc o n t r o l l i n gt a s ko rs o l v eac o m p l e xp r o b l e m t h i sd i s s e r t a t i o nc h o o s e sc o o p e r a t i o ni nm a sa s t a r g e tt a s kb a s e d o nt h et e s t b e d o t r o b o c u ps i m u l a t i o nl e a g u e a f t e rs t u d y i n gt h e e x i s t i n gc o o p e r a t i o ns t r a t e g i e s i n m a s ，t h i sp a p e rp u tf o r w a r dt h e 。 c o o p e r a t i o ns t r a t e g i e sb a s e do nt h ea f f i l i a t e dd e g r e em o d e la n do nt h e1 c o o p e r a t i o nd e s i r em a t r i x ( c d m ) r e s p e c t i v e l yf r o md e f e n da n da t t a c k i a s p e c t s t h i sp a p m 。p r o p o s e st h ec o n c e p to fa f f i l i a t e dd e g r e et od e s c r i b e t h ed e g l e eo f c l o s er e l a t i o nb e t w e e na g e n t s t h ec o o p e r a t i o ns t r a t e g y b a s e do nt h ea f f i l i a t e dd e g r e em o d e lr e q u i r e sa g e n tt oa s s i s ta n o t h e r a g e n t w h oh a st h eh i g ha f f i l i a t e dd e g r e ew i t hh i mw h i l eh ei st a k i n go nh i so w n t a s k ，i nt h i sw a yw er e a l i z et h ei m p o r t a n c eo fu n i t yo fd i s t r i b u t i o na n d c o o p e r a t i o n ，w h i c ha l s op e r f e c t l ys o l v e st h ep r o b l e mo fd e f e n c el i n e b e i n ge a s i l y b l o k e n t h t o u g hw h e nm a n t o m a nd e f e n c eo ra r e a b a s e d m a r k i n g d e f e n c ef a i l s a i m i n gt ot h ef a c tt h a tc o l l a b o r a t i o n t h r o u g h c o m n m n i c a t i o ni s u n c e r t a i n t y i nt h es i m u l a t i o ng a m e ，a ni n n o v a t i v e c o o p e r a t i o nd e s i l em a t r i xi sb r o u g h tf o r w a r di nt h i sp a p e x t oi n d i c a t e s y m b i o s i so t m u l t i p l ea g e n t s ，b yu s eo fw h i c h ，t h ea g e n th a v i n gb a l l w i l l c h o o s et h ea p p r o pz i a t er e c e i v e rw h i l et h e a g e n tw i t h o u tb a l lj u d g e sh o w t oc o o p e r a t ee f f e c t i v e l yw i t ht h ef o r m e r b yt h ea d o p t i o no fc o o p e r a t i o n s tn a t e g yb a s e do nc d m ，t h ep r i v i t i e sa m o n g s tt h ea g e n t sc a nb er e a l i z e d s u c c e s s f u l l y ，a n dr e q u i r e m e n t so ft h er e a l t i m ea n df l e x i b i l i t yc a nb em e e t e x c e l l e n t l y t h ec o o p e r a t i o ns t r a t e g yb a s e do nc d mp r o v i d e da ne x p l i c i t c o o p e r a t i o nw h i c hd o e sn o td e p e n do nc o m m u n i c a t i o ni nm u l t i a g e n t s y s t e m t h et w o c o o p e r a t i o ns t r a t e g yp r o p o s e s i nt h i sa r t i c l eh a sb e e n s u c c e s s f u l l ya d o p t e di nc s u y u n l us i m u l a t i o nt e a m ，t h er e s u l to fa c t u a l a n t a g o n i s mt e s t i n gs h o w st h a t t h ec o o p e x a t i o n s t r a t e g yi sf e a s i b l ea n d e f f e c t i v e k e yw o r d s m a s ，c o o p e r a t i o n ，a f f i l i a t e dd e g r e em o d e l ，c d m i o b o c u p a 世c n 【 m a s d a i c d p n b d l a d m c d m 符号说明 t h er o b o ts o c c mw o tl dc u p m t l i t i a r e n ts y s t c m 1 ) i s t ii l ) t i l e ( ia 九i f i c i a li n t e l t i g e n c e c o , p o ln i j v e1 ) i s t t i b u l e c l i i o b l c n ls 0 1 v m 2 b c l l l ld c s i l _ ci n t c n t i o n a i i i i i a t e ( 1d e g l _ c cm a t r i x c o , p o t a 【i v ed e s j l _ em a t r i x 机器人足球毗界杯例能体多锚能体系统分砷扛人j 1 ：纠能合作分川行题求解，。一信念、愿身! 、意图的慎思结构亲密皮矩阵合作意愿矩阵原创性声明本人声明，所呈交的学位论文是本人在导师指导下进7 7 i , 7 研究工作及取得的研究成果。尽我所知，除了论文中特别加以标注和致谢的地方外，论文中不包含其他人已经发表或撰写过的研究成果，也不包含为获得中南大学或其他单位的学位或证书而使用过的材料。与我共同工作的同志对本研究所作的贡献均已在论文中作了明确的说明。作者签名：迅塑同期：生年二翻卫f f 关于学位论文使用授权说明本人了解中南大学有关保留、使用学位论文的规定，即：学校有权保留学位论文，允许学位论文被查阅和借阅；学校可以公布学位论文的全部或部分内容，可以采用复印、缩印或其它手段保存学位论文；学校可根据国家或湖南省有关部门规定送交学位论文。作者签名：缝蚴导师签名：耋乏錾二r 期：丝年月旦同嘶! i 学位论义笫一章绪论第一章绪论本文以r o b o c u p 仿真比赛为研究平台，以多智能体系统为研究对象，选择智能体问协作为目标任务，分别从防守和进攻的角度出发，来研究r o b o c u p 仿真比赛中多智能体系统的协作问题。本章首先简单介绍多智能体系统和机器人足球世界杯，接着说明课题来源和目的，最后介绍本沦文的主要内容安排。 1 1 1多智能体系统人：l ! 智能作为一门独立的研究学科，始于二十世纪五十年代。过去五十年中人工智能的主要问题是“多主体动态不可预测环境中的问题求解”，其标准问题是足球的机机剥+ 抗赛和人机对抗赛。自七十年代后期以来，随着计算机网络、计算机通信和并行程序设计技术的发展，分布式人工智能d a i ( d i s t r i b u t e d a r t i f i c i a li n t e l l i g e n c e ) 的研究逐渐成为一个热点，早期的研究主要是分布式问题求解，其目标是创建大粒皮的协作群体，个体之问共同工作以对某一问题进行求解：，l - 时，多智能体系统m a s ( m u l t i a g e n ts y s t e m ) 【2 】【3 1 的研究成为分研j 式人工智能的热点，实际系统的分川r 陛、复杂性和动态性有望通过对单个个体能力的有效分：i ：、协渊和组织而达到系统整体优化的目的。 1 1 1 智能体的概念多智能体主要研究自主的智能体( a g e n t ) 5 舶1 之问智能行为的协调，为了一个兆同的全局l | 标，也可能是关于各自的不同目标，共享有关问题和求解方法的知i 以、胁作进行问题求解。 a g e n t ，i _ 【| j 智能体，已成为分巾式人：智能( d a i ) 研究中的主要角色。从 2 0t u ： g7 0 年代出现至今，a g e n t 的设计与应用成为越来越多研究人员的兴趣。对于“什么是a g e n t ? ”这个问题，学术界至今没有统一的答案。在人工智能研究领域l _ i = t i ，由w o o l d r i d g e 和j e n n i n g s 所给出的a g e n t 定义 7 1 1 8 1 被大多数研究者所接受，f ；! | a g e n t 是一个具有自主性、社会能力和反映特征的计算机软、硬件系统，它具有自治性、社会性、反应性和能动性。基于智能体的概念，人们提出了一种新的人工智能定义：“人工智能是计算机利学的一个分支，它的目标是构造能表现出一定智能行为的智能体”。所以，智能体的研究应该是人工智能的核心问题。坝i ：学位论文第一章绪论 1 1 2 智能体的体系结构每个智能体接收从环境中感知的输入，并产生输出动作作用于环境，所以智能体也可以定义为从感知序列到智能体动作的映射，体系结构的任务就是将感知1 、规划、决策、行动等各种模块有机结合起来，从而形成具有一定特色的智能系统。根据人类思维的层次模型，多智能体系统中主要有以下三种典型的a g e n t 体系结构。 1 反应式体系结构反应式体系结构( 9 】的提出者是r o d n e yb r o o k s ，反应式智能体只是简单地对外部环境发生反应，它不断地获取感知的输入并将其映射成一个要执行的动作，而不使用复杂的符号推理。反应结构的设计源自这样的假设：智能体行为的复杂性是智能体所处环境复杂性的反映，而不是智能体内部设计复杂性的反映。 2 慎思式体系结构基于s i m o n 和n e w e l l 的物理符号系统假设川，智能体维持着对世界的内部表示，具有能用一定形式的符号推理加以修正的精神状态。根据大多数通用的慎思方法，认知构件基本由两部分组成：世界模型和规划器。这种方法中有一个基本的假没：对认知功能进行模块化是可能的，即可以分开来研究不同的认知功能( 如感知、学习、规划和动作) ，然后把它们组装在一起构成自治智能体。 3 混合型体系结构分析上两种体系结构，慎思型结构强调规划、搜索，反应式结构强调交互、反馈。将两种结构互相渗透，相互补充，提出一种混合结构【坦】。这种结构既能体现舰划推理，又能实时交互反馈。它包含两个予系统：慎思予系统包含问题的抽象符号模型，川于脱划、决策：反应予系统响应环境变化“t 吖内紧急时刚，无需复杂推理。所以混合型体系结构既能实现面向目标的长期规划，又具有实时性的特点，是多智能体系统中最常用的a g e n t 体系结构。 1 1 3 多智能体系统及应用多智能体系统足山多个智能体组成的集合，是一种分斫i 式自主系统。与单个智能体相比，多智能体系统具有以下特点： ( 1 ) 每个成员智能体仅拥有不完全的信息和问题求解能力( 故其观点是局部有限的) ； ( 2 ) 不存在全局控制，数据是分散或分布的，计算过程是异步、并发或并行的： ( 3 ) 同一多智能体系统中的智能体可以异构。因此多智能体技术对于复杂系统具有更大的表达力，可以为各种实际系统提、顺学位沦文鲋一市绪论供统一的模型，从而为各种实际系统的研究提供统一的框架。图l 一1 描述了一个标准的多智能体系统。系统包含一些a g e n t ，他们可以通过通信互相交互j 这些a g e n t 可以在环境中动作，7 l o i na g e n t 有不同的“作用范围”，表示它们可以控制、至少是影响环境的不同部分。在有些情况下，影i i q 的范围可能会重叠，而影响重叠的事实会产生a g e n t 之问的依赖关系f 1 3 1 。图1 1 多智能体系统的标准结构多智能体技术是人工智能技术的一次质的飞跃：首先，通过智能体之问的通汛，可以丌发新的规划或求解方法，用以处理不完全、不确定的知识：其次，通过智能体之问的协作，不仅改善了每个智能体的基本能力，而且可从智能体的交互中进一步理解社会行为；最后，可以用模块化风格来组织系统。如果说模拟人是单智能体的目标，那么模拟人类社会则是多智能体系统的最终目标。多智能体技术具有自主性、分斫i 性、协调性，并具有自组织能力、学习能力和推理能力。采用多智能体系统解决实际应用问题，具有很强的鲁棒性和可靠性，并具有较高的问题求解效率。多智能体技术打破了目前知识工程领域的一个限制，即仅使用一个专家，因而可完成大的复杂系统的作业任务。多智能体技术在表达实际系统时，通过各智能体问的通讯、合作、协调、调度、管理及控制来表达系统的结构、功能及行为特性。由于在同一个多智能体系统中各智能体可以异构，因此多智能体技术对于复杂系统具有无可比拟的表达力，它为各种实际系统提供了一种统一的模型，从而为各种实际系统的研究提供了一种统一的框架，其应用领域十分广阔。多智能体系统理论的一个具体应用就是机器人足球世界杯比赛，从1 9 9 6 年开始的机器人足球比赛能够十分典型的体现多智能体系统的许多特点，如动态、实时、多机器人协调、感知信息不完全等，并具有对抗性及较强的观赏性。坝i ：学位论义第一章绪论 1 2机器人足球世界杯 r o b o c u p 1 6 i ( t h er o b o ts o c c e r w o r l dc u p ) ，即机器人足球世界杯赛。是一个通过提供足球比赛这样一个标准问题来促进人工智能、智能机器人以及相关领域的研究而建立的国际性的研究和教育组织。 1 2 1 r o b o c u p 简介 1 9 9 2 年，机器人足球的最初想法山加垒大不列颠哥伦比亚大学的a l a n m a c k w o r t h 教授于正式提出。同本学者立即对这一想法进行了系统的调研和可行性分析。1 9 9 3 年。m i n o r u a s a d a ( 浅f h 埝) 、h i m a k i k i t a n o ( 北野宏明) 和y a s u o k t m i y o s h i 等著名学者创办了r o b o c u p 机器人足球世界杯赛。，与此同时，一些研究人员丌始将机器人足球作为研究课题。隶属于f i 本政府的电子技术实验室( e t l ) 的i t s u k in o d a ( 松原仁) 以机器人足球为背景展丌多主体系统的研究，| _ f 本大坂大学的浅用埝、美国卡内基一梅隆大学的v e l o s o 等也，1 ：展了同类：作。 1 9 9 7 年，在囡际上最权威的人工智能系列学术大会第1 5 届国际人工智能联合大会( t h e15 t hi n t e r n a t i o n a lj o i n tc o n f e r e n c eo na r t i f i c i a li n t e l l i g e n c e ，简称 i j c a i 9 7 ) 上，机器人足球被正式列为人工智能的一项挑战。至此，机器人足球成为人工智能和机器人学新的标准问题。 r o b o c u p 的最终目标是到2 1 1 盐纪中叶，一支完全自治的人形机器人足球队应该能在遵循固际足联正式规则的比赛中，战胜最近的人类世界杯冠军队【l ”。就近期来泌，r o b o c u p 为人工智能和机器人学提供了一个标准的测试平台，检验信息自动化l 谢沿研究，特别是多智能体系统研究的最新成果，包括动态不确定的对抗环境下的多智能体合作、实时推理、机器学习和策略获取等当前人工智能的热点问题以及自动控制、机器人学、传感与感知融合、无线通讯、精密机械和仿生材料等众多学科的前沿研究与综合集成。并且和影响范围最广的足球运动结合，受到了公众的关注，促进了基础研究和实际应用的联系和转化。 - r o b o c u p 机器人足球世界杯赛及学术研讨会是国际上级别最高、规模最大、影响最广泛的机器人足球赛事和学术会议。从1 9 9 7 年在同本名古屋丌始举行第一届比赛后，以后每年举办一次，最近一次是在2 0 0 4 年葡萄牙里斯本举行的第八届r o b o c u p 机器人足球世界杯赛及研讨会。现在r o b o c u p 共包括四大项活动，分别是足球比赛、紧急救灾比赛、青少年组比赛和研讨会。足球比赛是整个比赛的主要部分，包括小型组、中型组、四腿组、类人组和仿真组，除了仿真组比赛是全部通过电脑模拟外，其余的比赛都是以实物机器人形式比赛。 ! i ：学位论义撼一帝绪论 1 2 2 r o b o c u p 中多智能体协作在r o b o c u p 中，每个参赛的球队是由多个队员( a g e n t ) 组建，每个a g e n t 必须具有如下能力： f 1 ) 个人技术，对应于人类足球队员的个人能力。 f 2 ) 决策r i p - f ；，根据比赛的实际情况，进行实时决策，以决定下一步的动作。 ( 3 ) 合作能力，可以和j ：e 它a g e n t 合作完成一定的子目标。 ( 4 ) 学习能力，包括在线学习和离线学习。 ( 5 ) 通讯能力，与本队的其它队员实现信息交换并不被对方破解。机器人足球赛则是两支参赛队伍或团队的对抗活动，每个团队都包含若干智能体，共享相同的目标：多进球，赢得比赛。为了实现这个团队目标，每个智能体必须进行灵活的配合，尽快将足球推进到对方半场进而形成射门机会。也就是况尽管每个智能体都是自治的，但它们必须在共同目标的指引下进行团队协作。上| 于比赛是双方的，对其中一支队伍来况，另外一支队伍为了相同目标进行的各种对抗性活动也进一步造成了环境的不可预知的动态变化，这样，我们就需要研究列抗环境下的合作问题。另外比赛环境只能提供低带宽不可靠的通信信道，存在噪声干扰的感知器和执行器，要求每个智能体具有实时推理功能。这些都表明，利用机器人足球比赛来研究多智能体系统的理论是非常适合的。 r o b o c u p 仿真比赛平台通过模拟类似的特性，成为完全分稚式的既有合作又有划抗的多智能体系统理论的测试平台。本文主要从防。、) ：和进攻的角度出发来研究r o b o c u p 仿真比赛中多智能体系统的协作问题。防守中的协作难题主要是盯人的任务分配和如何协作进行抢断；进攻中的协作难题是如何实现一种不依赖于通信的传球配合。f 1 前国内外各仿真球队在防守方而的研究：l 二作主要集中在单个智能体的截球和刖人能力上，对多智能体作防守的研究：作十i ! i x , 1 较少，其中已应用的防守协作策略主要有根据智能体问距离进行朗作和通过制定固定协作关系进行防守两种。在进攻方面广泛采用的传球策略主要有亩日搜索传球法、基于区域传球策略和固定球员配合传球法。以上的协作策略都存在不足和局限，这就需要对已有的写作策略进行改进或提出更合理的阱作策略来满足r o b o c u p 仿真比赛的需要。 1 3 课题来源和研究目的本课题来源于国家“8 6 3 ”计划基金资助项目( 2 0 0 1 a a 4 4 2 2 2 0 0 ) 和中南大学信息科学与工程学院“青年骨干教师科技基金”项目“多智能体系统的学习、合作与协调”。课题的研究工作是在机器人足球仿真比赛的平台下进行。在机器人足球仿真在噪声干扰的感知器和执行器，要求每个智能体具有实时推理功能。这些都表明，利用机器人足球比赛来研究多智能体系统的理论是非常适合的。 r o b o c u p 仿真比赛平台通过模拟类似的特性，成为完全分斫i 式的既有合作又有对抗的多智能体系统理沦的测试平台。本文主要从防：) ：和进攻的角度出发来研究r o b o c u p 仿真比赛中多智能体系统的协作问题。防守中的协作难题主要是盯人的任务分配和如何协作进行抢断；进攻中的协作难题是如何实现一种不依赖于通信的传球配合。目前国内外各仿真球队在防守方而的研究工作主要集中在单个智能体的截球和印人能力上，对多智能体协作防守的研究工作相对较少，其中已应用的防守协作策略主要有根据智能体间距离进行阱作和通过制定固定协作关系进行防守两种。在进攻方面广泛采用的传球策略主要有盲目搜索传球法、基于区域传球策略和固定球员配合传球法。以上的协作策略都存在不足和局限，这就需要对已有的写作策略进行改进或提出更合理的协作策略来满足r o b o c u p 仿真比赛的需要。 1 3 课题来源和研究目的本课题来源于国家“8 6 3 ”计划基金资助项目( 2 0 0 1 a a 4 4 2 2 2 0 0 ) 和中南大学信息科学与工程学院“青年骨干教师科技基金”项目“多智能体系统的学习、合作与协调”。课题的研究工作是在机器人足球仿真比赛的平台下进行。在机器人足球仿真 f * ! i + 学位论文笫二二章r o b o c u 【p 仿真比赛第二章r o b o c u p 仿真比赛 r o b o c u p 仿真比赛在标准的计算机环境下进行，比赛模拟了人类足球实际比赛的情况，比赛队员的仿真模型与人类足球队员接近，比赛规则也基本上与国际足球联合会的比赛规则一致，主要区别在于仿真平台模拟的是二维平面，没有高度概念。仿真比赛环境避丌了诸如列象识别、通讯和硬件殴计等机器人底层问题使研究人员能够集中柑力研究多智能体之问的协作和学习等商层次问题。另外建立仿真比赛的研究平台只需少量资金投入。因此，仿真比赛成为所有 r o b o c u p 比赛项e 川：，参赛队伍最多的一利一。本章对r o b o c u p 仿真比赛环境、仿真球队的建立j ：! | ! 行了系统论述，是后续章= 仃多智能体系统队作策略研究的基础。 2 1 r o b o c u p 仿真比赛服务器介绍 r o b o c u p 委员会为仿真比赛提供了一个完全分祈j 式控制、实时异步、有噪声的多智能体环境，用这个平台测试各种理论、算法和a g e n t 体系结构，和研究多智能体m 的合作与列抗问题。仿真比赛是在一个标准的计算机系统中进行的，这个系统就是r o b o c u p 模拟系统【2 0 】【2 1 1 1 2 2 r c s o c c e r s i m ( r o b o c u ps o c c e rs i m u l a t o r ) 。 r c s o c c e r s i m 包含两个程序：s o c c e rs e r v e r 和s o c c e rm o n i t o r ”j 。s o c c e rs e r v e r 提供了一个虚拟场地，模拟球和所有球员的动作，负责服务器和客户端之问通讯和根据规则控制比赛过程。s o c c e rm o n i t o r 是一个用来将比赛的虚拟场地显示在计算机屏幕上的一个程序。 r o b o c u p 仿真比赛采用c l i e n t s e r v e r 方式运行：服务端运行s o c c e rs e r v e r 程序为比赛提供平台。客户端运行各参赛队伍编写的球员程序，每个球员就是一个自治智能体。 2 1 1 服务器、客户端和监视器服务器( s o c c e rs e r v e r ) 是一个能使不同队伍进行足球比赛的系统。由于比赛以c l i e n t s e r v e r 方式运行，在服务器和每个客户端程序之间的所有通讯都是通过一个u d ps o c k e t 来进行的，所以参赛队伍可以使用任何支持u d p i p 的操作系统平台和编程语言米没计自己的客户端程序。每个客户端程序是一个独立的进程，通过特定的端i _ 也址连接到s o c c e rs e r v e r 上。每个队伍能启动1 1 个客户端 ( 或球员) 和一个在线教练( o n l i n ec o a c h ) 。客户端程序根据自己想要执行的动作向服务器发送命令请求( 比如k i c k 、t u r n 或r u n 等) ，服务器收到这些命令后 2 0 0 4 年底仿真比凑引入新的了项，即3 d 仿真比赛，木义仍然集中神：2 d 、卜台i ：进行讨论 7 坝i 学位论义第二市r o b o c u p 仿真比赛处理这些请求- j j u 4 ；, j 应王l ! 新比赛的环境。除此之外，服务器还向每个球员提供感知i 信息( 比如球、球门和其他队员的位箭信息) 。客户端程序就像是球员的大脑：从服务器接收视觉和听觉信息，根据这些信息做出决策，然后发送控制命令到服务器。服务器通过将时问分割成离散的时间段( 周期) 来实现一个实时系统，每个周期有特定的长度，任何需要在给定周期内完成的动作必须在相应的周期内到达服务器。因此，低效率引起的丢失动作执行机会对整个队伍的比赛成绩有很大的影响。每个客户端( c l i e n t 或p l a y e r ) 程序只能控制一名球员，所以每个参赛队伍的球员数和客，o 端程序数目相同。不同客户端程序之m j 的通信必须通过s o c c e r s e r v e r 执行s a y 和h e a r 协议来实现。r c s o c c e r s i m 系统的一个目的就是用来评价多智能体系统的，在这个系统中多智能体之问的通讯效率也是一个评价的标准。参赛队伍必须使川这种受限的通讯能力来实现多智能体的控制。图2 - 1 r o b o c u p 仿真比赛的整体结构图山_ - j 二r c s o c c e r s i m 提供的是一个对抗性环境，在比赛时就需要裁判对队员的某些行为做出判断。在当f m 的r c s o c c e r s i m 已经实现了部分的人工裁判能对一些简单的情况进行检测，比如射门。然而在正式比赛中仍然有许多情况( 比如程序死锁) 需要一名人：i ：裁判做出处理。监视器( s o c c e rm o n i t o r ) 作为一个特殊的客户端程序连接到s o c c e rs e r v e r 坝i ：学位论义第二市r o b o c u p 仿真比赛上，是一个可视化工具，用米动态实时显示比赛过程中的服务器信息。这些信息包括：当时比分、参赛双方队伍名称、足球场地、球员和球的位簧等。同时s o c c e r m o n i t o r 程序也提供了控制服务器的一些简单接口，比如参赛双方的客户t 端连接到服务器后，可以按s o c c e rm o n i t o r 的“k i c k o f f ”按钮来丁i ：始比赛。对于一场比赛的进行，s o c c e rm o n i t o r 不是必须的，然而如果需要的话，多个s o c c c rm o n i t o r 可以同时连接到服务器上，比如想在不同的终端上显示比赛的话。 r o b o c u p 仿真比赛的整体结构图如图2 1 。 21 2 球员感知模型 r o b o c u p 中的每个a g e n t 具有- - k f 不同的感知信息，分别是：听觉信息、视觉信息和身体信息，这些信息山s o c c e rs e r v e r 按规定的周期发送给球员。感知信息剥球员：哪苦重要，它们决定了球员的世界模型，对这些信息处理的优劣将直接影响球员的性能，i 玉lj l e 作为仿真比赛的研究者，熟悉这些信息是非常重要的。 1 听觉信息智能体的消息来自三方而，一是队员之间的通讯交流，二是教练的指示，三是裁判的裁决消息。 a g e n t 之问的通讯能力2 4 是非常有限的，只能听到一定距离( 5 0 0 米) 之内的声音。而且每个队员在一个仿真周期内只能i 听到分别来自每个队伍的最多一条消息，也就是说只能听到两条消息( 一条本方的和一条敌方的) 。如果本方有多名球员在同一个仿真周期内讲活，对符合距离限制的球员来说，它只能接收到其 1 = | = j 一条消息( - i 前的服务器实现选择最先到达的那条消息) ，其他消息将丢失。而且，每个队员u h 舌内容最多足l o 个字符( 只能是0 9 a z a z ( ) + * ? 共7 4 个字符的组合) 。因此队员刚的通讯能力被做了极大限制，r c s o c c e r s i m 系统模拟了低带宽双通道的声音传递。教练给队员的指示内容长度可以达到1 2 8 个字节，但是每场比赛允许教练发出指示的次数是非常有限的。裁判的裁决消息包括进球、丌球、犯规等内容，具有最高的优先级，可以即刻被全部队员准确无误接收到。 2 视觉信息服务器的视觉模型每隔s e n s es t e p 时问会自动将每个球员当时看到的视觉信息发送给他们。视觉信息的形式为： ( s e eo b j n a m ed i s t a n c ed i r e c t i o nd i s t c h n gd i r c h n gb o d y d i rh e a d d i r ) 其中：o b j n a m e ：= ( p “t e a m n a m e ”u n i f o r m n u m b e rg o a l i e ) i ( g 1 lr ) 1 ( b ) 视觉消息中的数据是以相对坐标的形式给出的，所以智能体自己定位的精度、坝i 。学位论文笫二章r o b o c u p 仿真比赛将影响看到目标的定位精度。视觉消息的内容山视觉精度和视野范围决定。视觉精度分高、低两种，默认为高精度模式。如果i j ：置为低精度模式，那么服务器传来的视觉信息中只有相对 o b j n a m e 的距离d i s t a n c e 。视野范围包括视野角度范围汞i 视野的长度范围，角度范田有三种模式：宽模式一9 0 。，9 0 。、正常模式 4 5 。，4 5 。和窄模式一2 2 5 。， 2 2 5 。。假设智能体选择默认的正常模式，他能够看到头部朝向( 代表视线) 左右各4 5 。珀度范内的区域。对于近距离队员，智能体既能看到被观察对象所属的球队同时可以看到它的球员号码。然而，随着距离的增加，队员号码将首先消失，随后球员队伍名称也将看不清。为了更好地模拟真实的足球比赛，s o c c e rs e r v e r 在发送给球员的视觉信息中加入了干扰因素，因此场上每个球员看到的信息并不是精确的。 3身体信息身体信息拙述了球员当前的状态，服务器每隔s e n s e _ b o d y _ s t e p 毫秒自动将这个信息发送给场上的每个球员。身体信息的形式为： ( s e n s e _ b o d y t i m e ( v i e w m o d ev i e w q u a l i t yv i e w w i t h ) ( s t a m i n as t a m i n ae f f o r t ) ( s p e e da m o u n t o f s p e e dd i r e c t i o n o f s p e e d ) ( h e a d a n g l eh e a d d i r e c t i o i n ) ( k i c kk i c k c o u n t ) ( d a s hd a s h c o u n t ) ( t u r nt u m c o u n t ) ( s a ys a y c o u n t ) ( t u r n n e c kt u m n e c k c o u n t ) ( c a t c hc a t c h c o u n t ) ( m o v em o v e c o u n t ) ( c h a n g e v i e wc h a n g e v i e w c o u n t ) ) 其中，v i e w m o d e 、s t a m i n a 、s p e e d 和h e a d a n g l e 分别表示此项为视觉模式、体力、速度和头角的信息，后面是相应耿值。另外，k i c k 、d a s h 、t u r n 等项表示球员的动作，带c o u n t 的变量表示相应动作被球员执行的次数。 21 3 球员运动模型和动作模型 | = i = i 于仿真比赛全部在计算机上模拟，因此仿真比赛和实物机器人比赛的一个不同点就是仿真比赛是离散的。仿真平台以1 0 0 毫秒为一个仿真周期，比赛分上颇l ：学位论义第一帝r o b o c u p 仿真比赛下两个半场，共3 0 0 0 个周期( 共计l o 分钟) 。比赛过程被离散化后，队员对象羽促球的位! 一t i l l 和速度状态只在每个周期末更新一次。在仿真比赛中的每个周期内，对象的运动模型计算如下。 ( “? 。，“：? 1 ) = ( v ：，v t ，) + ( ：，d ：) ：加速 ( 2 1 ) ( p ? ，：? 1 ) = ( p ：，p t ，) + ( “? ，“，1 ) ：运动( 2 - - 2 ) ( v ? 1 ，v ：。) = d e c a y x ( “? 1 ，“：1 ) ：速度衰减( 2 - - 3 ) ( “_ ，“：? 1 ) = ( 0 , 0 ) ：重置加速度 ( 2 - - 4 ) 其中，( p ：，p t ，) 和( v t v t ) 分别表示f 周期内对象的位置和速度。( “二1 ，z f ) 表示t + l 周期内物体的速度，( v v ，) 表示c + 1 周期术的速度，它山( “t 。“，“? 1 ) 乘以变量d e c a y 得到，d e c a y 是一个参数，分别山b a l l _ d e c a y ( 运动对级为足球) 和p l a y e r _ d e c a y ( 运动对象为球员) 的取值指定。( “：，“：) 表示对象的加速度，。可以通过公式( 2 5 ) 计算得到。在公式( 2 5 ) 中p o w e r 山d a s h 命令( 针对球员) 和k i c k 命令( 针剥足球) 中的体力参数决定，有关d a s h 和k i c k 请参见 2 2 3 节：p o w e ir a t e 则服务器参数d a s h 和控制：p o w e r _ r a t e k i c kf l o w e rr a t e 另外，0 表示在t 周期内对象的前进方向，当列象为球员时，0 即为他的面部朝 i ：若是足球，则0 用公式( 2 - - 6 ) 中的“。表示，其中。和p 0 。分别表示球和踢球队员当前的方向，而d i r e c t i o n 是k i c k 命令中第二个参数，即球员踢球 n 喃度。 ( “：，“j ) = p o w e r xp o w e r _ r a t e x ( c o s ( 0 ，) s i n ( 0 ) ) 8 = o ：i c h r + d i r e c t i o n ( 2 5 ) ( 2 6 ) 为了使物体运动模型能够反映出现实世界中球及球员运动的不确定性， s o c c e rs e r v e r 在剥+ 象的运动和有关命令参数中加入了一定的二二扰因素。公式( 2 7 ) 是对速度的二f 扰模型，耳。为离散区问 - r m a x ，r m a x g ，的随机数。而r m a x 是依赖于对织速度( ，i 。，v ) 的参数，山公式( 2 - - 8 ) 计算得到，其中r a n d | = l = | 参数 p l a ) ，e r 和决定。对命令参数的干扰主要针对和中体力_rand b a l lr a n dd a s hk i c k p o w e r 及t u r n 中转身角度m o m e n t ，如公式( 2 9 ) 所示，其中a r g u m e n t 代表 p o w e r 或m o m e n t 。 ( “? 1 ，“) = ( v ：，v ：，) + ( “：，“，t ) + ( 茸m a x 焉。) ，- - 7 ) n 缸2r a n d 怫，。川 r 2 8 、 8 。g u m e n t = ( 1 + 焉a 。g “m e n t ( 2 9 ) 在运动模型中还要注意碰撞问题，碰撞指在一个仿真周期结束时两个运动对缘“ 现了重叠。发生这类情况时，两个碰撞对象的速度矢量被乘以一o 1 ，它们将向与原来相反的方向运动。在r o b o c u p 仿真比赛中，每个c l i e n t 可以根据服务器的规定执行各种动作，、皇型兰丝兰2 生一丝= 里! ! ! ! ! ! ! 堕塞些至每种动作有个服务器命令与其对应，球员只需向s o c c e rs e r v e ，发

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（计算机应用技术专业论文）robocup中多智能体系统协作的研究与实现.pdf

文档简介

温馨提示

最新文档

评论

（计算机应用技术专业论文）robocup中多智能体系统协作的研究与实现.pdf

文档简介

温馨提示

最新文档

评论

相关文档