（计算机应用技术专业论文）机器人足球仿真比赛策略研究及实现.pdf

上传人：扣*** IP属地：宁夏上传时间：2019-12-14 格式：PDF 页数：56 大小：1.74MB 积分：0 举报 版权申诉

已阅读5页，还剩51页未读，继续免费阅读

（计算机应用技术专业论文）机器人足球仿真比赛策略研究及实现.pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

硕士论文机器人足球仿真比赛簧略研究及实现摘要多机器人足球比赛，作为分布式人工智能研究领域的典型问题，近年来受到大家的关注。机器人足球涉及多个研究领域，而仿真平台的机器人足球研究则使研究者的注意力集中在多机器人足球这一动态不可预测环境中，单个机器人a g e n t 的决策与推理，以及整体球队的协作配合上。本文主要研究机器人足球仿真比赛系统的球员策略动作与球场策略问题主要工作包含以下内容： ( 1 ) 从单个球员的动作和球队的协作配合入手，本文实现了球员的主要策略动作，提高球员的技战术能力。 ( 2 ) 为机器人球员提供了有限确定的动作集合，每一个球员a g e n t 根据系统分配的角色任务，通过决策系统的推理选择合适的动作。同时，在考虑球员体力模型的基础上调整同构球员的角色分配策略，使球员的体力得到更好的恢复与使用。 ( 3 ) 运用粒子群算法的多目标优化处理防守多个进攻球员时的跑位问题，以粒子群算法随机性来适应不断变化的形势，加强对对方进攻的破坏能力。本文在多机器人足球仿真平台的环境中，安排了三次实验，分别对以上的内容进行检验，统计数据显示球员的部分技战术水平、体力安排和防守能力都有所提高。机制关键词：多机器人足球，多a g e n t 系统，策略行为，仿真平台，协作硕士论文机器人足球仿真比赛策略研究及实现 a b s t r a c t t h em u l t i - r o b o t ss o c c e rc o m p e t i t i o n , t h et y p i c a lq u e s t i o no f t h ed i s t r i b u t e da r t i f i c i a l i n t e l l i g e n c er e s e a r c ha r e a , r e c e i v e dm o r ea t t e n t i o ni nr e c e n ty e a r s t h er o b o ts o c 髓r i n v o l v e sm a n yr e s e a r c ha r e a s ，w h i l es i m u l a t i o np l a t f o r mr o b o ts o c c e r r e s e a r c hm a l u l y c o n e e n t l a t e so nt h ed y n a m i ca n du n f o r e s e e a b l ee n v i r o n m e n to ft h em u l t i - r o b o t ss o c c e r , s i n g l e r o b o t a g e n td e c i s i o n - m a k i n ga n d i n f e r e n c ea n do v e r a l lt e a mc o o p e r a t i o n c o o r d i n a t i o n t h i sa r t i c l ed e a l sw i t ht h ep l a y e rs t r a t e g ym o v e m e n ta n df i e l d s t r a t e g yo ft h e s i m u l a t i o np l a t f o r mr o b o ts o c c e rs y s t e m t h e f o l l o w i n ga r et h em a i ne o r i t e i l t s ： ( 1 ) t h i sa r t i c l ec o o r d i n a t e sf z o mt h es i n g l ep l a y sm o v e m e n ta n dt e a m sc o o p e r a t i o n , h a s c a l i z a x lp l a y e r sm a i ns t r a t e g ym o v e m e n t , s h a r p e n e dp l a y e r st e c h n i q u ea n dt a c t i c s a b i l i t y ( 2 ) t h i sa r t i c l ep r o v i d e st h er o b o tp l a y e r sw i t ht h el i m i t e dd e f i n i t em o v e m e n ts e t a c c o r d i n gt ot h ed u t yt h a ts y s t e ma s s i g n e d , e a c h9 l a y e ra g e n tc h o o s e sa p p r o p r i a t e m o v e m e n tt h r o u g hd e c i s i o ns y s t e mi n f e r e n c e b yc o n s i d e r i n gt h ep l a y e rp h y s i c a ls t r e n g t h m o d e l ，t h ea r t i c l ea d j u s t st h ep l a y e r sr o l ea s s i g n m e n ts t r a t e g yi no r d e rt oc n s r l r ep l a y e r s p h y s i c a ls t r e n g t hb e t t e rr e s t o r a t i o n ( 3 ) u t i l i z e st h ep a r t i c l es w a r mo p t i m i z a t i o nm u l t i - o b j e c t i v e so p t i m i z a t i o nt od e a l w i t ht h er u nt h ep o s i t i o nq u e s t i o nw h i l ed e f e n d i n gm a n yp l a y e ra t t a c k i n g , a d a p t st h e s i t u a t i o nb yt h eg r a mo fs u b g r o u pa l g o r i t h mr a n d o m n e s sw h i c hc h a n g e su n c e a s i n g l y , s u e r t 殍h e n sd e s t r u c t i v ec a p a b i l i t yw h i c h a t t a c k st oo p p o s i t ep a r 哆 i nt h em u l t i - r o b o t ss o c c e rs i m u l a t i o np l a t f o r me n v i r o n m e n t , t h i sa r t i c l eh a sa r r a n g e d t h r e ee ) 【p e r i m e n t s , c a r r i e so nt h ee x a m i n a t i o ns e p a r a t d yt ot e s tt h ea b o v ec o n t e n t s ，t h e s t a t i s t i c a ld a t ad e m o n s t r a t e sp l a y e r s p a r t i a lt e c h n i q u ea n dt a c t i c sl e v e l ，t h ep h y s i c a l s t r e n g t ha r r a n g e m e n ta n dt h ed e f e n s i v ea b i l i t yh a v ei m p r o v e d 。 k e y w o r d s ：m u l t i r o b o t ss o c c e r , m u l t i a g e n ts y s t e m ，s t r a t e g yb e h a v i o r s i m u l a t i o np l a t f o r m ，c o o p e r a t i n gm e c h a n i s m 声明本学位论文是我在导师的指导下取得的研究成果，尽我所知，在本学位论文中，除了加以标注和致谢的部分外，不包含其他人已经发表或公布过的研究成果，也不包含我为获得任何教育机构的学位或学历而使用过的材料。与我一同工作的同事对本学位论文做出的贡献均已在论文中作了明确的说明。学位论文使用授权声明南京理工大学有权保存本学位论文的电子和纸质文档，可以借阅或上网公布本学位论文的部分或全部内容，可以向有关部门或机构送交并授权其保存、借阅或上网公布本学位论文的部分或全部内容。对于保密论文，按保密的有关规定和程序处理。研究生签名：茜小狄沙年月2 护日硕士论文机器人足球仿真比赛策略研究及实现 1 绪论 l 。l 机器人足球系统的发展与意义随着人工智能技术的不断发展，越来越多的人把目光投向对分布式多智能体的研究。而机器人足球就是分布式多智能体研究的一个很好的切入点。和计算机博弈一样，机器人足球也是人工智能研究的一个里程碑。机器人足球就是让机器人代替真人进行足球比赛，它的规则与真实的足球比赛类似。这个设想是加拿大哥伦比亚大学的a l a nm a c k w o r t h 教授在1 9 9 2 年的一次人工智能的国际会议上提出的，其目的就是为了促进人工智能学科的进一步发展。这是一个标志性的课题，它的提出得到了众多科学家的大力支持。在第1 5 届国际人工智能联合大会上，由k i t a n o 、v e l o s o 和t a m b e 等九位世界知名学者联合发表重要论文( t h e r o b o c u ps y n t h e t i ca g e n tc h a l l e n g e ，系统阐述了研究机器人足球系统的意义、目标、阶段设想、近期主要内容和评价原则。机器人足球研究的最终目标，就是在2 1 世纪中叶，机器人球队能够在世界杯上击败人类最好的球队。文章指出，在过去五十年中，人工智能主要研究的问题是“单智能体静态可预测环境中的问题求解”，其标准问题是国际象棋人一机对抗赛，而在未来五十年，人工智能的主要问题是“多智能体动态不可预测环境中的问题求解”，其典型问题就是机器人足球比赛系统【”。目前的人工智能的研究有理论与实践脱节的倾向，而机器人足球系统的研究涉及到硬件、软件等诸多方面，为人工智能系统的研究提供了很好的载体。足球机器人系统由四个部分组成o 】，即视觉子系统、决策子系统，无线通信子系统、机器人小车子系统。视觉子系统负责实时采集比赛场地的图像，得到所有机器人和足球的位置以及其他的一些信息，然后传给决策子系统。决策子系统是足球机器人的神经中枢，决定着机器人的行为。决策子系统通过通信子系统来控制机器人小车来执行具体动作。所以，机器人足球的研究涉及到包括人工智能、图象处理、控制系统、机器视觉、机械、无线通信和模式识别等诸多领域。同时，机器人足球技术的进步也牵涉到多个相关产业。我们可以用表1 - 1 1 简单表示：表1 1 1 机器人足球关键技术与相关产业关键技术相关产业计算机视觉系统生产过程在线检测系统无线电通信技术抗干扰中短程通信系统多智能体协调策略技术多智能体协作系统人工生命与模期控制技术人工智能应用系统机电一体化技术各家电产品机电一体化系统多传惑嚣融会技术各机器人智能控制系统硕士论文机器人足球仿真比赛簧略研究及实现软硬件集成技术各工业控制专业计算机 lv r 人机接口技术各种、，l c 人机交互系统机器人足球比赛系统的研究有着重大意义：m a s 技术已成为人工智能研究的重点方向，研究m a s 关键技术可以对分布式人工智能理论的研究有所突破，具有深远的理论价值；机器人足球比赛系统是m a s 多项关键技术的集成，在一定程度上反映了各国多项高新技术实力；机器人足球的研究涉及多个学科领域与产业，可以带动机械、电机、控制系统，无线电等学科的发展；机器人足球比赛具有科普性和娱乐性，是一项相当好的科学普及工具；体育科研单位可用于研究足球比赛策略，学校可用于示范教学、编程实习，游乐场所可用于吸引游客等。 1 2 机器人足球仿真比赛的研究现状目前，很多国家都有了自己的机器人足球队。在世界上最有影响的机器人足球赛事主要有两个，一个是由国际人工智能协会组织的机器人世界杯r o b o c u p ( t h er o b o t w o r l dc u ps o c c e rg a m e sa n dc o n f e r e n c e s ) 比赛，另一个是由国际机器人足球联合会( f i r a ) 组织的微机器人世界杯m i r o s o t ( m i c r o - r o b o tw o r l dc u ps o c c e r t o u r n a m e n t ) 比赛。在国际人工智能协会组织的机器人世界杯r o b o c u p 中的比赛分为三个项目：小型机器人比赛( 直径小于1 5 c m ) 、中型机器人比赛和电脑模拟仿真比赛。由于本文主要讨论的是基于仿真平台的r o b o c u p 机器人足球比赛，所以下面着重介绍一下仿真比赛的环境与比赛原理。 r o b o c u p 仿真比赛是在一个统一标准的计算机环境内进行的。比赛的标准服务器系统f l q r o b o c u p 委员会提供，各个参赛队编写各自的客户端程序( c i i e n z ) ，模拟实际足球队员参加比赛。比赛以客户服务器方式进行，服务器与2 个参赛的客户端用以太网连接，服务器和客户之间的通信是通过u d p i p 协议进行的。服务器( s o c c e r s e r v e r ) 提供了一个虚拟场地，并对比赛双方的全部队员和足球的移动进行仿真。客户程序相当于球员的大脑，指挥球员的运动。参赛者可以使用任何支持u d p i p 的操作系统。仿真比赛的系统如图1 2 1 所示：1 7 1 图i 2 1r o b o c u p 仿真比赛系统架构图 2 硕士论文机器人足球仿真比赛簧略研究及实现其中服务器是整个仿真系统的核心，它对系统的性能要求较低，可以运行在诸多操作系统上。服务器是控制处理的核心，在后台运行并完成各种信息的处理，它通过 u d p i p 协议与客户程序连接。s e r v e r 包含s o c c e r s e r v e r 和s o c c e r m o n i t o r 两个程序。其5 b s o c c e r m o n i t o r 的作用是显示赛场，而s o c c e r s e r v e r 的工作主要如下：信息传递模块的功能是把一些球场的信息通过网络套节字传递给客户端，比如球员的视觉、听觉、身体状态和场上的比分等。信息分析模块用于分析来自于信息处理模块的通信数据信息，并通过信息传递模块返回信息结果给客户程序。信息处理模块的工作主要是接收来自于客户程序的信息，包括队员控制指令信息和其它的一些通信信息如果是队员的控制指令信息，经过处理后由比赛场地仿真模块的处理，其他的通信信息进一步由信息分析模块来处理。客户端通过u d p i p 协议与仿真平台连接，将事先编写好的球员、球场策略等输给服务器。在比赛过程中，服务器将球场上的信息实时发给客户端，如球员和球的位置、球员的体力、球员可以。看”到和“听”到的信息等等。客户端通过网络信息接受模块接受到信息，然后分析场上的情势，选择各自球队的策略，比如是进攻还是防守等等，将选择的策略通过网络通信发送给服务器，控制虚拟球员的运动。在机器人足球的视觉子系统、小车子系统、通讯子系统和决策子系统中，决策子系统最为关键。仿真平台的机器人足球系统，抛开了机器人小车制作、场地因素、图像处理、无线通信等问题，使研究人员专注于机器人足球的决策子系统，加速了球队的球场策略研究的进步。通过研究人员的努力，机器人足球发展迅速，比赛规模逐年扩大，r o b o c u p 现有成员国近4 0 个，参赛队已经从最初的4 2 支代表队发展到今天的2 5 4 支球队。f i r a 己经从最初参赛的l o 个国家的2 3 支代表队发展到2 5 个国家组织的2 0 7 支球队。同时各个参赛队竞争激烈，比赛水平提高很快。每届比赛各个球队的战术水平都有明显提高，新的软、硬件设计和巧妙的战术配合策略不断出现。此外，机器人足球研究还得到国际研讨、著名期刊和会议的倍加重视，足球机器人专辑在( t h ej o u r n a lo nr o b o t i c sa n d a u t o n o m o u ss y s t e m ) 、t h ei n t e r n a t i o n a lj o u r n a lo fi n t e l l i g e n ta u t o m a t i o na n d s o f tc o m p u t i n g ) 、a r t i f i c i a li n t e l l i g e n c e ) 等学术刊物上的出版表明，机器人足球正以一种高科技对抗性的形式赢得学术界的关注。一些有影响的国际学术会议如 w a c 9 8 a r o b i i i 9 8 ，a r o b 9 9 也都安排了这方面的专题讨论。一年一度的世界杯赛也都同时召开学术会议，推动了相关学科的发展。我国机器入足球的研究相对于国外起步较晚，但己吸引了众多研究者的兴趣，东北大学、广东工业大学等已先后开发出各种形式的机器人足球系统。我国的机器人足球队的水平与世界上的先进国家相比目前存在着较大的差距。特别是协同作战能力方面与美国、德国等世界冠军队相比还有较大差距。国际机器人足球联盟主席金钟焕硕士论文机器人足球仿真比赛策略研宄及实现 ( k i mj o n gh w a n ) 近期正式宣布，2 0 0 8 年世界杯机器人足球大赛将在山东青岛举行，此前北京曾在2 0 0 1 年成功举办过第六届世界杯机器人足球大赛。可见中国机器人足球的技术进步迅速，已经在机器人足球比赛中显示出相当的实力。 1 3 本文的主要内容与安排本文着重讨论r o b o c u p 机器人足球仿真比赛的球场策略。对于球员的传球一系列的策略行为的设计，本文分别进行了讨论、改进，实现。从球员体力模型的角度考虑球员的角色分配问题，使得球员的体力得以较好的安排和恢复，体力状态较好的球员去完成体力要求较高的任务同时在防守对方多个前锋进攻时，运用多目标追踪的粒子群优化算法指导防守球员的卡位。在以上几点的基础上实现多机器人足球比赛的客户端程序的改进，通过测试数据，比较出策略的优劣。本文共分七章，大致内容安排如下：第一章介绍本文的选题背景和机器人足球的国内外研究现状，并对本文的结构进行安排。第二章介绍了a g e n t 的基本理论，包括基于推理的慎思型a g e n t 、基于反应的反应型a g e n t 还有混合型a g e n t ，以及a g e n t 在机器人足球系统中的应用。讨论了姒s 的基本理论，以及如何实现多球员a g e n t 之间的协作，如何消除自利的个体( 球员) 之间的冲突而达到系统( 球队) 宏观上的目标一致性和利益最大化。第三章讨论仿真平台的机器人足球比赛的球员基本动作的实现，包括他的基本感知模型和动作模型。第四章研究球员的策略行为的实现，包括球员的传球、截球、守门等一系列的策略动作。对现有常用的行为判断、实现方法进行改进。第五章分析球员的角色分配策略。分别讨论球场各个位置、角色的球员的策略动作的选择过程。在加入了对机器人球员的体力模型的考虑后，对同构模型的球员进行角色调整，使体力消耗较厉害的球员得到休整，而体力较好的球员去担当第六章采用粒子群算法的多目标追踪来实现防守对方多个球员进攻时球员的跑位，利用粒子群算法的随机性来适应不断变化的球场形势。第七章介绍了多机器人足球的软件仿真平台的实验环境并安排若干组仿真实验，并且在以上几点的基础上对球队进行比较，通过观察比赛过程和数据统计，分析对球队的改进效果，得出结论。 4 硕士论文机器人足球仿真比赛簧略研究及实现 2a g e n t 、m a s 与机器人足球 2 1a g e n t 基本理论 a g e n t 通常被人们当作智能体来理解，但是人们对a g e n t 还没有比较统一、准确的定义。人们对a g e n t 的下了各种各样的定义，以下几种比较有代表性：【) r u s s e l l 认为：“a g e n t 是任何能通过传感器感知环境并通过效应器( 执行器) 对环境进行动作的东西。” p m a e s 认为：“a g e n t 是在复杂动态环境中能自治地感知环境并能自治地通过动作作用于环境，从而实现其被赋予的任务或目标的计算系统。” f i s h e r m 定义a g e n t 为“一个带有传统的a i 能力的封装实体” s h o h a m 从模拟人类行为的角度出发，用精神状态来描述a g e n t ，认为a g e n t 是具有信念( b e l i e f s ) 、能力( c a p a b i i i t i e s ) 、决定( d e c i s i o n ) 、承诺( c o m m i t m e n t ) 等属性的实体，后来很多专家学者又对精神状态作了扩充，增加了很多属性，如：愿望 ( d e s i r e ) 、意图( i n t e n t i o n ) 、目标( g o a l ) 、选择( c h o i c e ) 、决策( d e c i s i o n ) 和职责 ( o b l i g a t i o n ) 等等。虽然还没有一种统一的标准定义，但比较一致的看法是：a g e n t 代表了一种具有独立的问题求解能力和与环境中其它a g e n t 合作求解问题能力的自治实体。我们认为一个a g e n t 是具有一系列的目标、确定的能力和知识( 代表了对整个环境的看法) ，能够推理环境( 包括推理其它a g e n t 的行为) ，生成相应的规划并执行规划，以实现目标的功能实体。a g e n t 具有以下的一些特性： ( 1 ) 自治性：a g e n t 应该能够解决给定的子问题，自主地选择通信、合作策略，以特定的方式响应周围的环境，独立地对自身的行为进行规划，而不需要人或其它 a g e n t 的指令，其行为通常称为自治行为； ( 2 ) 交互性：也称为社会性。a g e n t 与a g e n t 之间能够基于高级的通信语言进行交互，通过交换知识、信念和规划等达成合作关系或基于协商协议通过协商解决冲突。其行为通常称为社会行为； ( 3 ) 学习能力与适应性：a g e n t 并不是一成不变的，a g e n t 能够在运行中动态地推理环境和搜集环境知识，发现资源，从而改变自己的知识结构，适应环境的动态变化； ( 4 ) 鲁捧性：健壮性，能够对突发事件作出适当的反应； ( 5 ) 预动性：a g e n t 通过主动发起可以表现出目标引导的行为，为满足它们的设计目标可以主动的发起一个动作。 a g e n t 不同于传统的软件系统，传统的软件系统一般是被调用触发才会采取行动，有受控的关系。而a g e n t 软件则能够依据自己的目标、意图主动行动。a g e n t 也不同硕士论文机器人足球仿真比赛策略研究及实现于专家系统，相对专家系统的独立的问题求解能力，如计算、规划等，a g e n t 还具有合作求解问题的能力，如消息传递、交互、协商和对话能力等。由此可以看出，a g e n t 区别于传统智能系统的显著特性在于它具备与其所处环境以及与其它a g e n t 进行协调、交互和协作的能力，主动依据自己的目标采取行动。在机器人足球中，足球机器人代替人类进行足球比赛，它们独立的对自己的环境进行判断，根据各自的目标调整自己的行为，不需要别人或者别的球员的指令，属于自治行为。在比赛过程中，球员之间或者球员和教练之间可以通过。s a y ”和“h e a r ” 来传递信息，协商解决冲突等问题，体现了交互性。球员要在比赛中动态的搜集环境条件，推理、发现资源，从而改变自己的知识结构，适应环境的动态变化，具有一定的学习能力和适应性。比赛过程瞬息万变，会出现各种无法预料的异常情况，面对这样的情形，机器人球员就必须具备一定的抗干扰能力，表现出健壮性、鲁棒性。在比赛中，球员在自身角色给定的行为目标的指引下，根据球场的情势，提前主动的采取行动，具有预动性。综合以上几点，机器人球员身上体现出a g e n t 的自治性、交互性、学习能力、适应性、鲁棒性和预动性等，是具有一系列的目标、确定的能力和知识( 代表了对整个环境的看法) ，能够推理环境( 包括推理其它a g e n t 的行为) ，生成相应的规划并执行规划，以实现目标的功能实体，可以看作是一种a g e n t 。 a g e n t 根据其体系结构嘲，可分为慎思式、反应式和混合式。 ( 1 ) 慎思式：这种体系结构是一种纵向体系结构，推理和控制的表达是一个从低层的环境建模到高层的过程，其动作不是传感器数据直接作用下产生的结果，而是经历了一系列从感知、建模到规划等处理阶段之后产生的结果。这是一种基于传统人工智能的认知模型，适合于已知环境下任务明确、目标给定的系统。智能体内部维护一个对外界环境的描述，并具有更新机制，智能体根据其内部的环境模型及感知的外部信息进行推理，产生动作。它的结构如下图2 1 1 所示：图2 1 1 慎思式a g e n t 结构图 6 硕士论文机器人足球仿真比赛策略研究及实现 ( 2 ) 反应式：反应式( r e a c t i v e ) 是一种不同于慎思式智能体的新的结构，起源于 8 0 年代，也称作“基于行为”( b e h a v i o r - b a s e d ) 智能体。它的体系结构表现为从“感知”到“反应”的横向体系结构。此结构建立了从传感器数据直接到一系列行为的映射，直接基于传感器的输入进行决策，在其内部可以不保留外界环境模型，在完全陌生的环境中工作。一个典型的反应式结构首先定义多个行为模块，从传感器得到的数据同时传给这些模块，如果它们的条件满足，则通过算法从它们的输出中得到被执行的动作。智能体通过。条件一动作”规则将感知与动作连接起来。这种结构反应快速、灵活机动，系统能力从低层次的局部规划到冲突消解等逐步得到提高。反应式的结构如下图2 1 2 所示；图2 1 2 反应式a g e n t 结构图 ( 3 ) 混合式：智能体在不论现实还是虚拟的环境中，都会遇到各种不同的情况。它不但要保持对紧急情况的及时反应，还要使用一定的策略对中短期的行为做出规划，进而通过对世界和其它智能体的建模分析来预测未来的状态，以及通过通信语言实现和其他智能体协作或协商。我们希望这些功能同时存在，并行地执行，以提供良好的实时性和规划性，因此拥有反应式和慎思式优势的混合式结构发展起来。混合式模型的智能体中包含感知( p e r c e p t i o n ) 、动作( a c t i o n ) 、反应( r e a c t i o n ) 、建模 ( m o d e l i n g ) 、规划( p l a n n i n g ) ，通信( c o m u u n i c a t i o n ) 、决策( d e c i s i o nm a k i n g ) 等模块。智能体通过感知模块来反映现实世界，并对环境信息做出一定的抽象。根据信息的类型，感知模块将经过抽象的信息送到不同的处理模块。如果感知到的是简单的或紧急的情况，信息则被送到反应模块。反应模块对传入的信息立即做出决定，并将动作命令送到动作模块。动作模块则根据传入的动作命令做出相应的动作，对外界做出反应。从感知到反应到动作的信息传递过程构成了“反射弧”。结构如下图2 1 3 所示： 7 硕士论文机器人足球仿真比赛策略研究及实现外部世界图2 1 3 混合式a g e n t 结构图分层结构是混合式结构的一种实现方法。分层结构对于组织功能和控制，是有效的，而且对于支持( 如反应、慎思、协作和适应性等) 期望特性的系统设计，分层结构是一重要工具。分层结构的主要思想是将一个智能体的功能分到多个层次的组织层中，这些层在总体上完成智能体一致的行为，彼此间可以交互作用。它既可在最低层进行反应式的响应，以解决某些突发事件，同时在高层进行慎思式决策与规划。如下图2 1 4 就是3 种不同形式的分层结构：垂直结构水平结构联合结构图2 1 4分层结构在r o b o c u p 的仿真比赛中，系统服务器端为球员提供了一系列的基本动作：踢球 ( k i c k ) 、转向( t u r n ) 、移动( m o v e ) 、奔跑( d a s h ) 等，这些基本动作是能够被仿真平台直接执行的。参赛球队的客户程序还需在此基础上进一步开发出球员的基本战术动 8 硕士论文机器人足球仿真比赛簧略研究及实现作，如带球( d r i b b l i n g ) 、断球( i n t e r c e p t i o n ) 、防守( d e f e n s e ) 和守门( g o a l t e n d i n g ) 等高层次复杂动作，由此才能有最终的球场策略的实现。对应在分层结构中，球场的实时的变化需要球员做出相应的处理，这主要要求的是反应迅速、机动灵活，这就是较低层次的响应。同时整个球场情势的变化，相对的没有那么紧急，它表现为整个球队战术部署的调整或者角色分配的转换等，这些决策的生成就是通过慎思行为。 2 2 姒s 基本概念与组织结构 2 2 1m a s 基本概念简单来说，多a g e n t s 系统( m a s ) i s l 可以被这样定义：m r s 是由多个问题解决者 ( a g e n t ) 组成的网络系统，其中的a g e n t 相互作用、相互合作从而解决单个a g e n t 由于能力、知识或资源上的不足而无法解决，或即使能解决而效率很低的问题。m r s 协作，能力超过单个a g e n t ，是m r s 产生的最直接的原因。 m r s 是a g e n t 技术中一个重要的研究领域。它和分布问题求解( d p s - d i s t r i b u t e d p r o b l e ms o l v i n g ) 的研究都属于分布式人工智能( d a i ) 的内容，是两个不同的研究阵营。d p s 研究的主要内容是，多个问题求解器如何彼此合作，达到一个共同的目标，解决一个问题，交互策略是系统的一部分，预先集中在系统中，各问题求解器共享关于问题的知识和求解方案而m r s 研究多个软件实体自主的合作解决多个问题，这些软件实体关于问题的知识及求解方法都不完全，从而希望通过合作来产生比完全由单个实体来解决问题更好的结果。m r s 一般被定义为松耦合的问题求解器，也可以定义为由多个具有自主或半自主行为的软构件构成的系统。姒s 有如下特点： ( 1 ) 每个a g e n t 对环境和问题具有不完全的知识及问题解决能力； ( 2 ) 系统没有全局控制； ( 3 ) 数据是分布的； ( 4 ) 各a g e n t 之间的计算是自主的、异步的 2 2 2m a s 组织结构对协同机制的分类源于m r s 的组织结构分类，根据是否存在管理和服务机构，m r s 的组织结构可分为分布式、集中式和混合式三种蛳具体结构见图2 2 2 卜2 2 2 3 ，其中集中式与分布式的区别就在于有没有一个中心管理者负责成员a g e n t 的集中控制。 9 硕士论文机器人足球仿真比赛策略研究及实现图2 2 2 1 ：集中式姒s 圆团圆图2 2 2 2 ：分布式姒s 团圆图2 2 2 3 ：混合式m a s 集中式姒s ：将有相同耳标、关系靠近的a g e n t 集合成一组，在保证成员a g e n t 具有一定自治性的前提下，用一个管理服务机构来负责这一组内的协调。多个a g e n t 组再组成更高一级的a g e n t 组，并由一个高层管理_ a g e n t 来协同低层管理服务机构，这样的层次可以有若干个。管理服务机构与成员a g e n t 间具有一定的管理与被管理关系。分布式m a s 不存在管理者，而由中介服务机构来为a g e n t 成员间的协同提供辅助和服务作用，中介与成员a g e n t 间不存在管理与被管理关系。混合式m a s 兼具分布式和集中式的特性，既有管理机构，也有中介服务机构。 m a s 的组织结构对协同机制的决定作用就体现在这两种机构的功能上，它们在协同中的作用是不同的。管理服务机构负责对所有或部分a g e n t 成员的行为、协作、任务分配以及共享资源等进行统一的调配和管理，建立学习系统和a g e n t 成员的模型，实现成员行为和系统安全性监测及控制掣1 8 1 。它与成员a g e n t 之间存在着一定的管理与被管理关系，但这种管理活动并不采用简单的命令方式，而是以协商的方式进行，保证了成员a g e n t 自治性的实现。 1 0 硕士论文机器人足球仿真比赛簧略研究卫实现中介服务机构用以发布、保存和维护各a g e n t 成员的能力、位置和状态等信息，并进行合作对象和服务请求的匹配工作，它与系统内a g e n t 成员的关系是服务与被服务关系。中介服务机构与管理服务机构最大的不同在于：中介服务机构仅仅为a g e n t 成员提供中介服务，并不像管理服务机构那样拥有多个a g e n t 成员和系统当前环境的丰富知识，也不对系统的共享资源进行管理，更缺乏总体的协同组织能力。这样的区别往往是由系统规模决定的：中介服务机构一般存在于大型的开放的姒s 中，不可能像管理强务机构那洋拥有系统内所有的全局知识。在机器人足球中采用的教练员机制，用黑饭模型来进行协作，球员将信息发送到黑板上，然后由教练员从黑板上读取信息，再来处理协作。教练员充当的就是管理服务机构的角色。硕士论文机器人足球仿真比赛策略研究及实现 3 足球机器人的基本动作模型 3 1 球员的感知模型。在r o b o c u p 机器人足球仿真比赛中，智能体有三种感知，听觉、视觉、以及自身状态的感觉【7 2 3 】。听觉能够接受来自各方的消息，来源包括裁判，教练和一定距离内的球员；视觉能感知来自球场的可视信息，例如球员在当前可视范围内的对象的距离和方向，视觉信息类似一个传感器，可以“看到”在球员身后的近距离内的对象；自身状态的感知能检测球员自身当前的物理状态，例如它自己的体力剩余值、速度、脖子的角度、身体正向的角度、当前视觉的质量、特定动作累计执行的次数等等。球员所有的感知信息都是在每个仿真周期间隔内，由服务器自动发送给球员的。 3 1 1 视觉模型视觉感知信息在每个s e n s e _ s t e p ( 当前缺省为1 5 0 m s ) 内，自动的发送到球员处。 s e r v e r 发送的视觉信息是遵循这样的格式：( s e eo b j n a m ed i s t a n c ed i r e c z i o n d i s t c h n gd i r c h n gb o d y d i rn e a d d i r ) 。球员获得的视觉信息与距离有着很大的关系。对于近距离的球员，它既可以看到它所属的球队同时也可以看到它的球衣号码，然而随着距离的增加，首先消失的是球员的号码，然后距离的增加会导致球员的队别也看不清楚了，s e r v e r 中是这样来定义的：瞄1 i fd i s t u n u mf a rl e n g t h ，那么球员号码和球队名称都可见； i fu n u m f a r l e n g t h d i s t u n u mt o o f a rl e n g t h ，那么队名是可见的，但队员号码有一定的概率看不到。这个概率根据d i s t 线性的从l 减少到o ； ( di fu n u mt o of a rl e n g t h d i s t ，那么球员号码是不可见的； i ft e a m _ f a r _ l e n g t h d i s t o ) ，体力值降低p o w e r 。如果是向后加速，体力值降低p o w e r 的2 倍。如果 d a s h 需要的p o w e r 超过了球员的体力值，那么p o w e r 就会降低。异构队员在没有足够的体力值时可以使用额外体力。额外体力值依赖于球员类型和参数 e x t r a _ _ s t a m i n a _ d e l t am i n 和e x t r as t a m i n a _ d e l t a _ m a x 。降低体力值后，s e r v e r 计算d a s h 命令中p o w e r 的有效鄯分。命令d a s h 的有效部分e d p ( e f f e c t i v ed a s hp o w e r ) 硕士论丈机器人足球仿真比赛簧略研究及实现是由d a s h - p o w e r _ r a t e 和球员当前的e f f o r t 决定的。球员的e f f o r t 是介于e f f o r t m i n 和e f f o r tm a x 之间的值，受球员的体力管理决定： e d p = e f f o r t d a s hd o w e rr a t e p o w e r( 3 2 1 ) e d p 和球员的当前身体方向被转化成向量，然后再加到球员当前的加速度瓦中 ( 通常情况下是0 ，因为球员在一个周期内不能d a s h 一次以上，而且球员也不可能不通过d a s h 而通过其它动作来获得加速度) 踢球( k i c k ) 命令k i c k 有两个参数，踢球力量( 取值范围在m i n p o w e r 和m a x p o w e r 之间) 和球员踢球的角度( 角度以度数表示，取值范围在m i n m o m e n t 和m a x m o m e n t 之间) 一旦命令k i c k 到达s e r v e r 端，只要球员没有被置为越位，而且足球在可踢范围内，那么k i c k 就会被执行。如果足球和球员之问的距离在0 到k i c k a b l e _ m a r g i n 之间，那么足球对这个球员来说就是可踢的。首先要计算的是踢球的有效力量e p ( e f f e c t i v ek i c kp o w e r ) ： e p = k i c kp o w e rk i c k 木p o w e rr a t e( 3 2 2 ) 如果足球不在球员的正前方，那么根据足球相对球员的位置，踢球有效力量将会减去某个数值，所以角度和距离都是很重要的。如果足球相对球员身体角度是0 。，就是说如果足球在球员面前，有效力量将不会改变。角度越大，有效力量将会减少的越多。最差的情况是足球在球员身后1 8 0 。，有效力量将会减少2 5 。影响有效力量的第二个重要因素是足球到球员问的距离：要执行k i c k 命令，足球到球员的距离介于 0 到k i c k a b l e _ m a r g i n 之间。如果距离是0 ，那么有效力量将不会再被削弱。两者问的距离越大，有效力量减少的越多。如果距离等于k i c k a b l e m a r g i n ，那么有效力量将会减少原来踢球力量的2 5 。最坏的情况是足球在球员的后方最远处，将会使用5 0 的踢球力量。具体如式( 3 2 3 ) ；【刀 e p = e p ( 1 - 0 2 5 ) 笋们等甓 ( 3 z s ) 其中d i r _ d i f f 是足球和球员身体的相对角度，d i s td i f f 是足球和球员的相对距离) 。踢球的有效力量e p 被用来计算加速度瓦，这个加速度在周期n 中加到足球的全局加速度上。足球加速变与速度的计算与球员执行d a s h 命令获得加速宝比较类似，s e r v e r 参数k i c k _ r a n d 被用来在足球加速变中产生噪音。默认球员的k i c k r a n d 等于0 ，不产生噪音。转身( t u r n ) 命令t u r n 用来改变球员的身体赣向。命令t u r n 的参数是m o m e n t ，其有效值介于m i n m o m e n t 和m a x m o m e n t 之间。如果球员是静止的，那么它实际转过的角度就等于硕士论文机器人足球仿真比赛策略研究及实现 m o m e n t 的值。然而，如果球员在运动中，由于惯性的作用使其转身较为困难。球员真正转过的角度用下列公式计算【7 】： a c t u a l _ a n g l e = m o m e n t ( 1 o + i n e r t i a _ m o m e n t p l a y e r _ s p e e d ) ( 3 2 4 ) 其中，i n e r t i am o m

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（计算机应用技术专业论文）机器人足球仿真比赛策略研究及实现.pdf

文档简介

温馨提示

最新文档

评论

（计算机应用技术专业论文）机器人足球仿真比赛策略研究及实现.pdf

文档简介

温馨提示

最新文档

评论

相关文档