




已阅读5页,还剩51页未读, 继续免费阅读
(计算机应用技术专业论文)机器人足球仿真比赛策略研究及实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
硕士论文机器人足球仿真比赛簧略研究及实现 摘要 多机器人足球比赛,作为分布式人工智能研究领域的典型问题,近年来受到大家 的关注。机器人足球涉及多个研究领域,而仿真平台的机器人足球研究则使研究者的 注意力集中在多机器人足球这一动态不可预测环境中,单个机器人a g e n t 的决策与推 理,以及整体球队的协作配合上。 本文主要研究机器人足球仿真比赛系统的球员策略动作与球场策略问题主要工 作包含以下内容: ( 1 ) 从单个球员的动作和球队的协作配合入手,本文实现了球员的主要策略动作, 提高球员的技战术能力。 ( 2 ) 为机器人球员提供了有限确定的动作集合,每一个球员a g e n t 根据系统分配 的角色任务,通过决策系统的推理选择合适的动作。同时,在考虑球员体力模型的基 础上调整同构球员的角色分配策略,使球员的体力得到更好的恢复与使用。 ( 3 ) 运用粒子群算法的多目标优化处理防守多个进攻球员时的跑位问题,以粒子 群算法随机性来适应不断变化的形势,加强对对方进攻的破坏能力。 本文在多机器人足球仿真平台的环境中,安排了三次实验,分别对以上的内容进 行检验,统计数据显示球员的部分技战术水平、体力安排和防守能力都有所提高。 机制 关键词:多机器人足球,多a g e n t 系统,策略行为,仿真平台,协作 硕士论文机器人足球仿真比赛策略研究及实现 a b s t r a c t t h em u l t i - r o b o t ss o c c e rc o m p e t i t i o n , t h et y p i c a lq u e s t i o no f t h ed i s t r i b u t e da r t i f i c i a l i n t e l l i g e n c er e s e a r c ha r e a , r e c e i v e dm o r ea t t e n t i o ni nr e c e n ty e a r s t h er o b o ts o c 髓r i n v o l v e sm a n yr e s e a r c ha r e a s ,w h i l es i m u l a t i o np l a t f o r mr o b o ts o c c e r r e s e a r c hm a l u l y c o n e e n t l a t e so nt h ed y n a m i ca n du n f o r e s e e a b l ee n v i r o n m e n to ft h em u l t i - r o b o t ss o c c e r , s i n g l e r o b o t a g e n td e c i s i o n - m a k i n ga n d i n f e r e n c ea n do v e r a l lt e a mc o o p e r a t i o n c o o r d i n a t i o n t h i sa r t i c l ed e a l sw i t ht h ep l a y e rs t r a t e g ym o v e m e n ta n df i e l d s t r a t e g yo ft h e s i m u l a t i o np l a t f o r mr o b o ts o c c e rs y s t e m t h e f o l l o w i n ga r et h em a i ne o r i t e i l t s : ( 1 ) t h i sa r t i c l ec o o r d i n a t e sf z o mt h es i n g l ep l a y sm o v e m e n ta n dt e a m sc o o p e r a t i o n , h a s c a l i z a x lp l a y e r sm a i ns t r a t e g ym o v e m e n t , s h a r p e n e dp l a y e r st e c h n i q u ea n dt a c t i c s a b i l i t y ( 2 ) t h i sa r t i c l ep r o v i d e st h er o b o tp l a y e r sw i t ht h el i m i t e dd e f i n i t em o v e m e n ts e t a c c o r d i n gt ot h ed u t yt h a ts y s t e ma s s i g n e d , e a c h9 l a y e ra g e n tc h o o s e sa p p r o p r i a t e m o v e m e n tt h r o u g hd e c i s i o ns y s t e mi n f e r e n c e b yc o n s i d e r i n gt h ep l a y e rp h y s i c a ls t r e n g t h m o d e l ,t h ea r t i c l ea d j u s t st h ep l a y e r sr o l ea s s i g n m e n ts t r a t e g yi no r d e rt oc n s r l r ep l a y e r s p h y s i c a ls t r e n g t hb e t t e rr e s t o r a t i o n ( 3 ) u t i l i z e st h ep a r t i c l es w a r mo p t i m i z a t i o nm u l t i - o b j e c t i v e so p t i m i z a t i o nt od e a l w i t ht h er u nt h ep o s i t i o nq u e s t i o nw h i l ed e f e n d i n gm a n yp l a y e ra t t a c k i n g , a d a p t st h e s i t u a t i o nb yt h eg r a mo fs u b g r o u pa l g o r i t h mr a n d o m n e s sw h i c hc h a n g e su n c e a s i n g l y , s u e r t 殍h e n sd e s t r u c t i v ec a p a b i l i t yw h i c h a t t a c k st oo p p o s i t ep a r 哆 i nt h em u l t i - r o b o t ss o c c e rs i m u l a t i o np l a t f o r me n v i r o n m e n t , t h i sa r t i c l eh a sa r r a n g e d t h r e ee ) 【p e r i m e n t s , c a r r i e so nt h ee x a m i n a t i o ns e p a r a t d yt ot e s tt h ea b o v ec o n t e n t s ,t h e s t a t i s t i c a ld a t ad e m o n s t r a t e sp l a y e r s p a r t i a lt e c h n i q u ea n dt a c t i c sl e v e l ,t h ep h y s i c a l s t r e n g t ha r r a n g e m e n ta n dt h ed e f e n s i v ea b i l i t yh a v ei m p r o v e d 。 k e y w o r d s :m u l t i r o b o t ss o c c e r , m u l t i a g e n ts y s t e m ,s t r a t e g yb e h a v i o r s i m u l a t i o np l a t f o r m ,c o o p e r a t i n gm e c h a n i s m 声明 本学位论文是我在导师的指导下取得的研究成果,尽我所知,在本 学位论文中,除了加以标注和致谢的部分外,不包含其他人已经发表或 公布过的研究成果,也不包含我为获得任何教育机构的学位或学历而使 用过的材料。与我一同工作的同事对本学位论文做出的贡献均已在论文 中作了明确的说明。 学位论文使用授权声明 南京理工大学有权保存本学位论文的电子和纸质文档,可以借阅或 上网公布本学位论文的部分或全部内容,可以向有关部门或机构送交并 授权其保存、借阅或上网公布本学位论文的部分或全部内容。对于保密 论文,按保密的有关规定和程序处理。 研究生签名: 茜小狄 沙年月2 护日 硕士论文机器人足球仿真比赛策略研究及实现 1 绪论 l 。l 机器人足球系统的发展与意义 随着人工智能技术的不断发展,越来越多的人把目光投向对分布式多智能体的研 究。而机器人足球就是分布式多智能体研究的一个很好的切入点。和计算机博弈一样, 机器人足球也是人工智能研究的一个里程碑。 机器人足球就是让机器人代替真人进行足球比赛,它的规则与真实的足球比赛类 似。这个设想是加拿大哥伦比亚大学的a l a nm a c k w o r t h 教授在1 9 9 2 年的一次人工智 能的国际会议上提出的,其目的就是为了促进人工智能学科的进一步发展。这是一个 标志性的课题,它的提出得到了众多科学家的大力支持。在第1 5 届国际人工智能联 合大会上,由k i t a n o 、v e l o s o 和t a m b e 等九位世界知名学者联合发表重要论文( t h e r o b o c u ps y n t h e t i ca g e n tc h a l l e n g e ,系统阐述了研究机器人足球系统的意义、目 标、阶段设想、近期主要内容和评价原则。机器人足球研究的最终目标,就是在2 1 世纪中叶,机器人球队能够在世界杯上击败人类最好的球队。文章指出,在过去五十 年中,人工智能主要研究的问题是“单智能体静态可预测环境中的问题求解”,其标 准问题是国际象棋人一机对抗赛,而在未来五十年,人工智能的主要问题是“多智能 体动态不可预测环境中的问题求解”,其典型问题就是机器人足球比赛系统【”。 目前的人工智能的研究有理论与实践脱节的倾向,而机器人足球系统的研究涉及 到硬件、软件等诸多方面,为人工智能系统的研究提供了很好的载体。足球机器人系 统由四个部分组成o 】,即视觉子系统、决策子系统,无线通信子系统、机器人小车子 系统。视觉子系统负责实时采集比赛场地的图像,得到所有机器人和足球的位置以及 其他的一些信息,然后传给决策子系统。决策子系统是足球机器人的神经中枢,决定 着机器人的行为。决策子系统通过通信子系统来控制机器人小车来执行具体动作。所 以,机器人足球的研究涉及到包括人工智能、图象处理、控制系统、机器视觉、机械、 无线通信和模式识别等诸多领域。同时,机器人足球技术的进步也牵涉到多个相关产 业。我们可以用表1 - 1 1 简单表示: 表1 1 1 机器人足球关键技术与相关产业 关键技术相关产业 计算机视觉系统 生产过程在线检测系统 无线电通信技术抗干扰中短程通信系统 多智能体协调策略技术 多智能体协作系统 人工生命与模期控制技术人工智能应用系统 机电一体化技术各家电产品机电一体化系统 多传惑嚣融会技术各机器人智能控制系统 硕士论文机器人足球仿真比赛簧略研究及实现 软硬件集成技术各工业控制专业计算机 lv r 人机接口技术各种、,l c 人机交互系统 机器人足球比赛系统的研究有着重大意义:m a s 技术已成为人工智能研究的重点 方向,研究m a s 关键技术可以对分布式人工智能理论的研究有所突破,具有深远的理 论价值;机器人足球比赛系统是m a s 多项关键技术的集成,在一定程度上反映了各国 多项高新技术实力;机器人足球的研究涉及多个学科领域与产业,可以带动机械、电 机、控制系统,无线电等学科的发展;机器人足球比赛具有科普性和娱乐性,是一项 相当好的科学普及工具;体育科研单位可用于研究足球比赛策略,学校可用于示范教 学、编程实习,游乐场所可用于吸引游客等。 1 2 机器人足球仿真比赛的研究现状 目前,很多国家都有了自己的机器人足球队。在世界上最有影响的机器人足球赛 事主要有两个,一个是由国际人工智能协会组织的机器人世界杯r o b o c u p ( t h er o b o t w o r l dc u ps o c c e rg a m e sa n dc o n f e r e n c e s ) 比赛,另一个是由国际机器人足球联合 会( f i r a ) 组织的微机器人世界杯m i r o s o t ( m i c r o - r o b o tw o r l dc u ps o c c e r t o u r n a m e n t ) 比赛。在国际人工智能协会组织的机器人世界杯r o b o c u p 中的比赛分为 三个项目:小型机器人比赛( 直径小于1 5 c m ) 、中型机器人比赛和电脑模拟仿真比赛。 由于本文主要讨论的是基于仿真平台的r o b o c u p 机器人足球比赛,所以下面着重 介绍一下仿真比赛的环境与比赛原理。 r o b o c u p 仿真比赛是在一个统一标准的计算机环境内进行的。比赛的标准服务器 系统f l q r o b o c u p 委员会提供,各个参赛队编写各自的客户端程序( c i i e n z ) ,模拟实际 足球队员参加比赛。比赛以客户服务器方式进行,服务器与2 个参赛的客户端用以太 网连接,服务器和客户之间的通信是通过u d p i p 协议进行的。服务器( s o c c e r s e r v e r ) 提供了一个虚拟场地,并对比赛双方的全部队员和足球的移动进行仿真。客户程序相 当于球员的大脑,指挥球员的运动。参赛者可以使用任何支持u d p i p 的操作系统。 仿真比赛的系统如图1 2 1 所示:1 7 1 图i 2 1r o b o c u p 仿真比赛系统架构图 2 硕士论文机器人足球仿真比赛簧略研究及实现 其中服务器是整个仿真系统的核心,它对系统的性能要求较低,可以运行在诸多 操作系统上。服务器是控制处理的核心,在后台运行并完成各种信息的处理,它通过 u d p i p 协议与客户程序连接。s e r v e r 包含s o c c e r s e r v e r 和s o c c e r m o n i t o r 两个程序。 其5 b s o c c e r m o n i t o r 的作用是显示赛场,而s o c c e r s e r v e r 的工作主要如下: 信息传递模块的功能是把一些球场的信息通过网络套节字传递给客户端,比如球 员的视觉、听觉、身体状态和场上的比分等。信息分析模块用于分析来自于信息处理 模块的通信数据信息,并通过信息传递模块返回信息结果给客户程序。信息处理模块 的工作主要是接收来自于客户程序的信息,包括队员控制指令信息和其它的一些通信 信息如果是队员的控制指令信息,经过处理后由比赛场地仿真模块的处理,其他的 通信信息进一步由信息分析模块来处理。 客户端通过u d p i p 协议与仿真平台连接,将事先编写好的球员、球场策略等输给 服务器。在比赛过程中,服务器将球场上的信息实时发给客户端,如球员和球的位置、 球员的体力、球员可以。看”到和“听”到的信息等等。客户端通过网络信息接受模 块接受到信息,然后分析场上的情势,选择各自球队的策略,比如是进攻还是防守等 等,将选择的策略通过网络通信发送给服务器,控制虚拟球员的运动。 在机器人足球的视觉子系统、小车子系统、通讯子系统和决策子系统中,决策子 系统最为关键。仿真平台的机器人足球系统,抛开了机器人小车制作、场地因素、图 像处理、无线通信等问题,使研究人员专注于机器人足球的决策子系统,加速了球队 的球场策略研究的进步。 通过研究人员的努力,机器人足球发展迅速,比赛规模逐年扩大,r o b o c u p 现有 成员国近4 0 个,参赛队已经从最初的4 2 支代表队发展到今天的2 5 4 支球队。f i r a 己经 从最初参赛的l o 个国家的2 3 支代表队发展到2 5 个国家组织的2 0 7 支球队。同时各个参 赛队竞争激烈,比赛水平提高很快。每届比赛各个球队的战术水平都有明显提高,新 的软、硬件设计和巧妙的战术配合策略不断出现。此外,机器人足球研究还得到国际 研讨、著名期刊和会议的倍加重视,足球机器人专辑在( t h ej o u r n a lo nr o b o t i c sa n d a u t o n o m o u ss y s t e m ) 、t h ei n t e r n a t i o n a lj o u r n a lo fi n t e l l i g e n ta u t o m a t i o na n d s o f tc o m p u t i n g ) 、a r t i f i c i a li n t e l l i g e n c e ) 等学术刊物上的出版表明,机器人 足球正以一种高科技对抗性的形式赢得学术界的关注。一些有影响的国际学术会议如 w a c 9 8 a r o b i i i 9 8 ,a r o b 9 9 也都安排了这方面的专题讨论。一年一度的世界杯赛 也都同时召开学术会议,推动了相关学科的发展。 我国机器入足球的研究相对于国外起步较晚,但己吸引了众多研究者的兴趣,东 北大学、广东工业大学等已先后开发出各种形式的机器人足球系统。我国的机器人足 球队的水平与世界上的先进国家相比目前存在着较大的差距。特别是协同作战能力方 面与美国、德国等世界冠军队相比还有较大差距。国际机器人足球联盟主席金钟焕 硕士论文机器人足球仿真比赛策略研宄及实现 ( k i mj o n gh w a n ) 近期正式宣布,2 0 0 8 年世界杯机器人足球大赛将在山东青岛举行, 此前北京曾在2 0 0 1 年成功举办过第六届世界杯机器人足球大赛。可见中国机器人足 球的技术进步迅速,已经在机器人足球比赛中显示出相当的实力。 1 3 本文的主要内容与安排 本文着重讨论r o b o c u p 机器人足球仿真比赛的球场策略。对于球员的传球一系 列的策略行为的设计,本文分别进行了讨论、改进,实现。从球员体力模型的角度考 虑球员的角色分配问题,使得球员的体力得以较好的安排和恢复,体力状态较好的球 员去完成体力要求较高的任务同时在防守对方多个前锋进攻时,运用多目标追踪的 粒子群优化算法指导防守球员的卡位。在以上几点的基础上实现多机器人足球比赛的 客户端程序的改进,通过测试数据,比较出策略的优劣。 本文共分七章,大致内容安排如下: 第一章介绍本文的选题背景和机器人足球的国内外研究现状,并对本文的结构 进行安排。 第二章介绍了a g e n t 的基本理论,包括基于推理的慎思型a g e n t 、基于反应的反 应型a g e n t 还有混合型a g e n t ,以及a g e n t 在机器人足球系统中的应用。讨论了姒s 的基本理论,以及如何实现多球员a g e n t 之间的协作,如何消除自利的个体( 球员) 之间的冲突而达到系统( 球队) 宏观上的目标一致性和利益最大化。 第三章讨论仿真平台的机器人足球比赛的球员基本动作的实现,包括他的基本 感知模型和动作模型。 第四章研究球员的策略行为的实现,包括球员的传球、截球、守门等一系列的 策略动作。对现有常用的行为判断、实现方法进行改进。 第五章分析球员的角色分配策略。分别讨论球场各个位置、角色的球员的策略 动作的选择过程。在加入了对机器人球员的体力模型的考虑后,对同构模型的球员进 行角色调整,使体力消耗较厉害的球员得到休整,而体力较好的球员去担当 第六章采用粒子群算法的多目标追踪来实现防守对方多个球员进攻时球员的跑 位,利用粒子群算法的随机性来适应不断变化的球场形势。 第七章介绍了多机器人足球的软件仿真平台的实验环境并安排若干组仿真实 验,并且在以上几点的基础上对球队进行比较,通过观察比赛过程和数据统计,分析 对球队的改进效果,得出结论。 4 硕士论文 机器人足球仿真比赛簧略研究及实现 2a g e n t 、m a s 与机器人足球 2 1a g e n t 基本理论 a g e n t 通常被人们当作智能体来理解,但是人们对a g e n t 还没有比较统一、准确 的定义。人们对a g e n t 的下了各种各样的定义,以下几种比较有代表性:【) r u s s e l l 认为:“a g e n t 是任何能通过传感器感知环境并通过效应器( 执行器) 对环 境进行动作的东西。” p m a e s 认为:“a g e n t 是在复杂动态环境中能自治地感知环境并能自治地通过动 作作用于环境,从而实现其被赋予的任务或目标的计算系统。” f i s h e r m 定义a g e n t 为“一个带有传统的a i 能力的封装实体” s h o h a m 从模拟人类行为的角度出发,用精神状态来描述a g e n t ,认为a g e n t 是具 有信念( b e l i e f s ) 、能力( c a p a b i i i t i e s ) 、决定( d e c i s i o n ) 、承诺( c o m m i t m e n t ) 等 属性的实体,后来很多专家学者又对精神状态作了扩充,增加了很多属性,如:愿望 ( d e s i r e ) 、意图( i n t e n t i o n ) 、目标( g o a l ) 、选择( c h o i c e ) 、决策( d e c i s i o n ) 和职责 ( o b l i g a t i o n ) 等等。 虽然还没有一种统一的标准定义,但比较一致的看法是:a g e n t 代表了一种具有 独立的问题求解能力和与环境中其它a g e n t 合作求解问题能力的自治实体。我们认为 一个a g e n t 是具有一系列的目标、确定的能力和知识( 代表了对整个环境的看法) ,能 够推理环境( 包括推理其它a g e n t 的行为) ,生成相应的规划并执行规划,以实现目标 的功能实体。a g e n t 具有以下的一些特性: ( 1 ) 自治性:a g e n t 应该能够解决给定的子问题,自主地选择通信、合作策略, 以特定的方式响应周围的环境,独立地对自身的行为进行规划,而不需要人或其它 a g e n t 的指令,其行为通常称为自治行为; ( 2 ) 交互性:也称为社会性。a g e n t 与a g e n t 之间能够基于高级的通信语言进行 交互,通过交换知识、信念和规划等达成合作关系或基于协商协议通过协商解决冲突。 其行为通常称为社会行为; ( 3 ) 学习能力与适应性:a g e n t 并不是一成不变的,a g e n t 能够在运行中动态地推 理环境和搜集环境知识,发现资源,从而改变自己的知识结构,适应环境的动态变化; ( 4 ) 鲁捧性:健壮性,能够对突发事件作出适当的反应; ( 5 ) 预动性:a g e n t 通过主动发起可以表现出目标引导的行为,为满足它们的设 计目标可以主动的发起一个动作。 a g e n t 不同于传统的软件系统,传统的软件系统一般是被调用触发才会采取行动, 有受控的关系。而a g e n t 软件则能够依据自己的目标、意图主动行动。a g e n t 也不同 硕士论文机器人足球仿真比赛策略研究及实现 于专家系统,相对专家系统的独立的问题求解能力,如计算、规划等,a g e n t 还具有 合作求解问题的能力,如消息传递、交互、协商和对话能力等。由此可以看出,a g e n t 区别于传统智能系统的显著特性在于它具备与其所处环境以及与其它a g e n t 进行协 调、交互和协作的能力,主动依据自己的目标采取行动。 在机器人足球中,足球机器人代替人类进行足球比赛,它们独立的对自己的环 境进行判断,根据各自的目标调整自己的行为,不需要别人或者别的球员的指令,属 于自治行为。在比赛过程中,球员之间或者球员和教练之间可以通过。s a y ”和“h e a r ” 来传递信息,协商解决冲突等问题,体现了交互性。球员要在比赛中动态的搜集环境 条件,推理、发现资源,从而改变自己的知识结构,适应环境的动态变化,具有一定 的学习能力和适应性。比赛过程瞬息万变,会出现各种无法预料的异常情况,面对这 样的情形,机器人球员就必须具备一定的抗干扰能力,表现出健壮性、鲁棒性。在比 赛中,球员在自身角色给定的行为目标的指引下,根据球场的情势,提前主动的采取 行动,具有预动性。综合以上几点,机器人球员身上体现出a g e n t 的自治性、交互性、 学习能力、适应性、鲁棒性和预动性等,是具有一系列的目标、确定的能力和知识( 代 表了对整个环境的看法) ,能够推理环境( 包括推理其它a g e n t 的行为) ,生成相应的 规划并执行规划,以实现目标的功能实体,可以看作是一种a g e n t 。 a g e n t 根据其体系结构嘲,可分为慎思式、反应式和混合式。 ( 1 ) 慎思式:这种体系结构是一种纵向体系结构,推理和控制的表达是一个从低 层的环境建模到高层的过程,其动作不是传感器数据直接作用下产生的结果,而是经 历了一系列从感知、建模到规划等处理阶段之后产生的结果。这是一种基于传统人工 智能的认知模型,适合于已知环境下任务明确、目标给定的系统。智能体内部维护一 个对外界环境的描述,并具有更新机制,智能体根据其内部的环境模型及感知的外部 信息进行推理,产生动作。它的结构如下图2 1 1 所示: 图2 1 1 慎思式a g e n t 结构图 6 硕士论文 机器人足球仿真比赛策略研究及实现 ( 2 ) 反应式:反应式( r e a c t i v e ) 是一种不同于慎思式智能体的新的结构,起源于 8 0 年代,也称作“基于行为”( b e h a v i o r - b a s e d ) 智能体。它的体系结构表现为从“感 知”到“反应”的横向体系结构。此结构建立了从传感器数据直接到一系列行为的映 射,直接基于传感器的输入进行决策,在其内部可以不保留外界环境模型,在完全陌 生的环境中工作。一个典型的反应式结构首先定义多个行为模块,从传感器得到的数 据同时传给这些模块,如果它们的条件满足,则通过算法从它们的输出中得到被执行 的动作。智能体通过。条件一动作”规则将感知与动作连接起来。这种结构反应快速、 灵活机动,系统能力从低层次的局部规划到冲突消解等逐步得到提高。 反应式的结构如下图2 1 2 所示; 图2 1 2 反应式a g e n t 结构图 ( 3 ) 混合式:智能体在不论现实还是虚拟的环境中,都会遇到各种不同的情况。它 不但要保持对紧急情况的及时反应,还要使用一定的策略对中短期的行为做出规划, 进而通过对世界和其它智能体的建模分析来预测未来的状态,以及通过通信语言实现 和其他智能体协作或协商。我们希望这些功能同时存在,并行地执行,以提供良好的 实时性和规划性,因此拥有反应式和慎思式优势的混合式结构发展起来。混合式模型 的智能体中包含感知( p e r c e p t i o n ) 、动作( a c t i o n ) 、反应( r e a c t i o n ) 、建模 ( m o d e l i n g ) 、规划( p l a n n i n g ) ,通信( c o m u u n i c a t i o n ) 、决策( d e c i s i o nm a k i n g ) 等模 块。智能体通过感知模块来反映现实世界,并对环境信息做出一定的抽象。根据信息 的类型,感知模块将经过抽象的信息送到不同的处理模块。如果感知到的是简单的或 紧急的情况,信息则被送到反应模块。反应模块对传入的信息立即做出决定,并将动 作命令送到动作模块。动作模块则根据传入的动作命令做出相应的动作,对外界做出 反应。从感知到反应到动作的信息传递过程构成了“反射弧”。结构如下图2 1 3 所 示: 7 硕士论文机器人足球仿真比赛策略研究及实现 外部世界 图2 1 3 混合式a g e n t 结构图 分层结构是混合式结构的一种实现方法。分层结构对于组织功能和控制,是有效 的,而且对于支持( 如反应、慎思、协作和适应性等) 期望特性的系统设计,分层结构 是一重要工具。分层结构的主要思想是将一个智能体的功能分到多个层次的组织层 中,这些层在总体上完成智能体一致的行为,彼此间可以交互作用。它既可在最低层 进行反应式的响应,以解决某些突发事件,同时在高层进行慎思式决策与规划。如下 图2 1 4 就是3 种不同形式的分层结构: 垂直结构水平结构联合结构 图2 1 4分层结构 在r o b o c u p 的仿真比赛中,系统服务器端为球员提供了一系列的基本动作:踢球 ( k i c k ) 、转向( t u r n ) 、移动( m o v e ) 、奔跑( d a s h ) 等,这些基本动作是能够被仿真平台 直接执行的。参赛球队的客户程序还需在此基础上进一步开发出球员的基本战术动 8 硕士论文 机器人足球仿真比赛簧略研究及实现 作,如带球( d r i b b l i n g ) 、断球( i n t e r c e p t i o n ) 、防守( d e f e n s e ) 和守门( g o a l t e n d i n g ) 等高层次复杂动作,由此才能有最终的球场策略的实现。 对应在分层结构中,球场的实时的变化需要球员做出相应的处理,这主要要求的 是反应迅速、机动灵活,这就是较低层次的响应。同时整个球场情势的变化,相对的 没有那么紧急,它表现为整个球队战术部署的调整或者角色分配的转换等,这些决策 的生成就是通过慎思行为。 2 2 姒s 基本概念与组织结构 2 2 1m a s 基本概念 简单来说,多a g e n t s 系统( m a s ) i s l 可以被这样定义:m r s 是由多个问题解决者 ( a g e n t ) 组成的网络系统,其中的a g e n t 相互作用、相互合作从而解决单个a g e n t 由 于能力、知识或资源上的不足而无法解决,或即使能解决而效率很低的问题。m r s 协 作,能力超过单个a g e n t ,是m r s 产生的最直接的原因。 m r s 是a g e n t 技术中一个重要的研究领域。它和分布问题求解( d p s - d i s t r i b u t e d p r o b l e ms o l v i n g ) 的研究都属于分布式人工智能( d a i ) 的内容,是两个不同的研究阵 营。d p s 研究的主要内容是,多个问题求解器如何彼此合作,达到一个共同的目标, 解决一个问题,交互策略是系统的一部分,预先集中在系统中,各问题求解器共享关 于问题的知识和求解方案而m r s 研究多个软件实体自主的合作解决多个问题,这些 软件实体关于问题的知识及求解方法都不完全,从而希望通过合作来产生比完全由单 个实体来解决问题更好的结果。m r s 一般被定义为松耦合的问题求解器,也可以定义 为由多个具有自主或半自主行为的软构件构成的系统。 姒s 有如下特点: ( 1 ) 每个a g e n t 对环境和问题具有不完全的知识及问题解决能力; ( 2 ) 系统没有全局控制; ( 3 ) 数据是分布的; ( 4 ) 各a g e n t 之间的计算是自主的、异步的 2 2 2m a s 组织结构 对协同机制的分类源于m r s 的组织结构分类,根据是否存在管理和服务机构,m r s 的组织结构可分为分布式、集中式和混合式三种蛳具体结构见图2 2 2 卜2 2 2 3 , 其中集中式与分布式的区别就在于有没有一个中心管理者负责成员a g e n t 的集中控 制。 9 硕士论文机器人足球仿真比赛策略研究及实现 图2 2 2 1 :集中式姒s 圆团圆 图2 2 2 2 :分布式姒s 团圆 图2 2 2 3 :混合式m a s 集中式姒s :将有相同耳标、关系靠近的a g e n t 集合成一组,在保证成员a g e n t 具 有一定自治性的前提下,用一个管理服务机构来负责这一组内的协调。多个a g e n t 组 再组成更高一级的a g e n t 组,并由一个高层管理_ a g e n t 来协同低层管理服务机构,这样 的层次可以有若干个。管理服务机构与成员a g e n t 间具有一定的管理与被管理关系。 分布式m a s 不存在管理者,而由中介服务机构来为a g e n t 成员间的协同提供辅助 和服务作用,中介与成员a g e n t 间不存在管理与被管理关系。 混合式m a s 兼具分布式和集中式的特性,既有管理机构,也有中介服务机构。 m a s 的组织结构对协同机制的决定作用就体现在这两种机构的功能上,它们在协同中 的作用是不同的。 管理服务机构负责对所有或部分a g e n t 成员的行为、协作、任务分配以及共享资 源等进行统一的调配和管理,建立学习系统和a g e n t 成员的模型,实现成员行为和系 统安全性监测及控制掣1 8 1 。它与成员a g e n t 之间存在着一定的管理与被管理关系,但 这种管理活动并不采用简单的命令方式,而是以协商的方式进行,保证了成员a g e n t 自治性的实现。 1 0 硕士论文机器人足球仿真比赛簧略研究卫实现 中介服务机构用以发布、保存和维护各a g e n t 成员的能力、位置和状态等信息, 并进行合作对象和服务请求的匹配工作,它与系统内a g e n t 成员的关系是服务与被服 务关系。中介服务机构与管理服务机构最大的不同在于:中介服务机构仅仅为a g e n t 成员提供中介服务,并不像管理服务机构那样拥有多个a g e n t 成员和系统当前环境的 丰富知识,也不对系统的共享资源进行管理,更缺乏总体的协同组织能力。这样的区 别往往是由系统规模决定的:中介服务机构一般存在于大型的开放的姒s 中,不可能 像管理强务机构那洋拥有系统内所有的全局知识。 在机器人足球中采用的教练员机制,用黑饭模型来进行协作,球员将信息发送到 黑板上,然后由教练员从黑板上读取信息,再来处理协作。教练员充当的就是管理服 务机构的角色。 硕士论文机器人足球仿真比赛策略研究及实现 3 足球机器人的基本动作模型 3 1 球员的感知模型 。 在r o b o c u p 机器人足球仿真比赛中,智能体有三种感知,听觉、视觉、以及自身 状态的感觉【7 2 3 】。听觉能够接受来自各方的消息,来源包括裁判,教练和一定距离内 的球员;视觉能感知来自球场的可视信息,例如球员在当前可视范围内的对象的距离 和方向,视觉信息类似一个传感器,可以“看到”在球员身后的近距离内的对象;自 身状态的感知能检测球员自身当前的物理状态,例如它自己的体力剩余值、速度、脖 子的角度、身体正向的角度、当前视觉的质量、特定动作累计执行的次数等等。球员 所有的感知信息都是在每个仿真周期间隔内,由服务器自动发送给球员的。 3 1 1 视觉模型 视觉感知信息在每个s e n s e _ s t e p ( 当前缺省为1 5 0 m s ) 内,自动的发送到球员处。 s e r v e r 发送的视觉信息是遵循这样的格式:( s e eo b j n a m ed i s t a n c ed i r e c z i o n d i s t c h n gd i r c h n gb o d y d i rn e a d d i r ) 。 球员获得的视觉信息与距离有着很大的关系。对于近距离的球员,它既可以看到 它所属的球队同时也可以看到它的球衣号码,然而随着距离的增加,首先消失的是球 员的号码,然后距离的增加会导致球员的队别也看不清楚了,s e r v e r 中是这样来定 义的:瞄1 i fd i s t u n u mf a rl e n g t h ,那么球员号码和球队名称都可见; i fu n u m f a r l e n g t h d i s t u n u mt o o f a rl e n g t h ,那么队名是可见的,但 队员号码有一定的概率看不到。这个概率根据d i s t 线性的从l 减少到o ; ( di fu n u mt o of a rl e n g t h d i s t ,那么球员号码是不可见的; i ft e a m _ f a r _ l e n g t h d i s t o ) ,体力值降低p o w e r 。如果是向后加速,体力值降低p o w e r 的2 倍。如果 d a s h 需要的p o w e r 超过了球员的体力值,那么p o w e r 就会降低。异构队员在没有足 够的体力值时可以使用额外体力。额外体力值依赖于球员类型和参数 e x t r a _ _ s t a m i n a _ d e l t am i n 和e x t r as t a m i n a _ d e l t a _ m a x 。降低体力值后,s e r v e r 计 算d a s h 命令中p o w e r 的有效鄯分。命令d a s h 的有效部分e d p ( e f f e c t i v ed a s hp o w e r ) 硕士论丈机器人足球仿真比赛簧略研究及实现 是由d a s h - p o w e r _ r a t e 和球员当前的e f f o r t 决定的。球员的e f f o r t 是介于e f f o r t m i n 和e f f o r tm a x 之间的值,受球员的体力管理决定: e d p = e f f o r t d a s hd o w e rr a t e p o w e r( 3 2 1 ) e d p 和球员的当前身体方向被转化成向量,然后再加到球员当前的加速度瓦中 ( 通常情况下是0 ,因为球员在一个周期内不能d a s h 一次以上,而且球员也不可能不 通过d a s h 而通过其它动作来获得加速度) 踢球( k i c k ) 命令k i c k 有两个参数,踢球力量( 取值范围在m i n p o w e r 和m a x p o w e r 之间) 和球 员踢球的角度( 角度以度数表示,取值范围在m i n m o m e n t 和m a x m o m e n t 之间) 一旦命令k i c k 到达s e r v e r 端,只要球员没有被置为越位,而且足球在可踢范围 内,那么k i c k 就会被执行。如果足球和球员之问的距离在0 到k i c k a b l e _ m a r g i n 之 间,那么足球对这个球员来说就是可踢的。首先要计算的是踢球的有效力量e p ( e f f e c t i v ek i c kp o w e r ) : e p = k i c kp o w e rk i c k 木p o w e rr a t e( 3 2 2 ) 如果足球不在球员的正前方,那么根据足球相对球员的位置,踢球有效力量将 会减去某个数值,所以角度和距离都是很重要的。如果足球相对球员身体角度是0 。, 就是说如果足球在球员面前,有效力量将不会改变。角度越大,有效力量将会减少的 越多。最差的情况是足球在球员身后1 8 0 。,有效力量将会减少2 5 。影响有效力量的 第二个重要因素是足球到球员问的距离:要执行k i c k 命令,足球到球员的距离介于 0 到k i c k a b l e _ m a r g i n 之间。如果距离是0 ,那么有效力量将不会再被削弱。两者问 的距离越大,有效力量减少的越多。如果距离等于k i c k a b l e m a r g i n ,那么有效力量 将会减少原来踢球力量的2 5 。最坏的情况是足球在球员的后方最远处,将会使用5 0 的踢球力量。具体如式( 3 2 3 ) ;【刀 e p = e p ( 1 - 0 2 5 ) 笋们等甓 ( 3 z s ) 其中d i r _ d i f f 是足球和球员身体的相对角度,d i s td i f f 是足球和球员的相对 距离) 。踢球的有效力量e p 被用来计算加速度瓦,这个加速度在周期n 中加到足球的 全局加速度上。 足球加速变与速度的计算与球员执行d a s h 命令获得加速宝比较类似,s e r v e r 参 数k i c k _ r a n d 被用来在足球加速变中产生噪音。默认球员的k i c k r a n d 等于0 ,不 产生噪音。 转身( t u r n ) 命令t u r n 用来改变球员的身体赣向。命令t u r n 的参数是m o m e n t ,其有效值介 于m i n m o m e n t 和m a x m o m e n t 之间。如果球员是静止的,那么它实际转过的角度就等于 硕士论文机器人足球仿真比赛策略研究及实现 m o m e n t 的值。然而,如果球员在运动中,由于惯性的作用使其转身较为困难。球员 真正转过的角度用下列公式计算【7 】: a c t u a l _ a n g l e = m o m e n t ( 1 o + i n e r t i a _ m o m e n t p l a y e r _ s p e e d ) ( 3 2 4 ) 其中,i n e r t i am o m
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2023-2029年中国种羊养殖行业市场深度研究及投资战略规划建议报告
- 2025年 高级焊工职业技能考试练习题附答案
- 2025-2031年中国玻璃移门行业市场发展监测及投资策略研究报告
- 2025年AOI检测设备市场调研报告
- 2025年中国全套管钻机行业市场深度分析及投资策略研究报告
- 2025年中国专网无线通信市场前景预测及投资规划研究报告
- 中国商用汽车行业未来趋势预测分析及投资规划研究建议报告
- 中国通信网络时钟同步设备行业市场深度分析及发展潜力预测报告
- 亚胺薄膜复合-NHN项目投资可行性研究分析报告(2024-2030版)
- 职业卫生检测与评价报告书编制规则
- 2025年湖北省高考政治试卷真题(含答案)
- 老龄化社会的数字包容-洞察及研究
- 广东省深圳市宝安区2023-2024学年二年级下册期末测试数学试卷(含答案)
- 2025江苏扬州宝应县“乡村振兴青年人才”招聘67人笔试备考试题及参考答案详解
- 2025年宁夏银川灵武市选聘市属国有企业管理人员招聘笔试冲刺题(带答案解析)
- 三大监测培训试题及答案
- 两办意见宣贯考试题及答案
- 2025年汽车驾照考试科目一考试题库及参考答案
- 超市商场保密协议书
- 社工社会考试试题及答案
- 跨文化交际知识体系及其前沿动态
评论
0/150
提交评论