(计算机应用技术专业论文)基于阵形和角色的多agent协作研究和战术库的设计.pdf_第1页
(计算机应用技术专业论文)基于阵形和角色的多agent协作研究和战术库的设计.pdf_第2页
(计算机应用技术专业论文)基于阵形和角色的多agent协作研究和战术库的设计.pdf_第3页
(计算机应用技术专业论文)基于阵形和角色的多agent协作研究和战术库的设计.pdf_第4页
(计算机应用技术专业论文)基于阵形和角色的多agent协作研究和战术库的设计.pdf_第5页
已阅读5页,还剩67页未读 继续免费阅读

(计算机应用技术专业论文)基于阵形和角色的多agent协作研究和战术库的设计.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

安徽人学硕士毕业论文摘要 摘要 机器人足球世界杯以多智能体系统( m a s ) 和分布式人工智能( d a i ) 为主要 研究背景。其主要目的是通过提供一个标准的比赛平台,促进机器人学和人工智 能的研究与发展。为了能让一个机器人球队真正能够进行足球比赛,必须集成各 种各样的技术,包括自治智能体的设计准则、多智能体合作、策略获取、实时推 理、机器人学以及传感器信息融合等。 本论文以仿真机器人足球比赛中的多个智能体为研究对象,对多智能体系 统中的多个智能体之间的协作问题进行了分析和研究,把一些研究的新方法、 新思路运用于改造我们的球队中来。 论文首先介绍r o b o c u p 仿真平台的系统组成及运作原理,包括服务器、监视 器、客户端程序等;随后切入本文研究重点:多a g e n t 间协作和战术库设计。 本论文做的主要研究工作如下: 基于层结构的思想,设计了球队的主体结构,给出了球队的c l i e n t 程 序结构和比赛流程。 基于动态阵形和动态角色的概念,设计了球队的协作模型,在此基础 上,详细阐述了协作模型中多a g e n t 协作的具体过程。针对多a g e n t 协作冲突,提出了有效的解决方案。 在分析比赛战术特点的基础上,设计了球队的战术库系统。结合战术 的思想设计了球队的全局策略;给出了部分战术的具体实现,并在球 队的比赛中得到了验证。 最后对当前工作的成果做了简单的总结,并展望了未来,对球队以后需要 做的工作做了简要的介绍。 关键词:机器人足球世界杯,多智能体系统,分布式人工智能,多智能体 协作模型,智能体的主体结构,多a g e n t 协作冲突,战术库。 安徽人学硕士毕业论文a b s t r a c t a b s t r a c t b e i n gt h em a i nr e s e a r c hb a c k g r o u n do fm u l t i a g e n ts y s t e m sa n dd i s t r i b u t e d a r t i f i c i a li n t e l l i g e n c e ,r o b o ts o c c e rw o r l dc u p ( r o b o c u p ) s u p p l i e sas t a n d a r d t o u r n a m e n tp l a t f o r mi no r d e rt of o s t e rt h er e s e a r c ha n dd e v e l o p m e n to f r o b o t i c sa n d a r t i f i c i a li n t e l l i g e n c e t om a k ear o b o tt e a mp l a ye f f e c t i v e l y , v a r i o u st e c h n o l o g i e s i n c l u d i n gd e s i g np r i n c i p l e so f a u t o n o m o u sa g e n t s , m u l t i - a g e n tc o o p e r a t i o n ,s t r a t e g y a c q u i s i t i o n , r e a l - t i m er e a s o n i n g , r o b o t i c s ,a n ds e n s o r - f u s i o nm u s tb ei n c o r p o r a t e d u s i n gt h em u l t i p l ea g e n t si nr o b o c u p a sr e s e a r c h ,t h i sd i s s e r t a t i o na n a l y z e st h e c o o p e r a t i o na m o n gm u l t i p l ea g e n t si nm u l t i - a g e n ts y s t e m s ,a n da p p l ys o m en e w m e t h o d sa n dn e wt h o u g h t sf o ro u rt e a m f i r s t ,t h i sp a p e rg e t st h eu n d e r s t a n d i n go ft h er o b o c u ps i m u l a t i o ns y s t e m m a k e u pa n dh o w i tf u n c t i o n ,i n c l u d i n gs e r v e r , m o n i t o ra n dc l i e n t a f t e r , t h i sp a p e r p r e s e n t st h ee m p h a s i so f t h i sp a p e r :m u l t i a g e n tc o o p e r a t i o na n dt a c t i c sd e s i g n t h i sp a p e ra c h i e v e sp u r p o s e sa sf o l l o w s : t h i s p a p e rd e s i g n sal a y e r e da g e n ta r c h i t e c t u r e ,a n dp r e s e n t st h ep r o c e d u r e s t r u c t u r eo f c l i e n ta n dt h ef l o wo f m a t c h ; t h i sp a p e rd e s i g n sam u l t i - a g e n tc o o p e r a t i v em o d e lb a s e do nd y n a m i c f o r m a t i o na n dd y n a m i cr o l e ,a n de x p o u n d st h ec o o p e r a t i v em e c h a n i s mo f t h i sm o d e l t h e nt h i sp a p e rp u t sf o r w a r da ne f f e c t i v em e t h o dr e s o l v i n g m u l t i - a g e n tc o o p e r a t i v ec o n f l i c t ; t h i sp a p e ra n a l y z e st h et r a i t so ft a c t i c a lb e h a v i o r , a n dp u t sf o r w a r do u r t e a m sh o l i s t i cd e c i s i o n - m a k i n gs y s t e mb a s e do nt a c t i c s ;a r e r w a r dt h i s p a p e ri m p l e m e n t ss o m ec o n c r e t et a c t i c s ,w h i c ha r et e s t i f i e de f f e c t i v ei n e x p e r i m e n t s i nt h ee n d ,t h i sp a p e rm a k e sac o n c l u s i o no ft h ew o r kt h a th a sb e e nd o n e ,a n d s i m p l yp o i n t so u tw h a tw es h o u l dd oi nf o t u r e k e y w o r d s :r o b o ts o c c e rw o r l dc u p ( r o b o c u p ) ,m u l t i - a g e n ts y s t e m s ( m a s ) , d i s t r i b u t e da r t i f i c i a li n t e l l i g e n c e ( d a d ,m u l t i a g e n tc o o p e r a t i v em o d e l ,a g e n t a r c h i t e c t u r e ,m u l t i - a g e n tc o o p e r a t i v ec o n f l i c t , t a c t i c ss y s t e m 1 _ 安徽人学硕士毕业论文图表目录 图目录 图2 - 1s o c c e rs e r v e r 模型 图2 2 球员视觉范围图 图3 - 1 混合式主体结构 图3 - 2 基于层结构的a g e n t 主体结构 图3 - 3a g e n t 类结构罔。 图3 4o b j e c t 类的子类 图3 - 5a g e n t i 作流程图 图3 1 混合式主体结构 图3 2 基于层结构的a g e n t 主体结构 图3 - 3a g e n t 类结构图。 图3 - 4o b j e e t 类的子类 图3 - 5a g e n t i 作流程图 图4 i 球场区域示意图 图4 - 24 3 3 阵形中球员角色的分布图 图4 3 基于阵形和角色的协作模型 图4 - 4 散开的4 - 3 3 阵形 图4 - 5 基于教练( c o a c h ) 的阵型变换 图4 6 角色转换的流程 图4 7 球员角色u m l 图 图4 - 8 任务t 的分解“与或”树示意图 图4 - 9 中场、边前锋的活动区域 图5 一l 战术库系统实现框架 图5 - 2 战术管理器 图5 - 3 战术的解释过程 图5 - 4 三种二人局部配合战术 图5 5p a s s k i c k 战术实例 图5 - 6 球员基本战术动作决策树 图5 - 7 二分法求解截球点。 表1 1 表3 i 表4 1 表5 - 1 表5 - 2 表5 - 3 表5 - 4 表目录 9 1 2 2 1 2 2 2 4 2 5 2 6 2 l 2 2 2 4 2 5 3 4 3 5 3 9 4 1 4 8 4 8 4 9 5 4 5 6 5 7 5 8 国际机器人象棋对抗赛和机器人足球比赛的区别。3 a g e n t 主体结构各层次任务2 3 三种典型协作模型的优缺点3 0 球员的基本战术动作5 l 比赛射门和传球情况6 0 比赛1 对l 、2 对1 情景分析6 l 比赛3 对2 情景分析6 l v i 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得 的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包 含其他人已经发表或撰写过的研究成果,也不包含为获得徽尖善或其他教 育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任 何贡献均已在论文中作了明确的说明并表示谢意。 学位论文作者签名: 球哆立笙 签字日期: ? 矿0 7 年岁月日 学位论文版权使用授权书 本学位论文作者完全了解彦嗣嫁霉 有关保留、使用学位论文的规定, 有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅 和借阅。本人授权撕以将学位论文的全部或部分内容编入有关数据库 进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:如乞至 签字日期:知口7 年 月日 学位论文作者毕业去向: 工作单位: 通讯地址: 导师签名: 签字日期:年月 日 电话: 邮编: 安徽人孕硕士毕业论文第一- 章绪论 第一章绪论 人工智能作为一门独立的研究学科,始于二十世纪五十年代。随着自动化 信息技术的迅速发展,特别是计算机这一强有力的运算工具的进步,对人工智 能系统研究半个多世纪以来,已取得了一系列成果,从“深蓝”系列计算机解决 的单智能体静态可预测环境中的问题求解,到多智能体动态不可预测环境中的 问题求解,成为了人工智能研究的代表性问题l 。 机器人足球世界杯( r o b o c u p ) 是国际上一项为促进分布式人工智能和多智 能体系统研究与发展的大型比赛和学术活动。由于机器人足球赛的特点,决定了 足球的机一机对抗和人机对抗成为研究多智能体理论的一个合适平台。 1 1 多智能体系统 1 1 1 智能体( a g e n t ) 智能a g e n t 是指一种处于一定环境下的计算机系统,为了具体的目的而设计, 能在指定环境下灵活的自主活动”,不断感知环境并作用于环境,以完成其计划 的一类系统。a g e n t 具有自治能力、社会能力、反应能力和自发行为能力: 自治能力:a g e n t 对自身的行为和状态有一定的控制权,能在没有用户 干预的情况下完成任务。 社会能力:a g e n t 具有通过某种方式和其它a g e n t 进行信息交换和协作的 能力1 3 】。 反应能力:a g e n t 能够监测自己的环境,对关心的环境变化做出反应, 并通过自身行动来改变环境。 自发行为能力:a g e n t 的行为具有主动性,它能感知周围环境的变化, 并为实现预定目标采取行动。 人工智能是计算机科学的一个分支,它的目标是构造能表现出一定智能行为 的智能体,因此,对智能体的研究是人工智能的核心问题。斯坦福大学计算机科 学系的b a r b a r ah a l e r s r o t h 在i j c a j 9 5 的特约报告中说到:“智能计算机a g e n t 既 是人工智能的最初目标,也是人工智能的最终日标” 4 1 。 安徽人学硕士毕业论文 基于畸形和角色的多a g e n t 协作研究和战术库的设计 1 1 2 多智能体系统( m a s ) 多智能体主要研究自主的智能体( a g e n t ) 之间智能行为的协调,为了一个共 同的全局目标,也可能是各自的不同目标,共享有关问题和求解方法的知识,协 作进行问题求解。 七十年代后期,随着计算机网络、计算机通信和并行程序设计技术的发展, 对分布式人工智能d a i ( d i s t r i b u t e da r t i f i c i a li n t e l l i g e n c e ) 的研究逐渐成为一个热 点,早期的研究主要是分布式问题求解,其目标是创建大粒度的协作群体,它们 之间共同工作以对某一问题进行求解;九十年代初,对多智能体系统m a s ( m u l t i a g e n ts y s t e m ) 的研究成为分布式人工智能的热点。虽然单个a g e n t 能够自主完成 一定的任务,但是对于一些复杂任务,如具有分布式数据和知识,或要求分布式 控制的系统,则需要采用多智能体系统。实际系统的分布性、复杂性和动态性有 望通过对单个个体能力的有效分工、协调和组织而达到系统整体优化的目的。 多智能体系统的关键问题是如何组织由多个智能体组成的群体,以及在群 体中如何实现智能体之间的协调合作。传统的机器人系统采用分层和集中的机 制,自上而下的制定决策陋1 。这种方式有以下缺点: 全局的路径规划工作量很大; 系统所能具有的机器人数量受限: 系统的容错性只能限定在一些小的范围。 分布式人工智能( d a i ) 和多智能体( m a s ) 克服了这种集中式系统的缺陷,提 供了一种分析、设计和实现大型复杂系统的方法。基于智能体的观点提供了一种 强有力的工具、技术和途径,提高了人们概念化和实现许多类型系统的能力。智 能体技术和方法正得到快速地发展,被广泛应用于各个领域。 1 1 3 多a g e n t 系统的特点 具有较强的问题求解能力:通过多个a g e n t 相互协作,多a g e n t 系统能够解决 单个a g e n t 不能解决的问题。 具有较强的计算能力:计算不只是在主机上进行,而是分布地发生在系统中 的所有a g e n t ,多个a g e n t 并行计算,加快求解速度,消除主机性能的瓶颈。 具有较强的灵活性:各a g e n t 既可以单独工作,又可以在需要时相互协作来 安徽大学硕士毕业论文第一章绪论 完成任务。 具有较好的可扩展性:每个a g e n t 具有独立性,可以动态地加入到已有的m a s 中,为系统带来新的问题求解能力,同时,在其任务完成后还可以动态地退 出系统,从而带来灵活的扩展性。 具有较强的可靠性:每个a g e n t 具有解决局部问题或完成局部任务的能力, 独立性较强,即使系统中的某个a g e n t 出现问题,其它具有相似功能的a g e n t 可代替它继续执行任务,对系统造成的影响较小,有助于提高系统的可靠性。 具有较强的适应性:简单灵活的a g e n t 与庞大的中央控制器相比,更容易适 应突发情况和动态变化的环境,既降低控制复杂性,又增加系统的灵活性。 1 1 4 人工智能的研究问题 过去的5 0 年中,人工智能研究的主要问题是“单主体静态可预测环境中的问 题求解川“,其标准问题是国际象棋人一机对抗赛,作为博弈的典型问题。人工 智能领域发展了搜索与产生式理论,成为发展人工智能的第一个里程碑。未来的 5 0 年中,人工智能的主要问题改为。多主体动态不可预测环境中的问题求解”, 其标准问题是足球的机一机对抗赛和人一机对抗赛。作为人工智能的标准问题,机 器人足球赛与国际象棋人机对抗赛所体现出的区别如表1 - 1 。 表1 1 国际机器人象棋对抗赛和机器人足球比赛的区别 t a b l e l - ld i f f e r e n c e sb e t w r o b o tc h e s sa n dr o b o c u p r o b o t c h e s s r o b o c u p e n v i r o n m e n ts t a t i c d v n a m i c s t a t ec h a n g e r u m t a k i n g r e a l t i m e s e n s o rr e a d i n g s s y m b o l i c n o n s y m b o l i c i n f o r m a t i o na c c e s s i b i l i t y c o m p l e t ei n c o m p l e t e c o n t r o lc e n t r a ld i s t r i b u t e d 1 2 机器人足球比赛( r o b o c u p ) 机器人足球世界杯( r o b o c u p ,r o b o tw o r l dc u p ) 是国际上一项为促进分布式 人工智能、智能机器人技术研究与发展而举行的大型比赛和学术活动。r o b o c u p 以多智能体系统和分布式人工智能为主要研究背景,其主要目的就是通过提供一 个标准的、易于评价的比赛仿真平台,检验各种智能机器人技术,促进多智能体 3 安徽人学硕士毕业论文 基于阵形和角色的多a g e n t 协作研究和战术库的设计 系统与分布式人工智能的研究与发展【”。 1 2 1r o b o c u p 的起源 r o b o c u p 最早的设想来自于加拿大不列颠哥伦比亚大学的a l a nm a c k w o r t h 在1 9 9 2 年发表的论文i o ns e e i n gr o b o t s ) 。同年1 0 月,在东京举行的关于人工智 能领域重大挑战的研讨会中,对机器人足球的构想做了一系列的调查,包括技术 可行性,社会影响力以及财政的可行性,而足球机器人和模拟系统的开发原型也 在这次研讨会上诞生了。 在一些学者的积极倡导( 如美国c m um a c m e l a m v e l o s o 教授等) ,以及s o n y 公司的全力支持下,r o b o c u p 世界联合会于1 9 9 6 年宣告成立,并于同年在日本举 行了表演赛,获得了很大成功。自1 9 9 7 年开始,r o b o c u p 每年组织机器人足球比 赛,包括仿真组,小型机器人组、中型组、四腿组、类人组等。 r o b o c u p 作为教育目标和应用领域相平行的一个研究挑战,被用来刺激公众 对机器人技术和人工智能的发展的兴趣。r o b o c u p 是继深蓝之后人工智能的又一 课题。r o b o c u p 致力于分布式解决方案,r o b o c u p 不使用传统的集中控制的方式 来完成功能,参加比赛的各个a g e n t 必, 须独立运行,所以它的研究不仅仅是人工 智能的传统领域,还包含了机器人技术、传感技术、机器学习、实时推理、多智 能体协作、实时任务控制等关键技术。 1 2 2r o b o c u p 的研究意义 机器人足球比赛中不但包含着多智能体系统要研究的全部内容,而且包含 的动态环境与实时性要求比一般系统更为苛刻,这主要表现在两个方面: 一方面,机器人足球比赛是几个机器人对另几个机器人对抗的分布式多机 器人系统,其中每个机器人是具有决策能力的智能体。 另一方面,在比赛过程中,每个球队不但能发挥个人技术,而且还能通过 合作策略体现集体协作。 机器人球队双方必须实时的了解本方和对方球员的位置的动态变化,根据 这一动态变化实时地对全而进攻或局部进攻或防守等问题进行决策。 因此,机器人足球比赛成为研究多智能体系统的典型问题,还成为检验对 抗双方多智能体协调策略优劣程度的标准试验平台。机器人足球比赛提出了更 安徽人学硕士毕业论文第一章绪论 高的要求,它将研究环境从静态环境发展到动态环境,并且将非实时知识处理 发展到实时处理,它将人工智能技术发展到新的境界,因此有人将机器人足球 比赛称为是发展人工智能的第一个里程碑【8 】。 另外,机器人足球比赛研究是培养信息和自动化科技人才的重要手段,同 时也是展示高科技进展的生动窗口和促进科技成果实用化和产业化的新途径。 1 2 3 仿真组s i m u l a t e dl e a g u e 。 r o b o c u p 仿真组基于被称为s o c c e rs e r v e r c l i e n t 的r o b o c u p 模拟器,可以用来 评价各种不同的理论、算法和体系结构。s o c c e rs e r v e r 由s e r v e r ,c l i e n t ,m o n i t o r 组成,下一章具体介绍s o c c e rs e r v e r 仿真环境。 随着机器人特别是智能多机器人的应用推广,机器人应用向人工智能及相 关领域提出了严峻的挑战,这些挑战包括: 如何在快速和高度动态的复杂环境中实现智能,简称实时的智能; 如何在多机器人快速对抗的环境中利用多个智能体的通力合作实现智 能和完成复杂任务,简称合作的智能; 如何在一个多机器人分组合作的、高实时性要求的环境下战胜一个同样 具有较高智能的对手,简称对抗的智能。 这些都是在设计一个优秀的足球机器人的策略系统之前所必须考虑的重要 问题。为了应对上述挑战,r o b o c u p 仿真组主要进行以下研究: 智能体及多智能体学习。包括在线学习和离线学习,以及底层技能学 习和高层策略学习。 智能体协作。研究如何协调多个智能体的行为,包括智能体的协作结 构,高层协作技能的设计。 智能体建模。为其它智能体的目标、规划、知识、能力或情感建模和 推理,包括在线追踪、在线策略识别、离线审阅等。 在研究过程中,无论是符号主义、联结主义和行为主义思想,集中控制和 分布控制结构,还是模糊逻辑、决策论、神经网络和进化算法,人工智能及相 关学科的各种思想,理论和方法都可以用来解决足球机器人的策略问题。 安融大学硕士毕业论文 基于阵形和角色的多a g e n t 协作研究和战术库的设计 1 3 论文组织 本文主要研究r o b o c u p l 土赛o o 多a g e n t 协作及战术策略系统的设计,各章节 主要内容安排如下: 第一章简要介绍了人工智能的基本概念,并简要回顾了r o b o c u p 机器 人足球比赛的发展历程,阐述了课题研究的意义。 第二章介绍r o b o c u p 的仿真比赛环境s o c c e rs e r v e r ,包括仿真模型、感 知模型等,并总结了比赛平台的特点。 第三章首先介绍了智能体的三种主体结构( 反思结构、慎思结构和混合 结构) ,并给出了基于层结构的主体结构设计,最后分析了球队的代码 结构和程序流程。 第四章先介绍多a g e n t 协作的领域知识,然后设计了基于阵形和角色的 多a g e n t 协作模型,引入了动态阵形、动态角色的概念,把阵形的动态 转换和角色的动态变换运用于多a g e n t 协作当中,最后给出了多a g e n t 冲突预防和解决的办法。 第五章简要分析了仿真比赛战术行为的特点,在此基础上,设计了球队 的战术库系统;利用战术的思想设计了球队的全局策略,并给出了部分 战术的具体实现;最后对实验比赛数据进行了分析。 第六章是全文的总结与展望。 安徽大学硕士毕业论文 第二章r o b o c u p 仿真环境 第二章r o b o c u p 仿真环境 r o b o c u p 仿真比赛提供了一个完全分布式控制、实时异步的多智能体环境, 通过这个平台,可以测试各种理论、算法和a g e n t 体系结构,以及研究多智能体 之间的合作和对抗问题。仿真比赛采用c l i e n t s e r v e r ( c s ) 方式,由r o b o c u p 联合 会提供标准的s e r v e r 系统r c s o c c e r s i m ( 8 版本之前称为s o c c e rs e r v e r ) ,参赛队编 写各自的客户端程序,模拟实际足球队员进行比赛【i 】。 仿真组比赛要求统一采用l i n u x 系统,比赛规则基本上与国际足球联合会的 比赛规则一致,目前的仿真组比赛环境基本上基于二维平面( 2 0 0 4 年,出现基于 s p a d e s 平台上的r o b o c u p3 ds e r v e r ) 。下面具体介绍r o b o c u p 仿真环境。 2 1s o c c e rs e r v e r s o c c e rs e r v e r 是整个r o b o c u p 仿真系统的核心,它是一个简洁的程序,对系 统的性能要求很低,可以运行在诸如s u n s 、s o l a r i s 、l i n u x 、w i n d o w s 等多种操作 系统上【1 0 l 。s o c c e r s e r v e r 提供了一个虚拟场地,对比赛双方的全部队员和足球的 移动进行仿真,按照1 0 0 m s 的周期运转,以离散的方式控制比赛的进程。 2 1 1s e r v e r s e r v e r 是比赛的模拟系统,负责计算足球比赛的各个对象的运动、碰撞等相 互作用,用规则控制比赛,并负责与各个c l i e n t 之间的通讯。比赛以c s 方式进行, s e r v e r 使用u d p i p 协议与c l i e n t 通讯。一只球队最多由1 1 个c l i e n t 组成,每个c l i e n t 都是独立的进程,通过给定的端口和s e r v e r 连接。 由c l i e n t 发送给s e r v e r 的信息如下: 球员初始化信息及结束信息、队名、版本号等: 比赛中的各种命令:如k i c k ,t u r n 等底层命令都是通过字符串的方式由 u d p i p 协议发送给服务器的。 而s e r v e r 发送给c l i e n t 的消息如下: 初始化信息:进攻方向、号码、服务器当前参数等; 球场状态:比赛状态、时间、比分; 各种感知信息:包括声音感知信息、视觉感知信息、自身感知信息、命 7 安徽大学硕十毕业论文 基于阵形和角色的多a g l 协作研究和战术库的设计 令执行状况等信息。 s e r v e r 发给c l i e n t 的信息也是以字符串的形式发送的。r o b o c u p 有一套完整的 信息解析方式。而c l i e n t 发给s e r v e r 的信息也必须是正确的格式,服务器才能正确 的根据命令的意图更新动作。由于u d p i p 协议是无序的且是不可靠的,所以作 为c l i e n t 必须有自动调整时钟周期并对信息进行时间排序的能力,同时,c l i e n t 应该具有自动调整时钟和服务器同步的能力。 2 1 2m o n i t o r m o n i t o r 是供观看或者调试比赛的可视化工具,将所有比赛的活动虚拟的显 示在模拟场地上,并通过屏幕观看。在m o n i t o r 中不但可以显示球场的信息如位 置、比分、号码、球队名等,还具有手工控制比赛状态的功能。m o n i t o r 与s e r v e r 的连接方式使用u d p i p 协议,因此一个s e r v e r 可以和很多m o n i t o r 相连。在s e r v e r 上进行比赛,m o n r o r 并不是必需的。 2 1 3l o g p l a y e r l o g p l a y e r 是- - 个比赛状态的记录工具,可以用来重放比赛。运行s e r v e r 时, 可以加上一些选项,s e r v e r 就会将比赛数据存储在硬盘上,在比赛后可以观看或 者为离线学习提供参考数据,这对进行球队的分析或者发现球队的强处和弱处是 很有用的。和录像球员差不多,l o g p l a y e r 也有开始p l a y ,停止s t o p ,快进f a s t f o r w a r d 和后退r e w i n d 按钮,而且l o g p l a y e r 也允许你跳到比赛的任一周期。 2 2 仿真模型 2 2 1 场地和对象模型 s o c c e rs e r v e r 是二维的仿真器,没有高度。其中包括2 4 个球员和一个球,还 有一些可看到的球场标记,如f l a g s 和s i d el i n e s ,如图2 一l 。 球员和球都是可移动的对象,在每个仿真周期t 内,每个对象都有自己的位 置( ,:) 、速度( 正,t ) 和方向( o ) a 每个球员都有6 8 0 1 0 5 0 3 6 0 。个位置。其中, 1 0 5 0 、6 8 0 分别表示球场的长度和宽度,3 6 0 。表示球员的方向。 安徽大学硕士毕业论文 第i 章r o b o c u p 仿真环境 仃l ( f b o y ( n o ) j 一 业1 ( f p i t ) 贬匿 引c , 一( f pi b l 2 2 2 运动模型 图2 - 1s o c c e rs e r v e r 模型 f i g u r e2 - is o c c e rs e r v e rm o d e l r o b o c u p 仿真真实的足球比赛,s e r v e r 通过对物理位移、碰撞的计算来模拟 足球比赛。系统中每个m o b i l e o b j e c t 都有自己的运动模型( m o v e m e n tm o d e l ) ,这 些物体在每个周期速度都会减少,而速度的增加则靠a g e n t 发出的命令如d a s h , k i c k 获得。速度每个周期的衰减量由服务器d e c a y 类参数决定。 a g e n t n 可使用k i c k ,d a s h 命令对球场上的物体的运动施加影响。a g e n t 在运 动时需要不停的使用c l a s h 命令保持自己的速度,而a g e n t 在带球时需要合理的安 排d a s h 和k i c k 命令发送的时间才能准确的带球。在r o b o c u p 中物体的运动按照如 下公式进行计算: ( h 1 ,h ) = ( t ,v t ,+ ,t ,口;) + ( 。) ( 口。,v ) = d e c a y + ( 砟1 ,“) ( p ,j 口) = ( ,p :) + ( v ,t + l ,v ) 代码1物体运动计算公式 其中( ,p :) 表示物体在周期t 时刻的位置,( t ,v :) 向量表示物体在周期t 时 刻的速度,而( ,口:) 向量表示物体在周期t 时刻的加速度,对于球的速度衰减使 f f b a l i _ d e c a y 参数,而对于球员则使用是p l a y e r d e e a y 参数。 k i c k 命令用于对球施加作用使其产生一个特定方向的加速度。k i c k 命令在被 a g e n t 发送到服务器后,如果此时a g e n t 不处于越位位置,且球在a g e n t 的触球范 围内,那么k i c k 命令会立即产牛效果。当球离a g e n t 懈超过b a j l s i z e + 9 安徽大学硕士毕业论文 基于阵形和角包的多a g e n t 协作研究和战术库的设计 p l a y e r s i z e + k i c k a b l em a r g i n 的时候,球被看作在a g e m 的触球范围内。 此时k i c k 命令对球产生的力量由以下公式计算: a c t _ p o w e r = p o w e r n - o 2 5 * d i r _ d i f f 1 8 0 - 0 2 5 * d i s t _ d i f f k i c k a b l em a r g i n ) 代码2k i c k 命令弼球作甩力的计算 其中,d i r d i 嘴球与球员的身体方向的夹角绝对值,d i s t _ d i 喘球与球员的 距离。f a c t _ p o w e r 对球所产成的加速度是: u :。d ) = a c t o w e r * k i c k _ p o w e r r a t e ( c o s ( e ) s i n 国) ) 代码3k i c k 命令产生加速度的计算 其中k i c k - p o w e r - r a t c 是服务器参数用于调整力量产生加速度的大小。o 是k i e k 命令所指定的踢球方向。 2 2 3 噪音模型 为了反映真实比赛中队员和足球运动的不确定性,仿真平台在队员和足球 的移动过程中加入了一定的噪声,干扰是以如下方式加入的: ( 。,1 ) = ( t ,e ) + ( ,) + ( r a n d ,r a n d ) r 码4 噪音因素 其中,r a n d 是p l a y 盯门n d 和b a l l _ l 彻d 的参数,属于 咖a kr m a x 之间的随机 数,服从均匀分布。r m a x 的定义为:r m a x = r a n d l ( t ,v :) l 。在仿真平台中还引 入了天气的干扰w i n dr a n d ,只是目前暂不考虑。 2 2 4 体力模型 每个球员都有自己的体力值。s o c c e rs e r v e r 通过限制球员的体力来阻止队员 始终以最大速度( p l a y e r _ s p e e d _ m a x ) 跑动。球员的体力模型包含三个方面: ( 1 ) s t a m i n a e o ,s t a m i n a m a x 表示球员的体力,限制t d a s h 命令的p o w e r 参数; ( 2 ) e f f o r t e f f o r tm i n ,1 o 表示球员体力的使用效率: ( 3 ) r e c o v e r y r e e o v e r y _ m i n ,1 0 控制体力的恢复速率。 在比赛过程中体力模型具体的计算方法为: ( 1 ) 当球员使用d a s h 命令时,他的p o w e r 参数要受至1 s t a m i n a f f f l e f f o r t 的影响: e f f e c t i v e _ d a s h _ p o w e r = m i n ( s t a m i n a ,p o w e r ) e f f o r t 安徽大学硕士毕业论文 第二章r o b o c u p 仿真环境 s t a m i n a2 s t a m i n a e f e c t i v e _ d a s h _ p o w e r 由上式可知,e f f o r t 的大小决定了s t a m i n a 中可以有效使用的部分。 ( 2 ) 在每个循环周期内,如果s t a m i n a k 乇于e f f o r td e ct h r ( e f f o r t d e c r e a s e t h r e s h o l d ,即体力减少的界限,是s o c c e rs e r v e r 规定的参数) 时,e f f o r t 减少;如果 s t a r a i n a 高于e f f o r ti n ct h r ( e f f o r ti n c r e a s e t h r e s h o l d ,即体力上升的界线) 时,e f o r t 增加。体力的使用效率正比于体力值的变化,计算公式如下: i f ( ( s t a m i n as e f f o r t _ d e c _ t h r s t a m i n am a x ) & & ( e f f o r t e f f o r t _ r a i n ) ) t h e ne f f o r t = e f f o r t e f f o r t _ d e c i f ( ( s t a m i n a2e f f o r ti n ct h r s t a m i n am a x ) & & ( e f f o r t 果s t a m i n a 低于阈值r e c o v e l d e c j h r 时,r e c o v e r y 减少。计算过程如下: i f ( s t a m i n a5 c o v e r d e c t h r s t a m i n a _ m a x ) & ( r e c o v e r y r e c o v e r _ m i n ) t h e nr e c o v e r y2 r e c o v e r y r e c o v e r d e c ( 4 ) 在每个循环周期内,s t a m i m a 会得到一定程度的恢复。恢复情况依 r e c o v e r y ( 也是s o c c e rs e r v e r 上规定的参数,目前在用的是3 5 ) 的当前值进行: s t a m i n a = s t a m i n a + r e c o v e r y s t a m i n a _ i n e i f ( s t a m i n a ) - s t a m i n am a x ) t h e ns t a m i n a = s t a m i n am a x 2 3 感知模型 r o b o c u p 的感知模型有三种:视觉感知模型、听觉感知模型、自身感知模型。 这三种感知模型是a g e n t 获取环境信息的手段,它为球员提供了一个很真实的球 场环境。下面简要介绍这三种感知模型。 2 3 1 视觉感知模型 视觉感知模型是三种感知模型中最复杂也最重要的,它是比赛的基础。视觉 信息( s e e _ m e s s a g e ) 像一个传感器,球员可以看到当前可视范围内的对象,也可 以“见到”在球员身后的附近对象。在每个s e n s e _ s t e p ( 1 5 0 m s ) 内,视觉信息被自 动发送到球员处。s e r v e r 发送以下的字符串表示视觉模型。 1 1 安徽大学硕士毕业论文 基于阵形和角色的多a g e m 协作研究和战术厍的设计 ( s e e _ m e s s a g e ) t i m e

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论