已阅读5页,还剩61页未读, 继续免费阅读
(计算机应用技术专业论文)robocup智能体的开发与应用.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
r 0 b o c u p 智能体的开发与应用 摘要 机器人足球比赛逐渐成为当前人工智能研究的热点之一,作为多a g e m 系统 的一种理想的试验平台,它涉及多个技术领域。目前r o b o c u 口机器人足球世界 杯是国际上规模最大且具有很大影响力的机器人足球赛事。本文基于a g e n t 的理 论基础设计并实现一只r o b o c u p 仿真机器人足球队。 设计一只r o b o c u p 仿真球队需要很多的工作要做,包括网络通讯程序的设 计、环境信息的解析工作、a g e n t 结构的设计、基本技能的训练、多个a g e n t 之 间的协作问题等。本文的重点主要几种在以下几个方面: a g e m 的模块化设计:本文运用面向对象软件工程的思想设计a g e m 。使 a g e m 具有很好的可扩展性。 通过对决策树学习方法的研究,本文提出了一种基于决策树学习的训练 方法,来对a g e m 的基本技能进行训练,使a g e n t 能根据当前场上状况 选取适当的行为方式。 本文设计了一种基于a + 算法的带球路径选择算法,可以有效的提高 a g e n t 对带球方向的选择能力。 介绍了反思结构和慎思结构的决策模型,并给出了相应的例子。在本文 设计的球队中守门员采用了反思结构,而其他队员则采用了更为复杂的 慎思结构。 提出了种局部的树状协作模式,实现了多个a 譬e n t 之间的有意识协作。 提高了球队的配合和对抗的能力。 设计了种在w i n d o w s 平台下基于时钟控制和多线程机制的任务控制 器,提高了a g e n t 的计算能力,为各种a g e n t 智能算法提供了时间预算 管理的功能。提高了a g e n t 运行的稳定性和效率。 关键词:a g e n t ,r o b o c u p ,面向对象软件工程,任务调度,决策树,a * 算 法,树状协作,多线程 摘要 a b s i r a c i t h er o b o ts o c c e rh a sb e e nb e c a m et h e s e a r c hc e n t e ro fm a n ya r t m c i a l i n t e l l i g e n c er e s e a r c h e r s a sai d e a lt e s t i n gp l a t f o r mo fm u i t i - a g e n ts y s t e m s ,i ti s i n v o l v e di nm a n yt e c h n i c a ld o m a i n s 。n o w ,r o b o c u pi st h em o s ti m p o r t a n tr o b o t s o c c e rg a m ei nt h ew o r l d t h ea u t h o rh a sd e s i g n e da n dl 屯a l i z e dar o b o c u p s i m u l a t i o nt e a mu n d e rw i n d o w sp l a t f o r mb a s e do nt h et h e o r yo fa g e n ta n d m u l t i a g e n ts y s t e m t h e r ea r em a n yc o n s j d e r a t i o ni nt h ep r o c 船so far o b o c u pt e a md e s i g n :t h e c o m m u n i c a t i o nt h r o u g hn e t w o r k ,m e s s a g ep a r s j n 昏t h ea r c h “e c t u r eo fa g e n t t h e t r a i n i n go fa g e n t ssk j l i s ,t h ec o l l a b o r a “o na m o n ga g e n t s ,e t c i nt h ep r o c e s sw e f o c u s e do u rm i n do nt h ef 0 i i o w i n ga s p e c t s : 户 t h em o d u l ed e s i g no fa g e n t :t h ea u t h o ru s eo b j e c to r i e n t e ds o f t w a r e e n g i n e e “n gt od e s i g naa g e n tp r o j e c t t h i sc a nm a k et h ee x p a n s i o no f a g e n tb e c o m ee a sy t h ea u t h o ri n t r o d u c e dan e wm e t h o db a s e do nd e c i s i o nt r e el e a r j n gt o t r a i n i n gaa g e n t ss - 【i l i m a k et h ea g e n tc a nc h o o s eab e t t e ra c t i o n a c c o r d i n gt os j t u a t i o no nt h en e l dw h e no u rm e t h o di sa p p l i e d t h ea u t h o rd e s i g nan e wm e t h o dt oe n h a n c et h e a b i l i t yo fd r i b b i eb a s e d o na l g o r i t h ma “ t h ea u t h o rd e s i g bt h eag o a l k e e p e ra 窑e n tb a s e do nr e a e t i v ea g e n t s y s t e ma n df o rt h eo t h e ra g e n t st h ea u t h o ru s et h ed e l i b r a t j v ea g e n t s y s t e mt od e s i g nt h e m t h ea u t h o ri n t r o d u c eal o c a ls t r a t e g yo fc o l l a b o r a t i o nb a s e do nt r e e c o o p e r a t i o n w h i c kr e a l i z e dt h ec o n s c i o u s l yc o a b o r a t i o no fa g e n t sa n d i m p r 0 v e dt h ec o o p e r a t i o na n dc o n f r o n t a t i o na b i l i t yo 九h et e a m t h ea u t h o rd e s i g na1 1 a s k m a n a g e rb a s e do nm u l t i t h r e a ds y s t e m t h e t a s k m a n a g e rc a nm a k ef u uu s eo fs y s t e mp e r f o r m a n c et oe n h a n c et h e a b i l i t ) ro fa g e n t r o b o c u p 智能体的开发与应用 k e y w o r da g e n t ,r o b o c u p ,0 0 ( o b j e c t o r i e n t e ds o f w a r ee n g i n e e r i n g ) , t a s k m 柚a g e e r , d e c i s i o nt r e e , a ,t r e ec o o p e 豫t i o n ,m u l t i t h r e a d 摘要 表格1 表格2 表格3 表格4 代码l 代码2 代码3 代码4 代码5 代码6 代码7 代码8 代码9 代码】o 代码1 l 代码1 2 代码1 3 代码1 4 代码1 5 代码1 6 代码1 7 代码1 8 插图目录 视角范围图 r o b o c u d 虚拟结构 a g e n t 的结构 世界模型模块的结构 网络模块结构 决策模块结构 底层动作模块的结构 任务控制模块的结构 穿越传球示意图 射门示意图 带球方向示意图 反应结构a g e n t 结构图 守门员比赛状态转移图 表格目录 服务器参数表 射门结果比较 射门结果比较( 有2 名后卫协防) 线程的时间预算及测试表一 代码目录 视觉信息格式 视觉信息计算公式 视角计算公式 距离计算公式 听觉信息格式一 物体运计算公式 k i c k 命令对球作用力的计算 k i c k 命令产生加速度的计算 熵计算公式一 d 3 算法 射门算法 消息的结构 配合信息结构 , 线程剖建函数结构 s e t t i m e r 函数结构 时钟调用函数 w i n d o w s 下时钟的实现 线程数据结构 l o 1 6 2 0 2 1 2 3 2 4 2 5 2 6 2 8 3 2 3 5 3 8 3 9 1 3 3 3 3 3 5 2 9 1 0 1 0 1 1 1 2 1 6 1 7 1 7 2 7 3 0 3 2 4 3 4 3 4 6 4 9 5 0 5 0 5 1 1 2 l 2 3 4 5 6 l 2 3 1 2 2 2 3 3 3 3 3 3 4 4 4 5 5 图图图图图图图图图图图图图 安徽大学硕士学位论文自评表 姓名余澄丹专业 l 计算机麻用 论文题目 r o b o c u p 智能体的开发与应刚 土要创新点 l 不义将寺刖流仃阴顿引擎阴砹卅万j 舌廷用剑r o b o c u p 的设计中。摊两j ,程序对 复杂计算的负载能力,提供了强大的以线程管理为基础的任务控制模式。使硬 件的讣算技能得到最大的发挥,为a g e n t 运用复杂的人工智能计算提供了基础 2 本文运j _ | ;j 面向对象的软件r 程方法设计r o b o c u p 程序,通过对整个项目的模块化 设计降低了开发的难度,使个人爱好者以及小的开发团队可以更方便的利用彼此的 开发成果 3 设计了儿种使用的技能算法,射门和传球的算法将球场状况做抽象后再利用决策树 进行计算人人提高了a g e n t 学习的效果 有待改进之处 首先a g e n t 整体的开发尚不完善,世界模型的精度以及对噪声的处理有待改进。使 刚帧引擎的方法设计的程序,如果在圊一台机器上运行很多个会产生性能上的抖动。 与论文内容相关的已经发表文章 杂志名称、发表卷期、年文章题目 内容论文相关章节 份、页码 微机发展( 已录用)基了二p 2 p 协议的 多a g e n t 协作的利用 第一章,第六章 文件服务器技术 p 2 p 协议的主动文件 传输系统 微机发展,2 0 0 4 ,1 2 : 时间规划问题中 1 3 9 1 4 ir 时刻表及其在 实际中的应用 驴7 6 5 6 3 3 也 安徽大学学位归档村蚪之血 独创性申明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的 研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含 其他人已经发表或撰写过的研究成果,也不包含为获得1 刍未出萼或其他教 育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任 何贡献均已在论文中作了明确的说明并表示谢意。 学位论文作者签名:拿篁丹 签字日期:三一o r 年 月字日 学位论文版权使用授权书 本学位论文作者完全了解揣礴有关保留、使用学位论文的规定 有权保留并向国 和借阅。本人授 、 或机构送交论文的复印件和磁盘,允许论文被查阅 盘萼可以将学位论文的全部或部分内容编入有关数据 库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文储签争擘滢埙 签字日期:2 0 0 年r 月7 了日 学位论文作者毕逃去向 工作姚僧足 通讯地址: 新签名:象籀 签字日期:r 沙睁厂月9 日 电话 邮编 一砝 家汉, 序论 第一章序论 1 1 智能a g e n t 以及多智能a g e n t 与r o b o c u p 1 1 1 智能a g e n t 智能a g e n t 是指一种处于一定环境下的计算机系统,为了具体的目的而设计, 能在指定环境下灵活的自主活动。a g e n t 应该具有自治性、社会能力、反应能力 和自发行为能力: 自治性是指a g e m 对自身的行为和状态有一定的控制权。 社会能力指和其他a g e n t 通过某种方式有信息交互的能力和协作的能力 g e n e s 一9 4 】。 反应能力是指a g e m 能感知环境并通过自身行动来改变环境。 自发行为是指a g e n t 的行为是主动的,它可以感知周围环境的变化,并 为实现预定目标采取行动。 综上所述a g e m 具有“人”的部分特性。a g e n t 是人的智能的对应物,因而 它理所当然的成为人工智能的重要研究对象 s 0 1 。斯坦福大学计算机科学系 的b a r b a r a h a y e r s r o t h 在i j c a l l 9 5 的特约报告中说到:“智能计算机a g e n t 既是 人工智能的最初目标,也是人工智能的最终目标”【 l 钳e s 9 5 。 11 2 多智能a g e n t 多智能a g e n t ,m a s ( m u l t i - a g e n ts y s t e m ) 则是对“社会”、“团体”等人类 概念的一种模拟。单个的a g e n t 可以在指定的环境中完成一些任务,但a g e n t 之间按照一定的协议协作完成更加复杂的工作更有实际意义。对于m a s 目前主 要分为两个层次,一个是关于m a s 及a g e n t 的基础理论。另外一个则是关于 m a s 的体系结构、描述语言、通信互动方式等。 多智能体系统的关键问题是如何组织由多个智能体组成的群体,以及在群体 中如何实现智能体之间的协调合作问题。传统的机器人系统采用的是分层和集 r o b o c u p 智能体的开发与应用 中的机制,自上而下的制定决策。这种方式由以下的缺点: ( 1 ) 全局的路径规划工作量很大; ( 2 1 系统所能具有的机器人数量受限; ( 3 ) 系统的容错性只能限定在一些小的范围。 在8 0 年代末,受分布式人工智能系统研究的启发,一些学者提出了分散化 和分布式的多机器人系统合作组织策略、方法和协调机制,这些研究后来成为 “协作机器人学”。其中基于多智能体概念的多机器人系统逐渐成为研究的热点 和方向。分布式人工智能p d ) 和多智能体( m a s ) 克服了集中式系统的缺陷,提 供了一种分析、设计和实现大型复杂系统的方法。基于智能体的观点提供了一 种强有力的工具、技术和途径来提高人们概念化和实现许多类型系统的能力。 智能体技术和方法正在被应用于各个广阔领域。 1 2 机器人足球比赛 r o b o c u p ( r o b o tw 吲dc u p ) ,即机器人世界杯足球锦标赛是国际上一项为提 高相关领域科研水平而举行的大型比赛和学术活动,通过一个标准任务来促进 分布式人工智能、智能机器人技术及其他相关领域的研究。 r o b o c u p 最早的设想来自于加拿大不列颠哥伦比亚大学的m a n m a c k w o n h 在 1 9 9 2 年发表的论文o ns e e i n gr o b o t s 。同年l o 月,日本的研究人员在东京组 织了关于人工智能重大挑战的研讨会。在这个研讨会上他们对机器人足球的构 想做了一系列的调查,包括技术可行性,社会影响力以及财政的可行性。而足 球机器人和模拟系统的开发原型也在这次研讨会上诞生了。 1 9 9 3 年6 月,浅田埝( m i n o m 心a d a ) ,y a s u ok u n i v o s h i 和北野宏明( h i m a k i k i t a n o ) 在内的一些研究者决定创办一项机器人足球比赛,定名为r o b o c u 口j 联 盟。不过后来由于非日本的研究人员的要求,这项比赛被定名为机器人足球世 界杯,简称r o b o c u p 。 r o b o c u p 作为教育目标和应用领域相平行的一个研究挑战,也被用来刺激公 众对机器人技术和人工智能的发展的兴趣。r o b o c u 口是继深蓝之后人工智能的 又一课题。r 0 b o c u p 致力于分布式解决方案,r o b o c u p 不使用传统的集中控制 序论 的方式来完成功能,参加比赛的各个a 2 e n t 必须独立运行,所以它的研究不仅仅 是人工智能的传统领域,还包含了机器人技术、传感技术、机器学习、实时推 理、多智能体合作和协作、实时任务控制等关键技术。 自1 9 9 7 年开始r o b o c u p 每年组织机器人足球比赛,包括仿真组,小型机器 人组、中型组比赛等。r 0 b o c u p 显示了巨大的活力,许多大学的研究机构纷纷 积极行动起来参加r o b o c u p 的主要活动。 r d b o c u d 的主要活动包括: 机器人足球世界杯赛 学术会议 机器人足球挑战赛 教育计划 基础组织发展 r o b o c u p 选择了足球比赛作为基本的领域,组织了r o b o c u p 机器人足球世 界杯赛及学术会议。为了能让一个机器人球队能真正的进行足球比赛,必须集 成各种各样的技术,包括自主智能体的设计、多智能体合作、策略获取、实时 推理、机器人学以及传感器技术等。对于一个在变化环境中快速运动的机器人 球队来说,r o b o c u p 是一项在动态环境下的多任务系统。对于的软件方面, r 0 b o c u p 提供了一个虚拟的环境平台以便于研究。 1 2 1r o b o c u p 仿真比赛的历史 1 9 9 7 年在日本大阪举行了第一届r 0 b o c u p 比赛( p r e r o b o c u p 9 6 o s a k a ,j 印a n ) ,有来自9 个国家的4 2 支球队参加了比赛。比赛项目包括仿真组、 小型组、中型组和表演赛。超过5 0 0 0 名观众观看了这次比赛。 9 8 年在巴黎举办了第二届r o b o c u p 比赛( r o b o c u p 9 8p 碰s ,f r a n c e ) ,这次 比赛由于和世界杯同年同地举行因此获得了很大关注,一共有8 1 支球队参加了 比赛。 第三届r o b o c u p 比赛在瑞典的斯德哥尔摩举行举行( r o b o c u p 9 9 ) ,这次比 赛新增了s o n y 四腿的比赛项目。共有9 0 多支球队参加。 r o b 。c u p 智能体的开芨与应用 2 0 0 0 年在墨尔本的第四届r 。b o c u p 比赛中,来自中国科技大学的蓝鹰队获 得了仿真组第九名和s o n y 四腿第九名的好成绩。 在2 0 0 1 年和2 0 0 2 年的r o b o c u p 比赛中,比赛的规模和观众的人数大大增 加。令人鼓舞的是来自清华大学的风神队连续获得了两届的冠军。不过2 0 0 3 年 清华的风神队惜败与荷兰阿姆斯特丹大学的u 、,at m e a r n 球队屈居亚军。 1 2 2 仿真组s i m u l a t e dl e a g u e r o b o c u p 仿真组是基于被称为s o c c e rs e e r c l i e n t 的r o b o c u p 模拟器。该系 统由s e n ,e l c i i e n t ,m o 血o r 组成。m o n i t o r 的作用是将所有活动虚拟的显示在模拟 场地上,并可以通过屏幕观看。同时这种模式还掺杂着实时指令和半结构化的 状态来协调比赛的进行。s o c c e rs e e r 的大优点是其抽象性。这种特性可以让 研究者抛开机器人硬件的技术而专著于对a g e n t 智能、协作的研究。仿真系统的 抽象性可以让研究人员从解决实现机器人各种功能的难题中解放出来,而专心 致力于机器人互动和机器学习这些高层次的领域。 s o c c e rs e r v e r 提供了一个挑战性的复杂环境。这个环境需要一名机器裁判用 来判断例如进球、出界等简单的情况。s o c c e rs e r v e r 还需要一名人类的裁判以保 证球队不使用系统的漏洞进行比赛,以及处理比赛中所出现的死锁等问题。 仿真组主要进行智能体的各种研究,主要包括: ( 1 ) 智能体及多智能体学习。包括在线学习和离线学习,以及底层技能的学 习。 ( 2 ) 智能体协作。研究如何协调多个智能体的行为,包括智能体的协作结构, 高层协作技能的设计。 f 3 ) 智能体建模。 r o b o c u p 仿真系统以c l i e n t s e r 、,e r 方式运行,s e e r 与c l i e n t 通过u 】) p i p 协议连接,c l i e m 通过发送字符串形式的指令控制球员的行动,而s e r v e f 通过发 送字符形式的信息向c l i e n t 提供场上情况的信息。每个c l i e m 模块只允许控制一 名球员,c l i e n t 与c 1 i e m 之间不允许直接通讯。r o b o c u p 仿真组比赛提供了一个 对实时、不确定、协作等环境下对智能体系统进行研究的载体。 序论 一般来说a g e m 必须具有一下的属性: ( 1 ) 自治性:a g e n t 能在没有用户干预的情况下完成大部分任务,并对其行 为和内部状态进行调控。a g e n t 具有时间上的连续性以及显示或者隐式 的任务目标。 ( 2 ) 记忆和推理能力:a g e m 应该能够根据环境的有限信息进行推理和记忆, 以维护一个相对完整的世界模型。 ( 3 ) 协作性:a g e n t 应该具有和其它a g e n t 交换信息,并进行协作的能力。 应急性和主动性:a g e n t 应该能够监测自己的环境,对关心的环境变化作出 反应。 1 ,2 3r o b o c u p 仿真比赛系统结构简介 首先,比赛以c l i e n t s e r v 盯方式进行。s o c c e rs e r v e r 提供了一个虚拟场地, c l i e n t 是场上比赛球员的大脑,通过发送命令指挥其运动。 其次s e r v e r 中的声音感知系统是c l i e m 之间通讯的唯一手段,任何c l i e n t 之 间的私下通讯都被视为作弊。 r 0 b o c u p 仿真比赛对系统的要求是开放式的,只要系统支持u d p 口协议即 可。 在正式比赛中s o c c e rs e r v e r 包含两个程序:用于模拟球场环境和比赛进程的 s o c c e r s e r v 盯以及用于观看比赛的s o c c e 珊o n i t o r ,一个s o c c e r s e r v e r 可以连接多 个s o c c e m o n i t o r 。 l _ 3 论文组织 ( 4 ) 本文以开发一个完整可靠的r d b o c u p 系统为背景,在相关章节突出智能 体计算与系统实现的一些属性。 本文以下各个章节主要内容如下: 第二章介绍的是s o c c e r s e e r 的仿真环境,其中介绍了r o b o c u p 仿真比 赛的s o c c e r s e n ,e r 仿真环境。主要包括仿真物体模型、感知模型等。并 总结了其特点。 r o b o c u p 智能体的开发与应用 第三章按照面向对象软件工程的方法设计了a g e m 的整体框架以及整体 框架中各个模块的结构,并叙述了各个模块的功能。 第四章介绍了几种底层技能的设计。设计了使用决策树的方法设计了穿 越传球的算法,该算法可以用在射门、传身后球等多个技能上。还提出 并实现了了将带球方向离散化后使用a + 算法进行带球路径选择的算法。 第五章介绍了反思结构和慎思结构的特点,并给出了基于反思结构的守 门员的设计。 第六章介绍了a g e m 之间的树型协作方式。并用树型协作模式实现了配 合模型。 第七章首先介绍了w i n d o w s 的多线程机制,然后介绍了w i n d o w s 下时 钟控制器的设计,最后提出并设计了a g e m 所使用的基于多线程机制和 时钟控制的任务控制器,实现了在、斫n d o w s 平台下的时间预算功能的和 多线程调度功能。 第八章是全文的总结与展望。 1 4 本章结束语 本章简要介绍了r o b o c u p 的概念,对r o b o c u p 的起源及其历史做了简要介 绍。并介绍了论文所要讨论的各个方面以及和论文各个章节的组织。 r o b o c u p 系统简介 第二章r o b o c u p 系统简介 r 0 b o c u ps o c c e rs e e r 是足球仿真系统。它模拟真实的足球比赛,使用客户 端服务器模式为多个智能体提供比赛服务。s e e r 的由球场仿真、裁判模块、 消息模块组成。其中球场仿真负责模拟球场上对象的运动、检测碰撞。裁判模 块则根据规则来控制比赛。消息模块负责c 1 i e m 之间的通信限0 b o c u p 】。 s o c c e rs e r v e r 允许使用任何语言、平台开发的a g e m 进行比赛。不论是 w i n d o w s ,u n i x 平台,甚至不是p c 而是一部手机只要支持u d p 邛协议,理论 上都可以运行a g e n t 参加比赛。 2 1 系统预览 r o b o c u p 仿真系统由3 个主要部分组成:s e r v e r 、m o n i t o r 、l o g p l a y 盯。仿真 比赛系统按照c s ( c i i e 州s e r v e r ) 结构设计。下面分别介绍s e e r ,m o n i t o r , l o g p l a y e r 的主要功能 2 11s e r v e r s e e r 是比赛的模拟系统,它负责计算足球比赛的各个对象的运动、碰撞等 相互作用,用规则控制比赛,并负责与各个c l i e n t 之间的通讯。s e n ,e r 使用u d p p 协议与c l i e n t 通讯。一只球队最多由1 1 个c 1 i e n t 组成,只要球队名( t e a mn a m e ) 相同不管这些c l i e n t 的口地址和物理位置是什么都也不管使用的程序是什么都 在比赛中被看作一只球队。 由c l i e m 发送给s e e r 的信息如下: 球员初始化信息及结束信息、队名、版本号等,以及在退出时发出b v e 信息。 比赛中的各种命令:如k i c k ,t u r n 等底层命令都是通过字符串的方式由 u d p 坤协议发送给服务器的。 而s e r v e r 则将以下信息发送给c i i e n t : 初始化信息:进攻方向、号码、服务器当前参数等。 7 r o b o c u p 智能体的开发与应用 球场状态:比赛状态、时间、比分。 各种感知信心:包括声音感知信息、视觉感知信息、其他的如体力、命 令执行状况、等信息。 s e r v e r 发给c 1 i e n t 的信息也是以字符串的形式发送的。r o b o c u p 有一套完整 的信息解析方式。丽c l i e m 发给s e r v e r 的信息也必须是正确的格式,服务器才 能正确的根据命令的意图更新动作。 由于u d p d 协议是无序的且是不可靠的,所以作为c l i e n t 必须有自动调整 时钟周期并对信息进行时间排序的能力。同时c l i e m 应该具有自动调整时钟和服 务器同步的能力。 2 1 2m o n i t o r m o n i t o r 就是供观看或者调试比赛的可视化工具,一个完备的m o i l i t o r 应该 不但可以显示球场的信息如位置、比分、号码、球队名等,还应该具有手工控 制比赛状态的功能。m o n i t o f 与s e e r 的连接方式也是使用u d p i p 协议,因此 一个s e r v e r 可以和很多m o l l i t o r 相连。 2 1 3l o g p l a y e r l o g p l a y e r 是一个比赛状态的记录工具,可以用来重放比赛。s e n ,e r 在比赛时 可以将比赛数据记录在硬盘上,在比赛后可以观看或者为离线学习提供参考数 据。 2 2 感知模型 r o b o c u p 的感知模型有三种:视觉感知模型、听觉感知模型、自身感知模型。 这三种模型是a g e m 获取环境信息的手段。下面简要介绍这三种模型 r o b o c u p 。 r o b o c u 口系统简介 2 2 1 视觉感知模型 视觉感知模型是3 种感知模型中最复杂也是最重要的,它是比赛的基础。 s e r v e f 发送以下的字符串表示视觉模型。 代码1 视觉信息格式 o b j i n f o 指明了看到的物体的种类、距离、角度、速度变化、角度变化,如果 该物体是一个其他a g e n t 则有可能还指明该a g e n t 的身体方向和视角方向。其中 o b j n e 用来说明物体类型,d i s t c e 说明该物体和观察者的距离,d i r e c t i 。n 说明 该物体和观察者的角度,d i s t c h a n g e 说明该物体和观察者之间的距离变化, d i r c h a n g e 说明该物体相对于观察者的方向变化,如果物体是一名队员那么 h e a d f a c e d i r 、b 0 d y f a c e d i r 、t e n e 、u n i f o n u m b e r 分别说明这名队员的脖子方向、 身体方向、队名和号码。 a g e n t 在收到视觉信息后需要对该字符串进行解析,根据看到的f l a g 计算自 己的坐标、身体方向和视角方向。由于n o i s e 的存在加上u d p 协议是不可靠的, 所以不应该在a g e n t 本地根据发出的转向和转头的命令计算自己的身体以及头 的角度,而应该每个周期在得到视觉信息后动态计算这些基本参数。 对于视觉感知模型r o b o c u p 系统还给出了很多限制,首先是v i e w a n g l e 和 v i 一d i s t a n c e 的限制,如图2 1 所示: 篙怒 砉 删 n d=气“m且 谬 仙一一 川岫。一 一一一一一一一一一一一一 r 。b o c u p 智能体的开芨与应用 卜一乱l ( 1 - l n 彗h 卜 图2 1 视角范围图 a g e m 在服务器所能获得的视觉信息与角度和距离都有关系。首先只有在 v i e w a n g l e 内的物体才能被看见。其次在、r i e w _ a n g i e 内的物体根据距离的远近信息 的详细程度也不一样。a g e n t 可以调节自己的视角方式在更大的视角和更远的距 离之间做动态的取舍,以获得最详细的信息。 r o b o c u p 有多种视角方式,球员的视觉属性依赖于几个因素。首先是s e r v e r 的参数s e n s e - s t e p v i s i b l e _ a n g l e ,它们决定了视觉信息的时间间隔,以及正常视角 的角度。球员通过v i e w w i d t h 和、,i e w q u a i i t y 也可以改变视觉信息的频率和质量。 v i e 吐f r e q u e n c y 由下面的等式计算: v i e w f r e q u e n c y :s e n s e s t e p 丰v l e w q u a l i t y f a c t 。r 宰v i e * 一w i d t h f a c t 。r 代码2 视觉信息计算公式 如果v i e w q u a i i t y 是h i 曲,那么v i e w - q 眦t y f a c t o r 等于1 ;如果v j e w q u a i i t y 是 l o w ,那么v i e w _ q u a l i t y _ f a c l o r 等于o5 如果、,i e h t w i d t h 是n a r r o w ,那么 v i e w - - w i d t h - f a c t o r 等于2 ;如果e w w i d t h 是n o r m a l ,那么v i e w _ w i d t h - f a c t o r 等于1 , 如果e w d t h 是w i d e ,那么就等于05 。也就是说视觉信息的质量越高,视角 就越小而发送时间间隔也会越大。a g e m 需要自己根据需要在质量和时间以及角 度上做权衡。、,i e w a l i g l e 由下面的公式计算而成: v i e w a 一e = v j s i b l e a n 毋e + v i e l i d t b f a c t o r 代码3 视角计算公式 r o b o c u p 系统简介 也就是说如果v i e w - w i d t b f a c t o r 是o ,5 此时视角最小只能看到正常视角一半的 角度,而如果v i e ”l w i d t h _ f a c t o r 为w i d e 那么球员能看到的角度就是正常情况的2 倍。 除了角度限制之外,a g e m 感知视觉信息还受距离的限制。只有距离在 v i s j b l e - d i s t a n c e 之内的物体才能被看到。而且能够被看到的物体a g e n t 所获得的 视觉信息也和距离有很大的关系。例如对于一名球员,在近距离a g e n t 可以看到 它的所属球队、号码,而随着距离的增加号码就看不清楚了,而如果距离很远 那么连球队也无法辨认了。服务器参数u n u i r i _ f a r _ l e n g t h 、u n u m t 0 0 _ f a r _ l e n 昏h 、 t e a m _ f a r _ l e n g t h 、t e a m j o o _ f a r - i e n g t h 四个参数决定对于一名球员其视觉信息的详 细程度。 如果距离d i s t j 、于u n u i n _ f a l k n g t h 那么球员的号码和球队名称都可见。 如果距离d i s t 界于u n u m _ f a r _ l e n 群h 和u n u h l - t o 虻f a r _ l e 垂h 之间,那么队名可 见而号码可见的概率按照从u n u m _ 触j e n 嚣h 到u n u i _ t 0 0 _ f a r _ l e 班h 线性减少,最 大为l ,最小为o 。 如果距离d i s t 大于u n u f n j o o - f a r h j e n 簪h 那么号码肯定不可见。 如果距离d i s t 界于t e a m f a r _ i g t b 和t e a m j 0 0 - f a r _ i e n g t h 之间,那么队名不可 见的概率也是按照从t e a m f a r _ l e d g t h 到t e a n o o o _ f a e n g t h 线性减少。 如果距离d i s t 大于t e 枷- t o o - f a r - i e n g t h 那么队名也不可见了。 在视觉模型中还引入了噪声,s e f v e r 所发送给a g e m 的信息并不是准确的, 这些信息都被经过了量化的处理。实际发送给a g e n t 的距离d 是按照以下公式 计算的: d 、= q u t i z e ( e x p q u a n t i z e ( 1 0 9 ( d ) ) ,q u a n t i z e _ s t e p ) ) ,0 1 ) q u a n t i z e ( v ,q ) ;c e i l i n g ( v q ) o 代码4 距离计算公式 a g e n t 是无法得到远处物体的精确位置的。而a g e n t 又是根据视觉信息来判 断自己在场上位置的。由于a g e m 可以同时看到很多个n a g ,所以我们在设计 a g e n t 时采用了近处和远处各取2 各点计算自身坐标的方法计算自身的位置。 r o b 。c u p 智能体的开技与应用 2 2 2 听觉模型 相对视觉模型听觉模型比较简单。不过听觉模型中裁判发出的信息却非常重 要。是变更比赛状态的根据,听觉信息的格式如下: ( h e a rt i m es e n d e r “m e s s a g e ”) 代码s 听觉信息格式 其中啊m e 指的是当前时间,也就是服务器周期。 s e n t i e r 指谁发出了这个信息可以是s e l f 、r e f e r e e ( 裁判) 、 0 1 1 l i n e _ c o a c h j e 蹦g h t ( 在线教练) 。 m e s s a g e 是消息的内容。 队员每个周期所能听到的信息数是受限制的。当球员的听力大于等于 h e a rd e c a y 时,该球员才会听到一条消息。当球员听到一条消息后,听觉能力以 h e a r - d e c a y 下降。而每个周期球员的听觉能力又会增加h e a r - i n c 。听觉能力的最 大值时h e a u n h 。两只球队的听力系统是分开的也就是说你的a g e n t 听不到对手 在说什么。 服务器参数a u d c u td i s t 代表的是听力所能到达的范围,只有在这个范围之 内的a g e m 才能听到信息,不过裁判发出的声音是可以被场上所有a g e n t 听到的。 223 感知模型 r o b o c u p 服务器每隔s c n s 乞b o d 删e p 的时间会向球员发送感知信息,让球员 了解自身状况。由于在r o b o c u p 系统中球员发出的命令是无反馈的,所以a g e n t 发出指令后无法知道这条指令有没有执行。通过感知模型,a g e n t 可以了解自身 状况从而做可行的决策。感知模型可以为a g e m 提供如下信息: 夺当前时间:( s e n s e - b o d yt i m e ) 夺视角模式:( v i e w 二m o d e 、,i 朗q u a i t yv i e w w i d t h 夺 体力及精神力状况:( s 衄m i as t m i n ne 胁n ) 夺速度向量信息:( s p e e da m o n t o f s p e e db i m c t i o f s p e e d ) 夺 视角角度:( h e a d - 柚g l eh e a d d i r e c t i o n ) 夺触球动作数目:( 1 i c k c k c o u n t ) 1 2 r o b o c u p 系统简介 夺加速次数:( d a s bd a s h c o u n t ) 夺转向次数:( t u r nt u r n c o u n t ) 夺发声次数:( s a ys a y c o u n t ) 夺 转动视角次数:( t u r n - n e c kt u r n n e c k c o u n t ) 夺 守门员抓球的次数:( c a t c hc a t c h c o u n t ) 夺移动次数;( m o v em o v e c o u n t ) 夺 视角转换次数:( c h a n g e _ - v i e wc h a n g e v i e w c o u n t ) 服务器为a g e n t 提供以上信息供a g e m 根据自身当前状况做决策。此外服务 器还在初始化时为a g e n t 提供了r - o b o c u p 虚拟世界的各种参数,只有将这些参 数与感知信息结合起来才能组成完整的世界模型。服务器参数列表如下: 表格l 服务器参数表 参数名称默认解释 值 g o a lw i d t h 73 2 f球门宽度 p l a v e rs i z 8 1o f 球员的半径 p l a y e r d e c a y o5 f 球员每周期的速度衰减 p l a v e rr a n d o1 f 移动噪声数据 p 1 a y e r w e i g h t 6 00 f球员重量 p 1 a y e r s p e e d m a x 3 2o f球员最大速度 s t a m i n am a x2 5 0 0球员最大体力 s t a m i n a i n c m a x 2 0 o f球员在一个仿真周期内可以获得的体力总量 r e c o v e rd e ct h r0 3 f球员可以恢复体力的闻值 r e c o v e rd e c0 0 5 f球员可恢复体力的下降值 r e c o v e rm i n 01 f 可恢复体力的最小值 e f f o r td
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 包装工创新实践能力考核试卷含答案
- 真空电子器件金属零件制造工诚信竞赛考核试卷含答案
- 锅炉设备装配工岗前个人防护考核试卷含答案
- 燃气轮机值班员创新应用模拟考核试卷含答案
- 重冶固体物料配料工安全文化模拟考核试卷含答案
- 海水捕捞工8S执行考核试卷含答案
- 中药质检员安全宣教能力考核试卷含答案
- 养蜂员安全生产规范测试考核试卷含答案
- 2024年襄樊市直属机关遴选公务员笔试真题汇编附答案
- 2025年三明医学科技职业学院辅导员招聘考试真题汇编附答案
- 《造血干细胞移植护理指南》课件
- 2025承揽加工订做合同范本
- 托幼机构传染病应急处置预案
- 合欢花苷类对泌尿系感染的抗菌作用
- 汕头市金平区2025届九年级数学第一学期期末检测试题含解析
- 2023年司法鉴定所党支部年终总结
- 肿瘤生物学1(完整版)
- cie1931年标准色度观测者的光谱色品坐标
- 2023-2024学年广东省广州市小学数学二年级上册期末自我评估试题
- YS/T 971-2014钛镍形状记忆合金丝材
- 方小丹建筑地基基础设计的若干问题课件
评论
0/150
提交评论