(计算机应用技术专业论文)多主体仿真系统的战术库设计.pdf_第1页
(计算机应用技术专业论文)多主体仿真系统的战术库设计.pdf_第2页
(计算机应用技术专业论文)多主体仿真系统的战术库设计.pdf_第3页
(计算机应用技术专业论文)多主体仿真系统的战术库设计.pdf_第4页
(计算机应用技术专业论文)多主体仿真系统的战术库设计.pdf_第5页
已阅读5页,还剩60页未读 继续免费阅读

(计算机应用技术专业论文)多主体仿真系统的战术库设计.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 l 目阿人工 拍 伪会组彭:的机器人世界十7 ( r o h o ( u p ft h er o h ( - t i f o r i d ( u p s o c c e r g a m e s a n d ( b n f e r e n c e s ) 仿真比赛系统,是人工智能和机器人研究的一种 集中表现,它的仿真比赛融合了决策与对策、神经网络、人工生命与智能控制等 学科内容,是研究多智能体的一个很好的平台。 返m 沦父首九介? 口了多 l 能体系统,同时四顷了机器人足球世界柯p 以,f 赛 事,随后又给出了其仿真系统及其主要模型。而本论文的研究主要都建立在 u v a t r i l e a r n _ 2 0 0 3 的基础上,除了对其结果的诸多改善外,我们做的主要工作如 下; 给出t a g e n t 具体的组织结构; 针对w i n g l e t 2 0 0 5 的特点设计t a g e n t 的详细流程; 借用丑尸算法的思想设计了一种新的传球策略; 给出了决策树在不同角色下的具体的实现; 提出了一种具体的4 胪消减算法,并在其基础上实现非通讯多爿肼之 1 日j 的协作; ,设计了一个完整的战术库,并给出了战术库的具体实现。 本文所完成的工作,都在聊喇口酊仿真球队中进行了实现,并对其进行相 应的实验,同时证明了相关方法的可行性和有效性。 最后还对当前的工作做了简单的总结,并展望了将束的工作。希望能够给类 似的研究和工作提供一定的参考。 关键词:机器人足球,流程图,传球策略,决策树,非通讯,协作,战术库 a bs t r a c t r o b o ( 即( t h er o b o t ,。埘( 1 妒c c e l g c i m e , a n dc o n f e r e n c e * ) s i m u l a t i o n g a m es y s t e mi sag o o ds a m p l eo f t h er e s e a r c ho f a r u f i c i a li m e l h g e n c ea n dr o b o t t h e s i m u l a t i o ng a m ei n c l u d e ss u c hc o n t e n t sa sd e c i s i o n m a k i n g 、n e u r a ln e t w o r ka n d i n t e l l i g e n tc o n t r 0 1 i ti sag o o dr e s e a r c hp l a t f o r mf o rt h er e s e a r c ho f 。纠sa n dh a s a r o u s e dt h ee n t h u s i a s mo fm a n 3 7p e o p l e a f t e rp r e s e n t i n gt h ec o n c e p to fm u l t i - a g e n ts y s t e ma n dt h eb a c k g r o u n do f r o b o c u p ,t h i sp a p e ri n t r o d u c e ss o c c e rs e r v e ra n ds o m ei m p o r t a n tm o d e l si nd e t a i l i n a d d i t i o nt om u c hi m p r o v e m e n tb a s e do nt h eu v a t r i l e a r n _ 2 0 0 3 ,t h em a i nc o n t e n t s a n dr e l a t e do r i g i n a la c h i e v e m e n to f t h i sp a p e ra r ea sf o l l o w : t h i sp a p e rp r e s e n t st h ef r a m e w o r ko fa g e n ti nd e t a i l ; t h ef l o wo f a g e n ti sd e v e l o p e di nw i n g l e t 2 0 0 5 ; an e w s t r a t e g yo f p a s si si n t r o d u c e db a s e do nb pa l g o r i t h m ; d i f f e r e n tr o l e so f d e c i s i o n m a k i n gt r e ea r ei m p l e m e n t e d ; t h i sp a p e rh a s d e s i g n e d a l l a g e n t m i n i f ya l g o r i t h m i nd e t a i l a n d i m p l e m e n t e dn o n - c o m m u n i c a t i v em u l t i a g e n tc o l l a b o r a t i o no ni t ; ,t h i sp a p e rp u t sf o r w a r dt h ec o n c e p to ft a c t i c ss y s t e m ,a n dd e v e l o p sa c o m p l e t et a c t i c ss y s t e m a l lt h ew o r k si nt h i sp a p e rh a v eb e e ni m p l e m e n t e di nw i n g l e t 2 0 0 5s i m u l a t i o n t e a m t h ee x p e r i m e n tr e s u l ts h o w st h a tt h ea p p r o a c h e sa r ev a l i da n de f f i c i e n t i nt h ee n d ,t h i sp a p e rm a k e sac o n c l u s i o no ft h ew o r kt h a th a sb e e nd o n ea n d s h o u l dh a v ed o n e 1h o p et h i st h e s i sc a ng i v eh e l pt oo t h e r sw h oa r ei n t e r e s t e di nt h i s f i e l d k e yw o r d s :r o b o c u p ,f l o wc h a r t ,p a s ss t r a t e g y , d e c i s i o n m a k i n gt r e e , n o n - c o m m u n i c a t i o n , c o l l a b o r a t i o n ,t a c t i c ss y s t e m i i 代码1 代码2 代码3 代码4 代码5 代码6 代码7 代码8 代码9 代码1 0 代码1 1 代码1 2 插图目录 视角厄田图 r o b o c u p 中的层次结构, a g e n t 的组织结构 系统的具体结构 a g e n t 的流稃图 伸终网络结掏罔 传球,j :意图 传球的安全性因素 熵与样本集中数据分1 1 】关系图 的锋决策树。 中场决策树 后卫决策树 球场区域示意图 区域处理决策树 同一情况下不同球员的决策 战术库系统的实现框图 二过一传球示意图 代码目录 听觉信息格式8 视觉信息格式9 视觉信息计算公式1 0 视角计算公式1 0 距离计算公式1 2 自身信息格式1 2 物体运动计算公式1 5 k i c k 命令对球作用力的计算1 6 k i c k 命令产生加速度的计算1 6 熵的表达公式3 2 熵减的表达公式一3 3 信息增益率的公式3 4 v i 2 3 4 ,2 3 1 2 3 4 5 6 l l 2 2 2 2 2 3 4 4 4 5 5 5 5 5 5 6 7 7 瞄图图图图嘎图图图图图图图图图图图 独创性声明 本人声馥所呈交的学位论文是本人在导师指导下进彳亍昀研究工作及取得的 研究成果。据我所知,除了文中特别加以标注舞口致谢的地方外,论文中不包舍其 他人已经发表我撰写过抟研究成果,也不包含为获得孚教7 乏拳或其池教育机构 酌学位或证书雨使用过昀材料。与我一圈- r 作的同志对本研究所做的任何贡献均 已在论文中作了明确的说明并表示谢意, 学位论文作者签名:喜f 每 签字日期:沙。年年月多口e 学位论文版权使用授权书 本学位论文作者完全了解毒教犬墨 有关保留、使用学位论文的规定, 有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允谗论文被墅阅釉 借闽。本人授权窜妊可以将学位论文的全部或部分内容缟入有关数据库送行 捡索,可以呆渭影印、缩印或扫摧等复制手段保存、汇缡学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名 崭俦 签字翟赣:j 6 筚年月罗d 窭 学位论文作者毕业去向: 工作卑位: 通讯遗址: 翩签名:毵锯 签字露期:侈扩舌整午题日 电话 邮编 绪论 第一章绪论 智能体( a g e n t ) 技术,特别足多智能体( m u l t t - a g e n t ) 技术,为分和式系 统的分析、设计和实现提供了一种全新的方法:同时分伟式多智能体系统( d m a s ) 也是人q - 智能领域阳n 一个苹要的研究谍题,而训l 练机器人进行足球比赛,成为 国际人t 智能领域的热点之一。 机器人足球世界杯( r o b o c u p ) 足国际上一项为促进分御式人t 智能、智能机 器人技术及其技术领域的研究与发展而举行的大型比赛和学术活动。作为人1 二 智能和机器人学的一个研究课题,r o b o c u p 是以多智能体( m a 研和分白式人t 智 能( d a l ) 为主要研究背景的,其目的就足通过提供个标准的、易丁i 评价的比赛 平台,检验再种智能机器人的技术,促进 纠s 和d 4 的研究和发展【2 j 。 1 1 多智能体系统 1 1 1 智能a g e n t a g e n t 的概念最早可以追溯剑1 9 7 4 年由h e w t t t 提出的演员模型1 3 1 在此模型中 给出了些“演员”,这些“演员”足一组具有自我包禽、相互作用和并行执行 的对象。虽然a g e n t 这个术语被广泛的使用在相关领域中,却很难找剑一个大家 都愿意接受的定义。一般认为,a g e n t 足一种处丁i 一定环境下的计算机系统,为 了实现设计目的,它能在那种环境下灵活自主地活动1 4 j 。 智能a g e n t 足指一种处于一定环境下的计算机系统,为了特定的目的而设计 的,能在指定环境下灵活自主的活动,同时应该具有自治性、社会能力、反应 能力和自发行为能力: 自治性足指a g e n t 对自身的行为和状念有一定的控制权; 社会能力足指和具他爿朋月f 通过某种方式而具有信息交互的能力和协作 的能力【5 1 : 反应能力足指a g e n t 能感知环境并通过自身行动来改变岗闱环境; 自发行为能力足指a g e n t 的行为足土动的,它可以感知岗i 爿环境的变化, 多中 奉伯鱼系铣的战术f 设计 并为实现预定目标采取行动。 综上所述作为人类智能对府物的爿船”,理昕当然的成为人1 午 】能的重要研 究对g i 州。身f 坦借人,声计舁衬l f 。产系的占甜 “mh a t e r , - r o t h a - l l c a j 9 5 的t 荨约j 【乏 告中说剑:“智能计算机爿g p h f 既足人t 智能的最初目标,也是人t 智能的最终目 标”。 1 1 2 多智能体系统 多智能体系统( m m t i - a g e n ts y s t e m ,m a s ) 的协作求解的能力超过单个的 a g e n t 是m a s 产生的最直接原i 天| 。而导致其研究逐渐兴起的其他原冈还包括:与 已有系统或软件的互操作,求解那些数据、能力及控制具有分布特性的问题和 提高系统的效率和鲁棒性等f ”。 m a s 足对“辛卜会”、“团体”等人类概念的一种模拟。单个彭j a g e n t 可以在指 定的环境中完成一些特定的任务,但伽”f 之间按照一定的协议协作完成更加复 杂的下作则更有实际意义【8 1 。对于此4 s 目l ; 主要分为两个层次,一个足关i :m a s 3 l 4 9 e n t 的基础理论;另一个足关t - m a s 的体系结构、描述语言和通信瓦动方式 等。 多智能体系统中的关键问题足如何组织由多个智能体构成的群体,以及在 群体中如何实现它们之间的协调合作。传统的机器人系统采用的足分层和集中 的机制,自上而下的制定决策1 ”。这种方式由以下的缺点: 全局路杼规划的1 二作量很大: 系统具有的机器人的数量足受限的; 系统的容错性只能限定在些较小的范闱。 在8 0 年代未,受分却式人工智能系统研究的启发,一些学者提出了分散化 和分却式的多机器人系统合作组织策略、方法和协调机制,这些研究后来成为 “协作机器人学”。其中基丁二多智能体概念的多机器人系统逐渐成为研究的热点 和方向。心跚蜊度服了集中式系统的缺陷,提供了一种分析、设计和实现大 型复杂系统的方法。基丁智能体的观点提供了一种强有力的下具、技术和途杼 来提高人们概念化和实现许多类型系统的能力。智能体技术和方法正在被应用 丁符个广阔领域f 1 。 绪论 1 2 机器人足球赛 机抬人九球叠( r o b o th b r m ( u p j 日 j 最千j 訾。土由屯j 拿大f ,j 颧哥伦叱币人字 的a l a n m a c k w o r t h 教授在1 9 9 2 年正式提出的。日本学者立即对这一想法进行了 系统的调研和可行性分析。1 9 9 3 年,m m o r ua s a d a ( 浅田埝) 、h t r o a k lk i t a n o ( j t 野宏明) 和y a u ok u m y os h t 等著名学者创办t r o b o c u p 机器人足球世界杯赛【7 ”5 】 ( r o b o t ,i d c l 印s o c c e r g a m es 简衍r 。胁( 、妒) , r o b o c u p 作为教育目标和应用领域相平行的一个研究挑战,也破用来刺激公 众对机器人技术和人t 智能的发展的兴趣”o 】,而且r d 6 d c 即是继深蓝之后人t 智 能的义一课题。r o b o c u p 致力丁分靠式的解决方案,而不使用传统的集中控制的 方式来完成功能。其中参加比赛的齐 个a g e n t 都足独立运行的,所以r o b o c u p 的 研究不仅涉及人t 智能的传统领域,而且还包含了机器人技术、传感技术、机 器学习、实时推理、多智能体合作和协作和实时任务控制等关键的技术。 1 2 1r o b o c u p 仿真组 r o b o c u p 仿真组( r o b o c u ps i m u l a t e dl e a g u e ) 是基丁被称为s o c c e rs e r v e r c h e n t 的r o b o c u p 模拟器。该系统由& 九,p ,c h e n t 和m o m t o r 组成。m o n i t o r 的作 用足将所有活动虚拟的显示在模拟场地上,并可以通过屏幕进行观石。同时此 模式中还掺杂着实时指令和半结构化的状态来协调比赛的进行】。s o c c e r s e r v e r 的一大优点就是抽象性。这种特性可以让研究者抛丌机器人硬件的技术而专著 于对a g e n t 智能和协作的研究。仿寅系统的抽象性可以让研究人员从解决实现机 器人各种功能的难题中解放出来,而专心致力丁机器人互动和机器学习之类的 高层次领域。 s o c c e r s e r v e r 提供了一个具有挑战性的复杂环境。在这个环境中需要一名机 器裁判用来判断例如进球、出界等简单的情况。此外,s o c c e r s e r v e r 还需要一名 人类的裁判以保证球队不使用系统漏洞进行比赛,以及处理比赛中所出现的死 锁等问题。 仿真组土要进行智能体的符种研究土要包括: 智能体及多智能体学习。其中包括在线学习和离线学习,以及底层技能 多丰体仂舆系统的战术一设计 的学习: 智能体协作。研究如何协调多个智能体的行为,包括帮能体的1 力f 1 - 结构, 高层叻、f 1 技能【 勺哎计: 智能体建模。 r o b o c u p 仿真系统以c h e n t s e r v e r 方式运行,s e r v e r 1 c h e n t 通过u d p 1 p 协议 连接,c h e n t 通过发送字行串形式的指令控制球员的行动,t m s e r a ,p ,通过发送字 形式的信息向c h e n t 提世场lf i 兄的信,0 。每个c h e n l 磋块只龟 ? 剐名球 员,c l i e n t 和c h e m 之间不允许直接通讯。r o b o c u p 仿真组比赛提供了一个对实 时、不确定、协作等环境下对智能体系统进行研究的载体。 一般来说,a g e n t 应该具有以下属性; 自治性:a g e n t 能在没有用户干预的情况下完成大部分的任务,并对其 行为和内部状态进行调控。a g e n t 具有时间上的连续性以及显示或者隐 式的任务目标; 记忆和推理能力:a g e n t 廊该能够根据环境的有限信息进行推理和记忆, 以维护一个相对完整的世界模型: 协作性:a g e n t 虑该具有和其它a g e n t 交换信息,并进行协作的能力: 麻急性和t 动性:a g e n t 府该能够监测自己的环境,对关心的环境变化 做出反府。 1 2 2r o b o c u p 的特点 r o b o c u p 选择了足球比赛作为基本的领域,组$ 1 , y r o b o c u p 机器人足球世界 杯赛及学术会议。为了能让一个机器人球队能真正的进行足球比赛,必须集成 各种再样的技术,包括自土智能体的设计,多智能体合作、策略抉取、实时推 理、机器人学以及传感器技术等【1 3 】。对丁:一个在变化环境中快速运动的机器人 球队,r o b o c u p 足一个在动态环境下的多任务系统。而对丁软件的方面,r o b o c u p 提供了一个虚拟的环境平台以便丁| 研究 1 4 】。 冈此,r o b o c u p 具有以下特点: 1 、多土体。即问题求解的对象足多个,在r o b o c u p e f l 有1 1 个自士的个体; 2 、初始状态不唯一。初始状念随着比赛场上的念势而改变,目标状态( 将球 4 绪论 踢入对方门区) 是确定的,但随着初始状态的不同,$ i 达目标状态的解( 从卡j 始 状态刽达目标状态的动作序列) 足不同的: 3 、状念转换的不町预测眭。在足球机器人庆策止程中,由j 比葵形势的复 杂,一个机器人执行一个动作要受剑其他机器人执行动作的干扰,冈此动作执 行后的状态足不可预测的( 即不一定能达到动作执行后的理想状念) 。比如当一 个机器人满足射门条件时执行射门动作,但不一将球踢入对方球门内,即存 在目标状态i j 】厶的不确正性的lu 题1 4j 。 1 2 3r o b o c u p 比赛历史 1 9 9 7 年在日本大阪举行了第- - j 罱r o b o c u p 赛( p r e r o b o c u p 9 6o s a k a , j a p a n ) 中有来自9 个国家的4 2 支球队参加了比赛【4 】。比赛项目包括仿寅组、小 型组、中型组和表演赛,超过5 0 0 0 名观众观看了这次比赛。 9 8 年在巴黎举办了第二届r d 6 0 c 即比赛( r o b o c u p 9 8p a r i s ,f r a n c e ) ,这次 比赛由丁,和世界杯同年同地举行冈此抉得了很大关注,一共有8 1 支球队参加了 比赛1 4 j 。 9 9 年的第三屑r o b o c u p 比赛在瑞燕的斯德哥尔摩举行举行( r o b o c u p 9 9 ) , 这次比赛新增了s o n y 四腿组的比赛项目,共有9 0 多支球队参加。 2 0 0 0 年在攀尔本的第四届r o b o c u p = l 赛中,来自中国科技大学的蓝鹰队抉 得了仿寅组第九名和s o n y 四腿组第九名的好成绩 ”。 在2 0 0 1 年和2 0 0 2 年的r o b o c u p 比赛中,比赛的规模和观众的人数大大增 加。令人鼓舞的是来自清华大学的风神队连续获得了两届的冠军。不过2 0 0 3 年 清华的风神队惜败与荷兰阿姆斯特丹大学的u v at r i l e a r n 球队,屈居耵军。 1 3 章节安排 本文以开发一个完整的r o b o c u p 系统为背景,在相关章节突出智能体协作 与系统实现的些属性。 本文以下符个章节的土要内容如下: 夺第二章介绍了r o b o c u p 仿真系统的相关特性,并给出了a g e n t 的组织结 多丰体仿真系统的战术好设计 构: 夺第= 章给出了a g e n t 的具体流程,并从软件i i 翌的角度说明r 彦魔程的 口j 扩充土; 夺第四章给出了一种具体的传球策略,进而用儿何方法对其进行改进: 夺第五章给出了决策树在r o b o c u p 中的具体府用,同时针对不同角色进 行相府的调整; 夺第八章介绍了多a g e n t 系统,并给出了多a g e n t 么间的m 作的一种具体 实现; 夺第七章介绍了战术库的思想,同时也给出了一套具体实现的战术库; 夺第八章是全文的总结和展望。 1 4 本章结束语 本章简单介绍了多智能体系统,同时对r o b o c u p 的起源及其历史做了简要 介绍。最后给出了论文所要详细讨论的荐个方面以及作者自己所做的工作。 6 r o b o c u p 仿真系统介镏 第二章r o b o c u p 仿真系统介绍 r o b o c u p 仿真比赛足在一个标准的计算机环境内进行的。由丁要求仿真环 境与人类足球比赛的环境相似,所以比赛球员的仿真模型要尽可能的与实际球 员接近,存这套比赛环境中提供了一个完伞分南式控制,实时多智能体的环境。 我们通过这个平台口j 以测试人t 智能的各种理论、箅店帝 4 9 e n t 体系结构,故具 对丁分伟式人工智能理论的研究具有重要意义”。国际比赛要求统一采用l i n u x 系统,比赛规则基本上与国际足球联合会的比赛规则一致,而由丁i 目前的仿真 组比赛环境基本上足基于二维平面的,每年只是在某些方面傲一定的改动。比 赛的方式足( f l r o b o c u p 联合会提供标准的s o c c e rs e r v e r 系统决定,采用c l i e n t s e r v e r ( c s ) 方式,各参赛队编写备自的c l i e n t 程序,来模拟实际足球球员进行 比赛。 2 1s o c c e rs e r v e r 介绍 s o c c e rs e r v e r 提供了个虚拟场地( 可以通过m o n i t o r j , 挂行查看) ,对比赛双 方的队员和足球的移动进行仿真,以离散的方式( 系统按照l o o m s 的佶j 期运转) 控制比赛的进程。整个比赛足以c l i e n t s e r v e r ( c s 3 j y 式进行,其中a 船删就足球员 的大脑,用于指扦球员的运动。而s e r v e r ,b p s o e e e rs e r v e r ,是对比赛所需的信 息进行仿真”1 。 2 1 1s e r v e r s e r v e r 足能使不同的队伍进行足球比赛的系统。因为比赛是以c s t y 式进行 的,所以仅要求球队的开发丁具提供通过u d p i p 连接的c s 支持。每个c l i e n t 都 是独立的进程,通过给定的端口和九,盯连接”。一支球队可以有最多1 1 个球员 ( 也就足c l i e n t ) 。肖球员和s e r v e r j 匡接上后,所有的信息( 字符串形式) 都通过 这个端口进行传递。 多丰体仿其系镜的战术晒。设计 2 1 2m o n i t o r m o m t o r 足一个【j j 祝化的r 具,允竹在比赛的hr 候人们砚石, s e t a ,e r l j 恢发tj 什么事情“。在m o n i f o r 中不但可以显示球场信息包括比分,球队名字,所有球 员和足球的位置,而且包括手t 控制比赛状态的功能。在s e r v e r 上进行比赛时, m o n i t o r 并不足必需的。然而,我们需要在不同的终瑞显示同一场比赛可以和 s e r v e r 连接上小f j 的m o m t o r 。 2 1 3l o g p l a y e r 如印垃妒r 是一个比赛状态的记录工具,是可以用来进行重现比赛的t 具。 在运行s e r v e r 时加上一些选项,就可以将比赛数据都记录在硬盘上。z _ d 铲幻胛 和m o m t o r 连接在一起就可用来重现比赛,这在进行球队的发现或分析球队的优 点和弱点足很有帮助的。 2 2 主要模型介绍 每个球员可以从s o c c e r s e r v e r 接收三种不同的感知信息:听觉、视觉和身 体状态信息。听觉感知检测裁判、教练和其他球员发送的消息。视觉感知检测 场上的可视信息。自身感知检测球员的当前物理状态包括体力、速度和头颈角 度。这三类感知为球员提供了一个很真实的球场环境川。 2 2 1 听觉感知模型 听觉感知模型相对其他两类感知模型比较简单。当球员或教练发送s a y 命令 时,s e r v e r 就会发送听觉消息”1 。 l 、_ s e r v e r 发送的听觉信息的格式如下: ( h e a rt i m es e n d e r m e s s a g e ”) 代码l 呀觉信息格式 其中t i m e 指示当前时间,也就是服务器周期; s e n d e r 指谁发出了这个信息,可以是自己、裁判或在线教练; m e s s a g e 足消息内容。 r o b o c u p 仿其系镜介绍 队员每个周期所能昕到的信息数足受限制的l ”。当球员的听力大丁等丁 h e a rd e c a 、,时,谚球英才会听纠一条消息球员昕剑一条,息后,听觉能力以 h e a r r 降。每个墙身j 球员的听觉能力义会增i h c 。听见能力的最大d e c o 加h e a r 值足h e a rm a x 。为了避免球队阻塞信道使对手的交流失效,球员的两个球队的 听觉能力足相互分离的。 如果在同一时刻有多丁条的消息剑达,那么球员真正接收刽的消皂,足不 确止的。但此规则不包拒裁判和球员自身发送的自息,b 】在r j个魁划内 个球员能够发送一条消息并同时接收其他球员的一条消息。服务器的参数 a u d i oc u td i s t 代表的足听力所能到达的范崮,只有在这个范l 割之内的球员才能 听到信息。而裁判发送的消息是可以被场上所有球员听到的。 2 2 2 视觉感知模型 视觉感知模型是三种感知模型中最复杂也足最重要的。在每个s e n s e _ _ s t e p ( 日 前等于1 5 0 m s ) l 内,视觉信息被自动发送剑球员处1 4 1 。从s e r v e r 发送的视觉信息遵 循下面的基本格式: ( s e en m po h ) n a m ed i s t a n c ed i r e c t i o nd i s t c h n gd i r c h n gb o d y d i rh e a d d w ) o 如n a m e := p t e a m n a m e ” v n ( o r m n u m b e r g o a h e ) j ) fb f g f l r 1 ( f c f j f l c r j i t b 1 ) ( f p f l r j ( 1 c b j ( f g f l r j ( 1 b ) f f f l r t b 1o f l t b 1e l r | l l o 2 0 3 0 4 0 5 0 1 ) ( f f l r l t b jfl o 2 0 3 0 ) j f l 【l r t b j t8 f f ) f g ) f p ) 代码2 视觉信息格式 o b j n a m e 用来说明物体类型,d i s t a n c e 说明该物体和观察者的距离,d i r e c t i o n 说明该物体和观察者的角度,d i s t c h n g 说明该物体和观察者之间的距离变化, d f r c h n g 说明该物体相对于观察者的方向变化。如果物体是一名队员那么 h e a d d & 、b o d y d i r 、死a m n a m e 和u n i f o r m n u m b e r 分别说明这名队员的脖子方向、 身体方向、队名和号码。 球员的视觉属性依赖于几个冈素。首先足s e r v e r 上的参数s e n s ef l t e p 和 v i s i b l ea n g l e ,决定了视觉信息的时间间隔和球员正常视角的角度,现在使用的 足1 5 0 m s 和9 0 度。 多丰体仿真系统的战术j 年瑷十 球员通过v i e w w m t h 和v w w q u a h t y 也可以改变视觉信息的频率和质量。其 1i o e u 加口w w l 由卜面的等式j 算: v t e w j r e q u e n c y = s e n s e s t e p xp l e a , _ q u a h t y 一丘【f o r v l e l l ,一w t d t h j a c t o r 代码3 税觉倍惠i f 算公式 如果阮w q u a h o ,是h t g h ,那么,l e wq u a h t ) j a e t o r 等r1 :如果所“q u a h t l j 足l o w ,那么v w w _ q u a h o ,_ f a c t o r 等丁0 5 。虹果“1 4 ) d t h 足n a r r o ;i j ,那么 v i e ww i d t h j a c t o r 等于2 ;如果;q e w w t d t h 足i l o k o t a ,那么v i e ww m t h j a c t o r 等 于1 :如果v i e w w i d t h 足w i d e ,那么v i e ww i d t h a c t o r 就等于0 5 。也就足说视 觉信息的质量越高,视角就越小而发送时间间隔也会越大。a g e n t 需要自已根据 需要在质量和时间以及角度上做权衡。 而v i e w由下面的公式计算而成:_angle v i e w a n g l e = v i s i b l e a n g l e v i e w w i d t h f a c t o r 代码4 锐角计算公式 也就足说如果v i e ww i d t h c t o r 是0 5 ,此时视角最小只能看到正常视角一 半的角度,而如果v i e ww t d t h f a c t o r 为2 ,那么球员能看到的角度就足正常情况 的2 倍。 除了角度限制之外,a g e n t 感知视觉信息还受距离的限制。只有距离在 v i s i b l ed i s t a n c e 之内的物体才能被看到。而且能够被看剑的物体a g e n t 所获得的 视觉信息也和距离有很大的关系。例如对丁一名球员,在近距离a g e n t 可以看到 它的所属球队、号码,而随着距离的增加号码就看不清楚了,而如果距离很远 那么连球队也无法辨认了。服务器参数u n u m _ f a rl e n g t h 、u n u m _ t o o f a r _ _ l e n g t h 、 t e a m f a r _ l e n g t h 和t e a m _ t o o f a r _ l e n g t h 决定了对丁一名球员的视觉信息的详细程 度。 对丁:视觉感知模型r o b o c u p 系统还给出了很多限制,首先是v w w _ a n g l e 和 v i e wd i s t a n c e 的限制,如图2 1 所示: i o r o b o c u p 仿寅系镜舟印 一f i e l dl e n g t h _ - 图2 1 视角范固图 l d 、i d :h a g e n t 在服务器上所能获得的视觉信息与角度和距离有关。首先只有在 v i e wa n g l e 内的物体才能被看见。其次在v i e w _ a n g l e 内的物体根据距离的远近信 息的详细程度也不一样。a g e n t 可以调节自己的视角方式在更大的视角和更远的 距离之间做动态的取舍,以获得最详细的信息。 如果距离d i s t 小丁:等于u n u m _ f a rl e n g t h ,那么球员的号码和球队名称都可 见。 如果距离d i s t 介丁:u n u m _ f a v _ l e n g t h 和u n u mt o o f a r _ _ l e n g t h 之间,那么队名 可见而号码可见的概率按照从u n u m _ f a r _ l e n g t h 到i a n l a m t o o j a r _ l e n g t h 线性减 少,最大为1 ,最小为0 。 如果距离d i s t 大于等于u n u m _ t o of a rl e n g t h 那么号码肯定不可见。 如果距离d l s l 介于t e a mf a rl e n g t h 和t e a m _ t o of a rl e n g t h 之间,那么队名不 可见的概率也是按照从t e a m _ f a r _ 1 e n g t h 到t e a m _ t o o _ f a rl e n g t h 线性减少。 如果距离d i s t 大于等于t e a m _ t o of a r _ l e n g t h ,那么队名也不可见了。 在视觉模型中还引入了噪声,s e r v e r 所发送给a g e n t 的信息被经过了量化的 处理。实际发送给a g e n t 的距离d 足按照以下公式计算的: d = q u a n t i z e ( e 0 妇1 0 8d 9 加”眈一盯印,o 1 ) n lliliif 多= f 体仿直系士兜的战术辟霞汁 q w ”r 一( 矿,g ) = 鲫 增( 吾) q f k 4j 屈7 ,考i 筚三。,( 其中dd 分别表示精确距离和相对的量化距离。 这表示球员足不能知道远处物体的精确位置,而a g e n t 足根据视觉信息来判 断自己存场 二位覆的,所以我们存设计a g e n t 时采用了近处和远处再取2 个f l a g ( 球员可以时石烈多个) 来计算自身的f 、:盏。 2 2 3 自身感知模型 自身感知返回球员当前的物理状态。服务器每隔s e n s e _ b o d y _ s t e p ( 1 0 0 m s ) 的时间会自动向球员发送感知信息”。通过感知模型,彳”f 可以了解自身状况 从而进行下一步的决策。自身感知消息的格式如下: ( s e n s e _ b o b yt i m e ( v i e w _ m o d ev i e w q u a h ( yv i e w w i d t h ) ( s t a m i n as t a m i n ae f f o r t ) ( s p e e d a m o u n t o j s p e e d d i r e c t i o n o s p e e d ) ( h e a d _ a n g l eh e a d a n g l e ) ( k l c kk w k c o u n t ) ( d a s hd a s h c o u n t ) ( t u r nt u r n c o u n t ) ( s a ys a y c o u n t ) ( t u r nn e e kt u r n n e c k c o u n t ) ( c a t c hc a t c h c o u n t ) ( m o v em o v e c o u n t ) ( c h a n g e _ v i e wc h a n g e v i e w c o u n t ) ) f 码6 自身信息格式 服务器为一舻r 提供以上信息供a g e n t 根据自身当前状况做决策,此外还在初 始化时为爿伊”r 提供了r o 的c 即虚拟世界的各种参数。我们将这些参数与感知信 息结合起来才能组成完整的世界模型。 服务器的参数列表如下: 参数名称默认值解释 g o a lw i d t h1 4 0 2 f 球门的宽度 p l a y e rs i z e o - 3 f 球员的半径 r o b o c u p 伪炱系统介绍 | p l a y e r _ d e c a y 0 4 f 球员每岗期的速度衰减值 j p l a v e rr a n do 】f 移动噪声故拥 p l a ,e r w e i g h t 6 0 o f 球员的重量 p l a y e rs p e e d _ m a x i 0 f 球员的最大速度 s t a m l n am a x4 0 0 0 球员的最大体力 s t a m i n a l t i c n l a x 4 5o f 球员存一个仿真脚期内可以获得的体力总曼 r e c o v e rd e ct h r 0 3 f 球员n j 以陕复体力的幽值 r e c o v e rd e c0 0 0 2 f 球员可恢复体力的下降值 r e c o v e rm l n0 5 f 可恢复体力的最小值 e f f o r t _ _ d e c t h r o 3 f 球员精力减少的阈值 e f f o r t _ d e c 0 0 0 5 f 球员精力的减少步长 e f f o r ti n ct h r o 6 f 球员精力增长的闽值 e f f o r t j n e o o l f 球员精力的增长步长 e f f o r t _ r a i n o 6 f 球员精力的最小值 h e a rm i 口2 球员每个周期可以听到的消息数 h e o ri n c1 球员听力的最小值 h e a rd e c a y 2 球员听力的衰减时间 l t 2 e r l l a m o m e n l 5 0 f 惯性值 s e n e e _ b o d ys t e p 1 0 0 感知的间隔值 c a t c h a b l e a r e a 1 2 0 f 扑球的长度 c a w h a b l e a r e a w 1 o f 扑球的宽度 c a t e h _ p r o b a b t h t y 1 o f 扑球的成功率 c a t c h _ b a n _ c y c l e 5 守门员最大持球的周期数 b n l ts i z e0 0 8 5 f 球的半径 b a d e c a f 0 9 4 f 球速的衰减值 b a l lr a n d0 0 5 f 球的廷动噪声 b a l lw e i g h t0 _ 2 f 球的重量 b a l l _ _ s p e e am a x 2 7 f 球的最大速度 多丰体仿直系统的战术晴设汁 聃 df o r c e0 0 f 风的速度 晰”dd w0o f 风的厅向 腑”dr a n do o f 风的变化系数 k t c l u l b l e _ m a r g m 0 7 f 可触球范i 韦ik l c k a b l e a r e a 足k t c k a b l e m a r g m , b a l

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论