(控制理论与控制工程专业论文)多智能体机器人足球平台中智能技术的设计与应用.pdf_第1页
(控制理论与控制工程专业论文)多智能体机器人足球平台中智能技术的设计与应用.pdf_第2页
(控制理论与控制工程专业论文)多智能体机器人足球平台中智能技术的设计与应用.pdf_第3页
(控制理论与控制工程专业论文)多智能体机器人足球平台中智能技术的设计与应用.pdf_第4页
(控制理论与控制工程专业论文)多智能体机器人足球平台中智能技术的设计与应用.pdf_第5页
已阅读5页,还剩80页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

上海大学硕士学位论文 摘要 随着人工智能中多智能体技术的快速发展,作为一个典型的多智能体研究实 体和实验平台,多智能体机器人足球平台已经成为了智能体研究的热点。该平台 相对于人工智能中棋类比赛不同的是,它属于多智能体动态不可预测环境中的问 题求解,并逐步成为智能体和机器人学另一个标准问题。通过在该平台的实践, 众多智能体算法可以得到实际检验、对比和创新发展。 本文的主要研究工作如下: 1 ) 在研究已有智能体结构理论和多智能体机器人足球仿真平台的基础上, 本文提出、设计和实现了两个特殊的智能体结构:r o b o c u p 智能球员智能体结构 和r o b o c u p 智能教练智能体结构。 2 ) 智能球员协作跑位是一个多智能体协同合作的典型问题,本文分别设计 了智能体防守跑位和智能体进攻跑位协作的方法。智能球员通过对全局利益的寻 优求解,找到有效的防守和进攻的合作动作,从而实现了智能体之间协同完成目 标的方法。 3 ) 为了提高智能体截球动作的准确性,本文提出了使用遗传算法来求解智 能体的截球点。通过详细的设计和实验,表明了遗传算法能有效提高截球精度, 从而减少了底层误差在上层的叠加。 4 ) 由于智能教练自身具有较大的特殊性,故在智能教练的设计中,本文提 出了以模糊分析和决策为主的智能算法,并通过分析对手传接球能力、对手综合 实力和动态改变阵形等方法,全局性地提高了整个球队的智能应变能力。 在以上研究的基础上,本文用面向对象的方法设计了一支仿真球队。并且代 表上海大学两次参加了中国r o b o c u p 大赛,均获得了仿真组全国弧军,由此验证 了上述方法的可行性和有效性。 关键词:多智能体系统,r o b o c u p ,协作,遗传算法,模糊控制 第1 页 上海大学硕士学位论文 a b s t r a c t w i t ht h er a p i dd e v e l o p m e n to fm u l t i - a g e n tt h e o r yo fa r t i f i c i a li n t e l l i g e n t , m u l t i - a g e n tr o b o ts o c c e rp l a t f o r mb e c o m e st h eh o tr e s e a r c hp r o j e c t ,w h i c hi s a t y p i c a lr e a lm u l t i a g e n tr e s e a r c hb o d ya n de x p e r i m e n tp l a t f o r m b e i n gd i f f e r e n tf r o m t h ea r t i f i c i a li n t e l l i g e n tc h e s s , t h ep l a t f o r mb e l o n g st ot h e “m u l t i - a g e n td y n a m i c n o n - f o r e c a s t e d m a t t e r ,a n di ti sg r a d u a l l yr e g a r d e da sa n o t h e rs t a n d a r dr e s e a r c h m a t t e ri nt h ea g e n ta n dr o b o td o m a i n t h r o u g hp r a c t i s i n go nt h ep l a t f o r m ,t h ep a s t a n dn e wa l g o r i t h m sc a nb ev e r i f i e d t h i sp a p e rf o c u s e so nt h er e s e a r c hw o r ka sf o l l o w s : 1 ) o ns t u d y i n gt h ea g e n ta r c h i t e c t u r et h e o r ya n dm u l t i a g e n tr o b o ts o c c e r p l a t f o r m ,t w os p e c i a la g e n ta r c h i t e c t u r e a r ed e s i g n e da n dr e a l i z e d :t h er o b o c u p i n t e l l i g e n tp l a y e r a r c h i t e c t u r ea n dt h er o b o c u pi n t e l l i g e n to n l i n ec o a c h a r c h i t e c t u r e 2 ) t h ei n t e l l i g e n tp l a y e rp o s i t i o n i n gi sat y p i c a lt a s k o fm u l i - a g e n t c o l l a b o r a t i o n t h ea g e n td e f e n c ep o s i t i o n i n ga n dt h ea g e n ta t t a c kp o s i t i o n i n ga r e d e s i g n e d t h ea g e n ts e a r c h e st h eb e s ta c t i o nf o rt h et e a mt a s k ,a n df i n i s h e si t c o l l a b o r a t e l y 3 ) f o re n h a n c i n gt h ea c c u r a c yo fi n t e r r u p t i n ga c t i o n ,t h em e t h o do fu s i n gg at o c a l c u l a t et h ei n t e r r u p t i n gp o i n ti sp u tf o r w a r d t h ee x p e r i m e n t ss h o wt h ee f f i c i e n c y 4 ) a sa n o t h e rk i n d o fa g e n tb o d y ,t h ei n t e l l i g e n to n l i n ec o a c hi sg r e a t l y d i f f e r e n tf r o mt h ei n t e l l i g e n tp l a y e r t h ef u z z yb a s e da n a l y s i sc o a c hm e t h o di s p r o p o s e d t h eo n l i n ec o a c hr e c o g n i z e st h es i t u a t i o na n dc h a n g e st h ep l a y e r s d e c i s i o nm a k i n gg l o b a l l ya n dd y n a m i c l y b a s e do nt h ea b o v er e s e a r c h ,as i m u l a t i o nt e a mi sd e s i g n e dw i t ho o pm e t h o d t h i st e a m ,r e p r e s e n t i n gs h a n g h a iu n i v e r s i t y ,a t t e n d e dt h ec o m p e t i t i o n so fc h i n a r o b o c u p ,a n dg a i n e dt h er e w a r do fs i l v e rm e d a lt w i c e ,w e l li l l u s t r a t e dt h ee f f e c to f t h er e s e a r c h k e yw o r d s :m u l t i a g e n ts y s t e m ,r o b o c u p ,c o l l a b o r a t i o n ,g a ,f u z z yc o n t r o l 第1 i 贞 原创性声明 本人声明:所呈交的论文是本人在导师指导下进行的研究工作。 除了文中特别加以标注和致谢的地方外,论文中不包含其他人已发表 或撰写过的研究成果。参与同一工作的其他同志对本研究所做的任何 贡献均已在论文中作了明确的说明并表示了谢意。 本论文使用授权说明 州s g 本人完全了解上海大学有关保留、使用学位论文的规定,即:学校有权保留 论文及送交论文复印件,允许论文被查阅和借阅:学校可以公布论文的全部或部 分内容。 ( 保密的论文在解密后应遵守此规定) 签名:拉翩繇夔丝吼 垆p _ ;。它 上海大学硕士学位论文 图1 1 图2 1 图2 2 图2 3 图2 4 图2 5 图2 6 图2 7 图2 8 图2 9 图3 1 图3 2 圈3 3 图3 4 图3 5 图3 6 图3 7 图3 8 图3 9 图4 1 图4 2 图4 3 图4 4 图5 1 图5 2 图5 3 圈5 4 图5 5 图5 6 图5 7 图5 8 图5 9 插图清单 r o b o c u p 机器人足球组成和相关多智能体技术 机器人足球仿真比赛环境 s o c c e rs e r v e r 结构图 机器人足球平台的时钟 c l i e n t 的多线程结构, 反应式智能体结构图 认知智能体结构图 复合式智能体结构图 r o b o c u p 智能球员的结构图 r o b o c u p 智能教练的结构图 智能球员防守动作示意图 防守跑位动作利益计算示意图 基于团队利益的任务计划步骤 防守跑位评价示意图 智能球员进攻动作示意图 进攻跑位接应传球示意图 进攻跑位接应传球计算中视角因素示意图 进攻跑位待机射门示意图 进攻跑位实现的程序流程图 截球问题提出示意图 截球问题中b p 网络训练法示意图 截球动作中截球点编码 截球动作遗传算法流程 在线教练结构图 在线教练中对手传接球分析示意图 模糊逻辑系统 在线教练中模糊控制示意图 在线教练中基于模糊控制的对手识别技术示意图 模糊控制输入输出隶属度函数图 输出对输入的模糊控制立体图 a n f i s 网络结构图 对手强弱识别的a n f i s 结构图 一一一一一邙一一一一一一一一一一一一一一一一一一一一一一一一一一 扑 上海大学硕士学位论文 图5 1 0 图5 1 1 图5 1 2 图6 1 图6 2 图6 3 图6 4 图6 5 对手强弱识别a n f i s 网络输入量隶属度函数图 动态阵形变换流程图 阵形识别示意图 r o b o c u p 总体开发和调试流程 模块开发和调试流程 球员跑位威胁度示意图 实战比赛阵形变换图 上海大学在全国r o b o c u p 比赛中获奖情况 第v i 贞 弱田髓铂船臼加 上晦大学硕士学位论文 表1 1 表2 1 表3 1 表3 2 表3 3 表4 1 表5 1 表5 2 表5 3 表6 1 表6 2 表格清单 r o b o c u p 2 0 0 3 世界杯类别和球队数目 c l i e n t 与s e r v e r 初始化连接指令 防守跑位动作权值表 防守跑位算法实验结果 进攻跑位算法实验结果 智能体截球动作实验结果 在线教练与离线教练的比较 在线教练与智能球员的比较 在线教练实验结果 r o b o c u p 中常用m o n i t e r 列表 防守跑位单元测试中对方威胁度列表 第v 儿贞 _m孔站站鸲蛎蛄n勰 上海大学硕士学位论文 第一章绪论 1 1 机器人足球平台的研究意义 人工智能( a r t i f i c a t i o ni n t e l l i g e n c e l 是当前科学技术发展中的一门前沿学科, 同时也是一门新思想、新观念、新理论、新技术不断出现的新兴学科以及正在迅 速发展的学科。有人把它与空间技术、原子能技术一起誉为2 0 世纪的三大科学 技术成就。作为人工智能的一个重要方面,近年来多智能体( m u l t i - a g e n t ) 成为 一个研究的热点。在最近几年中,多智能体系统的研究在计算机和自动化领域受 到了广泛的关注,其应用主要包括智能制造系统、电子商务、智能信息系统、交 通管理系统等【】“j 。 中国科技大学的陈小平教授指出【7 】:机器人足球涉及人工智能和机器人学新 的标准问题,是连接基础研究与实际应用的中介和桥梁,是展示信息自动化前沿 研究成果的窗口和促进产、学、研结合的新途径。随着机器人足球研究的深入和 新成果的不断涌现,它将带来一次研究的热潮。 首先,过去5 0 年中人工智能研究的主要问题是单智能体静态可预测环境中 的问题求解,其标准问题是国际象棋人一机对抗赛,最典型的例子就是卡什帕洛 夫和i b m 高性能计算机“深蓝”的对抗;但是以后几 一年中,人工智能的主要 问题是多智能体动态不可预测环境中的问题求解,其标准问题是足球的机一机对 抗赛和人一机对抗赛,最典型的例子就是r o b o c u p 机器人足球,而且r o b o c u p 组织提出了5 0 年击败人类足球冠军队的宏伟r 标。 其次,机器人足球研究是连接基础研究与应用技术开发的必要桥梁。多智能 体系统是9 0 年代以来人工智能的主攻方向,a g e n t 这个词在人丁智能、计算科学 及相关领域文献中出现的频率高得惊人。但与此同时,内容空泛的论文数量也同 样多得惊人。出现这种情况的根本原冈是,当前a g e n t 基础研究与其应用背景之 间的距离过大,导致注重实际背景的工作就事论事,而注重基本问题的研究”纸 上谈兵”。为了改变这种现状,1 i 仅需要各种类型研究工作的大量积累,而且必 须采取必要的手段,在基础研究与实际背景之间寻找恰当的中介和桥梁。 r o b o c u p 机器人足球正是这样一个中介和桥梁。 第1 贞 卜海大学硕 学位论文 最后,它也是推动信息自动化领域产、学、研结合的重要途径。机器人足球 提供一个展示高科技成果的形象化窗口,促进科学技术与社会生产、生活更紧密 的结合。足球是当今世界上最普及的一项体育活动,同时也是一个巨大的产业。 机器人足球赛在人类足球赛所具有的娱乐性、观赏性和刺激性之上,进一步增加 了高科技对抗性,因而具有更大的魅力。它同时也提供了一种研究成果逐步转化 的方式。实践表明,机器人足球课程是素质教育、创新教育与前沿研究相结合的 一条可行途径。与传统的知识传授和技能培养为目标的课程不同,足球机器人及 球队的研制具有实践性强、探索性强和综合性强的特点,有利于迅速接触前沿研 究,并促使选课同学的创新能力和专业素质得到提高。 1 2 国内外发展概况 r o b o c u p 最早是由加拿大不列颠哥伦比亚大学的教授a l a nm a c k w o r t h 在 1 9 9 2 年的一篇论文中提出的。日本学者立即对这一想法进行了系统的调研和可 行性分析。1 9 9 3 年,m i n o r u a s a d a ( 浅田埝) 、h i r o a k i k i t a n o ( 北野宏明) 和y a s u o k u n i y o s h i 等著名学者创办了r o b o c u p 机器人足球世界杯赛( r o b o tw o r l dc u p s o c c e r g a m e s ,简称r o b o c u p ) 。与此同时,一些研究人员开始将机器人足球作为 研究课题。隶属于日本政府的电子技术实验室( e t l ) 的i t s u k in o d a ( 松原仁) 以机器人足球为背景展开多智能体系统的研究,日本大坂大学的浅田埝、美国卡 内基一梅隆大学的v e l o s o 等也开展了同类t 作。1 9 9 7 年,在国际最权威的人t 智能系列学术大会一第1 5 届国际人工智能联合大会( t h e1 5 t hi n t e r n a t i o n a lj o i n t c o n f e r e n c eo n a r t i f i c i a li n t e l l i g e n c e ,简称i j c a i 一9 7 ) 上,机器人足球被正式列为 人工智能的一项挑战。第一届r o b o c u p 比赛和会议于1 9 9 7 年举行,大约有4 0 个机器人球队和超过5 0 0 0 名观众参加此次盛会【8 】。 随后,崮际r o b o c u p 组织每年都将举办一次世界性的交流比赛和研讨盛会。 就本文完成时,共成功举办了7 屑世界杯比赛,规模已经空前壮大。在2 0 0 3 年 r o b o c u p 世界杯比赛中,共设立了三个大类8 个小项目的比赛,参加队伍超过百 支,如表l 一1 所示。其中,r o b o c u p 仿真足球和r o b o c u p 小型组足球项目参赛 队伍最多。为了保证比赛质量,组委会h 是将报名的队伍中分别从预注册的队伍 筛选出了其中优秀的4 6 支和2 4 支队伍参加最后比赛。我国也有清华大学等4 所 第2 贞 上海大学硕士学位论文 高等学校参加了7 个项目的比赛。 表1 一lr o b o c u p 2 0 0 3 世界杯类别和球队数目 大类 r o b o c u ps o c c e r 小类s i m u l a t i o ns m a l l s i z em i d d i e - s i z e 4 - l e g g e d h u m a n o i d 参赛数4 6 支2 4 支2 4 支2 2 支1 2 支 大类 r o b o c u pr e s c u e r o b o c u pj u n i o r 小类s i m u l a t i o nr o b o t 参赛数 1 6 支1 2 支2 1 支 国内的r o b o c u p 研究起步略晚于国外,但是随着r o b o c u p 在中国的快速发 展,目前已经初具规模,部分项目的水平已经赶超世界。2 0 0 0 年中国科技大学 在合肥举办r o b o c u p 2 0 0 0 全国机器人比赛的时候,只有一个仿真项目的比赛,共 1 0 支参赛球队。而最近的在北京清华大学主办的r o b o c u p 2 0 0 3 比赛中,已经有 1 1 个项目,超过1 0 0 支球队参加,规模空前。而且在r o b o c u p 仿真等几个项目 上已经达到了国际先进水平。 1 3 机器人足球平台的主要技术和研究方向 机器人足球平台是一个多智能体技术研究的重要实体和实验平台。在多智能 体技术研究飞速发展和机器人足球迅速升温的今天,许多先进的智能技术及其成 功的应用层出不穷。如图1 一l 所示,根据r o b o c u p 功能结构,这些技术大致可 以分为四类: 图1 1r o b o c u p 机器人足球组成和相关多智能体技术 第3 页 蓠露 上海大学硕士学位论文 l 、底层动作搜索寻优技术。一般来说,单个智能体为了达到某个目的,通 过寻优计算,最终做出某个动作,这样的算法一般归为底层动作搜索寻优技术。 这样的算法层出不穷,如有的直接利用数学模型,p e t e rs t o n e 队使用决策树【9 】, 清华大学队用q 学习等。 2 、多智能体合作技术。智能体为了配合球队,考虑整体的利益来做出有利 于球员间配合的动作,可将其看成是多智能体合作的技术。例如阵形设计、战术 配合、跑位动作等都是属于该类多智能体合作技术。比较著名成功案例有m r i e d m i l l e r , a m e r k e , a 4 0m a n n 等将再励学习技术 1 0 - 1 2 1 加入到多智能体的合作 移动跑位动作训练中,取得了良好的效果;l u i sp a u l or e i s ,n u n ol a u 在建立世界 冠军队f c p 2 0 0 0 的时候,设计出了多智能体合作的s b s p ( s i t u a t i o n b a s e ds t r a t e g i c p o s i t i o n i n g ) 4 和d p r ef d y n a m i cp o s i t i o n i n ga n dr o l ee x c h a n g e ) 算法 3 】等。 3 、结构设计和决策技术。智能体结构设计和决策技术问题主要包括如何进 行分层、如何对环境识别、如何进行智能决策、如何进行全局调整等。例如p e t e r s t o n e 队最早采用分层结构进行学习:北京理工大学队采用模糊理论设计模糊决 策等。 4 、智能体在线分析和决策技术。智能体在线分析和决策技术主要包括在线 识别、对手建模、数据融合和智能决策等方法。在机器人足球设汁中,智能球员 和教练都有一定程度的应用。例如中国科技大学队对异构球员的识别等。 1 。4 本文研究内容及论文安排 1 4 1 本文主要研究内容 本文主要的研究目的是探讨智能技术如何在r o b o c u p 这一典型多智能体中 更加有效地得到应用,使其理论与实战相结合,从而完善理论,并为进一步实际 应用奠定基础。具体完成了以下几个方面的主要工作: 1 、智能体结构分析和r o b o c u p 智能体的结构设计。在智能体理论应用中,智能 体结构随着应用领域的不同,各种智能体结构也表现出多样性。根据人类思维的 层次模型为依据对智能体结构进行划分,主要可以分为反应智能体结构、认知智 能体结构和复合式智能体结构三种。通过分析三种结构的特点,并结合r o b o c u p 第4 页 上海大学硕士学位论文 智能球员的特殊性,提出、设计和实现了具有感知、动作、反应、建模、规划、 通讯、决策等模块的r o b o c u p 智能球员和智能教练的结构。 2 、多智能体协作跑位的算法设计。智能体跑位规划是多智能体协同丁作的典型 实例,同时又是最能体现出一个队伍的风格,它往往在机器人仿真足球比赛中发 挥决定性的作用。本文将智能体的跑位分为防守跑位和进攻跑位。防守跑位的设 计立足于找到一套全局防守的集合,通过搜索来找到全局最优的统一防守方案。 进攻跑位的主要目的是为了配合本方控球球员更好的完成进攻任务;其中考虑接 应传球和待机射门两种动作的设计。 3 、基于遗传算法的截球动作设计。截球动作是r o b o c u p 智能球员的底层动作, 它的计算为上层的决策提供了重要的依据。截球点的准确性将会直接影响到智能 体规划的正确性。通过对截球问题的分析和已有算法的比较,本文提出并实现了 用遗传算法来计算截球点的方法。试验数据表明,基于遗传算法的接球点计算能 够得到令人满意的效果。 4 、在线教练智能分析和指导设计。在线教练是具有和一般球员不同功能的特殊 r o b o c u p 智能体。本文通过分析在线教练的功能特点,提出并设计了智能教练决 策结构,该结构目前在国内的智能教练设计中处于领先地位。其中,采用了模糊 控制技术来识别对手传接球能力,使用a n f i s ( a d a p t i v en e u r o f u z z yi n f e r e n c e s y s t e m ) 网络分析对手整体实力,并构造了全面丰富的动态阵形变换,从而动态 地指导球队更好地达到共同的目的。实验表明智能在线教练的使用能够提高球队 整体作战能力和适应能力。 5 、系统设计、开发、测试与实战。多智能体机器人足球平台的复杂性决定了整 个项目设计过程的庞大,为了高效地完成开发的任务,本文根据软件工程的方法 和r o b o c u p 设计的特点,自行提出了有效的调试测试技术和方法,保证了软件质 量和开发效率,取得了良好的效果。 1 4 2 论文安排 第一章为绪论,概括性地介绍了多智能体研究及其意义和r o b o c u p 的国内外 发展状况,以及本人毕业论文的主要工作:第二章介绍了r o b o c u p 仿真平台模型 和设计了r o b o c u p 智能体的结构;第三章论述了多智能体协作跑位设计;第四章 第5 负 上海大学硕士学位论文 论述了基于遗传算法的截球动作设计;第五章论述了在线教练的分析与指导技 术;第六章论述了智能体调试和测试方法,以及实战情况;第七章是全文总结和 进一步的研究展望。 筇6 贞 上海大学硕士学位论文 第二章机器人足球平台的研究基础和结构 设计 2 1 机器人足球平台的规范 机器人足球平台由国际上的机器人世界杯组织( r o b o e u p ) 所提供,它是一 个统一的、标准的、开放的机器人足球仿真程序( r o b o e u ps e r v e r ) ,如图2 一l 所示。其版本随着旧功能的完善和新功能的补充而不断发展,目前的版本已经达 到9 4 5 。最新研发出来的程序经过澳j 试,通过以后将在w w ws o u r e e f o r g e x t e t 上对 外公布,原则上高版本的仿真程序是向下兼容的。每一个版本的s e r v e r 程序同时 提供功能性的说明文件来描述该版本的特有功能和改进之处。目前,版本伴随着 r o b o c u p 研究的进步而不断更新发展。就本文完稿时,国际r o b o c u p 组织已经发 布了第一版的机器人仿真足球三维平台( r o b o e u p3 ds e r v e r ) 。 图2 1 机器人足球仿真比赛环境 2 1 1 机器人足球仿真程序的结构 机器人足球仿真程序采用s e r v e r c l i e n t 的结构,s e r v e r 是整个平台的核心, d i e m 通过u d p i p 协议与s e i v c r 进行通讯。c l i e n t 包括各方队员程序、教练程序 第7 页 上海大学硕士学位论文 以及显示程序,其中各方最多能有11 个队员程序和1 个教练程序与s e r v e r 连接 h 3 j 。由于所有的队员程序之间是不能通讯的,所以是一个相对自治的系统( 智能 体) ,而为了达到共同的目的“赢球”,大家相互合作形成了一个分布式的求解问 题系统。 机器人足球s e r v e r 程序一般运行在l i n u x 操作系统环境下,里面包含了整个 球场复杂的环境模型、与各种c l i e n t 的接口和通讯协议、比赛开始后场上的所有 运作、整场比赛的记录等等。在s e r v e r 中的简单模型主要有球、球员、场地等等, 如图2 2 所示。 图2 - 2s o c c e rs e r v e r 结构图 2 1 2 机器人足球平台中的运行周期 在机器人足球仿真平台中,s e r v e r 作为服务器控制着与各种c l i e m 的程序连 接。s e r v e r 运行可以看成近似连续的运行,但是为了合理有序的安排与众多c l i e n t 的信息交互,s e r v e r 引入了周期的概念。每场比赛共有6 0 0 0 周期,每个周期约 0 1 秒。在一个周期的时间内s e r v e r 固定的向每个c l i e n t 发送数据消息,同时也 在这个周期内接收一个c l i e n t 发来的消息,如图2 3 所示。任何大量发送消息 而阻碍网络通讯质量的行为都将被视为恶意破坏比赛而被取消资格。因此,c l i e n t 需要将自己的周期与s e r v e r 进行同步,以达到合理的利用时间。 第8 页 上海大学硕士学位论文 t lm j 谴x 图2 3 机器人足球平台的时钟 c l i e n t l ( l i e n t2 每名球员在相隔特定的时间内会收到s e r v e r 所发出的特定消息,主要包括裁 判给出的信息、教练给出的信息、队友给出的信息、自身的感知信息和自身的视 觉信息等。每名球员每个周期可以向s e r v e r 发出3 种类型的消息各一次,分别是 “说话”、“转动脖子”、“脚上动作”。但是s e r v e r 收到这些动作以后,并不是立 刻就执行的,而是等到每个s e r v e r 周期结束的时候执行,例如图2 3 中的c l i e n t 内s e r v e r 发出的动作都分别在t 、t + l 、t + 2 个周期末执行。 为了能够使c l i e n t 与s e r v e r 的周期同步,并合理计算出动作以便赶在服务器 周期末之前发送,本文将每个c l i e n t 程序建立了2 个线程,个负责信息的接收 和解析,另一个负责智能体决策,如图2 4 所示。本文将它分为两个问题:c l i e n t 与s e r v e r 的同步和线程间的异步。 图2 4c l i e n t 的多线程结构 1 、c l i e n t 与s e r v e r 的同步 通过分析s e r v e r ,发现s e r v e r 在所有发送的消息中都会打上周期标签,而且 s e r v e r 发送的s e n s e 消息数据正好是每个周期发送一次,这样就有了2 种同步解 决方案。一种是通过解析周期标签来更新c l i e m 的周期,另一种就是保持与s e n s e 第9 贞 上海大学硕士学位论文 消息数据同步。实际设计中两种方案都能与s e r v e r 保持同步。 彳i 过,在实际测试中同样遇到一种特殊的情况:当一个周期到来的时候,可 以预测其他消息也将到来。而且c l i e n t 等在其他消息到来后,依然能够完成c l i e n t 决策动作。这样就能多获得消息,为决策提供更充足的依据。 2 、线程间的异步 由于需要信息线程触发决策线程,所以本文设定了两个事件: e v e n tn e w c y c l e = c r e a t e e v e n t ( n u l l ,t r u e ,f a l s e ,n u l l ) e v e n t _ n e w s e n s e 2c r e a t e e v e n t ( n u l l ,t r u e ,f a l s e ,n u l l ) 分别定义为新周期事件和s e n s e 事件。信息线程中依据接收到s e r v e r 的消息 来触发( s e t e v e n t ) 这些事件,而决策线程中则通过w a i t f o r s i n g l e o b j e c t 0 来等待 事件的来临开始决策。由于需要避免线程间有数据的共享混乱问题,文本采用了 一些互斥手段,主要利用了i n i l i a i i z e c r i t i c a l s e c t i o n ( ) 、e n t e r c r i t i c a l s e c t i o n ( ) 、 l e a v e c r i t i c a l s e c t i o n 0 。 通过完成c l i e n t 与s e r v e r 的同步和线程间的异步这两个问题,本人实现了 c l i e n t 与s e r v e r 的接口,为下面的研究和设计工作奠定了稳定的基础。 2 1 3 机器人足球平台中的通讯协议 机器人足球平台中含有的参数众多,底层的通讯采用u d p i p 的协议进行, 而其中的数据消息格式则非常复杂。以一名球员c l i e n t 为例,c l i e n t 与s e r v e r 主 要会有3 种类别的数据传输,包括初始连接、动作指令和环境感知等。 初始连接是球员在比赛开始前与s e r v e r 建立连接,连接时告诉s e r v e r 自己的 所在球队和号码,当s e r v e r 确认连接成功后,就可以与s e r v e r 进行正常的通讯了。 但是有时候在比赛进行中c l i e n t 因为各种原因断开了与s e r v e r 的连接,s e r v e r 允 许c l i e n t 再次尝试连接,并使用r e c o n n e c t 命令”“。如表2 1 所示。 第1 0 页 上海大学硕士学位论文 表2 1c l i e n t 与s e r v e r 初始化连接指令 f r o mc l i e n tt os e r v e rf r o ms e r v e rt oc l i e n t ( i n i tt e a m n a m e ( v e r s i o nv e r n u m ) ( g o a l i e ) )( i n i ts i d eu n u mp l a y m o d e ) t e a m n a m e :。( 一l l a - z l a z f 0 9 ) s i d e := r w e r n u m :2t h ep r o t o c o lv e r s i o nu n u m := 1 2 11 p l a y m o d e :2 0 n eo f p l a ym o d e s ( r e c o n n e c tt e a m n a m eu n u m )( i n i ts i d eu n u mp l a y m o d e ) t e a m n a m e :。( 一l l a - z l a - zl 0 - 9 ) s i d e := 1 ir u n u m := l ll p l a y m o d e := o n eo f p l a ym o d e s ( b y e ) 2 2 面向机器人足球的智能体研究平台 2 2 1 面向机器人足球平台的多智能体原理 在机器人足球的仿真平台中,几乎所有环境均按照人类比赛的环境来模拟。 每一名球员程序都是身临其境地得到一些视觉、听觉、自己身体的感觉等感官上 信息,这些信息通过“大脑”的融合与提炼,并根据一定的信念进行分析和规划, 最终得到自己合理的“动作”并作用于实际的环境中”】。这其中的每一名球员 均可被看成一个智能体( a g e n o ,可以看出他具有自治性、社会能力、反应能力、 自发行为【l 。由于这些环境是依托程序设计语言和程序设计方法为主实现的,所 以人们又常把它划分为由s h o h a m 提出的面向智能体编程( a o p ,a g e n t o r i e n t e d p r o g r a m m i n g ) t 1 9 ,2 “。 社会学家认为,人是社会的人,这也就说明了人不能脱离社会和其他人而存 在。在智能体的研究中也有智能体之间通讯与交流的问题,如何使多个智能体协 作来完成某一个特定任务成为了一个研究热点,这就形成了人t 智能一个重要的 研究分支:多智能体系统( m a s ,m u l t i a g e n ts y s t e m ) 。而机器人足球的仿真平 台也正是一个多智能体的研究平台。每一个球队由1 1 个球员程序和1 个主教练 程序组成,也即由1 1 个进程与s e r v e r 相连接。球员程序之间、球员程序与教练 第1 1 页 上海大学硕士学位论文 程序之间的通讯只能通过s e r v e r 进行,而且由于这个过程是模拟人类听力模型来 实现的,所以它是受到极大限制的。例如每名球员每个周期只能发出一个1 0 个 字节长度的“说话”信息,而他也只能在“听到”近距离的某名球员上一个“周 期”的声音等。 h e w i t t 2 1 】于日出:一般认为,智能体是一种处于一定环境下包装的计算机系统, 为了实现设计目的,它能在那种环境下灵活和自主的活动。这个智能体的定义是 在众多智能体定义中比较能被大多数学者所认同的,但是在智能体特性研究过程 中,大家比较趋向于用智能体的一些特性来界定这一含糊的概念吲。在计算机领 域,a g e n t 是指分布式系统或协作系统中能持续自主发挥作用的计算实体,它具 有自主性、交互性、反应性和主动性的特征 2 3 , 2 4 】。而机器人仿真足球正是基于一 种多智能体理论基础上的实际物体,满足a g e n t 的4 个特征: 1 自主性智能体具有属于其自身的计算资源和局部于自身行为控制的机制, 能在无外界直接操纵的情况下,根据其内部状况和感知到的( 外部) 环境信 息,决定和控制自身的行为。r o b o c u p 球员拥有自己的模型,例如视觉、体 力、体重等。它能够感知到自身的状况信息和外部信息,并根据这些信息自 主地决策出自身地行为。 2 交互性能与其他智能体进行多种形式的交互,能有效地与其他智能体协同 工作。r o b o c u p 球队由1 1 名球员和1 名教练组成,它是一个多智能体的研究 平台,球员之间可以通过一定“叫喊”和“听力”规则进行交互,从而更好 地与其他球员协作,来赢得比赛。 3 反应性能感知所处的环境,并对相关事件做出适时反应。r o b o c u p 球员每 个周期都将感知到多方面的环境信息,例如视觉信息,听觉信息,教练信息, 裁判信息等,这些信息将触发球员适时地做出反应动作。 4 主动性能遵循承诺采取主动行动,表现出面向目标的行为。在足球比赛中, r o b o c u p 球员一起合作,来实现共同的目标,即“赢取比赛”。 2 2 2 面向机器人足球平台的智能体结构 智能体结构要解决的问题是智能体由哪些模块组成,它们之间如何交互信 息,智能体感知到的信息如何影响它的行为和内部状态,以及如何将这些模块用 第1 2 页 上海大学硕士学位硷文 软件或硬件的方式组合起来形成一个有机的整体,真正实现智能体 2 5 , 2 6 。本文在 研究过程中参考了多种智能体结构,并结合机器人足球的特点设计出种足球机 器人的智能体决策结构。 智能体结构方面的理论已逐步丰富和成熟起来,并在一些实践中得到了很好 的总结。由于应用领域的多样性,各种智能体结构“品种繁多”,要将其概括成 一种统一的模式结构是非常困难的事情。不少研究人员还是进行了高度的分析, 并总结出了几种以人类思维的层次模型为依据的结构,主要包括反应智能体结 构、认知智能体结构和复合式智能体结构。 2 2 2 。1 反应智能体结构 反应智能体( r e a c t i v ea g e n t ) 只是简单地对外部刺激产生反应,没有任何内 部的状态f 2 ”。它们有些类似于客户,服务器体系结构,每个智能体既是客户,又 是服务器,根据程序的安排,作出回答或发出请求。 图2 5 反应式智能体结构图 图2 5 给出了反应智能体的框图。条件动作规则使智能体将感知与动作连 接起来。其中方块表示智能体决策过程的当前的内部状态。椭圆表示过程中所用 的背景信息。智能体程序如下: f u n c t i o nf e a c t i v e a g e n t ( p e r c e p t ) r e t h r n sa c t i o n s t a t i c :r u l e s ,产一组条件动作规则+ s t a t e ( - - i n t e r p r e t - i n p u t ( p e r c e p t ) 第1 3 贞 上海大学硕士学位论文 r u l e ( - - r u l e m a t c h ( s t a t e ,r u l e s ) a c t i o n r u l e a c t i o n r u l e 】 r e t u r na c t i o n 上述程序中,i n t e r p r e t - i n p u t 函数从感知产生当前状态的抽象描述 r u l e m a t c h 函数返回与给定状态描述匹配的规则组中的第一条规则。 2 2 2 2 认知智能体结构 认知智能体是具有内部状态的智能体软件,它与具体的领域知识不同,具有 知识表示、问题求解表示、环境表示、具体通讯协议等。根据智能体思维方式的 不同,认知智能体可以分为抽象思维智能体、形象思维智能体。 图2 6 认知智能体结构图 图2 6 给出了认知智能体的框图。表明当前的感知信息与原理的内部状态 结合,产生修改当前状态的描述。认知智能体程序如下: f u n c t i o nc o g n i t i v e - a g e n t ( p e r c e p t ) r e t u r n sa c t i o n s t a t i c :e n v i r o n m e n t ,木描述当前世界环境8 k b ,幸知识库4 e n v i r o n m e n t u p d a t e w o r l d m o d e l ( e n v i r o n m e n t ,p e r c e p t

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论