(机械电子工程专业论文)微型足球机器人进攻策略的研究.pdf_第1页
(机械电子工程专业论文)微型足球机器人进攻策略的研究.pdf_第2页
(机械电子工程专业论文)微型足球机器人进攻策略的研究.pdf_第3页
(机械电子工程专业论文)微型足球机器人进攻策略的研究.pdf_第4页
(机械电子工程专业论文)微型足球机器人进攻策略的研究.pdf_第5页
已阅读5页,还剩52页未读 继续免费阅读

(机械电子工程专业论文)微型足球机器人进攻策略的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中文摘要 足球机器人是人工智能领域与机器人领域重要研究课题,也是一项极富挑战 性的高技术密集型项目。足球机器人比赛是在决策子系统指挥下完成的,【j , lj l e , 决策子系统的完整性和先进性对于整个足球机器人系统是至关重要的。 本文所讨论的进攻决策系统是整个决策子系统的一部分,以基于全局视觉的 微型足球机器人系统为研究对象。其主要任务是根据所用机器人的特点,设计出 一系列基本动作:这些基本动作可以进行组合从而编排出更高级的动作:为每个 机器人规划出一条最佳进攻路径,并引入多机器人协作机制,使场上两个机器人 可以相互协作共同完成进攻任务。 文中首先介绍了足球机器人的种类,对决策系统做了分析,介绍了决策系统 的任务及特点,给出了策略系统模型,详细论述了决策系统中实现的分层递阶思 想。然后详细讨论了机器人的运动规划问题,重点分析了基于快速扫描随机树的 路径规划方法的收敛速度问题。此外,还介绍了一种用卡尔曼滤波器进行球的运 动轨迹预测的方法,利用该方法可以对机器人运动时间进行估计。接着讨论了机 器人进攻动作设计方法,由简到繁地设计出了全套机器人进攻动作。最后讨论了 基于多机器人协作的进攻决策问题,对主攻机器人的进攻方式和辅攻机器人的跑 位机制进行了详细的讨论和分析。 关键词:机器人足球运动规划卡尔曼滤波快速扫描随机树 a b s t r a c t r o b o ts o c c e ri saq u e s t i o nf o rd i s c u s s i o ni nt h ef i e l do fa r t i f i c i a li n t e l l i g e n c ea n d r o b o t i t sac h a l l e n g i n ga n dh i g ht e c h n o l o g i c a lp r o b l e m t h er o b o t sa r ec o n d u c t e db y s t r a t e g ys u b s y s t e m ,s ot h ei n t e g r a l i t ya n da d v a n c e m e n to fs t r a t e g ys y s t e ma r et h e m o s ti m p o r t a n tf o rs o c c e rr o b o ts y s t e m t h ea t t a c ks t r a t e g ys u b s y s t e md i s c u s s e di nt h i sp a p e ri sap a r to fa l ls t r a t e g y s y s t e mt h er e s e a r c ho b j e e l sa r em i c r ov i s i o n b a s e ds o c c e rr o b o t s t h em a i nm i s s i o n i n c l u d e sd e s i g n i n gas e r i e so f b a s i cb e h a v i o r sa c c o r d i n gt ot h ec h a r a c t e r i s t i co fr o b o t s 、 w h i c hc o u l db ea s s e m b l e dt oa r r a n g em o r ea d v a n c e da c t s p l a r m i n ga no p t i m a la t t a c k p a t hf o re a c hr o b o t , a n di n t r o d u c i n gt h em u l t i r o b o tc o o p e r a t i v em e c h a n i s m t om a k e r o b o t si n 也ef i o l dc o m p l e t et h ea t t a c km i s s i o nb yc o l l a b o r a t i o n f i r s t l y , t h i sp a p e rp r e s e n t st h ei n t r o d u c t i o no ft h et y p eo fs o c c e rr o b o ta n d a n a l y s i so ft h es t r a t e g ys y s t e m ,i n c l u d i n gt h et a s k s ,c h a r a c t e r so fs t r a t e g ys y s t e ma n d t h em o d e lo fi t 1a l s od e t a i l e d l yd i s c u s st h ei d e ao fh i e r a r c h i c a ls t r u c t u r eu s e di n s t r a t e g ys y s t e m s e c o n d l y , t h em o t i o np l a n n i n gp r o b l e m so fs o c c e rr o b o t sa r e d i s c u s s e d p a t hp l a n n i n gm e t h o db a s e do nr a p i d l y e x p l o r i n gr a n d o mt r e ei st h e a n a l y t i c a le m p h a s i s f u r t h e r m o r e ,i no r d e rt o f o r e c a s tt h et r a j e c t o r yo ft h eb a l l , k a l m a nf i l t e ri sp u tf o r w a r d w h i c hc a ne s t i m a t et h ep o s s i b l et i m ew h e nt h er o b o tc a n r e a c ht h em o v i n gb a l la n dt h ep o i n tw h e r et h er o b o tc a nk i c ki t t h i r d l y , t h em e t h o d t h r o u g hw h i c ht h ea t t a c kb e h a v i o r so fr o b o t sa r ed e s i g n e di si n t r o d u c e d a n das e r i e s o fa t t a c kb e h a v i o r sa r ed e s i g n e df r o ms i m p l e n e s st oc o m p l e x i t y a tl a s t ,t h ea t t a c k s t r a t e g yb a s e d o nm u l t i - r o b o tc o o p e r a t i o ni ss e tu p w h i c hi n c l u d e st h ea t t a c km o d eo f t h em a i na t t a c k e ra n dt h es i t u a t i o no ft h ea s s i s t a n ta t t a c k e r k e yw o r d s :s o c c e r r o b o t ,m o t i o np l a n n i n g ,k a l m a nf i l t e r , r a p i d l y e x p l o r i n g r a n d o m1 l e e 独创性声明 本人声明所呈交的学位论文是本人在导师指导f 进行的研究工作和取得的 研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表 或撰写过的研究成果,也不包含为获得基生盘堂或其他教育机构的学位或证 书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中 作了明确的说明并表示了谢意。 始a 华一期:订年门 学位论文版权使用授权书 本学位论文作者完全了解墨壅盘茎有关保留、使用学位论文的规定。 特授权盘盗盘堂可以将学位论文的全部或部分内容编入有关数据库进行检 索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校 向国家有关部门或机构送交论文的复印件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 学位论文作者签名: 签字日期:v f 年 导师签名:誓慝 签字1 7 期:2 5 年1 月5 日 华即 a 第一章绪论 第一章绪论 足球机器人是当前国际上关于人工智能及机器人领域的研究热点。本章将就 足球机器人的起源及其发展、足球机器人比赛、其研究意义及当前的国际国内研 究状况做简单的介绍。 1 。1引言 1 1 1机器人足球的起源及其发展 机器人足球,顾名思义,就是制造和训练机器人进行足球比赛。机器人足球 的设想最早是由加拿大不列颠哥伦比亚大学的a l a nm a c k w o r t h 教授于1 9 9 2 年在 其论文o ns e e i n gr o b o t s ) ) 中提出的,希望经过五十年左右的研究,使机器人 足球队能够战胜当时的人类足球冠军队。机器人足球为人工智能和智能机器人学 科提供了另一个具有标志性和挑战性的课题。由于机器人足球不仅包涵大量前 沿学术问题,还像足球比赛一样充满激情、精彩和悬念,因此,从其诞生之1 起 就得到了全球学者和科学家们的广泛关注,得到了飞速的发展。 目前,国际上存在两个机器人足球比赛组织| 2 l ,其一是由国际人工智能学会 于1 9 9 6 年成立的国际机器人足球协会( r o b o c u p :t h er o b o tw o r l dc u pi n s t i t u t e ) , 日前已经成为国际上最具影响力的机器人足球比赛组织。其二是由韩国学者金钟 焕发起的国际机器人足球协会联合会( r l r a :f e d e r a t i o no fi n t e r n a t i o n a lr o b o t s o c c e r a s s o c i a t i o n ) ,成立于1 9 9 7 年6 月。 从最近几年的机器人足球杯赛来看,主要有如下几个特点i 3 j : 1 ) 发展迅速,比赛规模逐年扩大; 2 0 0 4 年6 月2 7 日至7 月3 日,在葡萄牙里斯本举行的第七届r o b o c u p 机 器人足球世界杯,有3 0 多个国家的2 0 0 支队伍参加了比赛,而成立之初仅仅只 有3 7 支队伍。f i r a 经过这些年的发展,比赛参赛队伍也超过百支。由此可见, 机器入足球的发展非常迅速。 2 ) 竞争激烈,比赛水平提高很快; 由于参赛队伍多,好多球队实力很接近,因此竞争非常激烈。每一次世界杯 赛队伍排名都会与上一届有很大的变化。这表明机器人足球已经受到各国的高度 重视,每次比赛各队的水平都有明显的提高,也会出现一些新颖的软、硬件设计 第章绪论 和巧妙的战术配合。 3 ) 研究不断深入,比赛类型不断升级。 各队都在不断探索新方法、新思路。以求进一步提高队伍的水平。也出现了 一些新的足球机器人类型,如1 9 9 9 年增加了s o n y 公司四足机器狗足球赛,2 0 0 0 年出现了拟人双足机器入踢球表演等。 为了提高机器人足球的水平,世界各国不仅加大人力、物力和财力上的投入, 而且在研究的深度上也不断深入,所有的这些都成为推动足球机器人发展的重 要因素。 1 1 2f i r a 机器人足球比赛简介 本文所研究的机器人足球比赛属于f i r a 组织的微型机器人足球比赛,如图 l 所示。比赛场地是一个1 5 0 c m 1 3 0 c m 的木质平台,四周有木墙( 高5 c m 、。 图1 1 微型机器人足球赛示意图 每个球队由3 个轮式移动机器人组成,机器人的长、宽、高均限制在7 5 c m 以内。 像人类踢足球一样,机器人足球也有相应的一套比赛规则。比赛开始后,通过球 场上2 米高处悬挂的摄像头将场上信息传入计算机,由预装的软件( 包括视觉子 程序和决策子程序等) 做出决策,再通过无线通讯方式传给场上的机器人。机器 人足球比赛的最大特点是在整个比赛过程中人不能干预,机器人必须完全自主独 立地进行比赛,因此每个机器人必须具备一定的智能,各机器人之间也要具有适 当的协调与合作能力。 2 第章绪论 2 机器人足球涉及的学科 机器人足球是人工智能与机器人领域重要研究课题,是一项极富挑战性的商 技术密集型项目。它集机械设计、机电一体化、传感技术、数字信号处理、幽像 处理与图像识别、知识工程与专家系统、决策与控制、无线通讯等理论和技术于 一体,不仅为开展智能机器人理论与技术研究提供了一个良好的实验平台,也成 为世界各围展示高技术实力的大舞台。 为了实现机器人足球赛的最终目标,即在2 0 5 0 年进行的人、机大战中战肘 人类足球队,还必须使机器人具备人的体态、体能和体感,因此,除了上面提到 的研究领域外,机器人足球赛还涉及到仿生学、材料、能源等诸多学科。 l _ 3 研究机器人足球的目的和意义 1 3 1 机器人足球的研究意义 机器人足球所涉及的学科相当多,研究足球机器人需要创新的内容也非常 多,不仅要求在各个领域内取得巨大的突破,还要求存各个学科之间进行交叉与 集成。机器人足球既是一个良好的实验平台,研究人员借以可以研究和应用各种 先进技术,反过来又可以促进相关领域的发展。这就是丌展机器人足球研究的深 远意义,也是机器人足球研究的魅力所在。 1 3 2 进攻决策子系统研究的目的及意义 足球机器人是在决策系统的指挥下进行比赛的,因此,决策系统在整个足球 机器人系统中处于非常重要的地位,其优劣直接关系到比赛的胜败及结果。只有 进攻才能得分一个好的决策系统必须拥有强大的进攻能力。足球机器人的智能 性主要体现在决策系统中,其智能水平的高低主要取决于决策系统的先进性、台 理性和实时性。 对决策系统的深入研究有重人的理论意义和实际应用价值1 4 】。利用足球机器 人这个优秀平台决策子系统的开发者可以最大程度地把当前人工智能和智能控 制领域的新方法和新理论应用于系统开发过程中,借以检验所用方法的先进性。 实际上,决策系统开发过程本身就是诸如任务的描述、分解与分配、智能体问的 交互及通讯以及一致性与协调性等诸多多智能体系统基本问题的求解过程。 足球机器人进攻决策系统的研究成果也具有巨大的应用价值。例如,在军事 足球机器人进攻决策系统的研究成果也具有巨大的应用价值。例如,在军事 第一章绪论 1 2 机器人足球涉及的学科 机器人足球是人工智能与机器人领域重要研究课题,是一项极富挑战性的高 技术密集型项目。它集机械设计、机电一体化、传感技术、数字信号处理、幽像 处理与图像识别、知识工程与专家系统、决策与控制、无线通讯等理论和技术于 一体,不仅为开展智能机器人理论与技术研究提供了一个良好的实验平台,也成 为世界各国展示高技术实力的大舞台。 为了实现机器人足球赛的最终目标,即在2 0 5 0 年进行的人、机大战中战胜 人类足球队,还必须使机器人具备人的体态、体h e w n 体感,因此,除了上面提到 的研究领域外,机器人足球赛还涉及到仿生学、材料、能源等诸多学科。 1 3 研究机器人足球的目的和意义 i 3 1 机器人足球的研究意义 机器人足球所涉及的学科相当多,研究足球机器人需要创新的内容也非常 多,不仅要求在各个领域内取得巨大的突破,还要求在各个学科之间进行交叉与 集成。机器人足球既是一个良好的实验平台,研究人员借以可以研究和应用各种 先进技术,反过来又可以促进相关领域的发展。这就是丌展机器人足球研究的深 远意义,也是机器人足球研究的魅力所在。 1 3 2 进攻决策子系统研究的目的及意义 足球机器人是在决策系统的指挥下进行比赛的,因此,决策系统在整个足球 机器人系统中处于非常重要的地位,其优劣直接关系到比赛的胜败及结果。只有 进攻才能得分,一个好的决策系统必须拥有强大的进攻能力。足球机器人的智能 性主要体现在决策系统中,其智能水平的高低主要取决于决策系统的先进性、合 理性和实时性。 对决策系统的深入研究有重大的理论意义和实际应用价值【4 】。利用足球机器 人这个优秀平台,决策予系统的开发者可以最大程度地把当前人工智能和智能控 制领域的新方法和新理论应用于系统开发过程中,借以检验所用方法的先进性。 实际上,决策系统开发过程本身就是诸如任务的描述、分解与分配、智能体间的 交互及通讯以及一致性与协调性等诸多多智能体系统基本问题的求解过程。 足球机器人进攻决策系统的研究成果也具有巨大的应用价值。例如,在军事 第一章绪论 上可以用于无人作战平台群的协作控制,让无人驾驶飞机编队或机器人部队自主 完成进攻任务。其研究成果还可以运用到交通控制1 5 】、软件开发、网络管理和信 息处理1 6 j 、商业管理【7 1 等众多领域当中。 研究进攻决策子系统,不仅需要具有机器入学、自动控制等方面的知识,还 要有一定的计算机知识,涉及人工智能、决策算法、软件工程等等。本人较系统 地学习过机械电子工程和计算机科学与技术方面的专业知识,研究这个课题有一 定的基础。通过这个课题的研究,还将进一步拓宽知识面,增强自己的专业知汉, 使知识和能力都得到进一步提高。 1 4 进攻决策子系统研究现状及发展趋势 g u p t a 于1 9 9 2 年提出了次序规划法1 8 】,其基本思想是直接或间接把高维问题 简单地转化为低维问题来处理。这种方法在简单环境下能有效规划出路径,但在 复杂环境下,尤其是多维空间,却存在很多问题。文献【9 】提出了“环境信息反 馈”法。首先建立人工势场,其负梯度方向即是系统的运动控制方向,要使移动 机器人沿“势峰”间的“势谷”前进。该方法的优点是系统的路径生成与控制直 接与环境构成闭环,大大加强了系统的适应性与避障性能;但困这种方法是将机 器人作为一个质点来处理,因而只适宜于进行位置控制,丽要对机器人进行姿态 控制就比较困难。文献f 1 0 】介绍了一神通过计算对方球员的运动范围和踢球的角 度进行射门的方法。这种方法可 以使得进攻机器人成功突破对方 后卫和守门员的拦截,但因该方 法没有选择合理的射门点的过 程,因而经常出现射门机器人不 能将球踢进对方球门的情况。文 献【1 1 】介绍了一种足球机器人底 层控制方法,其底层控制规则是 一系列的能得到左右轮轮速v ,、 v ,的方程组,计算方法如下: a = 口一西, 图1 - 2 文献 1 1 】计算公式的符号示意图 ( | r ) = ( c o s 2a s g n ( c o s a ) ,s i n 2 s g n ( s i n a ) ) v ,= v ( t r ) , ( 1 1 ) ( 1 2 ) ( 1 3 ) 筇一章绪沦 v 。= v ( r + r 1 , 目卅+ m i n o z , t a n - k ( 吾m 用式( 1 5 ) 中计算出柬的0 。代替 式( 1 1 ) 中的0 计算后的”f 、v ,就 是当前所需的左右轮轮速,上面 的各种符号含义如图1 2 。本人 经实验表明,这种控制方法只在 球场某一半场( 以球场中线的中 垂线为分界线) 内形成的机器人 路径是最佳路径,如图1 3 中情 况l ;而在球场的另外一半范围 内,机器人会沿固定时针方向绕 目标点运动,如图l 一3 中情况2 ( 1 4 ) ( 1 5 ) 厂 、筋情况l 弋 园f ) 情况2 阁1 - 3 文献【1 1 中的底层动作实验结果图 所示,这样不仅可能失去踢到球的机会,而且可能阻碍本方其它机器人踢球的路 线。文献【1 2 【1 3 】 1 4 】提出的经典动力学规划思想可以用来解决一大类问题,产生 最佳数字控制方案,称为网格( 或栅格) 法。该方法采用网格( 或栅格) 形式来表示 路径点,并用插补法定义了一些值,使得输入在状态空间中的每一部分上都能被 选上。如果只需要开环方案,那么网格中的每个小格都会用一个节点来代替,这 样,控制理论数字动力学规划技术经常被简化成一棵以起始状态点为根节点的 树。因为这个方法是以网格( 或栅格) 上的动力学规划和系统搜索为基础,因此其 适用性仅限制在低自由度的问题中。文献【1 5 提出了随机势场法,对于完整性规 划问题非常有效。但由于该方法非常依赖于选择一个好的启发式势函数,因此如 果遇到障碍物、或者是存在微分约束时,如何选择启发式势函数就成为一个令人 畏惧的任务。文献1 6 1 1 7 1 介绍了概率路标法,通过产生随机状态点并用局部规 划器连接相近的状态点,从而在构形空间中构造出一个路线图。对于完整性系统 或者可操作非完整性系统规划问题,局部规划步骤会非常有效;然而,因其连接 问题会像设计非线性控制器一样困难,特别是对于复杂的非完整性动态系统,概 率路标法需要连接成千上万状态点来寻找解决方案,如果每个连接都是一个非线 性控制问题,那么对于许多有微分约束的问题来说用概率路标法简直就是不切实 际的。 从最近一届世界杯录像资料可以看到,世界强队的决策子系统已日臻完善, 不仅简单情况处理得简洁有效,许多复杂情况也处理的很得当。 第一章绪论 1 5 论文主要研究内容及结构 本文集中研究微型足球机器人进攻决策系统。面对场上千变万化的情况,人 类足球运动员利用大脑对当前各种条件进行综合和判断并做出相应的动作。足球 机器人则是根据视觉系统传过来的场上信息,利用决策系统综合考虑当前情况, 推测出下一步场上态势,进而决定每个机器人的动作并发出运动命令。进攻决策 系统的研究重点将放在以下几个方面: 1 ) 动态环境中的路径规划及避障问题 路径规划就是在一个充满障碍物的环境中,规划一条从机器人的初始位置到 目标位置之间满足一定优化指标( 如时间最短、距离最短等) 的路径p j 。微型足 球机器人比赛场地四周有边墙,属于静态障碍物。比赛中同时有6 个机器人参与, 每5 个机器人就成为另一个机器人的动态障碍物。经过科学家们几十年的努力, 静态环境下的路径规划问题已经有了很大的进展,也产生了很多比较实用的路径 规划方法。但动态环境的路径规划算法还相当不成熟,还需要更进一步的研究。 2 ) 多智能体协作框架下的进攻队形 多智能体系统是分布式人工智能的研究热点问题,其特点是由多个智能体协 作完成一项任务。微型机器人足球赛每支队伍由3 个机器人组成,3 个机器人相 互合作共同完成攻防任务,是一个典型的多智能体系统。在进攻时,由于进攻方 投入的机器人只有2 个,对方投入的防守机器人数为3 个,因此不但要发挥每个 机器人的个人技术,更重要的是还得通过合作策略发挥集体的力量,获得1 + 1 2 的效果。这就要求分配好每个机器人的角色及其相应的动作,使各个机器人的行 为不产生干涉,这对于整个决策系统是相当重要的。 多智能体协作框架可定义为系统中智能体之间的信息关系、控制关系以及问 题求解能力的分布模式。它是结构和控制的有机结合,通过对角色、行为预测和 控制关系的定义提供智能体活动和交互的运作架构。多智能体协作框架是多智能 体系统的最高部分,多智能体之间的协作机制就是通过它来实现的。协作框架决 定了多智能体系统在任务分解、分配、规划、决策及执行等过程中的运行机制及 系统各智能体所担当的角色。对机器人足球比赛这个动态的、有对抗的多智能体 系统,如何建立起有效的协作框架并使多个智能体表现出团队行为,是需要进一 步研究的问题【l ”。 3 ) 实时决策问题 决策的过程就是状态空间到动作空间的映射过程。在微型足球机器人比赛中 一般要完成摄像头图像摄取、视觉系统计算球和队员的位姿、决策系统提出对策 并发出运动指令、足球机器人接收并执行动作指令等工作,整个循环周期总时间 6 第一章绪论 小超过三二十三毫秒。除去视觉处理等耗时留给决策系统的时问相当有限。此外, 随着硬件性能的不断提高,整个系统的扫描频率会不断提高,这就要求决策系统 的实时性必须越来越高。解决实时决策问题要考虑各方面的因素,包括程序的简 练性、算法的复杂性和效率、控制结构和方法等。这也是一个很有挑战性的i 作。 论文内容安排如下:第二章将介绍决策整体模型及决策基本思想等。第三章 将讨论单个机器人的运动规划,包括机器人的路径规划、轨迹生成和轨迹跟踪, 并将详细论述本文将采用的路径规划方法。第四章将讨论机器人的动作设计,包 括底层基本动作、技术动作、战术动作和组合动作,按照从低到高、先简单后复 杂,逐渐深入的方式进行讨论。第五章将讨论多机器人协作问题,构建起多机器 人协作进攻的决策子系统。 第二章决策系统模型 第二章决策系统模型 本章将会较为详细的介绍足球机器人控制方式种类,并对决策系统做分析 将介绍决策系统的任务及其特点,还会给出策略系统的模型,最后详细的叙述实 现决策系统的分层递阶思想,分析这种解决办法的优缺点,并提出改善系统的 办法。 2 1 足球机器人控制方式分类 2 1 1 对人类踢足球的分析 人类智能的表现是相当广泛和丰富的,归纳起来其主要表现是在感知、思维、 表达与动作三大方面。有关人工智能的定义也是众说纷纭。说白了,人工智能就 是对人类智能的理解与机器实现b 。例如,当计算机能够下象棋,我们说这是机 器智能:当一套装置可以摄取图像并做出判断,我们说这是机器视觉。但这都仅 仅是对单一方面的功能而言。同时也要看到,任何人类智能的机器实现都是相当 困难的。 因此,在研制机器人踢足球之前,必须对人踢足球活动做认真的剖析。人的 五官、头脑和四肢是一个有机的整体。如今这样的活动要让机器实现,就必须将 这些融为一体的活动进行认真的分解。就单人踢球而言,首先要看到球和球门, 想好了怎么上,再发力完成相应的动作。如果是多人踢球则还要沟通信息,实 现配合。高水平足球队所表现的视野宽阔,头脑清醒,判断准确,动作灵活,配 图2 - 1人踢足球智能环节连接图 第一二章决策系统模i q 合默契等绝对是高级智商的表现。上述智能环节是可以通过图2 - 1 表达的。并 且可以进一步归纳为,主动感知就是确定场上实体位姿,寻找目标,发现障碣等 思维决策则是判断态势,明确角色,规划动作;信息沟通便是通过手势、语言 甚至眼色达成默契;而动作实现则包括跑动、踢球、拦截、射门等。 显然,要让机器人一下实现如此丰富的功能是4 i 现实的。因此,山简入繁 先易后难,先个体后团队便是研发足球机器人系统的必然途径。 2 1 2 足球机器人系统控制方式分类 目前,足球机器人系统主要有三种控制方式1 9 】【2 0 】f 2 l 】:l 、集中控制式遥控机 器人足球系统( v i s i o n b a s e dr e m o t eb r a i n l e s sm u l t i - r o b o ts y s t e m ) ,主机通过无线 方式控制机器人;2 、集中视觉的有智能足球机器人系统( v i s i o n b a s e d b r a i n o n b o a r dm u l t i r o b o ts y s t e m ) ,主机通过处理摄像机获取的信息来控制机器 人;3 、基于机器人的多足球机器人系统( r o b o t b a s e dm u l t i r o b o ts y s t e m l ,这种 系统无需主机控制,每个机器人通过自身的传感器获取信息并做出判断。 ( 1 ) 集中控制式遥控足球机器入系统分为机器人小车、视觉、决策和通讯四 个子系统,形成一个视觉位置闭环的多运动体的轨迹决策与控制系统。这种系统 中机器人结构比较简单,突出了计算机视觉与机电一体化,易于设计与实现。t i 于没有传感器且所有决策运算都在主机执行,为了精确控制机器人的运动,故主 机计算能力要求较高;由于作为闭环周期决策输出的左右轮速度具有较高实刚 性,故系统执行速度要求较快,以避免过大的时间延迟。 ( 2 ) 集中视觉有智能足球机器人系统中,主机负责处理视觉数据,根据决策库 进行决策选择然后依据功能库确定每个机器人的具体行为,将控制命令发给机 器人。机器人根据主机命令运动,并通过速度控制器控制运动速度,根据自身传 感器的数据进行自动避障。各机器人将根据统一约定独立决策,使多智能体协调 图2 - 2 集中视觉式系统框图 问题更为突出和现实。相对于集中控制式系统,这种集中视觉式系统增强了智能 体的智能程度,提高了系统精确性,降低了主机计算负担,使控制更灵活、精确。 ( 3 ) 基于机器人的多足球机器人系统。系统不存在主机,每个机器人具有自 主行为,根据其摄像头观察场上形势,通过自身策略库进行策略选择,根据传感 器的数据自主避障,通过通讯系统与其它机器人进行通信。即所有计算、决策和 9 第二章决策系统模,“ 控制都由机器人自身完成。机器人足球比赛巾,环境是动态的,对方机器人的动 作往往也是不可预测的。这种机器人系统要求智能体刁i 仅能自我控制,而还要 能主动跟踪和控制球,这对移动机器人技术、人工智能等都有了更高的要求。 蚓2 - 3 分布控制式系统框图 2 2 机器人足球决策系统分析 2 2 1 进攻决策系统的任务 在足球机器人系统中,决策子系统的任务就是根据当前球场上的比赛形势, 当态势分析认为应当进攻时,经过分析,做出有规划的部署,给队员发出指令, 使机器人小车能像真难的足球运动员一样,做出各种动作,尽可能完成进球这个 目标。 通常人们在体育比赛中以形象思维为主,对球场信息的处理通常是在模糊概 念基础上的,如:远、近、快、慢,用自然语言进行推理、决断,显然,这 种思维过程必然处在一种千变万化的动态环境之中。而足球机器人决策子系统使 用精确的数据和刻板的程序语言。如何将人的决策思维形式化、规范化,并用计 算机语言表现出来,属于知识工程的范畴,这也是机器人足球比计算机下豳际象 棋更具有挑战性的要点所在,也是决策子系统的难点所在。 2 2 i 决策系统的特点 如图( 2 4 ) 所示,决策系统是一个有如下i 0 关系的知识性系统: 0 = f ( i ) 其中,。矩阵是视觉输入的数据,0 3 。:矩阵是决策输出结果,即我方每个机器 人小车的左右轮设定,因此也可以说决策子系统是从状态空间到动作空问的映 射。可以看出,这种映射关系是复杂、非线性、非结构化的函数关系。 综上所述,足球机器人决策系统的特点可归纳如下: 1 、 厂是一个非常复杂、非结构化的函数关系,体现教练员、运动员的决策过程, 显然解不是唯一的; l o 第一章决策系统模型 2 、 需要将模糊的形象思维转化为严谨的逻辑推理与数学计算过程: 3 、要体现智能控制系统的分层结构,把上层教练的决策与单个队员的决策统 起来: 4 、经验要逐渐积累,知i : 要逐渐丰富,策略在逐步发展。 l 视觉系统i , p 机器人左右轮轮 足球机器人 速设定 i 脯釉 策略系统 一 图2 - 4 、决策系统输入输出模块图 2 2 3 决策系统模型分析 足球机器人的决策系统扮演着教练员和运动员思想的职责。在真实的绿茵 场上,作为教练员要根据球场上的实际情况来部署球员,同时也根据不同的埘手, 选择不同的队形;足球机器人赛场上,决策者也应该根据不同的球队采取 i 间的 策略,对于错综复杂的球场形势,运用灵活的策略。作为运动员,应该根据球场 形势不断思考,寻找最佳传球队 员、判断球速、判断最佳接球点、 判断最佳射门点等,在足球机器 人系统里,也应该有对相应问题 进行处理的程序。一个好的决策 系统不可能一劳永逸地一次性 开发完成,而应该是一个不断完 善的过程。因此,构建一个合理 的、可持续开发的决策系统框架 就显得尤为重要。 翻2 - 5 比赛示意图 纵观整个足球机器人系统, 决策系统所能得到的信息仅是由视觉系统传递来的球的位置以及球员的位置和 方向信息,而决策系统传输给小车的信息仅为小车的左右轮轮速,面对这样一个 问题,面向对象的程序设计思想就是把整个决策系统看成一个复杂的对象,然后 进行分解、细化,最后使每一部分简单化。分析一下如图2 5 这种态势下的决策 过程:看到图2 5 所示场上形势,教练员首先直接看出球员2 离球近,球员l 离 球远,然后就赋予球员1 、2 不同的任务。当然,这是人通过形象思维得出的结 果,然而不幸的是,人们由形象思维完成的这一过程,必须转化为计算机的逻辑 第。章决策系统模型 运算过程。为了对上述教练员的决策过程进步抽象,东北大学的徐心和教授提 出了如下的六步推理模型1 2 3 1 :( 1 ) 输入信息顸处理( 计算有关实体速度、相对l i 离 等) ;( 2 ) 态势分析与策略选择;( 3 ) 队形确定与角色分配;( 4 ) 目标位置确定;( 5 ) 运动轨迹规划:( 6 ) 轮速确定。对六步推理模型进一步简化,可以得到如下推理 过程:输入信息预处理;态势分析;角色分配:动作实现。 基于上述推理过程,我们得到如图2 - 6 所示的决策树。决策系统首先处理从 视觉系统传来的位置信息,给态势分析提供必要的数据,山于场上的形势瞬息j 变,进行态势分析时,需要对各种态辨分类,从而得到不同格局,针对不同的格 局,我们可以采用不同的策略,能够灵活应付场上的形势。然后就是各个小车的 具体角色的分配以及他们完成各自角色所需采取的动作,这样,也就完成了整个 决策过程。 图2 - 6 决策树 可以看出,上述分析过程,都是分析整个决策过程这个对象,构建了决策树, 并没有考虑这个决策过程的功能是如何实现的,是完全基于面向对象的程序设计 思想,为决策系统的设计与开发提供了个较好的框架。 2 3 足球机器人决策系统的设计 2 1 3 1 决策系统的分层 决策系统的载体是一台计算机,其决策功能有计算机内运行的决策程序实 第二章决策系统模型 现。以视觉系统返回的图像数据为依据,经分析后,从策略库中调出合适的决策 方式,并将其参数化,形成三个机器人的运动指令。同时,对指令的执行效果做 出评估,如需要,则对决策库做一定的修改,最后将指令发给通讯系统,并要求 通讯系统向机器人发送指令。 决策子系统设计应考虑以下几个问题弘4 j : ( 1 ) 足球机器人比赛环境复杂。决策子系统面对的是一个复杂、动态、难以 准确得到模型的环境。决策子系统应能适应复杂的环境,为进一步的决策提供良 好的背景数据基础。 ( 2 ) 由于决策的目的就是取得比赛的胜 利。所以决策予系统应该能适应并击败对 方,因此,策略库应该是开放性的,决策子 系统应具有一定的自学习的能力。 ( 3 ) 由于必须实时控制小车,因而决策必 须满足实时性要求,能在较短的时间内完成 决策过程。决策时间越短,实时性越好。 我们将采用分层递阶控制的方法拉刈开 发决策子系统,这是一种集中控制方式。即 用一个全局控制器,对三个机器人进行统一 控制。 分层递阶控制方式对决策思路进行逻 辑上的分层,一般来说,决策思路是先确定 机器人之间的协作关系,然后根据配合的要 视觉子系统 协调层:机器人之间 的角色分配和协调 运动规划层:设定机 器人的运动方式 下 基本动作层:设定机 器人左右轮速度 茸信始 通讯系统l 图2 - 7 决策流程 求确定每个机器人的运动方式。分层的具体方式可以有一定的不同,本文把决策 的层次分为协调层、运动规划层、基本动作层,如图2 7 所示。 1 、协调层 协调层是决策系统的最高层它接受来自视觉系统采集到的场地数据,包括 机器人和球的位置。根据这些数据判断场上的形势,从知识库中抽取合适的协作 模式,定出合作的意图,并将意图传入下一层。协调层的关键有两点:场上形势 的判断和协作模式的选取。 人类的比赛中对场上形势信息的获得是直观和模糊的,我们的判断就是建立 在这些模糊的感觉上。而机器人视觉子系统得到的是具体的数字,这种对形势的 感受常难以用具体的数字来表达。决策子系统必须要从具体的数字符号中抽象出 对形势的估计,因此如何界定形势的各种状态就显得很重要,这涉及到如何从数 字中进行知识抽取和归纳。 第一二章决策系统模牙! 协作模式的选取使用专家系统。纠织策略库的结构是决策的前提。选样的依 据不同可以形成不同的策略库,本文将采用将场地分为若干区域,根据机器人处 于不同区域以及机器人、球之问的相对位姿来选取对应的协作方式。 2 、运动规划层设计 运动规划层是将协作意图进行分解细化的部分。它体现了群体协作与个体之 间的对应,即如何通过个体的运动来反映群体协作的整体效果。简单说就是针对 每个机器人所分配到的角色形成它的运动方式,因此,它注重的是个体要完成什 么动作。 运动规划层设计要求规划生成速度要快,控制周期之间规划的衔接应浚连 贯,规划的运动方式本身应该平滑,并尽可能简洁。在本文研究的机器人足球运 动规划中,还要求有避障处理,因此规划层考虑了有障碍物情况下的运动规划, 寻找快速和避障的最佳平衡点。 生成运动方式的方法很多,但并不意味着混合使用多种的规划方式可以产生 很好的效果。在不同规划的选择依据的临界处,由于某种原因使某些条件交替处 于两个规划的依据范围内,则产生不断交替使用两种规划的情况,使机器人的运 动出现反复振荡的情况,所以,我们提高了规划方法的适用范围,减少规划方法 的数量。 3 、基本动作层设计 基本动作层是决策系统的最底层,它将运动规划层产生的阶段性目标和具体 的行动指令对应起来,如要求机器人到某个点或转过某个角度,基本动作就生成 一定的运动指令,使机器人能完成走直线或转弯的动作。快速性和准确性是该层 设计的关键。 基本动作是不可分解的动作,这些动作可以离线设计。通过分析和实验得到 一组基本动作集合,然后通过调用集合的一个或几个基本动作,组合形成复杂的 动作。为此,要解决组合基本动作时的平滑过渡问题,避免变换过于生硬造成的 反应缓慢或运动失控。 由于它是决策最底层和机器人运动的控制紧密关联,在某种程度上,它的功 能和机器人车载控制器的功能有重叠。由于车载控制器的控制程序已经l 司化在车 载芯片内,而且车载芯片处理能力受限,基于动作层有时必须能补偿车载控制器 的不足,比如当机器人性能变化的时候。基本动作层应能修改部分参数,补偿性 能损失。 2 3 2 决策子系统分层的特点 这种决策模式下,机器人的智能部分由统一的全局控制器来实现,使各个机 第二章决策系统模刑 器人仅作为全局控制器的执行机构,所以这种决策模式属r 单智能体模式。决策 的流程是从上至下的。数据流是单向的,卜层充分执行上层意图,执行过程流畅 高效。但是,这意味着下层对上层没有反馈。 这种体系结构的各层在逻辑上是紧密关联又相对独立的,所以,设计过程允 许对各层分别设计。设计某层时将其他层对该层的影响作为约束条件加以考虑。 使用这种全局控制器模式能从整体上把握场上队员的情况,机器人之问无需进行j 交互,节省了决策的时间丌销,在策略库和推理机制完善的情况下,可以高效地 完成任务。但这种模式没有体现将每个机器人视为智能体的特征。另外,这种模 式下所有机器人共用一个策略库,这使得必须一次性生成三个机器人的指令,但 由于职能不同,机器人各自的决策所需资源开销不同,一次性生成指令则强迫所 有机器人决策时间一致。因此,全局控制器方式方面减少机器人的交互,节省 了开销,另一方面却造成了部分浪费。 对此我们引入多智能体模式,将每一个机器人视为个人智能体,享有独立 的资源空间,由于系统硬件环境的特征不变,每个机器人对环境变量的获取仍然 足全面的,这就保持了全局控制器的优势。每个机器人独立审视场上形势并进行 群体协调,形成群体意图后,每个机器人独立完成自己的任务。这种模式下,每 个机器人有自己的策略库,各自的策略库的变化不尽相同,体现了机器人的个性。 第三章机器人运动规封 第三章机器人运动规划 足球机器人的运动能力,包括移动、转动等,是机器人系统执行指令能力的 反映。m i r o s o t 足球机器人采用的是一种轮式移动机器人结构,这种结构的移动 机器人的运动规划具有一定的典型性。运动规划是最根本的问题,就是基于机器 人当前的位置、方向和速度,合理的分配机器人左右两轮的速度,使它能够快速 实现期望的位置、方向和速度。显然,时间最优是控制算法期望实现的目标。 3 1m ir o s o t 足球机器人建模 3 1 1 非完整性约束系统介绍 根据质点系的速度和位置是否受到一定的限制,有非自由质点系和自l i 质 点系之分。限制系统各质点位置和速度的这些条件成为约束,约束可用数学方程 解析的表达,称为约束方程。 通常根据限制条件( 是限制系统质点的位置还是速度) ,约束可以分为儿何 约束和运动约束。在约束方程中,只包含系统各点的坐标,不包含系统各点的速 度,这种约束就是几何约束。如果在约束方程中包含系统各坐标对时间的导数, 则为运动约束。如果运动约束方程可积分为有限形式,则与几何约束没有显著著 别,称为可积的运动约束,它与几何约束,总称为完整约束。不可积分为有限形 式的运动约束,则称为非完整性约束【2 ( n o n h o l o n o m i cc o n s t r a i n t ) 。 受非完整性约束的系统,称为非完整性系统。约束条件不能等价的表示成 广义坐标函数,约束中含有广义坐标对时间的导数。本文研究的足球机器人就是 典型的非完整性系统,其物理含义是机器人不能沿轮轴方向运动。非完整性控制 系统没有孤立的平衡点,因此没有局部渐进稳定平衡点,只存在包含原点的平衡 流形“( e q u i l i b r i u mm a n i f o l d ) 。 3 1 2 机器人小车运动学模型的建立 m i r o s o t 机器人是典型的轮式移动机器人( w m r :w h e e l e dm o b i l er o b o t s ) , 它有两个独立的驱动轮和一个辅助轮,在机器人小车底部成正交排列,如图3 - 1 ( a ) 所示。两个驱动轮同轴且独立运动,这种结构的机器人运动规划有一定的典

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论