英文文献翻译中文 6-5.doc_第1页
英文文献翻译中文 6-5.doc_第2页
英文文献翻译中文 6-5.doc_第3页
英文文献翻译中文 6-5.doc_第4页
英文文献翻译中文 6-5.doc_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

毕业设计(论文)文献翻译文献原文出处:Journal of Advanced Manufacturing Systems文献名: TEACHING MANIPULATION SKILLS TO A ROBOT THROUGH A HAPTIC RENDERED VIRTUAL ENVIRONMENT学生姓名: 董伟光 专 业: 机械电子工程 学 号: 040582 指导教师: 王殿君 2008 年 4 月 1 日在具有触觉的虚拟环境下机器人的示教操作技能 一种新的关于执行复杂受限运动任务的机器人机械臂的规划范例正在研究中。机器的操控技能的教学始于在具有触觉的虚拟环境中演示这些技能。在虚拟环境中产生的位置和接触力、力矩的数据再结合某一任务的先验知识可以用来识别和学习新的示例任务中的技能,然后在机器人系统中复制这些技能。本文将“装订入孔”问题作为一个研究案例。本文描述了总体概念;呈现了建立虚拟环境并学习基本技能的方法;提供了到目前为止所取得的成果。 关键词:触觉;技能学习;虚拟现实;装订入孔1. 绪论机器人作为一个自动化的工具在工业中被广泛应用,以提高工作效率。对于大量的工业任务来说,力敏操纵是一个通用的需求,特别是那些与装配有关的力敏操作。例如,在“装订入孔”问题中,钉子的自动插入经常被视为装配自动化问题中的基准问题,因为它简明扼要地代表了受限运动的力敏生产任务,并具有干扰、快速清拆、快速插入、可靠性等所有附随问题。阻碍机器人在装配作业中更广泛的使用的一个重要因素,就是没有快速可靠的方法对机器人进行规划以执行此类任务。因此,在实践中机器人一直无法方便的复制人类操作者所具有的复杂的力及力矩敏感能力。在这项工作中,一个关于机器人机械臂的运动规划的新的范例正在研究中。它的意图是,机器教学将开始在具有触觉的虚拟环境中模仿人类操作者所演示的一些基本技能。结合某一任务的先验知识,在虚拟环境中产生的位置和接触力、力矩的数据可以用来识别和学习新的演示任务中技能,然后在机器人系统中复制这些技能。虚拟环境的使用将简化这一过程,因为训练数据将被直接从触觉系统中提取。这也是机器人训练中一个崭新的手法,使这项研究能利用虚拟现实技术和计算机仿真最新发展成果。 在“装订入孔”的研究中已经形成的方法代表了繁忙的装配作业。然而,针对该系统形成的算法尽可能越通用越好。他们能识别自动装配中的基本操作技能,然后把它们转化成针对某一特定应用的机器人机械臂的轨迹和任务规划。 在下文中,将描述虚拟环境的设计,并介绍技能学习算法。2.背景通过编程,机器人机械臂最初用于执行某一特殊任务。到目前为止所形成的编程方法可分为四大类:文本编程,离线模拟编程,归纳学习和教学指导。文本编程,可用于复杂的应用,但发展时间很长,且需要特殊技能和很大的努力才能产生完整的程序。这就导致了任务级机器人语言发展。但通用任务级语言已被证明编译时间相当密集。 离线模拟编程通常在一个共同的平台上结合文字编程和基于模型的运动规划器。这种方法功能强大,但需要特殊的硬件和对现实环境的完整描述,这两方面都代价昂贵。在归纳学习中,一个机器人手臂通过反复试验掌握适当的运动和传感战略,这是一个有效的方法,当用于完善其他编程方法时,这一编程方法很有效。在“教学指导”中,一个人类操作者在现实环境中驱动机器人手臂完成任务,同时运动参数被记录。尽管其设计较为简单,但这种方法并不通用、灵活且不适用于复杂的任务。它不能容纳广泛的感官相互作用,对操作者来说具有危险性。很多人曾多次尝试克服“教学指导”编程办法中的一些缺点。萨默斯和格罗斯曼将收集到的感觉信息及与操作者的交互作用嵌入到任务教学程序中。Asada and assari从在人类操作者操作过程中产生的位置和力的数据中提取控制规则,以执行一个特殊的装配任务.Sator and Hirai通过主从式的操作臂将直接教学与任务级语言综合在一起。 “展示教学”的概念已经成为“教学指导”方法的另一种延伸,在“教学指导”方法中,机器人系统通过观看人类操作员完成某一特定任务来学习如何完成某一任务。该学习方法最初是用于开发计算机现场理解和自动运动感知功能。最近的一些发展大大推进了“展示教学”方法在机器人机械臂编程规划中的应用。Ikeuchi and Sehiro开发出一种系统,可以从由一系列的传感器获得的面接触状态的转换中提取良好的运动顺序。Haas利用视觉伺服将象征性识别和播放模块综合起来,应用于两维取放作业。Yamada and Uchiyama进行了一项研究,以确定基于多传感器数据的人的身体技能的基本特征,及将曲柄旋转和侧面匹配任务的基本特征转移到机器人上的可能性。Kuniyoshi等人开发了一种机器人系统,通过看一个人执行装配任务,可以实时学习可重复利用的任务计划。该方法是基于视觉识别和对人的行动顺序的分析。该方法的有效性在座装配任务中得到证明。在一个互动环境中,从人到机器的技能的直接转移,已成为机器人系统编程和培训的下一阶段。在移动机器人领域,帕墨利奥用一个3层感知器网络来控制CMU ALVINN自主汽车。在技能向移动机器人转移时,格鲁迪奇与劳伦斯用了一个近似方法,来产生机器人从传感器输入到舵机输出的映射。在获得操控技能,尤其是受限运动的操作技能方面,凯塞和迪尔曼所做的工作意义重大。为了从人类示范中获得基于传感器的机器人技能,他们的研究提出了一种一般的做法。他们还提出了一种改编的方法,以优化机械臂的运行方向。该方法在装订入孔和开门任务中被证明是有效的。在就基于知识的“告诉”的方式来描述机器人将要执行的任务和将要采取的纠正控制措施方面,Handleman 和 Lane已进行了一些初步的工作。作业任务由一个以规则为基础的目标指向策略来定义。他们提出的方法只在装订入孔的问题中通过计算机模拟得到证实。以规则为基础的系统的发展直观且比较复杂。已经形成的规则大多以文本编程为基础,对于任何新的应用,规则必须从有到无重新建立。3.人机学习这项工作的目的是在机器中实现人类技能学习。除了自我发现,人的技能的学习通常通过讲师在运动领域的培训实现的,在这一领域,“马达”是一个应对刺激的看得见的运动反应。据史密斯的观点,有三种类型的动作。首先是姿势性运动,用以调节身体位置.第二个是自发运动,用以调动和旋转身体,第三类包括操控性动作。操控行动作是本研究的焦点,因为他们是机器人机械臂在自动装配中需要模仿的一类运动。辛普森根据运动领域中人的行为提出了一个具有七个层次的分类等级的模型。该模型是作为一个分类法而形成的,它由以下几部分构成:(1)观感,涉及感官刺激,线索的选择和转化。(2)设置,涉及心理,生理和感情设置。(3)引导反应,涉及模仿和试错学习。(4)机制,涉及力学和习惯动作。(5)复杂的显性反应,这代表了学习者完成动作技能时一个更高层次的技能。(6)适应,使技能适应环境和任务的变化。(7)定位,代表了自动行为。第一,二层次并不能完全代表看得见的行为。下面的三个层次代表了许多运动技能内在的一个学习顺序。最后两个级别可以被解释为基本运动技能的细化和为达到同样目标产生的运动模式。对于操控性运动,在最后两个层次上,把缓慢、僵硬、谨慎的动作变成平稳的弹道轨迹,需要少得多的精神注意力。从认知形式的处理到更自动化的转化可以用以下词汇描述,例如清晰对模糊、协商对被动、宣示性对程序性。 在机器学习中,由于人和机器的基本不同,这种分类的仿真是无法完全实现的。在这项工作中,通过演示,操控性学习可以被仿效到何种程度,在探索中,着重在阶段(a),(c)和(d)-(f),因为这些都是和机器及机器人的制造应用特别相关的。4.系统的总体情况操控技能是指转移、身体变换或一部分与另一部分配对的能力。当测序和结合能达到预期的操控结果时,一个具体的操作技巧是由一些基本技能组成的。通过运动uh(t),由人力操作员将操纵任务(MS)的应用到这一部分,并把这一部分从初始状态xh(ti) 转换成最终状态xh(tf)。管制行动命令uh,提供了位置和力/力矩设置.根据操纵的类型,状态向量可以代表位置,方向,及这一部分的尺寸或其与环境的接触力/力矩。在任一时间的不同测量状态的态变量,代表操纵系统yh(t)的输出。变量x、u和h是向量。图1 系统的总体模型图1描述该系统的结构,该系统将在本研究中开发。如图所示,通过所获得的技能和从yh(t)产生的机器控制运动um(t),机器人机械臂能够模仿人类操作者的行为,如图1所证 。据设想,该系统将密切效仿并促进机器人机械臂人体运动技能学习分类的相关阶段,如下所述:(i)人类操作者在利用触觉装置的虚拟环境中执行操作任务。触觉装置提供给操作者接触力和力矩,和现实操作类似。(ii) 在虚拟环境中产生的信息yh(t),被感知模块用来识别基本技能和操作中所需要的功能,并提取测序应用技能的算法。这是分类法中的阶段(a)。(iii) 在(ii)中产生的信息,传递给机器人的任务规划器,并被转化成机器人机械臂的位置/力轨迹和相关的控制算法。最初,um是基于感知模块收到的信息、机械操纵系统的输出ym(t)和这一任务的先验知识产生的。然后,um控制下机械臂的性能与预期的行为比较。机械臂的轨迹和um根据错误进行调整,以产生与人操作时尽可能接近的动作。这是现阶段(c)。(iv)经过令人满意的模仿,计算um时,要考虑来自学习模块的信息。学习模块执行各种优化流程,以提高性能阶段(四)(七) 。当感知与学习模块是通用的时,这样的一个系统将是最有效的。操作虚拟环境取决于具体的应用和任务规划取决于所用到的机械臂。目前为止,这项工作集中于虚拟操作环境和感知模块的研究。5. 虚拟操作环境机器为获得基本的操作技所使用的数据是通过触觉补偿虚拟环境产生的。相对于其他获取训练数据的方法,这种方法具有许多优势,包括:(1)训练数据(例如:速度,角度,位置,力和扭矩)可直接提取和记录,简化了数据采集过程。(2) 随着操作过程和要求的改变,虚拟环境可以很方便地进行修改和改变。(3)系统分裂和破损的风险非常低。(4)危险、昂贵的环境可以很容易地构建和模拟。(5) 可开发对人类操作员友好的用户环境。在这项研究工作中所形成的概念和方法在“装订入孔”任务中进行了验证,“装订入孔”代表了转配中的典型操纵任务。通过一个三自由度的通用装置(Sensable公司生产的幽灵)提供触觉补偿。它允许用户直接与数字对象互动,就像在真实环境中一样。结合幽灵,GHOST(R) SDK软件可以处理复杂的运算,并允许开发人员,以处理简单、高层次的对象和物理性能,如位置、质量、摩擦和刚度。在虚拟环境中,“装订入孔”模型在几何模式和触觉补偿模式这两个阶段构建。在以下章节中,将对每一种办法进行描述。6. 几何模型几何造型是利用幽灵触觉装置提供的Ghost模型软件包建立的。已经开发的虚拟环境及其坐标如图2所示。钉子通过一个弹簧阻尼系统与幽灵(即操纵点)结合。在虚拟环境中钉子是一个动态刚性物体。钉子所受到的力和扭矩通过弹簧阻尼系统转移给幽灵。在虚拟环境中洞是静态的,而钉子可以转移、旋转。图3. “装订入孔”虚拟环境图2. “装订入孔”虚拟环境洞的几何模型是由一个三角多边形网格构建的。网格首先由四边形定义,然后围绕中心孔旋转四边形(如图三) 。利用OpenGL和Ghost SDK,可以用类似方法建立洞的图形模式。为了减少计算时间,在触觉补偿时要考虑孔的顶部和内表面的多边形。如果内表面多边形的法线指向观察者,则这些多边形都是看得见。否则,他们是看不见的。洞的几何模型也可以用两个圆柱体构建,分别形成孔的内,外表面。在这个阶段,多边形网格是用于构建洞的几何模型,因为这对触觉补偿来说更简单。7.触觉补偿模型对“装订入孔”作业产生中力的数据建立的触觉补偿模型是利用点阵的方法建立的。作业对象的点阵是指形成对象表面的所有点的集合。指向内部的表面法向量分配到点阵的每一个点上,以提供接触力的方向。图4(a)条阐明了一个点阵的法向量。图4.点阵和单个点. 在为“装订入孔”而开发的点阵中,分配到每一个点的向量的方向不是预先确定的,因为它们取决于接触面的法线图4(b)。当钉子和洞接触时,对方向进行分配。对于应用这一阶段来说,这是足够的,因为这一阶段并不需要voxmap,voxmap是通过离散静态环境空间产生的,并被用于碰撞检测。碰撞检测是通过探测动态物体的点阵实现的。在研究中探索了利用两种不同的方法建立产生力的数据的触觉补偿模型。在第一种方法中,钉子被定义为一个动态的对象,通过点集来描述,如图5(a)所示。在某一点处产生的力的方向孔的表面在该点处的法线方向。另一方面,对一个黑点来说,在该处所产生的力的方向量与钉子的表面法线方向相反,如图5(b)所示。只有位于该孔内的才产生力的信号,如图5(c)所示。在第二种方法中,该模型只考虑钉子和孔的末端的点图6(a)。当考虑钉子和孔接触处的点时,可以进一步减少点数,如图6(b)所示。在黑虚点处,力向量的方向和第一种方法里的一样。在这个阶段用第二种方法,因为它需要较少的计算时间。图6.第二种方法的物理模型图5. 第一种方法的物理模型幽灵提供了沿X-,Y-和Z-的三个自由度。钉子围绕Z和X轴(见图2)的旋转可以通过键盘上某些特定的键控制。在每一点处产生的力的大小由下式计算:f = kd + cad + bv (1)其中 d 在另一个静态对象上点的深度 ad 点和静态对象连续接触时的累积深度 v 物体的速度,计算方式是当前深度减去上一个采样时间的深度 k 刚度系数 b 阻尼系数 c 累积深度系数摩擦可以添加到接触力。钉子上黑点的深度和力方向可以通过使用幽灵SDK为圆柱体所提供的交互功能来到的。该相交功能可以得到物体和线的交汇点,这是通过另一个物体上点的当前位置和前一个位置来定义的。这体现为图7(a)中钉子和孔的交汇点。通过沿交汇点处物体的法线方向(当前点到交汇点)的向量映射可计算出深度。在虚拟环境中,因为洞是静态的,所以黑点是静态的,同时钉子是动态的。图7. 深度计算因此,先前点的位置可以通过钉子的当前位置估计出来图7(b)。我们假定在当前钉子位置的坐标框架中,所估计的先前点的坐标与当前点在先前钉子位置的坐标框架中的坐标是相同的。因此,可以确定钉子上黑点的深度,如图7(a)所示。 在每一次采样时,由触觉补偿模型所产生的数据储存在一个文件中。它有以下组成:x(k), y(k) and z(k): 点的坐标x(k), z(k): 定子的方向Fx(k), Fy(k) and Fz(k): 钉子的反应力Tx(k) and Tz(k): 钉子的反应力矩x(k), z(k) and y(k): 关于X和Y的角度控制信号及关于Y的位置控制信号图8. 从虚拟环境中提取数据的例子 根据具体应用的不同,采样时间是可以改变的。图8展示了一个为感知模块从虚拟环境中提取教学数据的例子。在这个例子中没有考虑摩擦。8. 感知模块一个操控任务是由一序列的基本技能构成的。这些基本技能的识别和将他们映射到一系列机器人操作原语形成了获取技能的算法及技能从人到机器人机械臂的转移的核心。对于执行复杂的任务的机器人机械臂来说,这种技术为基础的操控是一种有效的方法。这些发生在感知模块。基本技能是根据接触状态的转换来定义的,与机械臂的结构无关。在虚拟操纵环境中,基本技能可以通过接触状态和状态变化识别。利用这种方法,基本技能可以从在虚拟环境中实施的操作中自动提取。接触状态可以基于可用自由度来定义。例如,可以识别三种类型的旋转接触状态: 维护状态:即使物体围绕接触点旋转时也能维持这种状态。 分离状态:在这一状态时物体不能旋转。 抑制状态:在这种接触状态时物体完全不能旋转。接触状态的改变是以自由度的改变为基础的。举例来说,在图9(a)中旋转物体,接触状态可以从维护变成分离。接触状态还可以根据两接触物体的几何和空间关系来定义,如图10所示。三个联系国说明在无花果。图10(a)(c)中,三种接触状态示例是插入过程中钉子和孔的不同形态。图10. 插入阶段的三种接触状态图9. 维护、分离、抑制状态.根据环境和任务描述,感知模块可以生成机器人的操纵运动。它需要在线技能,适应没有遇到的状态,并相应更新其技能库。因此,它可以应对任务和环境的快速变化。从虚拟环境中获得可以被转换成机器操作技能。一种选择是利用启发式的方法,如自适应模糊逻辑和神经网络。虽然简单和自动,但这种系统应用于不确定系统时有严重的局限性。在这项研究工作中,使用了由李和陈所提出的通用、稳健的方法,这些将在下面描述。“装订入孔”实验的实验台的坐标被假定与虚拟环境中的一样。它也提供了和虚拟模型相同的自由度。假定钉子位于孔的上方和工作重点只在插入阶段。可以识别插入过程的三种接触状态,如图10所示。这将需要两个基本技能以完成这项任务:(1)运动接触技能:即移动钉子使其与孔接触,如果在运动方向阻力增加,那么这就意味着钉子被阻塞在孔中,如图11(a)所示。(2)旋转插入技能:即旋转孔,使孔与钉子重新对准已完成插入过程图11 (b) 。这相当于旋转钉子,使它与孔重新对准。如果钉 子能被无阻碍的插入一定距离,则认为插入成功。图11. 插入步骤当推钉子遇到阻碍时可直接应用第一个简单的技能。当改变操作物体或推动物体的方向时,通过维持接触可直接应用第二个技能。相对于最短操作时间或操控动作的数量而言,这可能不是最好的。 对在增广状态空间中定义的可行的状态过渡区而言,在这项研究工作中所使用的方法,代表了第二技能,生成状态转换的最优序列。增广状态空间由当前的状态和下一个状态形成。在增广状态空间的一个点代表了一个可行的状态变换。首先,从虚拟环境中收集许多具有不同的初始状态的成功的痕迹的数据。利用多分辨率径向竞争与合作的网络(MRCCN),通过椭球的多种尺寸可以得到近似的可行状态过渡区。这是一个双向型多对多映射神经网络,能够学习复杂的多对多输入、输出关系并且从必要的给定值中产生一个以上的解决方案。径向函数单元(RBFUs)是MRCCN中的隐藏单元。一个RBFU是由三个参数注释的,他定义了一个在增广状态空间的超椭球,即所谓的适应边界。图12显示了一维系统径向函数单元的产生和调整。最初的样本数据用来作为参考点,并被赋予一个圆形的特征函数(圈)。当随后的教学采样在圈内时,参考点向样本移动,形状也会随之变化图12(a)。当样本在圈外时,就在采样点处产生一个新的RBFU,其具有一个圆形边界图12(b).这个过程可以重复进行,以更新和产生新的边界。图13 一个一维动态系统的例子。图12 径向函数单元的产生和调整。在第二阶段,可行的状态过渡区,从任何状态到目标状态的最优路径可以运用双向动态路径规划(BDPP)算法得到。图13(a)提供了一个一维动态系统的可行状态转换区的例子。多决议聚集的结果如图13(b)所示。在图13(c)中,从0到12.5的最佳转换被(0,5), (5,7.5), and (7.5,12.5)三个点所标示,这意味者最佳路径时0 5 7.5 12.5. 在虚拟环境和实验装置中,如果我们限制了钉子沿Y轴方向移

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论