




已阅读5页,还剩10页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
外文翻译智能移动机器人的学习摘 要:智能移动机器人不同于在结构化工厂设置中工作的智能机器人,它必须经常工作在杂乱的环境下并能克服许多障碍或产生一些行动的方法。 然而,这种机器人有许多潜在的应用,即在医学、国防、工业、甚至在家庭方面,如视觉传感器的需要都会使他们的应用更为重要。然而,在许多应用上还需要某种形式的学习。本文的目的是介绍关与智能移动机器人学习的现代先进技术研究。在过去的20年里, 工业用智能机器人不仅配有传感器运动控制系统,还有摄相机雷射扫瞄或触觉传感器等,以适应不断变化的环境许可也大幅提升。 不过,对关于学习方面的相对较少。适应和强劲的控制能实现在变化的环境中点对点操作和控制。学习和控制可以解决这个问题。 在非结构化环境下、地形负荷的机器人马达不断地改变。学习比例参数、积分与微分控制器(PID)和人工神经网络提供了强有力的适应性控制。学习亦可用于下列路径。可进行模拟,包括看看机器人如何通过各种杂乱的障碍进行学习。如果情况是重复出现,那么,学习可以在实际中得到应用。为了达到更高程度的自主运作,需要新的学习水平。自适应评判最近已经提出学习理论在这样的学习过程中提供了一个行动控制模块机器人等。创造性控制过程用在超越自适应评判。一个创造性控制过程的数学模型,显示控制使用移动机器人。 从智能机器人应用到各种实例等,这项工作的目的是对移动机器人学习的应用可能导致许多应用有了更深入的了解。关键词:智能机器人、自适应控制、鲁棒控制、强化学习、自适应评判1 引言智能机器人是一种理想,一个远景。 所有人都能在虚幻中看到智能机器人模型。 准确地说智能机器人能够方便地采用多种协调动作,做一些像人但现在还没有一个人能做的事情。 他们感应到允许他们适应环境的变化。 他们从环境或者人类那里学习,从不犯错。他们模仿人类专家的反应。 他们自动履行,孜孜不倦、位置准确。他们可以诊断出自身问题并修理自己。 他们可以再生,但不像生物那样制作生产出机器人。 它们已在工业上广泛应用。一个好的智能机器人能解决重要问题已经在工业及新技术上开始应用。 例如,你可以想象一个机器人可以帮你给气车充燃气,帮您的草坪割草, 你可以驾驶一辆汽车在繁忙地工作, 而当它坏了,则可以自身修理。 智能机器人也是一个现实。机器人正在火星上探测。 有些医院食品的输送和外科手术都依靠于机器人。 现在普遍使用的工业机器人,更多的智能化已建成原型。 典型应用有:高速点焊机器人、精密缝焊机器人,喷漆机器人走动的车身轮廓, 机器人装卸机械等。 简介智能机器人是在第2部分。自适应、鲁棒控制方法描述在第3部分。采用线代创造性控制在第4部分。结论和建议载于第5部分。 2 智能机器人2.1智能机器人概论 智能机器人的组成有机器人、传感器和控制系统。 然而它是建筑设计或组合这些组件,为编程控制器范例,智能机器能够注重专业质量,实用性原型是远见和天才制度的设计者、也是制造工程师和技术员的得力助手。 智能机器人是如何智能的? 它的控制器是否就像一个人的脑神经连接那样智能呢?感应器能否让机器人适应? 它实际上在机械臂上能否工作呢? 抑或是有些组件的特定组合。何时最需要机器人?当每年做100万件这样重复的自动化任务时,自动化是最需要的,适合自动化的是智能机器人。 此外,当一个任务对人类有害时,自动化是需要的。 最好的解决办法可能是一个智能遥控。 最后,当一个产业须在成本和质量竞争的时候自动化是需要的。 再次,智能机器人在部分解决方案中还可以扮演一个重要的角色。 使用智能机器人有哪些好处?现在机器人可以做很多的工作。 但是,受周围环境影响的任务并不容易完成。工件和机器人的位置、大小、方向、形状必须准确定位才能履行任务。道路上的障碍,不寻常的事件,破损的工具,也创造了环境不确定性。 更多地使用传感器和智能机器人可减少这种不确定性,机器可以24小时不停工作, 可得到更高的生产力。2.2计算转矩控制器 第三部分介绍了比例微分(PD)、计算转矩(CT)和比例积分加微分(PID)控制器4。 在刘易斯框架基础上动态模拟,并进行了修改,以适应导航轮式移动机器人(WMR)。 仿真软件的投入, 使理想机器人导航算法描述更加精确。 仿真软件的制作适合控制力矩, 这个仿真是用MATLAB和C+开发的。 各种控制器已经用来控制机器人的运动,直到最近有移动机器人运动的自我控制才引起注意。因此,移动机器人运动控制是一个新的研究领域。Shim和Sung提出了利用移动机器人运动学方程限制移动机器人渐近控制与渐近漂移。在实践经验的基础上,他们发现选择适当的控制参数及数值渐近性能可有效地控制。Yun-Su、yuta讨论了轨迹控制的一种逆钟摆式轮式机器人,他们分别为余额控制算法和速度控制平衡,在实际的室内环境督导控制和跟踪控制直线航行。 2.3智能控制理论与神经控制为了设计智能机器人控制器,则机器人还必须具有解决问题的手段 。机器人研究的目标是设计一个机器人控制器并利用现有的数据来重复作业。一是在经常性的基础上,网络体系结构应具有时变特征, 二是要有较短的学习时间。 人工神经网络(ANN)可以用来获取系统模型,也可以用来识别设计合适的智能机器人控制器。 真正的系统模型,也可以被用来直接设计在控制器中。网络比较理想的轨迹与价值观的连续配对对多轴机器人在每一个瞬间都采样同一周期。 新轨迹参数,然后再加上从错误信号控制器驱动的机器人手臂。神经网络可作为一种用于系统辨识或作为控制机器人控制器描述的模式。神经网络可以用来获取系统模型,可以用来适当地识别设计控制。 可一旦采用真正的系统模型,也可以被用来直接设计在控制器上。 神经网络控制机器人讨论办法有以下几种: 这些方法可分为:(1)监督控制,理解力控制器,允许感官反应的投入; (2)直接逆控制是训练有素的逆动态的机器人; (3)神经自适应控制, 神经网络自适应控制结合造成更大的混乱和驾驭非线性; (4)反向公用信息流涉及落后时光。 (5)使用自适应方法来评价受训期间机器人的表现。 这种方法是一个很复杂的,需要更多的测试方法。图1. 循环神经学习控制器3 用比例微分和比例微分、积分的CT控制器控制的自适应移动机器人本节描述了比例微分(PD)、比例微分与积分控制器的研究。CT室外环境自主导航为实例,将针对某一特定配置:bearcat机器人, 具有两个固定轮子和一个小角轮。bearcat是由在辛辛那提大学机器人研究中心研制的。 简化的运动学和动力学模型是从牛顿-欧拉方法考虑沿着X和Y轴的速度和角速度,以机器人质心为参考点。其中:是横坐标的机器人质心。:是Y型轮轴的坐标中心。:方向角度的机器人。:法线方向的力。 :机器人质心与轮轴的距离。 :固定车轮的半径。 :机器人半宽度。:电机的正确力矩:马达转矩线左车轮。:机器人排除轮子。:机器人非惯性轮子。 更多详情请参阅穆罕默德阿里的论文。31计算转矩控制器等式1可写如下:其中N(q,)代表非线性 运动控制目的是移动机器人或机械手使其根据要求的运动轨迹(t)运动轨迹控制,虽然实际运动轨迹定义为q(t)。在这种情况下跟踪误差可以定义为: 其中其中研究CT控制器, 线性系统设计将采用以选择一个反馈控制(跟踪误差方程),然后计算出所需的马达力矩的移动机器人动态方程或两个环节机械臂 这里研究两种类型的CT控制器,即PDCT控制器和PID控制器。 PD CT控制器 具有动态跟踪误差: 增益矩阵须与保持跟踪动态误差稳定相适应。 PID CT 控制器:PD CT控制器描述了CT控制器可以轻易地调整加入 PID积分增益控制器由矩阵到u(t)如下:具有动态跟踪误差:积分增益不需要加以选择的太多,以保持稳定的跟踪误差。PD CT和PID CT控制器在图2中被描述,其中如果产生了PD CT控制器并且则产生了PID CT控制器。数字显示,它的外围组织和跟踪反馈线性环路包含了 图2:PD 和PID控制器方框图 3.2计算转矩控制仿真(CT):PDCT控制器的移动机器人仿真:本控制器的功能是要选出合适力矩电机来控制使移动机器人将按照预期的运动轨迹。如果描述的是两个环节的机械臂,那么这已经需要从任务中来让机器人工作。 但是,这一信息描述的一个移动机器人不太详细, 描述的将是详细的方法,用已制作的导航系统部分在本章的第一部分被描述。 从动态模型描述在方程1这可以在方程5作为书面说明线性与非线性元件:其中为非线性的表 已开发的仿真程序主要有以下内容: 第一部分移动机器人轨迹计算预期投入在导航系统的基础上, 理想的 轨迹被描述如下:其中: 是移动机器人重心的X轴坐标 是移动机器人重心的Y轴坐标是移动机器人设计角 第二部分计算出控制器投入计算跟踪误差之间设计的轨迹和实际轨迹被定义如下: 其中: 是移动机器人实际重心的X轴组坐标 :是移动机器人实际重心的Y轴坐标是移动机器人实际设计角图3: PD CT控制器的跟踪误差随时间的变化 图4:理想与现实运动轨迹 图5:PI CD控制器的跟踪误差随时间的变化 图6:理想与现实运动轨迹4 创造性学习与控制创造性学习提供了范例,了解这种生物脑存在的原理。 创造性控制结构如图7所示。本文提出按照学习创造性的理论。 这个拟议有三个重要组成部分:任务控制中心,标准(评论家)知识库、学习制度。 评判自适应学习方法是创作的一部份,是学习方法。 但是,创造性学习与决策能力超越自适应学习判断。 最重要的创造性学习的结构特点是:(1)脑类决策任务控制中心 人脑的能力,需要决策; (2)动态标准数据库纳入判断框架后自适应使得评论家控制器具有更加的灵活性。 (3)多重标准,多层结构; (4)建模判断预测结果更快的单元培训网络。这是一种假设,我们可以用移动机器人运动学模型来提供一个具有价值功能的模拟实验,其设计了网络影评运动学为基础的网络控制器的行动。 另外,运动也是用来建造一个以示范模式为基础的行动框架自适应评论家行动方针。 在这算法中,我们建立了一个标准(评论家)网络数据库及其泛化评论家训练过程。 尤其是当运行的关键是移动机器人在非结构化环境中工作的时候。 另一部分是在图的效用函数为跟踪问题(测量误差)。 控制器的设计创意结合领域知识和自适应的任务控制中心变成评论家控制器。 它需要得到一个明确的架构,例如自主移动机器人应用作为试验台控制器的创意。 图7. 拟议建筑氯算法 4.1.自适应临界控制 自适应临界控制是自适应学习理论的一个组成部分,智能系统在神经方面能作为大脑一样,它至少应包含三个主要通用适应性部件 : (1)诉讼或电机系统 (2)情绪或评价制度和评判(3)希望或识别系统组件。 临界作为一个典型的外部环境将受限制; 求解最优控制问题设计(多元化)时自适应可能被列为批评家。 在动态规划时,通常用户提供功能的随机模型。 分析师则试图解决另一个函数以满足某些形式的贝尔曼方程。以便提高认识动态特性。如是指预期值原则上,任何问题都可以在决定或控制理论被列为优化问题时。贝尔曼方程的动态规划、列如下: 那里是因子折扣因素(01),并且U。()是效用函数或本地成本。 另一种称为双启发式编程方法已经提出。 事实证明羟孕酮衍生物,年发电量顺畅相比呈现好转。首先提出构想如何做培训利用网络是一项错误措施相结合的措施。4.2任务控制中心(TCC)任务控制中心(TCC)能建立任务级控制系统的创造性学习系统图所示。 任务级别,即结合和协调感知、 规划和实时控制,以达到一定的目标(任务)。 TCC提供了总任务控制框架,它是用来控制各种任务和使命许可证回应基于指令、互动与其它机器人。 TCC虽然没有内建控制功能,特别是在任务(如机器人路径规划算法) 提供的控制功能,如任务分解、监控和资源管理,有许多共同申请。 特殊任务内置的动态数据库在比赛规则限制特定环境控制计划分配。 任务控制中心作为决策制度。 结合领域知识或标准输入数据库的适应性学习系统。 任务控制结构提供了各种移动机器人控制,通常需要建构机器人应用 和其它移动系统TCC学习系统整合与适应性评论家、与动态数据库 创造性学习系统既可以提供任务级和实时控制学习或单独一个框架。 4.3动态知识库(dkd)在任务控制中心和非线性学习系统之间建立一个动态知识库作为联接器。其目的是提供一个标准的联接器为适应职能和判断学习系统指挥控制中心的任务。在判断和行为网络的识别下其动态数据库是用来控制正常工作的运作,以及适应先前判断已知动态环境的计划进行一套复制或数据处理程序,它通过时间反向传播的神经网络反馈更新时所需要的一切偏导作用。5.结论和建议,供进一步研究智能移动机器人的设计是一项艰巨的任务。 然而一些学习方法在第4部分规定中已被描述,这些方法提供了解决点对点控制,甚至正式提出了解决非结构化环境的办法。 主管可根据不同的控制测试参数和运动轨迹从以前的文件所描述中的导航算法在选择合适的控制器控制力矩后能使移动机器人将按照预期的轨道工作。 模拟结果表明,一钯断层控制器 增益矩阵须为每个不同的运动轨迹组成; 模拟结果显示了PID控制器增益矩阵的CT也须较小的数目。 p k =2, v k =1, 和i k =1都会产生合理的结果。 因为有太多的参数,所以在选择适当的控制参数时是一项具有挑战性的任务。 当一个工作还必须选定自动化的时候,则创造性控制方法在第5部分中的描述可能被运用。 创造性学习理论提出了包含所有部件在内的自适应判断,自适应学习判断所概括改装学习和利用多种费率评和行动并提供了模块数据库。控制器可用于创造性探索不可预知的环境,并允许发现不明的问题。 领域知识的学习,系统应该能够获得全球最优和局部最优的方法。 创意自适应控制智能机器人能像评论家控制器那样有信息储存在一个动态数据库中, 另加动态任务控制中心,作为一个指挥中心职能任务分解成子任务具有不同功能的动态模式和标准,智能机器人的学习能力,也是一个学习方式。但是,智能机器人的目标是建设一个具有挑战、需要进一步开发全部潜力的研究领域,最终成为实现安全和有益的机器。参考文献1. Hall, E.L., and Hall, B. C., Robotics: A User-Friendly Introduction, pp. 1-8, Holt, Rinehart and Winston, New York 1985.2. Werbos, P. The Roots of Backpropagation: From Ordered Derivatives to Neural Networks and Political Forecasting, Wiley and Sons, 1994.3. Werbos, P.J., Tutorial on Neurocontrol, Control Theory and Related Techniques: From Backpropagation to Brain-Like Intelligent Systems, Proc. of the 12th Int. Conf. on Mathematical and Computer Modeling and Scientific Computing, 1999.4. Alhaj Ali, S. M., Technologies for autonomous navigation in unstructured outdoor environments, Chapter 3, Ph. D. dissertation, University of Cincinnati, Cincinnati, OH, 2003.5. Lewis, F. L., Jagannathan, S., and Yesildirek, A., Neural Network Control of Robot Manipulators and Nonlinear Systems, pp. 147-167, Taylor and Francis Ltd, T. J. International Ltd, Padstow, UK, 1999.6. Alhaj Ali, S. M., and Hall, E. L., “Technologies for autonomous operation in unstructured outdoor environments, Part I: Navigation,” Proc. of the Artificial Neural Networks in Eng. Conf., Vol. 12, pp. 57-62, 2002.7. Shim, H.-S. , and Sung, Y.-G., “Asymptotic control for wheeled mobile robots with driftless constraints,” Robotics and Autonomous Systems, 43(1), pp. 29-37, 2003.8. Yun-Su, H., and Yuta, S, “Trajectory tracking control for navigation of the inverse pendulum type self-contained mobile robot,” Robotics and Autonomous Systems, 17(1-2), pp. 65-80, 1996.9. Rajagopalan, R., and Barakat, N., “Velocity control of wheeled mobile robots using computed torque control and its performance for a differentially driven robot,” Journal of Robotic Systems, 14(4), pp. 325 340, 1997.10. Zhang, M., and Hirschorn, R. M., “Discontinuous feedback stabilization of nonholonomic wheeled mobile robots,” Dynamics and Control, 7(2), pp. 155-169, 1997.11. Koh, K. C., and Cho, H. S., “A smooth path tracking algorithm for wheeled mobile robots with dynamic constraints,” Journal of Intelligent and Robotic Systems, 24(4), pp. 367-385, 1999.12. Zhang, Y., Chung, J. H., and Velinsky, S. A., “Variable structure control of a differentially steered wheeled mobile robot,” Journal of Intelligent and Robotic Systems, 36(3), pp. 301-314, 2003.13. Corradini, M. L., and Orlando, G., “Robust tracking control of mobile robots in the presence of uncertainties in the dynamical model,” Journal of Robotic Systems, 18(6), pp. 317 323, 2001.14. Corradini, M. L., and Orlando, G., “Control of mobile robots with uncertainties in the dynamical model: a discrete time sliding mode approach with experimental results,” Control Engineering Practice, 10(1), pp. 23-34, 2002.15. Corradini, M. L., Leo, T., and Orlando, G., “Experimental testing of a discrete-time sliding mode controller for trajectory tracking of a wheeled mobile robot in the presence of skidding effects,” Journal of Robotic Systems, 19(4), pp. 177 188, 2002.16. Wu, S.-F., Mei, J.-S., and Niu, P.-Y., “Path guidance and control of a guided wheeled mobile robot,” Control Engineering Practice, 9(1), pp. 97-105, 2001.17. Jiang, Z.-P., Lefeber, E., and Nijmeijer, H., “Saturated stabilization and tracking of a nonholonomic mobile robot,” Systems and Control Letters, 42(5), pp. 327-332, 2001.18. Dong, W., Liang Xu, W., and Huo, W., “Trajectory tracking control of dynamic non-holonomic systems with unknown dynamics,” Int. J. of Robust and Nonlinear Control, 9(13), pp. 905922, 1999.19. Werbos, P.J., “New designs for universal stability in classical adaptive control and reinforcement learning,” Proc. Of the Int. Joint Conf. on Neural Networks IJCNN, Vol. 4, pp. 2292-2295, 1999.20. Montaner, M. B., and Ramirez-Serrano, A., “Fuzzy knowledge-based controller design for autonomous robot navigation,” Expert Systems with Applications, 14(1-2), pp. 179-186, 1998.21. Topalov, A. V., Kim, J.-H., and Proychev, T. P., “Fuzzy-net control of non-holonomic mobile robot using evolutionary feedback-error-learning,” Robotics and Autonomous Systems, 23(3), pp. 187-200, 1998.22. Toda, M., Kitani, O., Okamoto, T., and Torii, T., “Navigation method for a mobile robot via sonar-based crop row mapping and fuzzy logic control,” Journal of Agricultural Engineering Research, 72(4), pp. 299 309, 1999.23. Vzquez, F., and Garcia, E., “A local guidance method for low-cost mobile robots using fuzzy logic,” Annual Review in Automatic Programming, 19, pp. 203-207, 1994.24. Narendra, K.S., and Parthasarathy, K., (1990) Identification and control of dynamical systems using Neural networks, IEEE Transactions on Neural Networks, 1(1), pp. 4-27.25. Psaltis, D., Sideris, A., and Yamamura, A. A., A multilayered neural network controller, IEEE Control Systems Magazine, 8(2), pp. 17-21, 199826. Yabuta, T., and Yamada, T., Neural network controller characteristics with regard to adaptive control, IEEE Transactions on System, Man, and Cybernetics, 22(1), pp. 170-176, 1992.27. Liao, X., Creative Learning for Intelligent Autonomous Mobile Robots, PhD Dissertation, University of Cincinnati, 2003.28. Werbos, P., Optimal neurocontrol: practical benefits, new results and biological evidence, IEEE Westcon Conference Record, p.580-585, 1995.29. Prokhorov, D., and
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 新生儿泪囊炎健康宣教
- 零食行业报告
- 同城直播项目方案咨询
- 升学指导及咨询方案
- 营养素失衡与环境污染的前沿探索-第1篇-洞察及研究
- 学生餐具消毒安全培训课件
- 虚实夹杂证辨治-洞察及研究
- 嘉积中学 2025- 2026学年度第一学期第一次大测高三物理科参考答案及评分标准
- 低碳运营模式探索-洞察及研究
- 广东省部分学校2025-2026学年高三上学期9月联考历史试卷(含答案)
- 工程水文第3章课件
- GB/T 4032-2013具有摆轮游丝振荡系统的精密手表
- GB/T 34875-2017离心泵和转子泵用轴封系统
- GB/T 21063.4-2007政务信息资源目录体系第4部分:政务信息资源分类
- GA/T 1081-2020安全防范系统维护保养规范
- 02药物不良反应adr课件
- 施工项目成本管理课件
- 文物建筑保护修缮专项方案
- 营销与2008欧锦赛ktv渠道方案
- 故障录波器课件
- DB32-T 2665-2014机动车维修费用结算规范-(高清现行)
评论
0/150
提交评论