版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中国科学院沈阳自动化研究所2025年11月6日1AI增强的机器人技术及其在电力行业的应用展望王洪光hgwang@sia.cn1•
现状与趋势•
具身智能(
EAI)•
前沿技术•
应用案例•
结论与展望目
录2现状与趋势-机器人发展态势2024年
,全球工业机器人安装量54.2万台
,
中国29.5万台(占比54%)源自IFR
World
Robotics20253现状与趋势-机器人发展态势2024年制造业机器人密度全球平均177台
,韩国1220台、新加坡818台、
中国567台。
源自IFR
World
Robotics
20254现状与趋势-协作机器人发展态势2017-2024年度协作机器人在工业机器人总销售量中的占比源自IFR
WorldRobotics20255现状与趋势-国家规划和部署–美国:
2022国家机器人计划
3.0(
National
Robotics
Initiative
3.0:
Innovations
in
Integrationof
Robotics
(NRI-3.0));“赢得竞赛:美国人工智能计划”
(2025)–欧盟:“人工智能大陆行动计划(AIContinentAction
Plan)
”;“应用人工智能”和“科学中的人工智能”(2025)–德国:“机器人研究行动计划1.1”(2024);“2025年高科技战略”(2025)–
日本:“登月研发计划”“
Moonshot
Researchand
Development
Program”(2020-2050)–韩国:“第四次智能机器人基本计划”(2024-2028)–
中国:l
工信部等部门:《
“十四五”机器人产业发展规划》、《
“十四五”智能制造发展规划》(2021年)l科技部:《关于支持建设新一代人工智能示范应用场景的通知》(2022年)l
工信部等十七部门:《
“机器人+”应用行动实施方案》(2023年)l
工信部:《人形机器人创新发展指导意见》(2023年)l
工信部:《国家人工智能产业综合标准化体系建设指南》(征求意见稿)(2024年)l
国务院:《关于深入实施“人工智能+”行动的意见”
》(2025年)6现状与趋势-复杂环境与任务挑战环境挑战任务挑战如何建立人机和谐共存的行为方式与安全机制?如何实现机器人之间、
机器人与人之间的自然交互?如何实现复杂环境下完成复杂任务所需要的智能决策与作业?如何实现机器人对非结构环境的高效、
精确感知和适应?交互能力作业能力感知能力决策能力行为方式挑战交互挑战7现状与趋势-复杂环境与任务挑战传统的工业机器人难以满足电力等行业复杂环境和多任务的需求。性能挑战运动及力控制
绝对精度在线规划环境-任务推理多模态感知-交互自主规划-学习运动控制重复定位精度离线规划程序-任务预设
感知-认知有限决策-交互有限结构化环境
重复性任务非结构化环境
复杂多类任务AI增强的智能机器人传统工业机器人环境-任务挑战智能挑战作业搬运巡检加工装配共融8现状与趋势-发展趋势机器人受到人工智能(AI)
和机器学习领域各种技术发展的推动,同时也受到协作机器人扩展到新应用、
简化编程、
移动操作器、
数字孪生和仿人机器人等领域的影响—国际机器人联合会(IFR)AI-Powered
RoboticsAI增强的机器人9目
录•
现状与趋势•
具身智能(
EAI)•
前沿技术•
应用案例•
结论与展望10美国人恩格尔伯格
,
世界第一台工业机器人
,
Unimation公司
,被誉为“机器人之父”斯坦福大学
,
Shakey机器人
,第一
台移动机器人
,观察环境能力。“但丁”八角机器人探索南极洲火山
,行动在美国操控。美国内华达州颁发世界第一张无人驾驶汽车牌照。第一台家用扫地机器人Roomba,可以检测地板上的脏点
,避开障碍物和楼梯本田汽车公司人形机器人ASIMO瑞典ABB公司全球最快分拣机器人FlexPicker i
i
i
2008
i20202024
机器人发展历程11美国AMF公司生产出“VERSTRAN”
,成为真正商业化的机器人1981波士顿动力“
ParkourAtlas”通用汽车机器视觉系统“CONSIGHT”分源自IFR官网Figure发布了Figure01、
02优傲第一台协作机器人第一个人形社交机器人Pepper第一台医院用自主移动机器人“勇气号”探测器登陆火星特斯拉发布“Optimus”波士顿动力开源Spot机器人SDK商业化达芬奇机器人部20182022201420032002200020121972198819981999199419621959。人工智能的定义人工智能是一门利用计算机模拟人类智能行为科学的统称
,
它涵盖了训练计算机使其能够完成自主学习、
判断、
决策等人类行为的范畴。(中国人工智能创新应用白皮书)人工智能的三大学派符号主义:
强调通过符号和逻辑推理来模拟人类智能。
认为智能可以通过对符号的操作和处理来实现
,
注重知识的表示和推理过程。行为主义:
主张智能行为是通过与环境的交互和适应产生的。连接主义
:模仿人类大脑神经元的连接方式和工作原理。
通过构建人工神经网络
,让网络在大量的数据中学习和调整连接权重
,
以实现对输入数据的模式识别。12具身智能-发展历程1950年
,
图灵在《Computing
Machinery
and
Intelligence》论文提出具身智能概念。1991
年罗德尼·布鲁克斯(现代机器人之父)在《没有表征的智能》论文提出智能行为可以直接从自主机器与其环境的简单物理交互中产生
,而这种交互不依赖于预先设定的复杂算法。开发移动机器人“Genghis”
,能够在没有复杂中央控制系统的情况下
,在复杂环境中导航。1999
年罗尔夫·普费弗在《理解智能》一书中提出智能行为是通过身体与环境的直接相互作用产生
的
,
而不仅仅是大脑内部的计算过程
,身体的形态和物理性质都会直接影响智能行为的生成。2005
年琳达·史密斯在“具身假说”中提出人类的认知过程不仅仅是大脑内部的抽象思考
,更多地是通过身体与物理环境的直接互动实现的
,思维、感知能力以及其他各种能力的发展
,都是人们通过身体与环境的持续互动而逐渐形成的。例如
,婴儿通过触摸和操作物体学习物理规律
,
或者通过视觉和运动的协调来理解空间关系。大型语言模型(LLMs)、视觉语言模型(VLMs)以及ChatGPT等基础模型增强了机器人的感知、交互及信息处理能力
,但尚未解决机器人如何从物理环境中持续学习和适应的问题。需要基础模型与进化学习机制相结合。、
敏捷小脑与强健本体的有机融合。智13慧大脑具身智能-定义1)
具身智能是一种可以执行导航、
操作和命令执行等任务的机器人
,
机器人可以是任何在空间中移动的实体智能机器
,如自动驾驶汽车、
吸尘器
,或是工厂里的机械臂等。—斯坦福大学教授李飞飞《SearchingforComputerVisionNorth
Stars》2)
具身智能是机器学习、
计算机视觉、
机器人学习和语言技术的集成
,
最终形成人工智能的“具身化
”:能够感知、
行动和协作的机器人—卡内基梅隆大学(Robotics,
EmbodiedAI,and
Learning)实验室官网3)
具身智能是指一种基于物理身体进行感知和行动的智能系统
,
其通过智能体与环境的交互获取信息、
理解问题、
做出决策并实现行动
,从而产生智能行为和适应性—中国计算机学会计算机术语委员会动态交互能力14具身智能-核心要素1.本体具有物理实体的机器人
,
可以有多种形态
,
如人形机器人
,
四足机器人
,
复合机器人等。2.智能体具有本体之上的智能核心
,
负责感知、
理解、
决策、
控制等核心工作。3.数据数据是泛化的关键
,
涉及机器人的数据稀缺且昂贵。数据收集的方式:
仿真合成、
遥操作及抓取互联网数据。4.学习和进化结构智能体通过和物理世界的交互
,
适应新环境、
学习新知识并强化出新的解决问题的方法。1516运动能力突飞猛进
应用场景日趋丰富
具身智能-目前发展的特点视觉语言动作模型(VLA)成为主流技术路线人形机器人成为具身智能发展的重要代表17目前人形机器人产品的主要类型小尺寸足式人形机器人
全尺寸足式人形机器人
轮式人形机器人
仿真型人形机器人18人形机器人典型应用场景表演娱乐家庭服务无人零售智慧物流人形机器人-Figure
AI2022年Brett
Ad
cock创立Figure
AI
,
核心产品为人形机器人“
Figure01”;2023年10月
,发布Figure01行走的视频
,
实现了
“动态双足行走”;2024年3月
,发布接入OpenAI的大模型后人形机器人Figure01视频
,在视频中
,
Figure01能够与人类流畅对话
,理解人类的意图并执行;2024年7月
,更新发布Figure
01宝马车间工作。2024年8月
,发布Figure
02。2025年2月4日:
宣布终止与OpenAI合作。2025年2月20日
:发布端到端通用控制模型Helix。2025年3月15日:
推出BotQ
,
旨在每年生产12,000个人形机器人的制造工厂。19Helix被定义为全球首个视觉-语言-动作(VLA)一体化模型将视觉感知、
自然语言理解与高维机器人动作控制整合到单一模型中实现了全身协调控制(涵盖头部、躯干、手腕及单个手指的35DOF)零样本泛化能力(可处理数千种未见过的物体)多机器人协作(双机共享同一模型完成复杂任务)Helix20•
现状与趋势•
具身智能(
EAI)•
前沿技术•
应用案例•
结论与展望目
录21复杂任务约束下的
灵巧机构与多目标优化操作面向多元对象的
人机协同与智能控制输电
变电
配电
极端、复杂环境
智能感知与防护技术高空
狭窄空间
强电磁场
机器人如何支撑电网设备运维挑战2前沿技术-问题挑战1检测缺陷处理22前沿技术-端到端大模型发展
具身智能端到端大模型从单模态LLM、
双模态VLM
,
向多模态VLA发展
大语言模型(LLM)
:文本单模态
,擅长逻辑推理、任务分解等抽象任务
,但缺乏对视觉或物理世界的直接感知
视觉-语言模型(VLM)
:融合视觉编码器与语言模型LLM
,实现跨模态理解
,擅长感知理解
,但无法直接输出动作指令
,需结合控制模块实现具身交互
视觉-语言-动作模型(VLA):整合视觉、语言与动作三模态
,直接从多模态输入映射到机器人动作序列
,支持开放式任务
,但实时性受限
视觉-触觉-语言-动作模型(VTLA)
:在VLA基础融入触觉
,视触融合带来类人精细感知与操作能力提升LLM
VLM
VLA
VTLAOpenVLA(Stanford)
3D-ViTac(Columbia)RT2
(
)
FAROS
(
Horizon
)GR系列(
ByteDance)
CLIP(OpenAI)
Flamingo(
DeepMind)
BLIP(Salesforce)
Min
iCPM(面壁智能)
GPT系列(OpenAI)
BERT(Google)
PaLM/E(Google)
23前沿技术-“大脑-小脑”协同
需加强模型的长程推理和物理交互能力
真实世界任务通常是长程、
分阶段的
,现有模型多为短程行为映射
,
缺乏“思考-规划-执行-反馈”阶段分工
,容易陷入局部最优或产生无
效动作
,针对工业场景等复杂问题的推理逻辑性差
,物理交互能力不
足
需打破Scaling
Law的数据驱动固有路径
目前大脑推理模型是通过扩大数据集规模和提高参数量
,从而提高推
理能力。
虽然大模型仍未触摸到Scaling
Law的边界
,但数据收集难
度、
算力需求快速提升
,
以及在工业场景中难以达到Scaling
Law所
需数据量
,使得模型推理能力不足
,
需打破这种固有路径
需加强大脑-小脑的协同效率
大脑和小脑之间需要频繁交换感知数据、
任务指令、
动作反馈
,
同时高级语义指令需要转换为低级控制参数
,传统的通信接口难以精准传递意图
,并易引入延迟
,应建立高效的资源调度和通信机制
,
实现大小脑高效协同
24融合几何-代数
构型综合理论几何-代数融合
的拓扑表征理论活动度-负载-约
束特性指标构型拓扑优化机构/结构功能设计机构与机器人研制、
检测与测试验证融合几何-代数的构型-尺度-性能集成设计方法材料参数机构变构时序模型前沿技术-本体
问题
挑
学与本体设计体系
理论与方法
应用领域
能
源、航空、水利、交通等面向复杂环境与多任务的高适应性机器人设计方法
多场景多任务多功能
极端环境与复杂任务挑战
全域性能评价准则构型-尺度-性能优化多参数耦合数学模型动态性能变构性能结构参数耦合设计复杂、动态、非结构环境下的自主移动与灵巧操作移动操作机械菁动力学
参数辨识柔顺控制核心技术—智能控制啥力与加速度实时反馈手眼定位
视觉伺服26机器人化无人实验室27合成工作站
离心机
烘干
机视力融合机器人柔顺操作
,
解决动态非结构化环境下机器人接触作业问题视觉引导核心技术—基于视力融合的柔顺操作机器人自主烘干作业机器人自主离心作业高低层特征融合点云特征采样编码预测抓取点力觉引导特征检测特征提取点云信息末端随动相机全景双目相机逼近向量回归预测旋转角回归预测最佳姿态选取28l多配合、多约束条件下的高、低速端的支撑、
回转组合设计l考虑加工工艺的尺寸链分析l热应力变形分析、机械应力变形分析28多约束条件设计、
工艺尺寸链及应力应变分析
,
实现精密驱动传动机构设计精密驱动传动机构设计是保证机器人运动性能的重要环节
,为使机器人获得长时间的精度保持寿命
,传动链的结构设计尤为重要硬件技术—精密驱动传动机构核心技术支撑29
具备柔顺控制能力的伺服驱动器
,
实现高带宽力2矩9伺服控制位置环•Bi
SS-C协议解析•PD控制器模型控制•
齿槽转矩补偿•
电机参数辨识硬件技术—柔顺伺服驱动器•
磁场定向控制(
FOC)•
高精度电流A/D采样•
M/T法速度估计•PI控制器力矩环
速度环典型案例-三峡混凝土流道/背管检测机器人(中国长江电力股份有限公司公司、30三峡混凝土流道/背管检测机器人环境与任务挑战1.安全可靠吸附;
2.续航能力强;
3.
自主移动与检测(表面凹坑及裂缝)31三峡混凝土流道/背管检测机器人系统组成与关键技术•
适于混凝土流道和背管的高可靠、
大负载爬壁机器人设计;•
基于视觉的AI缺陷检测方法;•
基于多传感器融合的机器人定位导航技术。流道检测机器人
背管检测机器人32三峡混凝土流道/背管检测机器人三峡混凝土流道检测
三峡混凝土背管检测33任务:1)识别和测量水泥表面受损区域的裂缝。2)通过三维重建
,在全局地图上显示缺陷区域并定位裂纹位置。难点:视觉检测与定位算法的锚框难以准确定位缺陷。背管的现场数据不足无法满足训练要求三峡混凝土流道/背管检测机器人视觉系统-任务与难点
采用像素计算对裂纹掩模图像进行分割处理
,
以描绘裂缝并计算其大小。
采用公开的水泥裂纹数据集训练图片。,
。34分割定位裂纹检测定位裂纹GAN
network三峡混凝土流道/背管检测机器人视觉系统-方法
检测算法上
,
使用U-net网络来分割图像中的裂纹区域。
U-net网络融合不同大小的特征图以生成相同输入大小的图像。
为了提高生成裂纹的准确率
,
采用GAN模型进行对抗和博弈思维
,生成器使用U-net网络
,鉴别器区分生成器的输出和真实数据。U-net
network35三峡混凝土流道/背管检测机器人视觉系统-结果
将训练好的模型应用于现场图片。
结合SLAM算法匹配关键帧之间的姿态
,拼接空间点云
,
用于裂纹缺陷检测和定位。
利用姿态来合并点云
,地图上的每个点都包含RGB颜色信息SLAM地图在展示中降级成2D导航地图。
在现场实验中
,
攀爬机器人沿着墙面上升。
对图像的每一帧进行了裂纹检测后
,合成视频后的动态检测效果。
小裂纹检测存在位置与大小的误差
,但大裂纹全部成功检测。,363维重建动态检测典型案例-仪表检定机器人电测仪表全自动检定系统(广东电网公司佛山供电局
中国科学院沈阳自动化研究所)37主要存在的问题:l
操作流程繁复、
枯燥
,劳动强度大、
易疲劳;l
对检测单位人力耗费较多
,检定效率较低;l
存在操作不当导致仪器仪表损坏、
威胁人身安全的安全隐患;l
测试数据录入繁复易出错
,不易直接形成数据库。38研究背景电测仪表在电力系统中具有重要作用
,需大量、频繁使用
,而电测仪表的准确度极大地影响着作业质量。
因此
,
电测仪表必须进行周期性检定校准才能使用
,而这个过程目前主要由人工作业完成。机器人替代人实现全自动检定是重要发展趋势:l
全自动化
,效率高
,机器人7X24连续工作;l
精度高
,不会因疲劳而造成失误;l
避免安全隐患;l
检
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026河南郑州同安中医骨伤科医院招聘备考题库及参考答案详解(基础题)
- 2026安徽师范大学教育集团面向校内外招聘中小学正副校长备考题库附参考答案详解(典型题)
- 2026黎明职业大学招聘编制内博士研究生学历学位教师24人备考题库(福建)附答案详解(满分必刷)
- 2026西藏技师学院锅炉兼综合维修工岗位补聘1人备考题库及参考答案详解(b卷)
- 【高中语文】《永遇乐+京口北固亭怀古》教学设计+统编高一语文必修上册
- 麻纺厂市场分析规范
- 玻璃厂熔炼操作办法
- 网络直播服务合同
- 2026河北承德县中医院招聘20人备考题库及答案详解(历年真题)
- 2026天津市肿瘤医院秦皇岛医院选聘31人备考题库(河北)附参考答案详解(综合卷)
- 2026年度省综合专家库评标专家继续教育培训考试试题(附答案)
- 雨课堂学堂在线学堂云安全科学原理(中南大学)单元测试考核答案
- 2026年黑龙江省公务员考试《行测》试题题库(答案+解析)
- 航空货运自查制度规范
- 统编版(2024)七年级上册历史第2课 原始农业与史前社会 素养提升教案
- 喉癌课件讲解
- 金属非金属矿山重大事故隐患判定标准
- 金华人工浮岛施工方案
- 十年(2016-2025)高考化学真题分类汇编:专题50 有机推断综合题-结构半知型+信息(原卷版)
- 人形图护理查房制作流程
- 黄山团建活动方案
评论
0/150
提交评论