




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
高端装备制造:海外人形机器人巨头深度剖析
1.特斯拉:由人类打造、为人类服务的机器人
1.L后人工智能时代机器人将取代人类进行重复性劳动
Optimus定位为解放劳动力,可替代4亿岗位。特斯拉的人形机器
人项目Optimus(擎天柱)最早于2021年AIDay上公布(早期
名称为TeslaBot),定位为解放劳动力的通用型机器人。人形机
器人作为模仿人类的拟态物,相比机械臂等传统机器人,能无缝在
众多场景替代人类工作。马斯克表示,在后人工智能时代机器人将
取代人类进行重复性劳动,生产力充足的前景下可行的经济模式是
政府实行全民补贴,而体力劳动将成为个人的选择。根据世界银行
数据,2022年全球劳动人口约34.3亿人,劳动力人口已呈现下降
趋势,据麦肯锡报告预测,到2030年全球约4亿人的岗位将会被
自动化机器人替代,即11.7%的劳动者会被机器人所取代。以
Optimus单价2万美元计算,长期全球人形机器人市场天花板达8
万亿美元,是一个庞大的蓝海市场。
高自由度结构与精细控制初步具备实用性。目前Optimus原型机身
高约172cm,体重约57kg,力量能单手举起一架钢琴。其身体共
有28个自由度(下一代预计超过200个自由度),采用了更加灵
活的弹簧负载设计与6种类型执行器,关节采用仿生学关节设计,
模拟人类关节与肌腱形态,手部是Optimus最大亮点,采用人体工
程学设计,拥有11个自由度(下T弋预期27个),相比之下工
业机器人全身一般仅有4到6个自由度。特斯拉已于演示视频中展
示了精细手部动作,在Dojo超算的支持下Optimus利用动作捕捉
对人类活动方式进行学习,可抓取杂物,力道控制精细,甚至不会
打碎鸡蛋。根据特斯拉介绍,Optimus已经在特斯拉弗里蒙特工厂
试验简单工作,如移动零件或用扳手将螺栓固定在汽车上。
L2.自动驾驶的终极形态,FSD自动驾驶■超算■机器人三位一体
人形机器人是自动驾驶技术的终极形态。自动驾驶的本质就是有轮
子的机器人,特斯拉已经打通了FSD软件(完全自动驾驶)和机器
人的底层模块,特斯拉在FSD上的积累将使得人形机器人全面受
益。特斯拉将FSD从其汽车转移到了机器人,并经过调整以适应机
器人的身体和不同的工作环境。特斯拉主要通过对人进行真实世界
任务的运动捕捉,如提起物体、行走等,然后使用反向运动学技术
让Optimus重复这些动作,同时应用了在线动作适应技术,使这
些任务更加灵活,并能根据环境进行调整。同时由于采用了相同的
FSD系统,机器人可直接复用电动车成熟的视觉系统,由于特斯拉
决定采用同样的摄像头方案,而不是LIDAR传感器,因此可直接移
植到人形机器人上。
自动驾驶为机器人搭建技术框架。机器人的反馈机制本质上是与自
动驾驶相同的架构,即感知层-决策层-执行层。特斯拉在汽车上使
用自研的HW硬件与FSD软件,而机器人的感知层和决策层可直
接复用自动驾驶技术,特斯拉基于Transformer的BEV方案结合
时序队列与实现包含空间和时间的感
OccupancyNetworkz4D
知,即使在纯视觉方案下仍能实现高效的环境感知。在决策层上,
模型训练阶段的辘标注和模拟环境同样可复用于机器人上,因此
Optimus能在立项仅一年就拿出展示机型,远快于其他人形机器人
厂商,软件层面上只需要更多优质的训练数据积累就能快速提高运
动能力。
图2人形机密人可要用自动驾驶技术框架
感知层>决策层>执行层
Dojo超算—云端训练AI的基石。超级计算机Dojo基于特斯拉
自研的7nmD1芯片,具备采集、训练和进化的能力,能够更理想
的采集道路交通标识、生物形象、路面情况等信息。该芯片将354
个独立处理器封装在一起,产生362TFLOPS的计算和440MB的
内部静态随机存取存储器存储。在保持完全可编程性的同时,
DOJO强调资源分配和极高带宽的互连,使其能够从小型系统一直
扩展到exaFLOP超级计算机。在产品形态上,Dojo的最终落地单
位是名为ExaPOD的超级计算集群,它集成了3000颗D1芯片,
包含120个训练瓦片,最终能够实现高达1.1EFlops的
BF16/CFP8峰值算力。2023年7月特斯拉Dojo正式投产,预期
到2024年2月,特斯拉算力规模将进入全球前五,2024年10
月总规模将达到100Exa-Flops,相当于30万块英伟达A100显
卡的算力总和。
Dojo超算为机器人提供最强AI大脑。超级计算机Dojo被特斯拉
称为PureLearningMachine(纯学习机器),特斯拉FSD芯片最
到同样的效果。目前Optimus可期待的应用场景还是重复性的小
场景工作,因为FSD模型无法对未知信息进行预测,近日特斯拉
Optimus的官方推特账号上传了新的演示视频,Optimus能够仅
依靠视觉来对物体进行分类,还能完成难度更大的瑜伽动作,采用
了类似于特斯拉自动驾驶技术FSD12的端到端神经网络控制:视
频输入,控制输出,并由此来控制各个部件和关节的移动。谷歌
Deepmind已在测试多模态模型RT-2控制机器人,内嵌120亿参
数PaLM-E模型以及550亿参数PaLI-X模型的RT-2在陌生任务
中的平均准确率相比RT-1翻倍,达到62%。如果行业能打造出
〃RobotGPT〃的基座模型,实现零样本或少样本学习,则能在更
复杂乃至陌生的环境中执行任务,实现人形机器人的智能涌现。
Optimus初步落地可期,应用想象力扩大,根据马斯克发言,
Optimus预计将于今年11月进行行走测试,之后在生产稳定后开
始加速,明年进入工厂测试实际工作。此外,Optimus的核心硬件
模块化同样有巨大的应用潜力,透过将Neuralink脑机接口植入物
与机器人手臂或腿结合,可构成优秀的假肢,为被截肢的人提供一
个优秀的机器人身体,可能只需要6万美元。
2.波士顿动力:机器人领域的顶尖实验室
2」.最强动态性能的跑酷机器人Atlas
机器人领域三十年积累,造就最灵活人形机器人。波士顿动力
(BostonDynamics)由麻省理工学院副教授马克・雷波特于1992
年创立,最初的机器人是为美军研制的大狗(BigDog)机器人,
可在废墟、泥地、雪地、水中行走,奠定了Atlas运动能力的基
础。波士顿动力目前最先进的机器人Atlas身高1.5米,体重
80kg,速度1.5m/s,依靠28个液压执行器实现各种高难度运动,
足部踝关节由两个直线执行器并联驱动,靛关节和手臂多是伺服摆
动缸。Atlas不仅拥有卓越的物理机动性,更因其高级的控制系统
和算法而独立于众,多次在演示中展现出近乎超乎人类的运动与平
衡能力。
2.2.创新硬件与算法沉淀,Atlas实现卓越运动性能
Atlas以高性能电液驱动系统、复杂的AI算法和多模态视觉感知实
现优异运动性能:强大运动性能得益于独特液压驱动。不同于多数
机器人采用电驱,Atlas为了获得最强的机动性采用液压伺服驱
动,具有高负载驱动特性,即使是高难度动作如后空翻等依然能平
稳落地。Atlas机器人全身有28个自由度,在多个液压关节与算法
的协调配合下,Atlas已经可以熟练的完成垂直起跳、跨越障碍、
后空翻,甚至完成整套的舞蹈以及手脚都参与的跑酷功能。
表3Atlas各关节0由度
身体部位自由度具体应用
单腿3个小腿纵向自由度、大腿圾向自由度、胯部横向自由度
横向和纵向自由度,通过双液压缸的联合骅动能够实现纵向、横向、斜向三种
单脚踝2个
运动状态,这三种运动状态可增强行走过程中单艇支撑时腿部的运动能力
腰腹2个轴向和径向自由度
单臂6个肩郃轴向和任向自由度,大胃轴向和径向自由度,小管轴向和径向自由度
典狂±---------------------------止LW-------------------3条密库
离线模板与在线精细控制构成独特运动算法。Atlas的离线轨迹库模
板包含了众多预设的最优运动方案,会向决策层MPC(模型预测
控制)提示最佳的解决方案选择,此后MPC利用机器人的动力学
模型来预测其未来的动作。这种控制器的核心工作机制是优化计
算,确定机器人当前应该进行的最优动作,从而随着时间的推移产
生最佳行为。当遇到如环境改变、脚滑等实时因素时,MPC会调
整机器人的发力、姿势和动作的发生时机来适应。此外,MPC还
能跨行为边界预测下一步的行动,例如知悉跳跃后要进行后空翻,
它便会自动创建行为之间的过渡,确保动作连贯。在MPC3.0版本
中,Atlas已能主动使用参数已知的工具,在官方演示视频中Atlas
用木板搭了一座桥通过障碍。
TOF+预设地图构成Atlas的〃眼睛〃。在感知层,Atlas使用TOF
深度相机每秒生成15帧的环境点云,这些点云基于大规模的测距
集合。它的感知软件采用多平面分割算法从点云中提取平面,并将
此信息输入到映射系统中,为Atlas构建通过相机看到的各种对象
的模型。当Atlas执行扩展的跑酷行为时,波士顿动力的研发团队
为其提供了一张高级地图,指明了它应该前往的地方和沿途应该执
行的动作。尽管这张地图并不完全与真实路线的几何形状匹配,但
它提供了障碍模板和注释动作的近似描述,Atlas则利用这些稀疏
信息进行导航,并用实时感知数据来填补细节。
2.3.从机械狗Spot开始,商业化前路漫长
机械狗Spot率先开启商业化之路。Spot是波士顿动力2015年2
月发布的四足机器人,身高仅一米有余。SpotMini是Spot机器人
的更加小型且防水的版本,加上机器臂重量29.5kg,一次充电可
以跑90分钟,相比波士顿动力其他液压结构驱动的机器人,
SpotMini是纯电动的,因此是波士顿动力最安静的机器人之一,搭
配多种传感器,可以完成各项复杂的动作以及巡航,如无人区巡
逻、寻找气体泄露、公园安保等。SpotMini是公司商业化探索的
第一步,于2020年6月开始公开发售,每只定价74,500美元,
折合人民币超过50万元。Spotmini整体的设计以高集成度、高任
务作业能力为主,继承了波士顿动力其他机器人的高运动能力,最
优异的性能就是楼梯攀爬,其采用全视觉方案构建全局地图,进一
步选择合适的落足点避开台阶边缘以及不安全的落足区域。
难以降本量产约束商业化落地。波士顿动力从学术领域实验室诞
生,因此机器人的设计多是不计成本以性能为导向,早期为美国国
防高级研究计划局承包项目,由于商业化进程不及预期,被谷歌收
购后又经历两度易主,2017年6月软银接手、2021年6月由现
代汽车接管。根据AnalyticsIndia杂志,专家估计Atlas单台成本
至少为15万美元(折合人民币109万元),即使是更有〃性价
比〃的Spot机械狗,公司表示截至2023年6月售出超过L000
台。尽管Spot在市场中获得了一定的反响,但相较于Atlas等高
端产品的技术潜力,其商业化进程仍显缓慢,多次易主的波士顿动
力,在向商业市场推出产品的道路上还有很长的路。
3.1XTechnologies:开启AI具身智能革命
3.1.OpenAI领投,机器人使命是与人类并肩工作
AI与人形机器人结合,打造与人类协同的劳动力。IX
Technologies于2014年成立,是一家工程和人形机器人公司,
使命是创造与人类并肩工作的通用机器人।以满足全球的劳动力需
求。公司今年完成了2350万美元的A2轮融资,由OpenAI创投
基金领投,其他投资者包括老虎环球基金和一个由Sandwater.
AllianceVentures和SkagerakCapital等挪威投资者组成的财
团。公司表示将利用这笔资金来加大即将推出的双足机器人模型
NEO的产量,同时扩大其在挪威和北美的首款商用机器人EVE的
生产规模。
3.2.从Eve到Neo,具身智能雏形显现
以人类为灵感,运动马达实现突破。IXTechnologies不仅仅让机
器人模拟人类的形态,更重要的是,挖掘了人类自身独特的运动机
制,并突破性地转化为Revol运动马达,其拥有世界上扭矩与重
量比最高的直驱伺服,专为低齿轮比机器人设计,并搭配能模仿有
机肌肉运动的灵活机械,实现灵敏高效的运动能力。根据公开专
利,Revol执行器使用了名为哈尔巴赫阵列的特殊磁铁排列方式,
使得电机更紧凑、轻巧,同时能产生高扭矩,Revol的扭矩-重量
比是市面上发动机的四倍,非常适合用于人形直驱机器人。哈尔巴
赫阵列的设计使得磁场更有效地指向转动轴,同时通过调整磁铁的
厚度,防止在高温高扭矩运行时磁铁的退磁现象,从而保证电机的
性能和稳定性。
拳头产品EVE逐步实现商业化。IXTechnologies目前的旗舰产品
是名为EVE的类人机器人,EVE拥有两臂、两眼和四轮底盘,可以
像人类一样与其环境进行交互,在各种环境中执行多种任务,如巡
逻、监控、搬运等,适合在劳动力短缺的市场中使用。由于人形机
器人活动复杂,还未能实现完全由AI托管,EVE采用AI与人工结
合的方式控制,但一位操作员可同时操控一组多台EVE机器人。
2022年,公司首次取得商业突破,签署了至少140台EVE机器人
的分销合同,为美国商业场所提供安保服务。
双足机器人NEO初步具备具身智能特征。NEO是IX
Technologies正在研发的双足人形机器人,它完全按人类的外形
和运动方式设计:NEO有头、躯干、手臂和腿,会走路、抓东西,
并通过面部表情沟通。NEO的特点是其安全第一的设计思路,确保
了其柔软且有机的机械结构,使得与人类互动更加安全。NEO的高
精度运动基于模仿人类肌肉模式而设计,使其能够如同人类一样行
走、抓取物品并与环境互动。其AI设计使其能够自然地与用户交
流,目前,NEO不仅可以自然准确地穿门、爬楼梯,在OpenAI的
软件加持下有望完成更多高难度任务以及完整的无人操作体验。
3.3.与OpenAI合作共赢,将大模型带进现实世界
OpenAI技术全面赋能人形机器人。IXTechnologies与OpenAI
的合作不只是简单的技术共享,而是在探索将前沿的理论AI技术
与现实的机械结合,有望创建一个真正能与现实世界互动的智能实
体。公司正利用OpenAI的技术提升他们的机器人智能程度,如通
过OpenAIGym训练机器人进行自主导航和避障,使用OpenAI
ROS实现与机器人操作系统(ROS)的通信,以及借助GPT模型
使机器人理解并执行自然语言命令。未来,他们还可能采纳
OpenAI的DALL-E和CLIP等技术,使机器人有生朦口解析图像
的能力。GPT模型若能针对人形机器人进行优化,真正构成具身智
能大脑,使机器人能够更好地理解和适应复杂的环境,更高效地解
决问题,并具备更灵活的行为能力。
人形机器人与AI互相成就。OpenAI可借鉴IXTechnologies的
机器人技术,来提升其AI系统的物理交互能力。目前,OpenAI
的AI系统主要是在虚拟环境中运行,如OpenAIGym、Universe
和虽然这些环境可以模拟一些真实世界的场景和任务,
Procgeno
但仍然无法完全复制物理世界的复杂性和不确定性。如果OpenAI
能够将其AI系统部署到IXTechnologies的机器人上,那么它就
可以让其AI系统在真实世界中学习和适应,从而增强其泛化能力
和鲁棒性。
4.Apollo:始于人类、赋予人类
4.1.以探索宇宙为愿景的机器人
与NASA深度合作,长期目标为机器人探索宇宙。诞生于德克萨斯
大学奥斯丁分校的初创公司Apptronik于8月公布了其最新的人
形机器人Apollo(阿波罗)。Apollo体现了人的外形特征,高1.7
米,重72.6kg,拥有25公斤的举重能力,电机驱动的Apollo体
现了安全性的考量,将在与人共同工作的环境中展现其优势。
Apollo的短期目标是辅助物流领域,解决供应链中因人力短缺所带
来的挑战,但它的梦想远不止于此,Apptronik的创始团队在
2012年至2013年的DARPA机器人挑战赛期间为NASA机器人
Valkyrie工作,根据IOTWorldToday,公司此后也与NASA进
行深度合作,公司对Apollo的长期愿景即是将其用于太空探索,助
力人类登陆月球、火星及更远的天体。
定位为机器人领域的"iPhone"。Apollo的目标是像iPhone一
样,成为机器人领域的通用开发平台,使开发伙伴能够扩展
Apptronik的解决方案,并将数字世界扩展到物理世界,与人们一
同工作,完成他们不想做的工作。在通用框架的基础上,合作伙伴
可将Apollo的应用范围从物流和制造业扩展到建筑、石油和天然
气、电子等行业,乃至零售、送货上门、老人护理等与人类更密切
接触的领域。在设计上,Apollo多部件采用模块化设计,如腿部可
更换为固定桩,以及电池支持热插拔设计,以解决人形机器人续航
表8Apo11o性能参盘及应用场景
身高173cm
基本参体重72.6kg
数运行时间4小时/每个电池包
负重25kg
在RaaS(Robot-as-a-Service,机器人即服务)摸式下,可在高峰期短
适应多样需求
通用领期租贷
域根据需要进行任务切换通用型机器人可轻松切换任务
便捷切换可无缝将人工劳动替代,无需增加资本投入或改这设施
自动化机鬻人大幅提升效率、浪确性以及速度,为企业降本增缴
物流
高灵活性每个客户都有独挣性,Apollo可实现灵活且通用的自动化
自动化替代手动操作流程
零售
通用性灵活、通用的自动化可让零售商根据需求变化实现快速调整
制造工厂的自动化还差“最后一公里”,即运输材料,人彩机器人可完
完全自动化
美胜任
制造业回归带来人力需
过去四年北美制造业从海外回归数量增长250%,人力需求大幅增长
制造求
劳动力矮口扩大技能培训需要巨大成本,且底层材料运输劳动力块口继然士圮一出h
/:力:目序
自动牵弓车仍需人工支
3自动牵引车减少了司机需求,但仍需人工将托叁从牵引车转移到生产线
4.2.拟人形态与技术结合
以人为本,专注安全性。Apptronik的团队在近十年构建了超过10
种独特的机器人,外骨骼方面的研究提供了重要的安全背景知识,
而工业机械臂的开发则在保持经济性的同时提高了有效载荷,最终
凝结成为Apollo,专为在人类设计的环境中与人类一同工作而构建
的人形机器人。Apollo不仅尺寸接近人类,并且拥有独特的力控架
构,保证了它在人周围的安全操作,Apollo与传统的工业机器人相
比更像是一种协作机器人。早在研发外骨骼时,Apptronik就为其
配备了6轴力传感器、力敏感袖带、空气冷却的系列弹性执行器模
块来确保机械系统的稳定性和安全性,而Apollo在智能程度上更
胜,会利用其视觉感知和力度感应,当人类靠近机器人时减速,如
果人类靠得太近,Apollo会停下来。如果Apollo被绊倒,它会进
入安全模式〃蜷缩〃身体,以减少对机器人自身和周围环境的损
害。
性能和成本引导设计,长期价格将与汽车相当。Apollo的核心是执
行器,公司称为"机器人肌肉〃。人类体内有大约300块肌肉,
Apollo经过简化,系统内部有大约30个不同的肌肉群,满足基本
的动作和活动。Apollo的设计思路从第一性原理出发,为了使每个
关节完美配合,使用线性和旋转执行器控制整个系统,同时执行器
的设计着重考虑了成本问题,新执行器比以往机型少了约1/3的组
件,同时组装时间也缩短到1/3。公司CEO预计人形机器人要打
开市场,成本需控制在5万美元内,售价应当与汽车相当。
4.3.朝向月球进发
精细控制还有进一步提升空间。Apollo的研发重心更多放在安全性
和〃更像人〃上,公司CEO表示,不认为手部的灵活性是人形机
器人的核心技术壁垒,后续可能考虑和其他公司合作研发手部。在
Apollo的测试版本上,使用了更简单的手部执行器,公司认为初期
研发重心应当专注于这成类人形态,但同时也在手腕处保留了模块
化接口,长期可与其他公司合作进行精细手部的独立研发。Apollo
目前仅限于只需要粗略操控的工作,Apptronik计划首先将
Apollo部署到仓库中,来移动纸箱、篮子等,这些任务主要在于移
动,而不需要完全灵巧的手和腕部。
目标月球乃至更远的地方。作为与NASA深度合作的机器人公司,
Apptron汰的长期目标是将Apollo用于太空探索。它们可以用来
在宇航员到达之前建造和测试为人类设计的环境口列如月球和火星
栖息地。而人形机器人要进入太空,挑战无疑会更大,Apollo需要
更强的自主性、更高的稳定性和更佳的灵活性来适应外太空的环
境。
5.AgilityRobotics:从学术到实用,领跑仓睹机器人领域
5.1.实用主义与尖端科技结合:商用仓储机器人Digit
学术研究起家,推出仓储用人形机器人。AgilityRobotics成立于
2015年,其根源可以追溯到2000年代初,其创始人Damion
Shelton和JonathanHurst毕业于卡内基梅隆大学机器人专业,
两人联合创建了公司。Agility的两款主要机器人ATRIAS和Cassie
由俄勒冈州立大学的动态机器人实验室于2009年至2016年开
发,并授权给Agility进行商业化。ATRIAS机器人不仅展示了复杂
地形的行走能力,还突破了传统的双足机器人设计框架,具能够在
随机变换的障碍地形中行走,完美跨越障碍。而在ATRIAS基础上
开发的Cassie机器人则注重技术与应用的结合,不再只是科研展
示,而是真正意义上的实用机器人。
需求引导设计,实现真正实用仓储机器人。Digit在Cassie的基础
上升级推出,它能够实现崎岖地形穿越,越过障碍物,具有稳健的
步行和跑步步态、感知能力,可
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030年商业街临街铺面租赁合同
- 2025医疗机构聘用护士护理安全风险预防与处理服务合同
- 2025年能源公司员工停薪留职及光伏发电项目投资联合协议
- 2025年新能源汽车维修店面租赁及全链服务管理协议
- 2025年度金融产品研发保密及竞业禁止约束合同
- 2025版文化活动策划合同签订:十项创意执行与效果评估
- 2025年度艺术品投资抵押反担保服务协议
- 2025年二手车过户业务全程财务保障与担保协议
- 2025版土地流转项目土地经营权流转信息服务平台合同
- 2025年事业单位劳动合同模板(含员工休假制度)
- 初级魔方社团课件
- 储油储气项目社会稳定风险评估报告
- 《RWA 技术规范》标准草案
- 庭院围墙整治方案(3篇)
- 2025年高考物理真题完全解读(广西卷)
- 2025年北京市海淀区高一(下)期末考试数学试卷(含答案)
- 教师课件的制作培训
- 质量成本控制与管理考核试卷
- 机场安检员岗位培训教程
- 2025年全国矿山安全生产事故情况
- 2025年环境监测试验检测人员培训计划
评论
0/150
提交评论