具身智能发展报告（2025年）

上传人：加*** IP属地：北京上传时间：2026-01-31 格式：DOCX 页数：119 大小：8.12MB 积分：12 举报 版权申诉

已阅读5页，还剩114页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

2026年12025年《政府工作报告》首次将“具身智能”列入国家未来产学习作业技能，为真实场景应用打下基础。产业整体展现出“融合”合轮臂式机器人、人形机器人等操作类产品，解决“三是产业生态体系不断完善，市场空间广阔。斗赛”“运动会”引发社会高度关注，据披露数据统计，截至2025据与仿真/合成数据如何选择、处理和混合训练？具身智能整体处于 3 6 20 25 30 31 38 43 45 49 52 54 图图图图图图图图图1一、全球具身智能总体发展情况（一）具身智能的概念与内涵逐步明确1.具身智能核心内涵：基于身体交互的“智能闭环”是“人工智能+机器人”，而是人工智能通过物理本体与环境交互实1/kxyj/qwfb/bps/202408/P020240830312499650772.pdf2来源：中国信息通信研究院2.具身智能以增加认知、协作和学习三个能力为目标能（EAI，EmbodiedArtificialIntel3来源：ITU-TF.748.66（二）具身智能成为全球关注的下一个科技前沿2/~/media/mckinsey/mckinsey%20global%20institute/obig%20arenas%20of%20competition/the-next-big-arenas-of-competition_final.pdf4人技术列为塑造未来全球生产力和数字基础设施的五大新兴前沿之一。根据美国市场研究公司GrandViewResearch预测，到2030年被家具身智能公司估值突破百亿元。英伟达创始人黄仁勋在2025年消自主性的人形机器人作为优先事项。OpenAI也重启了四年前的机器表的主要玩家运营路径可分为三类。一是软硬件全栈派，从AI大脑研端到端模型Helix，可实现人形机器人上半身的高速精确控制；智Apptronik等。例如，宇树科技产品在成本控制方面具有明显优势，3/industry-analysis/humanoid-robot-mark4/industry-analysis/semi-autonomous-vehicl5/industry-analysis/drone-marke5的双足机器人Digit专注于物流场景，已与亚马逊等巨头合作。Apptronik于2023年发布人形机器人产品Apollo，并与GoogleDeepMind合作进一步提升产品功能。三是重软件“大脑派”，以成型，代表公司如PhysicalIntelligence、FieldAI和银河通用。例如，6（三）具身智能产业发展阶段仍需客观冷静看待段。2025年以来以美为代表的多家公司突破单笔最高融资，2月和机器人领域投资事件数达744起，融资总额735.43亿元人民币。无论是模型实现路径、数据方案还是本体分类分级的应78二、数据驱动下的具身智能软硬融合创新9来源：中国信息通信研究院（一）算法技术尚未收敛，多路径探索快速迭代具身智能技术突破是生成式人工智能与机器人学习技术的融合方法包括模型预测控制（ModelPredictiveControl，MPC）和全身控仿学习或两者结合，从数据经验中学习运动策略。2022年以后，随义理解能力。VLM在语言知识的基础上进一步融合了大量的视觉信端到端地输出动作。2023年至2024年，VLA通过利用Transformer），续动作（如DiffusionPolicy）。同时借助VLM提升策略泛化性（例2025年，围绕“通用大脑”和“技能可扩展学习”两大方向开知、决策能力单点突破，向VLA、世界模型等“感知－认知－决策-执行”闭环能力演进，技术创新呈现爆炸式增长。前Meta公司、在关注VLA”。杨立昆认为“机器人是否足够聪明甚至具备通用用年谷歌学术以“端到端VLA”为关键词的论文在不到一年时间翻了来源：公开信息整理知与运控的模块化组合或高难度组合式运控。例如自主移动机器人（AMR）的仓储搬运，机器人在运动会上的舞蹈表演、自由搏击等径关注如何让机器人等物理实体更好地理解外部任务需求并进行规端VLA将视觉、语言和动作统一到一个学习框架，根据视觉观测和制本体执行任务。例如PhysicalIntelligenceπ0.57采用VLM结合 6/abs7pany/bl自变量机器人WALL-OSS8采用MO测，以指导VLA动作策略学习或动作生成。例如清华大学联来源：中国信息通信研究院效衔接。2024年，LLM和VLM在不改变底层本体架构的情况下实8/en/research/68bc2cde8497d7f238dde690并调用API接口或与ROS等中间件进行交互来控制本体。例使用ChatGPT通过预定义函数库和提示工程，生成可调用不同机器能力。一是提升环境感知能力。例如中山大学RoBridge结合对象分作轨迹的建模能力。二是提升规划推理能力。上海人工智能实验室OWMM-VLM模型基于多模态输入进行链式思考，生成关键目标位务。智源VLM模型RoboBrain2.010结合RoboOS2.011分层框架，将10/FlagOpen/RoboBrain2.011https://arxiv.or拟世界，通过行为推演和预测优化行为策略。DayDreamer通过预测瑞士苏黎世联邦理工学院RoboticWorldModel在大脑预演行为过程端到端大模型VLA呈现“大一统”和“分层协作”两类设计架语言等完整多感官模态，通过整合异构信号提供更稳健的知和行动的异步时间处理，同时支持端到端的训练和模型12https://arxiv.or13/blog/nov-04-2025-GE14https://www.figure.智平方公司提出Fast-in-Slow15（FiS），将快速执行系统嵌入慢速推端到端VLA通过融合或集成不同组件实现关键能力突破，整体行为认知能力。上海交通大学推出DreamVLA17，融合清华大学联合多个单位开发的首个面向具身智能的大规模强化学习15https://arxiv.or16https://arxiv.or17https://arxiv.or18/RLinf/RLinf化学习方法改进VLA模型，能从专家纠正指导中修复错误，并不断端到端VLA尚未形成“感知－决策－执行”的完整如1XWorldModel在面临不熟悉的任务和环境时，很难准确地理解降。另外，现有VLA模型性能表现与本体强相关，在跨本体迁移时19pany/仿学习、强化学习或两者结合等方式掌握特定技能。例如PhysicalIntelligenceπ0和英伟达GR00TN1预训练阶段学习本体无关的通用主地探索环境。德国马普智能系统研究所提出CWYC方法在学习过业大学提出LEGION终身学习框架，能够在连续任务输入时持续积（二）数据成为核心需求，相关技术加速发展基础模型的性能提升具有显著作用。清华大学ManiBox论文指出空间泛化所需数据量与空间体积呈现幂律关系，如果要在38倍的空间20Tan,Hengkai,etal."ManiBox:Enhan通过物理模拟引擎结合仿真平台、世界模型或其他合成技术合成的少高低高中中中中Generation."arXivpreprintarXiv:2411.01850(2021/blog/nov-04-2025-GEN-0低高低来源：中国信息通信研究院真合成数据方面，英伟达基于物理模拟引擎Omniverse的IsaacSim平台构建了完整的数据合成管线，并在2025年几乎逐月更新，不断完善平台功能。IsaacSim5.0则集成了Cosmos世界模型提升合成真银河通用基于英伟达仿真平台的合成数据管线能够在一周内生成十据采集是绑定本体的手把手教学，包括采用VR设备、境采集是支持跨本体学到人类动作示范，包括UMI夹爪、灵巧手和22/p/193099027585092932023/abs/2505.24https://homietele.github.io/和采样频率可能均不一致。例如π0.5的训练数据包括对象检测和视真到真实的大规模合成数据训练。例如银河通用利用1数据，让VLA模型学会抓取技能，并实现真实场景的泛化。三是真时间内从1次成功操作进化到能连续工作24小时且成功率达到（三）本体技术多元发展，重在软硬一体的零部件创新模型带动具身智能本体多形态协同发展，包括人形、四足/多足氢能无人机、氢动力汽车和氢动力机器人等。2025年4月，川崎重合材料和聚醚醚酮（PEEK）等轻量化、高强度的高性能材料结构件需求持续增长。例如空客A350机身夹板、托架等零部件，特斯拉OptimusGen2均用到了PEEK材料。1/3，散热效率提升50%，实现爆发力、灵活性和稳定性兼备。天工通过结构优化设计和关节导热技术，在相同功率下电机铜损降低15%～20%，从源头减少热源产生。国外厂商如瑞士Maxon、德国Faulhaber和瑞士Portescap在一体化关节方面也具备技术优势。灵巧北京通用人工智能研究院与北京大学联合研制仿生视触觉灵巧手F-TACHand25，集成17个高分辨率触觉传感器和高维触觉数据的手产加工、标定检测等方面有较高技术壁垒。美国ATI、SCHUNK、Robotiq等品牌在性能指标和高端市场上具有较大先发优势，国内柯25https://arxiv.o（四）云－边－端协同运行，支撑现实应用落地芝麻智能计划于2025年量产的华山A2000系列最高算力也达到1000TFLOPS。二是大内存带宽支持大规模多模态数据的高效处理。实现百GB级带宽26。三是低能耗与良好的热管理，以支持系统长时间高强度运行，避免过热导致性能下降或系统崩溃。地平线远征6P采用ASIC方案，其能效比是Thor系列的1.2-1.4倍。四是算控一体升大小脑一体化控制能力。例如天准科技的星智007、国讯芯微NSPIC-R007NP+等。26/a/cn/news/rockchip/2025/1021/云CloudRobo平台在云侧结合视频生成模型和物理引擎提供合成数是端边云协同依赖操作系统及中间件进行本体功能开源项目ROS2通过工业级的数据分发服务（DDS）支持可靠数据传输。美国OpenMind推出OM1操作系统支持OpenAI、Gemini、内置功能开发包，支持端云异构算力整合和AI模型调度，帮助本体力在275TOPS左右。该芯片在运行7B参数规模的模型时性能会明显下降，运行3B参数规模的模型也需要更多的加载时间27。三是通三、场景驱动下的具身智能产品谱系不断丰富体上，驱动多样化载体融合发展。复合轮臂式机器人、四足/多足机热点。同时，如仿生机器人、智能机器臂、无人船、变形移集群式微型智能机器人、智能可穿戴设备等产品形态也在加27https://dev.to/jeremycmorgan/review-the-new-nvidia-jetson-orin-nano-4ci7?utm现阶段部署端到端VLA模型的产品还处于演示阶段，例如容易出现长尾问题（long-tailproblem）和失效案例（badcase）等很可能导致（一）机器人成为具身智能的最“热门”载体1.人形机器人构型是业界追逐的热点方向作业能力同步升级。2025年以来，国外特斯拉公司的O波士顿动力公司的Atlas系列以及FigureAI公司的系列产品持续更新2025年，轮式人形机器人成为市场关注重点，银河通用基于GalbotG1机器人形28/a/202507273468476973.html2.机器狗复杂地形适应性升级，初步落地行业场景豹四足狗以10.3米/秒的速度打破由波士顿动力WildCat创造的8.89足机器人学会攀爬70度到90度不同倾斜角的梯子30。二是更轻，但态交互能力升级，成为人们的生活伙伴。维他动力Vbot通过协同屏29/detail/2077330/html/2409.177幕表情，肢体、扬声器和指示灯提供丰富情感表达。蔚蓝科技小时无故障电力巡检31，并与湖南长沙市消防救援支队合作，代替指技Loona机器狗发布后半年即达成400万美元销售额。美国Tom31/a/202507/28/WS688762bca310a07bb590aa632/c/8EYi1b应用局限性在于，一是行业采用率有限。IDC数据显示2024年要采用方基本只支持单台套采购模式，这些高强度作业场景对（例如60度倾斜角爬坡、细小金属杆密集的障碍区域等），导致单障碍让机器人卡住。另外，金属管网拓扑结构也打造了弱信号区域，33/getdoc.jsp?containerId=prCHC5364杭州落地具身智能4S店，提供用户定制和乐高式模块化开发的产品3.仿生机器人、智能机械臂等产品加速探索机器人、复合轮臂式机器人、四足/多足机器人外，业界也在广泛探术支持34。再如哈尔滨工业大学研发的蛇形机器人，可实现水中和陆34/（二）智能运载装备是具身智能落地“最快”载体1.自动驾驶汽车法规不断完善，加速商业化进程一样思考，交互性和复杂路况处理问题解决能力明显提升。理想i8搭载VLA司机大模型后，可以直接通过“前方掉头”“前进10米”等简单指令调整行车路线。Waymo推出VLA架构的EMMA端到端自动驾驶汽车的上路通行和场景试点提供有力支持。其中，北京市2025年4月实施的《北京市自动驾驶汽车条例》明确支持自动驾驶划，并批准Zoox公司的自动驾驶汽车路测35，加速松绑监管政策，自动驾驶汽车L3级车型量产和L4级商业化运营并行推进。摩元36。一是L3级别智驾能力上车。华为智驾方案乾崑智驾ADS4计租车（Robotaxi）为代表，正在探索规模化、商业化示范应用。高盛35/press-releases/nhtsa-issues-first-ever-demonstration-exemption-american-b3637/articles/view/1496814565/593793e502001qgpi38/pdfs/insights/goldman-sachs-research/robotaxi/report.pdf至千台。三是L4级别无人驾驶小车在无人公交、无人配送、无人环卫等场景应用落地，推动未来出行与生活方式转变。截至2025年7应用规模越大，才能更早发现和解决问题，从而反哺技术加速虽然全国多地已经开展测试，但真正实现规模化试点示范的仅武汉等少数城市突破千台级规模，而其他城市大多停留在百台2.无人驾驶航空器快速发展，推进多元场景应用用更加广泛和深入。2025年6月，美团无人机在香港航线上进行外对比传统骑行方式效率提升近7倍40。随着深度强化学破性进展。eVTOL支持单次更大载荷、更多货物的点对点运输，通39/doi/10.1126/scirob40/economy/2025_06_06_778470.shtml41/a/202506/11/WS68495cffa3102053742/dlxxh/wurenji/2025-08-20优势，确保长时间、长距离的安全飞行。2025年7月，亿航智能物流无人驾驶eVTOL装载海鲜从广东珠海唐家港运起飞，途经中山、广州三市82.9公里，在广州穗港码头落地，历时约55分钟，内，制约了在物流配送、农业植保、安防监控等场景的工作效率。eVTOL电池能量密度也仅能勉强满足200公里以内的短途飞行。如43/2025/07/30/ARTIpKfLgArEVLO2yDLIBlET2（三）新型智能产品是具身智能“前沿”探索方向望应用于应急救援、野外探索、月球探测等场景45。集群式微型智能44/product/apas45https://actu.epfl.ch/news/morphing-robot-turns-challenging-terrain-to-its--2/46/document/10598230料，导致成本较高。目前具备AI动态调节、多模态交互等四、具身智能产业生态加速完善（一）产业链横跨多个领域，生态体系初步形成），来源：中国人工智能产业发展联盟具身智能工作组、具身智能测试实验室（截至9月25日）从地域角度看，目前我国在十余个省市/地区均有企业布局，产家）、浙江省（33家）紧随其后，五大省市汇聚主要产业力量，其来源：中国信息通信研究院务方面，人形机器人（双足/轮式）是业界关注热点，企业占比达到其他方向占比均超过6%，呈现均衡发展的整体态势。四大板块企业来源：中国信息通信研究院（二）训练场建设成热点，实际效用仍需进一步验证智能训练场超过30家，覆盖了北京、上海、天津、广东、浙江、江思路，北京人形机器人数据训练中心一期47搭建了家庭康养、汽车装47/m1/mtgz/20250329/

人人文库> 全部分类> 办公材料 > 办公文档

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

具身智能发展报告（2025年）

文档简介

温馨提示

最新文档

评论

具身智能发展报告（2025年）

文档简介

温馨提示

最新文档

评论

相关文档