产业赛道投资图谱：物理AI人工智能演进的第三波浪潮

上传人：b*** IP属地：北京上传时间：2026-07-05 格式：DOCX 页数：12 大小：2.07MB 积分：15 举报 版权申诉

已阅读5页，还剩7页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

内容目录物理AI：继感知与生成之后的下一波AI浪潮 3让AI认识物理世界：从到世界模型 5VLA模型：从模态孤立到具身智能的统一框架 6世界模型：为VLA注入想象力 10物理AI应用：历史上规模最大的技术市场扩张之一风险提示图表目录图1“最开始是感知式，然后是生成式I。现在，我们正在进入物理AI的时代。”3图2：过去28个月，物理AI领域在技术底座与产业验证方面取得了一系列关键进展 4图3：在政策端，中国已围绕物理的规模化落地构建起系统性分阶段聚焦实体的设计框架。图4：用于自动驾驶的LearningVision-Language-ActionWorld模型 6图5萌芽阶,VLA概念尚未形成;探索阶段,VA逐渐确立了以Tansfmer为核心的可扩展骨干结构;快速发展阶段,模型架构从单层往多层方向发展,并且随着数据积累,多模态VLA模型已经“崭露头角” 7图6：人形机器人使用VLA模型架构完成任务 7图7：VLA模型发展迅猛 8图8：2023年以来的部分主流VLA模型 9图9：VLA在真实物理世界中的迁移部署仍面临一系列挑战 10图10：世界模型为VLA提供了环境动态的“内嵌物理引擎” 11图11：物理市场规模 12图12：全球物理市场——涵盖自主机器人、自动驾驶车辆、人形系统、工业自动化、可穿戴设备、智能基础设施，以及支持的医疗和农业系统物理浪潮物理AI（Physical是指具备在真实物理环境中感知、理解、推理与执行能力的智能系统，其典型载体包括人形机器人、自动驾驶平台及工业自动化设备。相较于以图像识别、AIAIAI进一步实现从“理解世界“改变世界CEO2024年GTC大会上明确提出：“最开始是感知式AIAI我们认为，物理AI正成为继感知式与生成式AI之后，人工智能产业演进的关键第三波浪潮。图I英伟达博客过去28个月，物理AI“大脑（VLA模型，yicalelligece发布通用V——0NVDA发布GR00TN1"世界第一个开源人形机器人基础模型"，DeepMindGenie3，DeepMindGeminiRbics1.5“Tisefoeacig”的推理VA；在“想象引擎”层面（世界模型，OpenAISora首次将视频生成模型与世界模型概念挂钩，GoogleDeepMind的Genie2和Genie33D世界及高分辨率、长时一致的可交互世界生成，MetaV-JEPALeCun的世界模型路线提供了可复现的具身证据；在“训练场”层面，NVIDIACosmos提供规模化、可控且高性价比的合成数据支持；在“本体”层面，Figure021XNEOBeta20248月以人形机器人的形态公开演示家用助手场景；在“商业闭环”层面，以家居场景为起点，π0.6加RECAP已初步验证了VLA图2：过去28个月，物理AI领域在技术底座与产业验证方面取得了一系列关键进展财联社，各公司官网及博客等在政策端，中国已围绕物理AI的规模化落地构建起系统性、分阶段、聚焦实体的设计框架。2025年10月发布的《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》中明确提出“全面实施‘人工智能+’行动，以人工智能引领科研范式变革，加强人工智能同产业发展、文化建设、民生保障、社会治理相结合，抢占人工智能产业应用制高点，全方位赋能千行百业”国务院《关于深入实施“人工智能+”行动的意见》则明确了发展节奏20276大重点领域广泛深度融合，新一代智能终端、智能体等应用普及率超70，智能经济核心产业规模快速增长，人工智能在公共治中的作用明显增强，开放合作体系不断完善；到2030年，我国人工智能全面赋能高质量发展，新一代智能终端、智能体等应用普及率超90，智能经济成为我国经济发展的重增长极，推动技术普惠和成果共享；到2035年，我国全面步入智能经济和智能社会发展新阶段，为基本实现社会主义现代化提供有力支撑。在具体执行层面，工业和信息化部等八部门印发的《“人工智能+制造”专项行动实施意见》提出，加速智能终端升级，支持端侧模型、开发应用工具链等技术突破，培育智能手机、电脑、平板、智能家居等人工智能终端，聚焦工业巡检、远程医疗等重点场景，加快AR/VR可穿戴设备、脑机接口等新型终端的产业化、商业化进程，推动具身智能产品创新，建设人形机器人中试基地和训练场，打造人形机器人标杆产线，在典型制造场景率先应用。图3：在政策端，中国已围绕物理AI的规模化落地构建起系统性、分阶段、聚焦实体的设计框架。中国政府网让AI物理AI的技术路线正沿着“VLA（视觉-语言-行动）模型”与“世界模型”两条主线协同演进。VLA模型实现了从感知、语言理解到物理动作的端到端统一，使机器人具备了在复杂环境中执行任务的基础能力；世界模型则通过对环境动态的预测性表征，为VLA提供前瞻模拟与虚拟验证能力，弥补其在长程规划和分布外泛化上的不足。我们认为，未来物理AI的核心技术架构将是VLA与世界模型的深度闭环——前者负责实时决策与执行，后者负责环境推演与规划验证，两者互补，共同推动物理AI从演示环境走向真实场景的规模化落地。图4：用于自动驾驶的LearningVision-Language-ActionWorld模型LearningVision-Language-ActionWorldModelsforAutonomousDriving》GuoqingWang等，天风证券研究所VLA模型：从模态孤立到具身智能的统一框架境中的泛化与推理能力。VLA（Vision-Language-Action，视觉-语言-行动模型是一类旨在赋予机器人同时处理视觉信息、理解语言指令并执行物理动作能力的智能系统。该技术Transformer2021—2022年间被提出，而2023年GoogleDeepMind推出的RT-2（RoboticTransformer2）则将感知、推理与控制整合于同一架构，把机器人控制视为一个自回归序列预测任务。技术实现上，VLA在视觉-语言模型（VLM）的基础上引入“动作token”——即将机器人电机指令（如关节角度、移动距离）进行数值化或符号化编码——使模型能够从视觉、语言与机器人轨迹数据的配对中联合学习。这一方法显著提升了机器人在未见物体、新语言指令以及非结构化环境中的泛化与多步推理能力。在架构设计上，典型的VLA模型融合三个核心模块：视觉编码器（如NN或ViT、语言模型（如LM或Tafme）以及策略模块或规划器。5探索阶段former快速发展阶段往多层方向发展,,多模态面向具身操作的视觉−语言−动作模型综述》李浩然等图6：人形机器人使用VLA模型架构完成任务Vision-Language-Action(VLA)Models:Concepts,Progress,ApplicationsandChallenges》RanjanSapkota等当前VLA模型的性能虽已逼近技术极限，但从仿真环境迁移到真实物理世界时，仍然面临泛化能力不足等挑战。自2023年以来，VLA模型发展迅猛，性能已接近当前技术体系下的天花板。以LIBERO基准测试为例，2026年的主流VLA模型在该测试集上的成功率普遍稳定在98.5以上，其中顶级模型更是达到了99.2的准确率。不同模型之间的性能差异0.1以内，展现出在训练分布内近乎完美的任务执行能力。然而，尽管VLA在封闭或相似环境中表现卓越，其在真实物理世界中的迁移部署仍面临一系列挑战，其中泛化能力不足是关键挑战之一。当面对全新任务或不熟悉的任务变体时，模型性能往往出现断崖式下滑，成功率降幅可高达40。例如，一个在家庭服务场景中训练良好的VLA模型，一旦被引入工业制造或农业生产环境，由于物体种类、环境动态变化以及操作约束的显著不同，很容易出现执行失败。这种局限性本质上源于模型对狭窄训练分布的过拟合，以及对多样化任务表征的接触不足。因此，行业亟需精心构建的、平衡且全面的领域特定数据集。图7Vision-Language-Action(VLA)Models:Concepts,Progress,ApplicationsandChallenges》RanjanSapkota等图8：2023年以来的部分主流VLA模型沙丘社区公众号，PhysicalIntelligence博客，DeepMind博客Vision-Language-Action(VLA)Models:Concepts,Progress,ApplicationsandChallenges》RanjanSapkota等世界模型：为VLA注入想象力VLA模型一般根据当前观测直接映射出动作，缺乏对未来状态演化的显式推理。这一局限在复杂物理环境中尤为突出——当任务涉及长时程规划、多步推理或不确定性下的决策时，纯反应式VLA往往因累积误差和缺乏前瞻而表现不佳。世界模型（WorldModel）正是为弥补这一缺陷而生。世界模型是一种对环境动态的预测性表征，能够根据当前状态与候选动作，预测未来一系列状态的演化轨迹。它为VA提供了环境动态的“内嵌物理引擎VA可借助世界模型提前模拟动作的物理后果、验证计划可行性，并在虚拟环境中进行安全训练与数据增强。世界规划器：作为前向动态模型，通过预测未来状态（图像或潜在特征来为策略提供语义和物理上的“前瞻”指导，确保动作计划在物理上可行。-动作”轨迹对来合成训练数据，用于扩充数据集，克服真实世界中高质量机器人数据稀缺的问题。图10：世界模型为VLA提供了环境动态的“内嵌物理引擎”TowardsGeneralistEmbodiedAI:ASurveyonWorldModelsforVLAAgents》WentaoTan等物理AI全球物理AI市场——涵盖自主机器人、自动驾驶车辆、人形系统、工业自动化、可穿戴AI的医疗和农业系统——FutureMarkets年的约亿美元增长至3.26万亿美元，这将是历史上规模最大的技术市场扩张之一。AI市场。这一地位主要得益于：其一，该地区拥亚马逊机器人、谷歌DeepMind等技术领导者持续投入大量资源。此外，北美在工业自动化技术方面也具备显著优势。政府层面，通过推动更安全的人工智能开发、自主系统与下一代机器人的系列举措，区域领导力有望进一步强化。与此同时，顶尖研究机构与活跃的风险投资生态，也为物理系统的快速商业化与规模化部署提供了有力支撑。亚太地区是目前物理AI增长最快的市场之一。其驱动力主要来自快速工业化进程、制造能力持续扩张，以及中国、日本、韩国和印度等国智能工厂渗透率的提升。亚太地区已在AI机器人平台的快速部署奠定了产业基础。在政策层面，中国的“中国制造2025、日本的“社会5.0、韩国AI的投入。综合来看，伴随劳动力成本上升、自动化需求增强以及本土制造生态系统的持续完善，Acumen预计未来十年亚太地区将在物理AI应用规模上超越其他区域。图11：物理AI市场规模ACUMEN图12的医疗和农业系统MARKETSANDMARKETS风险提示产业发展

人人文库> 全部分类> 应用文书 > 研究报告

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

产业赛道投资图谱：物理AI人工智能演进的第三波浪潮

文档简介

温馨提示

最新文档

评论

产业赛道投资图谱：物理AI人工智能演进的第三波浪潮

文档简介

温馨提示

最新文档

评论

相关文档