多模型与智能体聚合及服务引擎(MoMA)白皮书_第1页
多模型与智能体聚合及服务引擎(MoMA)白皮书_第2页
多模型与智能体聚合及服务引擎(MoMA)白皮书_第3页
多模型与智能体聚合及服务引擎(MoMA)白皮书_第4页
多模型与智能体聚合及服务引擎(MoMA)白皮书_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

服务引擎(MoMA)白皮书本白皮书旨在提出中国移动九天人工智能研究院对于多模型与征和典型应用场景,并借助本白皮书面向产业提出共建共享的MoMA 1 2 3 3 4 6 6 8 8 9 2逐步由模型的技术创新转变为以落地价值为导向的应用创新,更加关注应用的任务完成质量和用户体验,成为部署模型和智能体实现在这一背景下,大模型和智能体的发展已进入一个迫切需要体系化AI基础 3图1MoMA的愿景和目标模型和智能体的规模化应用和商用落地进程,本白皮书基于中国移动在AI领域ofModelsandAgents(MoMA)的态路由、智能规划、精确调度,提供高准确、高安全、高可靠、高效能的大模汇聚的模型和智能体能力,并识别和理解用户意图,精准匹配满足用户 4l提供MoMA引擎:提供具备超大规模服务能力和极致优化成本的工程引擎。在效果、效率、成本三重约束下实现对任务类型、资源分配、执l构建MoMA协议:构建支持模型、智能体接口互联互通的标准化、高证及安全通信等能力,使能模型、智能体、工具、数据、环境和应用系图2MoMA总体框架 5多样、质量优良、安全可控的模型、智能体及工具的资源池型、智能体及工具的供应商建立严格的准入机制,以及通过作流程,持续吸引并激励优质供应商持续提供核心能力。在持续进行能力资源的筛选、评估与进化,并依托技术性能、安全与合规、服务稳定性四维能力评估体系,确保资源池始协同、可信的智能服务流,提供高准确、高安全、高可靠、全、便捷的接口,将平台智能服务高效输出至个人与企业场 6MoMA生态汇聚层是整个体系架构的底层,是承接供应侧能力输入、支撑构建起一套规模化、结构化、可调度的AI能力集群,为上层智能体服务、API在MoMA体系中,生态汇聚层直接对接供应商,是能力接入的直接来源。作为总体架构的底层支撑,MoMA生态汇聚面向模型、智能体、工具等多元异标衡量服务的质量,指标包括TPS、TTFT、TPOT等。在推理效果评估方面,则聚焦服务提供方在生成内容安全、数据保护和版权管在实际落地中,MoMA生态汇聚由一套清晰的智能能力聚合与服务支撑体 7图3MoMA生态汇聚层功能框图l能力汇聚:聚合了多类型的模型、智能体以及工具,包括语这些能力单元覆盖从通用生成到垂直工具的多模态任务类型,借助MoMA协议体系提供的统一接口接入,构成MoMA智能调度的操作单元。在运行过程中,这些能力可被动态路由、组合调用,用以支撑上层复杂任务的执行。能力组件在设计上遵循“最小可调度单元”原则,便于稳定性的多维评估机制。所有接入的模型能力需完成接入前的统一评估响应可控、质量可溯。供应商管理机制也嵌入该流程之中,要求能力提供方配置支持团队提供服务保障,从制度层面形成体系化的生态治理能上述模块共同构成了MoMA生态汇聚层的核心框架,在聚合的基础上实现能力支撑基础。可以说,生态汇聚既是MoMA能力广度的体现,也是其能力深度的基础。在这一资源底座的支撑下,MoMA得以构建起从供应商、协议调度到智能体服务的纵向能力通路,形成智能服务体系的完整闭环。 8图4MoMA模型功能框图好地适应数据变化、业务需求和环境波动。MoMAl模型探测:通过对模型和智能体能力的深入探测,从成程度等方面构建其能力高维表征,实现用户需求与智能体路由的快速匹配;通过评分机制,评估不同模型和智能体的效果,便于分层路由模型l任务规划:负责需求解构,将用户输入拆分为相互独立子任务,并综合任务难易程度,工具、模型及多智能体特性,为 9力覆盖广度、成本控制效能与任务适应弹性上的固有局限,促进了AI从被动响图5MoMA工程引擎功能框图l多级路由机制:在分层路由机制中,多级路杂任务的拆解与实现。其中一级路由完成专家模型、简单任务、复杂任务的分发;二级路由在综合准确度和成本的条件下,根据复杂度把问题l动态洞察:采用MonitorModel对推理内容进行实时监控、复盘两级路了Planner-Executor-Summarizer架构,能够根据具体任务动态地采用干预的情况下执行数十个步骤。通过采用复杂任务路由技术,将请求发送给专门的规划模型,选择不同的执行模式或混合模式,将用户的意图 分配至合适的智能体或大模型,并通过监控推理输出内容,进行动态接管与调整,从而保证回答的效果和效率。此外,这种方式还避免了或减少了依赖中心规划模型对智能体或工具输出内容的重复推理评估,降低图6MoMA协议体系功能框图范,主流协议包括MCP(ModelContextProtocol,模型上下文协议)[2]和A2A(Agent2Agent)[3]。其中MCP是一种用于规范模型或智能具和服务之间的交互的开放协议,其通过结构化的输入/输出将模型或智能体与A2A协议则是一种用于促进独立且可能成为黑箱的智能体系统之间通信与互操表1MCP与A2A对比对比维度MCPA2A协议定位模型/智能体与工具、资源的连接智能体之间的复杂协作核心优势结构化输入输出、对接成本低支持多轮交互、上下文共享、状态维护局限性仅适用于单论调用、不支持多轮交互和状态跟踪协议设计和实现复杂度高、多任务协作中成本高应用场景模型/智能体调用数据库等多智能体项目管理等 在此基础上,采用MCP规范模型或智能体与具备明确功能定义、结构化输入输功能扩展。采用A2A规范智能体与智能体之间的协同交互,提供标准化的能力MoMA协议体系下MCP与A2A也会协同使用。一个A2AServer(远端智能体)可以将其部分具备清晰定义、可按无状ANP(AgentNetworkProtocol)[5]作为面向未来智能体互联网环境下,智能体网协同上的不足。为MoMA后续更好地适配开放异构的智能体网络生态,构建大规模、动态演化的智能服务网络提供通信基础与对于与大模型的交互,MoMA同样予以考虑。鉴于当前主流大模型多以开放API的形式提供服务,且这些API通常采用HTTP进行通信并以JSON作为数据格式,其本质上与MCP所规范的工具接入方式高度接近。因此在MoMA对话、连续推理、长链路任务管理等,这些能力超出了MCP所面向的单次请求基于现有协议的二次开发,如补齐MCP在上 止未经授权的获取和篡改。通过在认证与安全通信两方面的协同设计,MoMA该协议体系体现的价值:MoMA协议体系通过MCP与A2A的互补协同,与扩展性,构建了覆盖数据、工具、模型、智能体的完整协议体系,为AI要素聚合与能力调度提供支撑。同时,国内智能体相关标准化体系的持续建设,如图7MoMA开放服务功能框图MoMA提供的服务均以开放API的形式对外提供,通过构建API开放与管提供便捷、统一、规范的API调用,也承担安全防护、调用统计等一系列平台API开放与管理平台承接了MoMA服务的对外统一入口,提供稳定可靠的API调用、标准化的接口文档及配套的SDK工具,以帮助不同能力水平的开发 API开放平台提供全链路的用量统计,通过对API调用次数、消耗token、馈,同时也为MoMA路由与调度引擎提供数据支撑。API开放平台支持多元化同服务需求,配合账单管理、结算对账等功能,保障API开放与管理平台平台提升了MoMA能力对外服务的可用性、便捷性与 同的应用与服务中,使用便捷性较差。MoMA通过语义理解、多智能体协作和然的方式发出指令,获得从需求解析、任务规划到表,并融合运营商特色的语音通话能力,提供AI代打电话服务。当用户点击卡自然语言解析与任务拆解(多轮Agent+MoMA调度引擎将用户请 邀请与日程同步管理(日程Agent+通信工具统一操作邀请在行业应用场景中,MoMA不仅是一个多模型与智能体的聚合平台,更是现对模型能力的合理统筹、实时调度和最优路径执行。通过这一机制,MoMA将人工智能技术从单一的任务执行模块扩展为企业全业务 用不同工具,导致流程割裂、效率低且算力与资源利用率不高。在MoMA体系化运行成本。同时,MoMA能够对模型和智能体能力进行维护、迭代与实时更在行业应用场景中,MoMA不仅作为智能能力中枢,同时也是成本控制与能力池与算力池统一管理:集中管理企业内部及外部接入的模型、APIMoMA为企业级AI平台提供了一个可扩展、可演化的智能调度中枢,使敏捷扩展:无需重构IT架构,即可引入新模型、新算法和新数据源,替换难度大等普遍痛点,不仅大幅降低了企业在AI技术选型与替换上的成本, 展望未来,大模型与智能体技术的蓬勃发展及其产业的快速壮大,为构建类型的用户提供精准匹配应用需求的,如同通信服务般便捷、普惠、可靠的模海量用户、运营通信业务及数智化服务方面积累的丰富经验可供借鉴。同时,新,合力打造共建共享的开放运营生态。因此,提盖个人、家庭、行业用户、应用开发者的典型场景需求,推动场景与能力之间的精准匹配与联动优化。通过真实场景驱动模型与智能体能力的演进与融合,以用户为中心形成“场景驱动、能力倍增、价值闭环”的良2)攻关MoMA模型和工程引擎关键技术。MoMA模型和工程引擎的决定了MoMA服务水平的上限。它不仅是连接“资源池”与“用户需求”的我们呼吁产业合作伙伴加入这一关键技术攻关,合作研发模型框架和引擎算法、制定技术标准、分享实践经验,打造强大的MoMA的“大脑”研究和制定,携手推动模型与智能体之间的能力互联、语义互通与行为协同,打造统一、高效的模型智能协作基础。鼓励开发者、研究机构和 企业依托开源社区和标准化组织,积极贡献智慧和经验、凝聚共识,合4)共商MoMA生态汇聚的评测准入规则。面向模型与智能体能力的多源汇聚与统筹管理,推动建立统一、权威的评测准入体系。联合产业各方就技术性能、推理效果、安全合规等核心维度,协商形成业界共同认可并愿意遵循的评测指标和准入规则,保障平台纳管资源的可控性与高质我们期待MoMA汇聚业界优质大模型及智能体,依托中国移动充沛的算力 缩略语A2AAgenttoAgent智能体到智能体AIArtificialIntelligence人工智能ANPAgentNetworkProtocol智能体网络协议APIApplicationProgrammingInterface应用编程接口ASRAutomaticSpeechRecognition自动语音识别BIBusinessIntelligence商业智能CRMCustomerRelationshipManagement客户关系管理ERPEnterpriseResourcePlanning企业资源计划GPTGenerativePre-trainedTransformer生成式预训练变换器HTTPHyperTextTransferProtocol超文本传输协议JSONJavaScriptObjectNotationJavaScript对象表示法LLMLargeLanguageModel大语言模型MaaSModelasaService模型即服务MCPModelContextProtocol模型上下文协议MoMAMixtureofModelsandAgents模型和智能体聚合OCROpticalCharacterRecognition光学字符识别POIPointofInterest兴趣点QAQuestionAnswering问答任务RAGRetrieval-augmentedGeneration检索增强生成SDKSoftwareDevelopmentKit软件开发工具包TPOTTimePerOutputToken输出每个词元时间TPSToken

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论