版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
AI原生应用开发最佳实践从企业级生产痛点到解决方案探索2026/01/13阿里内部Agent实践OneDay阿里内部AI开放平台
IdeaLAB内部提效
AI
Coding:
需求、
产品设计、
开发、
测试全流程演进
AI
Ops:
运维关注度高
,期望能辅助资源管理、
快速定位系统问题(Infra
or业务)
并给住自愈方案
,
甚至自动化自愈
内部工具:
BI助手、
内外小密、
会议助手
…业务场景
汽车出行
:智驾训练、
座舱推理(ASR、
TTS、
知识库)
、
市场营销(AI
GC)
、汽车设计(AI
GC)
具身智能
:大脑、
小脑训练
,
部分云端推理(
LLM、
TTS等)
,AI玩具(类具身智能ASR+LLM+TTS+MCP)
互娱游戏
:搜索推荐、
情感陪聊、
AI
GC-生图/视频/音乐、
视频剪辑、
智能客服(
Chat、
语音)
、AI
网剧
教育
:虚拟老师、
作业批改、
答题辅助、
AI编程
互联网-工具
:基模公司-通用Agent、
机器人外呼
零售
:智能选品、
市场营销、
AI
GC-商品图合成/模特换装/辅助设计、
智能客服
泛企业:
丰富的垂类Agent
,如智能眼镜、
智能音响、
合同审核、
商标查询、
建筑报告
…
医疗健康、
生物医药、
法律咨询、
物流
…各行各业都在探索落地AI应用AI原生、
Agent驱动了解现状
,
直面行业挑战
,
诞生AI原生应用架构和《AI原生应用白皮书》为AI而进化的基础设施AI
网关、
AI原生应用开发框架、
上下文工程、
AI工具、
AI应用运行时、AI可观测、
AI评估、
AI安全案例场景与最佳实践大规模生成使用的AI案例010203CONTENT目录
在AI领域已经积累什么经验?
是否使用过文生图/视频工具?(
SD
,ComfyUI等)
主要采用什么模型API?(
OpenAI、通义千问、Gemini等)
AIAgent应用主要用在什么场景?如果给你一个完整的AI
Infra平台
你最希望它帮你做到什么?
一行代码把模型变成可用的API?
零代码搭建一个AI助手/Agent?
能够衡量并提升Agent的执行效果?用过的这些AI能力
,
觉
得最麻烦的是什么?
遇到最头疼的问题是什么?
最想解决什么问题?开放性讨论
几分钟就能生成高质量内容?
AI
Agent趋势改变世界机器人(
Physical
AI)具身智能/
自进化/脑机接口接管数字世界APP
(AgenticAl)私域数据/Tools/场景模型性能突破Model
(Scaling
Law)大数据/大模型/多模态/空间智能AI原生应用白皮书背景模型迈过拐点
,
Agentic
AI爆发•
据Markets
and
Markets预测
,全球AI
Agent市场规模将从2024年的51亿美元增至2030年的471亿美元
,
年复合增长率达44.8%;
Gartner预计
,到2028年
,
至少15%的日常工作决策将通过AI
Agent自主完成。•
《国务院关于深入实施“人工智能+”行动的意见》到2030年
,智能体等应用普及率超90%。行业趋势行业报告AI发展阶段•
AI场景爆发:
Chat
,
Coding
,智能驾驶
,消费电子
,智能玩具
,
DeepResearch等•Google搜索指数
,AI
Agent过去16个月
,
1088%增长。单Agent高代码/零代码单任务Workflow
低代码/高代码AI原生应用架构模式AI原生应用架构多Agent高代码/零代码AI云原生应用架构定义ToolsPerception
Actions基于模型
,
Agent驱动
,
以数据为中心
,整合工具链InstructionsPrompt泛化(
LLM编排)具象(
Code编排)AgentRetrieveRAGStoreMemory单
应
用
多
应
用PlanningReasoningPromptResponseLLM大脑
,
既大语言模型(
LLM)
作用:
识别自然语言
,然后进行推理并做出决策。
原则
:选择最合适的大语言模型。(不同的大语言模型有自己擅长的领域和业务场景)记忆
,知识库
记忆
:让Agent记得目标、
偏好
,
以及过往的交互信息
,从而实现多步骤执行
,
自省等能力
知识库
:存的是「知识片段」
,
能回答具体问题
,
但不是一个完整的操作流程指令
,
既系统提示词(System
Prompt)
,
或上下文工程(Context
Engineering)
系统提示词
:定义Agent的目标和行为
,
为获得最佳推理结果而编写和组织
LLM指令的方法
上下文
:在
LLM推理过程中
,
动态规划和维护最优的输入token集合各类工具及能力(
MCP
Server、
Skills、沙箱Sandbox、
观测、
评估评测)
作用:
为Agent提供外部接口能力
,
如各类业务服务
,数据库服务
,存储服务等
Skill是「操作手册」
,
告诉当前Agent遇到问题该按什么步骤来。
Agent还是自己干
活
,
只是有了指导。
就像给新人一份SOP
,他还是自己操作
,
但知道该怎么做了
沙箱SandBox:
提供安全隔离、
自动弹性伸缩的、
独立的扩展环境
,
如Code、Browser、
Computer
Use、
Mobile
Use等沙箱环境AIAgent躯体
,
既运行环境(Agent
Runtime)
作用
:结合Agent
Framework
,
使AI
Agent主程运行起来
原则:
运行环境需要隔离、
弹性Memory记忆我记得之前发生了什么知识库我知道某个知识点SubAgent这活儿交给专人去干Skill我知道这类问题该怎么一步步处理AI
Agent的核心组件开发模式多样难以持续演进开发Agent时的挑战/痛点不同层次的开发者需要无代码,低代码,高代码多种开发模式,同时期望能够持续演Agent依赖大模型和外部工具服务,但这些服务经常不稳定,缺涉及知识库、用户数据、业务逻辑等敏感信息,数据安全和Agent运行是黑盒,无法评估效果好坏,不知道如何优化,Agent需要安全隔离的执行环境来运行代码、操作系统、调安全构建稳定效果效果评估和持续优化困难企业数据安全和合规挑战用工具,但自建成本高、性能差、安全隔离困难执行环境难构建服务稳定性差合规成为企业应用的最大顾虑模型和工具高性能安全乏统一的容错和治理机制运行时进,挑战高成本不透明部署实现快维护成本高模块化负载均衡服务管理RPC技术高密度部署原子、
自治按量使用极致弹性流量网关ESB微服务网关云原生网关AI
网关?应用架构演进趋势RuntimeKubernetesAI基础设施PromptTemplateInstructionsPlanningAgentReasoningStore/
RetrieveMemory云基础设施流量网关应用运行时BaaS智能体应用CodeAgent多智能体编排存量应用Web单体应用事件驱动应用•
存量系统融合:
Agent如何与存量系统打通
,
利用已有资产
,
赋能企业核心业务•
智能体开发:
全新的Agent开发技术栈
,
如何快速开发、
部署与市场验证应用发展与基础设施升级的双向驱动•
稳定运行:
如何保障新构建的AI应用稳定、
安全的运行AI应用架构落地难点引入智能体应用让业务系统更智能与存量应用打通复用已有业务能力APIGatewayChatAgent云原生可观测FlowAgent云原生网关微服务应用FC/SAETools异步任务ActionsResponsePrompt容器LLMOSSMQRDSALBECSLLMAgentAI
NativeAPP安全隔离弹性AI时代开发者关注业务创新而非基础设施VM/容器运行时AI时代需求
Serverless运行时从传统架构到
AI
原生架构
从
Serverless
架构到
AI
原生架构状态持久化内置状态持久化或集成工作流
,支持快照或会话管理,
自带3AZ容灾API驱动依赖网关/MQ实现同步和异步调用或
,微服务架构协作复杂度高事件驱动通过云产品事件驱动自动执行,架构原子化解耦
,协作更容易免运维安全隔离的多语言运行环境
,自带监控日志告警等配套设施运维负担沉重依赖专业运维团队配置集群、环境,
自建监控日志代价高动态弹性按请求弹性
,毫秒/秒级供给资源
,支持低峰缩0弹性降本状态管理复杂依赖
Redis/DB管理
,故障恢复复杂
,跨节点迁移几乎不可行静态资源分配预留固定资源
,利用率低,无弹性或分钟级弹性流量不可预测易受注入攻击多租户数据敏感AgentRun:
Agentic
AI
应用基础设施可观测凭证管理评估AI应用统一入口AI
网关(代理Agent)RocketMQforAI流程式编码式AI全栈统一监控基于
Prometheus构建AI全栈监控大盘
,包括模型性能分析、
Token成本分析、
GPU资源异动分析等端到端链路追踪基于OpenTelemetry
Trace实现用户终端、
网关、
模型应用、
模型服务、外部依赖工具等全链路追踪。日志存储与评估分析构建统一日志分析平台
,对模型调用日志进行二次评估分析
,
实现质量、安全、
意图提取等语义检测。MCP
代理
新建
MCP
Server
函数计算
FC
一键转化存量业务MCP
化AI网关
存量业务多种部署方式的LLM通义千问
DeepSeekOpenAIAI网关PAI/百炼/FC
GPU从AI原生应用架构
,
演进到AI
Agent构建平台函数计算FC(CPU+
GPU)云工作流AI
Studio节点A
节点
CSAE/ACK/托管DifyAgentScope节点
BAgent运行时与沙箱AI
网关
AI
工具Agent开发框架SandBoxAgentruntimeMCP
Server构建部署AI
AgentSDK运行时LangChain……上下文管理模型代理Mobile
APPGemini模型调用工具调用WebAPPWorkflowdeviceFunction异步同步User为AI而进化的基础设施从AI原生应用架构到Agent构建平台AgentRun
AI
网关
Agent
Framework
AI应用运行时
AI
工具
上下文工程
AI观测
AI评估
AI安全(应用、
模型、
数据、
身份、
基础设施安全)每个企业都需要一个AI
网关企业级
MCP
Server市场MSE
Nacos
MCP
Registry第三方
MCP
Server
市场Hi
MarketAI开放平台协议增强适配通用功能AI观测RESTTo
MCPTools动态组装Tools智能路由MCP
Server动态发现Agent
DiscoveryA2A百炼/Dify协议转换REST
To
A2A多模型流量分发智能路由智能负载均衡模型fallbackAI安全护栏会话保持消费者认证/鉴权自定义策略与插件…
…HTTP/WebSocket
ComfyUI/TTS
WebRTC(Q4)企业大模型市场企业Agent市场企业
MCP工具市场AgentScope、
LangChain
等开源框架MCP数据安全
内容安全AgentModelWAF集成LLMs
多模态模型ComfyUI
TTS生视频后端服务鉴权消费者鉴权IP黑白名单AI安全防护KMS集成API-KEY管理数据脱敏通义千问OpenAI7Agent
Rundeepseek自建大模型……AI
网关AIAgent网络安全SSL证书开源Agent/AI工作流Dify——12流量防护弱
管控与数据链路耦合无任何防护措施,很容易被穿透
AI应用设计与智能体的执行耦合,高并发无法保证稳定性,QPS不到50版本升级困难Dify社区更新频繁,每次版本升级都需要重新部署。缺乏多租隔离能力对比企业版,社区版缺少隔离能力,是个单租模型。数据源存储格式单一推理服务需要大量计算资源,资源分配不均会导致性能瓶颈。社区Dify很难满足生产环境543简单易用•5分钟创建
Dify应用•
默认集监控日志能力•
底层资源按需弹缩高可用•
默认支持智能化可用区
,支持指定三AZ•
默认支持负载均衡与健康检查联动
,提供无损上下线成本经济•
性能调优
,支持
500QPS•
支持多种规格资源
,并提供闲时计量模式
,夜间成本更低持续迭代•Dify版本更新快,SAE支持原地版本升级能力*•
AI应用监控提供Trace能力,结合日志查询,
问题定位更加迅速DifyonSAE——针对社区Dify优化提升10倍性能Dify-ServiceDify-可用区
BDify
ProxyDify-web
Dify-APIDify-sandboxDify-workerDify-可用区CDify
ProxyDify-web
Dify-APIDify-sandboxDify-workerDify-可用区ADify
ProxyDify-web
Dify-APIDify-sandboxDify-worker终端用户——浏览器/APP/小程序拖拽式编排快速构建业务接口调用业务应用MCP
ServerServerless应用平台云
RDS
PostgreSQL版本云数据库
RedisAnalyticDB
PostgreSQL云
RDS
PostgreSQL版本云数据库
RedisAnalyticDB
PostgreSQL数据库调用StandbyServerless应用平台(SAE)网关(云原生API
网关
|ALB)MasterAgentScope是阿里云官方的Agent框架目前支持
Python和Java两个开发语言:
AgentScope-Python
AgentScope-JavaSpringAIAlibaba合入AgentScope•后续Java语言的Agent
开发框架以AgentScope为主
品牌发展。•AgentScope-Java版本已追评
Python版本的能力。国内依然有50-60%的Java开发者或Java系企业AgentScope-Java性能优化
,启动速度提升60%Graalvm:原版3.087秒,
Native版本200毫秒Leyden:原版2.47秒,
Leyden版本0.818秒AgentScope——阿里云官方开源Agent开发框架AgentScope官方文档:https://doc.agentscope.io/zh_CN/index.html函数计算AgentRun
,
一站式
AI
Agent构建平台AgentRun
是以高代码为核心
,
开放生态、
灵活组装的一站式Agentic
AI基础设施平台
,
为企业级Agentic
应用提供开发、
部署与运维全生命周期管理。
基于
Serverless
架构提供强隔离的运行时与沙箱环境
,
深度集成开源生态
,
为用户提供模型高可用和数据不出域能力。零运维、极致弹性、按量付费
自动应对从0
到百万级并发的流量
毫秒级冷启动和弹性伸缩
真正的按量付费,闲时成本归零
无需管理服务器、容器、GPU卡彻底解放运维负担
,成本和性能最优平衡数据不出域,灵活集成,平滑演进
兼容主流框架(AgentScope等top5框架)
Agent无代码一键转高代码,支持持续演进
深度集成开源生态(RAGFlow、mem0等)
支持绑定已有向量库和RAG(VPC/IDC)
模块化使用,可散件集成到现有系统AgentRun企业级Agent最佳运行底座
高性能多语言,多种类Sandbox
多维度隔离(会话亲和/隔离,请求隔离)
统一模型代理、熔断降级、多模型Fallback
工具市场与MCP标准化治理提供生产级的执行环境和多租户安全保障看得清、管得住、优化快
端到端全链路
Trace,问题秒级定位
细粒度成本归因,每分钱都知道花在
哪
实时性能监控、智能异常诊断
多维度统计分析,持续优化依据Serverless基础设施灵活开放数据/框架无锁定企业级
Runtime与安全隔离全链路可观测用户掌握技术选择主动权
,避免供应商锁定
Agent不再是黑盒
,每个环节都清晰可控函数计算AgentRun的四大优势高性能、高安全、开箱即用X
函数计算
FC
50+内置多语言运行环境
,代码执行延迟
<100ms
会话亲和/隔离架构
,满足Agent/Sandbox
上下文保持需求
零运维、
毫秒级弹性、
按量付费的企业级安全沙箱
,兼容
E2B
X
函数计算
FC
开箱即用
,
DevPod二次开发
,
弹性交付GPU
,低峰缩0
内置vLLM/SGLang/Ollama/LMDeploy推理框架
最快30s将开源模型转化为生产级OpenAI兼容APIX函数计算
FC
零改造将开源STDIO
MCP升级为SSE/Streamable
HTTP
原子化解耦
,
MCP
Server冷热分离
,
弹性伸缩
RT抖动少
MCP
SSE亲和调度
,
闲置计费
,低峰自动缩0成本最优Serverless运行时已经成为阿里云AI原生应用的核心载体AI网关
+AgentRun运行时内部大规模实践案例业界首个全生命周期
MCP服务市场2万+热门模型一键托管到云上环境助力Qwen3-Coder成为领先的的代码模型Serverless智能体运行时Serverless工具运行时Serverless模型运行时Code
InterpreterRL
Sandbox高代码Agent大语言模型MCP
Server智能体领域模型模型工具开箱即用AgentSandboxServerless
运行时运行时隔离细粒度资源内置多语言执行引擎GPU算力解耦&
1/N切分Serverless
平台底座GPU
算力(Tesla,Ada,
Hopper,etc.)函数计算AgentRun——Serverless智能体和沙箱运行时Agent&
Sandbox
Runtime轻量化的函数管理&Session亲和与安全隔离内置多语言执行引擎提供开箱即用的沙箱服务Serverless弹性效率请求感知调度,无请求时自动休眠,有请求时毫秒唤醒毫秒级CPU实例&秒级GPU实例极速伸缩Serverless
降本提效缩容到
0&
休眠时更低单价GPU/CPU/MEM算力解耦&1/NGPU
卡灵活切分快速交付,极致弹性资源池化2.0产品集成,事件驱动云产品Serverless
化安全隔离,
自动容灾沙箱容器2.0高密部署,主动调度第四代神龙架构LlamaIndex函数&会话规模百万级冷启动加速毫秒级平均
TCO60%LangChainAIOSandboxComputerSandboxBrowserSandboxCodeSandboxAgentScopeCPU
算力(x86) XPU
算力异构算力轻量化函数毫秒级弹性存储隔离会话亲和Serverless
AI解决方案
引入会话粒度度存储粘性
,将会话和一个持久化的、
归属特定租户的存储子
目录进行强绑定
,在Sandbox运行的时候动态把目录挂载到实例。
平台基于POSIX标准多租存储安全实践框架
,落地层次化纵深防御体系传统共享存储问题(虚机/容器)K8s集群的容器实例在挂载存储时
,是多租户数据共享模型
,
而大模型
生成的代码具有不可预知性
,访问共享存储会有安全问题。x-custom-affinity-header:SessionID-1x-custom-affinity-header:SessionID-2x-custom-affinity-header:SessionID-3AgentRun——沙箱实例支持存储动态挂载
,
保障存储安全mount
/user-id-1/session-id-1mount
/user-id-1/session-id-2mount
/user-id-1/session-id-3OpenWeb
UI会话-1会话-2会话-3Sandbox函数实例-1实例-2实例-3函数计算
FC
持久化存储NASOSS用户AgentRun浏览器沙箱——舆情分析AgentRun
Code沙箱——AI
Coding通用型
Agent——智谱
Z.AIAgentZ.AI
Vibe
Coding
Sandbox详细落地架构模型服务享受PaaS自由度的同时获得SaaS便捷性
,
按调用量付费
,模型部署成本降低90%Devpod模型在线开发/构建按量付费CPU+GPU集群ServerlessAPI按量付费
,
降低成本免运维/低运维毫秒级弹性*百万级实例规模*与ComfyUI/SDDify等生态一键联动函数计算模型服务——AI模型转化为Serverless
API开源模型一键部署
,
AI模型一键Serverless化
,
云端模型开发部署零门槛函数计算-Serverless
GPU模型框架vLLM/SGLang/OllamaTransformers/PyTorch模型市场大语言模型垂类模型Model
scope自然语言处理语音计算机视觉计算科学多模态100+热门模型在线体验200+模型一键部署6
+模型框架一键托管与Agent服务一键集成*毫秒级弹性和百万规模集群紧针对部分模型的测试结果
,并不代表全部模型都可以具备该能力HuggingFace模型类型FunModel——AI模型转化为Serverless
APIFunModel支持
DevPod——云上大模型开发与微调环境
随着AI浪潮的发展
,
吉利汽车在今年推出新一代AI智能化服务
,成为核心竞争力之一
,在吉利银河
M9车型深度搭载。
基于阿里云函数计算的Serverless
GPU算力集群为AI座舱的交互和娱乐功能提供大模型推理服务
,
共同打造大规模、
高可用、
高性能的推理引擎。
场景涵盖意图解析、
文生图、
情感TTS等。
尤其在语音交互方面
,
吉利自研超拟人TTS
,
采用大量微调和训练
,
打造吉利汽车专属的逼真、
富有情感、
自然生动又稳定一致的语音交互体验。吉利汽车——AI让生活更美好函数计算
FunArt——从场景出发的AI
GC创作平台高性价比的GPU弹性算力;支持一键将ComfyUI工作流、
Stable
Diffusion发布为API
,实现资源独享
,自动弹性扩容,
内置队列
,支持异步调用提供开箱即用的云端ComfyUI,
Stable
Diffusion工具
,解决部署安装复杂
,及本地环境显存限制问题。提供
Muse
LoRa,
Kohya
Lora等多种
LoRA训练器
,解决从数据集打标到模型训练的全过程。影视行业AI
GC创意广告义乌小商品城“世界义乌”APP——AI玩具&电商换背景统一工具接口•
支持MCP和FunctionCall双协议
,兼容市面上99%的主流工具和服务•API统管工具调用,开发复杂度降低80%,集成时间从天缩短到分钟智能工具生成与发现•AI自动生成工具代码
,无需手动开发即可满足基础业务需求•AI驱动的工具推荐引擎
,根据Agent任务自动匹配最佳工具组合Tool
Hub生态•
海量工具一键集成
,覆盖数据处理、API调用、文件操作等全场景需求•
开放式工具市场
,支持自定义工具发布和分享
,构建Agent工具生态闭环AI工具——MCP/Skills灵活集成、平滑演进;用户掌握技术选择主动权,避免供应商锁定Python
3.6
~3.11Node.js
17
~22Java8
~21PHP/Go/.NET/…自定义运行时自定义镜像Mem0RagFlow百炼知识库Text
Json
Vector
Graph全文索引向量索引Json索引标量索引上下文工程——企业知识库
,
记忆系统
,
上下文压缩与窗口管理AgentRun
SDKMemory
SDKMemory
系统记忆提取记忆存储MemorySessionKnowledge采用开源Mem0与Ragflow企业数据安全可控,不出域SAE语义记忆技能记忆情景记忆SummaryI
DCVPCAgentRun存储系统快速集成一键绑定一键部署参数形式记忆对话记录存储知识库存储…模型服务层托管模型服务通义千问
DeepSeekOpenAI
…
…
.PythonAgent自建模型服务通义千问
DeepSeek
Llama3
…
…
.推理加速框架(
SGLang/VLLM等)PythonAgent模型应用层LLM应用LLM
应用
LLM
应用LLM应用开发平台/编排集成框架
(Dify/Langchain/Llamaln
dex)PythonAgentKubernetes
SAE实例向量数据库
缓存对象存储一
个
典
型
的
AI
原
生
应
用
架
构
及
可观
测
诉
求AI网关(MSE/ALB等)Otel
SDK链路上下文AI
ProxyToken
限流敏感信息过滤AI网关(MSE/ALB等)Otel
SDK链路上下文API管理流量防护模型日志存储与评估分析模型调用端到端链路追踪AI全栈统一监控基于
Prometheus构建AI全栈监控大盘
,包括模型性能分析、Token成本分析、GPU资源异动分析等基于ARMS构建Trace系统
,实现用户终端、
网关、模型应用、模型服务、外部依赖工具等全链路追踪。基于SLS构建统一日志分析平台
,对模型调用日志进行二次评估分析
,实现质量、安全、意图提取等语义检测。用户业务层客户端Web小程序AndroidiOSHTML
5WAF防护服务发现Cache/RAG链路上下文链路上下文GPU集群RUM
SDKTools…….在线评估基于AgentRun运行时产生的端到端Trace数据和模型调用日志对Agent质量、Rag效果、Tool调用效率等持续的做自动化评估。支持评估模型和代码两种方式。离线评估支持从AgentRun运行时的Trace和日志生成数据集,支持从数据集发起对Agent或者LLM的对比实验,清晰捕捉prompt模板变更、模型调整、tool使用等对于Agent的质量效果的影响,从而为Agent调优提供洞察Code
LLM指标Tool调用Token消耗评分Score
解释可观测Agent链路模型日志数据集可观测数据集自定义数据集基于Trace
或日志中记录的大模型应用输入输出内容,通过LLM/Code/人工等方式对智能体进行在线和离线评估,持续提升
Agent
效果和评估器LLMAgent评估
Tool评估
Rag评估质量评估AI应用评估实验AgentLLM在线离线模型部署——FunModel•
支持Serverless
GPU
算力•
支持微调后的模型进行私域一键部署模型微调——DevPod•
基于反馈的高质量数据集,对模型进行微调•
支持主流的强化学习框架运行•
预集成微调生态的插件Agentic
AI
应用的开发•
低代码白屏化脚手架•高代码无框架绑定开发•
版本的无损平滑升级Agent
数据收集•
无侵入式的全链路采点•一键开启,默认集成•除基础监控外,提供全链路的tracingAgent数据飞轮——持续提升Agent使用效果•
全链路的数据标注•
反馈数据收集•
基于数据测试集的回放数据飞轮Agent
反馈评估Hi
Market——云原生开源AI开放平台
,
构建企业专属的AI市场AI驱动的下一代应用平台端侧应用智能助理
售后服务CRM智能交付平台AI
网关Agent市场Agent构建平台AI
网关基于AI原生应用架构打造——AI驱动的全新应用平台智能体智能体智能体
智能体…理财助手
业务办理数字人平台Agent
API(南北向流量管理/策略管控)工具市场/API/数据源工具统一管理(
MCPServer)模型统一管理(
ModelAPI)基于AgentRun构建方案智能助理投研顾问售后服务售前助理理财助手流程助理基于原子能力构建方案业务办理…WebApp模型市场构建AI原生应用架构落地实践——从原子能力演进到Agent构建平台AI原生应用架构
原子能力构建一站式构建构建MarketingSalesProduct
EngineeringEngineeringDesignAI原生应用架构展望——AGI通向ASI让AI扩展自己和组织边界DesignProductMarketingSales谢谢Thank
You执行环境构建难,性能差毫秒级冷启动,百万级并发
提供Agent,模型,沙箱运行时
(Sandbox支持自定义镜像)基于函数计算构建开源自建维护成本高,性能差(单核<5QPS)支持Mobile/Computer/Browser
Use等沙箱GUI绑定,秒级启动延迟1000活跃会话,会话隔离2vCPU/8GB资源限制模型服务门槛高,成本高
稳定性差多模型接入(支持私有化)Serverless模型托管服务模型治理(负载均衡、安全、多级Fallback)通义千问系列模型平台锁定多模型接入缺乏模型治理与模型安全能力不提供模型服务模型Fallback机制25TPS限制,仅限AWS生态模型工具调用参差不齐,性能差工具市场(海量工具,一键部署)一键转MCP(Agent、Sandbox、API等)MCP扩展(Hook、语义分析、智能路由)开发框架集成(ADK,AgentScope,Langchain,CrewAI等主流Top框架)提供工具市场不支持异步调用,无Hook机制Langchain,CrewAI等高代码框架难以直接调用插件系统,支持扩展Agent可作为MCP被集成每个工具需单独适配,无统一标准支持MCP协议工具生态有限,无框架集成MCP不支Hook、智能路由等功能AWS
工具库工具需符合AWS标准,灵活性差调试优化黑盒执行,难以评
估在线调试,全链路可观测Token级成本归因在线调试,全链路可观测Token级成本归因无端到端可观测能力与成本分析自建门槛高只提供工具基础运行监控无端到端可观测能力与成本分析CloudWatch全套能力数据安全私域,安全合规请求、实例、会话等多层级强隔离支持模型、知识库,Memory私有化部署数据不出域,支持VPC/IDC网络打通基础安全措施,合规认证数据必须上云,不支持IDC打通支持私有化部署需自建安全隔离能力,缺乏企业级特性只提供沙箱隔离企业级安全与审计锁定AWS生态,国内合规挑战【附录】
函数计算AgentRun竞品分析?Agent
Run
高代码为主
,无代码和工作流编排为辅Serverless底座
,Agentic应用全生命周期管理
AgentCore以云电脑为底座
,提供Mobile/ComputerUse的GUI工具标准的Agent
Infra平台深度绑定
AWS生态以低代码和Flow为主与阿里云生态深度绑定AgentBay开源项目执行环境构建难,性能差毫秒级冷启动,百万级并发提供Agent,模型,沙箱运行时(Sandbox支持自定义镜像)基础版性能限制严重(启动时间20秒¹
,
并发能力
200用户¹
,
平均响应时间:1.1秒¹)支持高并发处理,适合规模化部署³Serverless架构,按需秒级扩缩容5基于Intel
TDX机密计算环境‘模型服务门槛高,成本高
稳定性差多模型接入(支持私有化)Serverless模型托管服务模型治理(负载均衡、安全、多级Fallback)海外版本多模型支持:豆包、Deep
seek等7
通过统一接口适配主流模型8国内版仅提供豆包系列模型模型生态高度绑定:主要对接豆包大模(生态锁定)缺乏多云模型支持企业级模型管理与火山方舟深度集成(生态锁定)工具调用参差不齐,性能差工具市场(海量工具,一键部署)一键转MCP(Agent、Sandbox、API等)MCP扩展(Hook、语义分析、智能路由)开发框架集成(ADK,AgentScope,Langchain,CrewAI等主流Top框架)开源版工具生态严重不足:开源版仅十几个个插件¹¹
,
商业版成千上万插件¹²
;功能差异巨大内置MCP客户端能力¹³基于MCP协议标准化集成¹4支持CRM/ERP系统API连接缺少开放的工具/插件市场(仅内置60+插件,其余需要用户自行添加)原生MCP协议支持¹5长短记忆管理¹5多框架兼容扩展(侵入性)调试优化黑盒执行,难以评
估在线调试,全链路可观测Token级成本归因工作流可视化调试,类Figma拖拽界面¹‘模型性能和并发指标监控¹7智能体多维度评测¹8缺乏Token级细粒度分析在线调试Agent
DevOps全流程管理¹9全链路应用观测¹5数据安全私域,安全合规请求、实例、会话等多层级强隔离支持模型、知识库,Memory私有化部署数据不出域,支持VPC/IDC网络打通部署模式严重分离:商业版:仅支持云端部署²¹
,
数据必须出域开源版:可私有化但缺企业特性²²支持私有化集成²³Intel
TDX机密计算‘代码全链路加密²4不支持数据不出域能力【附录】
函数计算AgentRun竞品分析HiAgent
AgentKit高代码为主
,无代码和工作流编排为辅Serverless底座
,Agentic应用全生命周期管理基于AIAgent的智能办公平台与字节跳动生态深度绑定Infra性能(启动、并发等)与Sandbox安全(多级隔离)
,数据不出域?Agent
Run企业专属AI应用创新平台一站式智能体工作站开发模式转换能力不足(无代码-低代码向高代码转换)企业级AIAgent平台深度绑定火山引擎生态生态锁定(尤其模型、框架生态)CozeAgentRunSandboxACS沙箱能力AgentBay沙箱类型
AllinOne、RL、Sim、Code、Browser沙箱
应用级别开箱即用
以容器界面提供沙箱能力
未提供应用层的进一步封装
Browser、Computer、Mobile沙箱
只提供GUI层面的封装镜像能力
预置镜像
自定义镜像(基于Base镜像灵活定制环境)
预置镜像
自定义镜像
预置镜像
自定义镜像隔离技术
安全容器(MicroVM)
多级隔离(请求级、实例级、会话级)
安全容器(MicroVM)
实例(Pod)级别隔离
虚拟机文件挂载
支持动态文件目录挂载(OSS,NAS等更多)
支持动态文件目录挂载
支持动态文件目录挂载弹性效率
支持缩容到0,按请求感知调度
浅休眠:5毫秒唤醒;深休眠:3秒内唤醒
支持Commit,时间维度多快照
浅休眠:1秒唤醒;深休眠:>3秒内唤醒
支持Commit,时间维度多快照
60-90秒冷启动,20秒唤醒
百级并发规模瓶颈
支持百万沙箱模板(函数级别)并发运行
Serverless弹性伸缩,支持3.5w+沙箱/分钟
支持十万沙箱模板(Deployment级别)并发运行
秒级Pod启动,15000沙箱/分钟
支持5个沙箱模板(自定义镜像级别)并发运行
会话上线默认10个,最大200个;集成能力
与AgentScope、ADK、Langchain、CrewAI等主流快速集成
SDK、MCP等方式集成
无原生SDK,依赖容器生态集成
SDK、MCP等方式集成计费模式
毫秒级计费,支持缩容到0
秒级计费,不支持缩容到0
付费门槛高:权益包基础上叠加资源秒级后付费
Pro&Ultra权益包(管控费):999-1499元/月函数计算AgentRun——Sandbox竞品分析函数计算AgentRun企业级一站式AI
Agent基础设施平台江昱阿里云产品经理2026/1江
昱阿里云产品经理AgentRun产品负责人
,
阿里云Serverless产品专家
,
云计算领域博士(主要研究方向为Serverless架构)畅销书《
Serverless架构》《
Serverless工程实践》《
Serverless架构下的AI应用开发》《
Serverless架构下的前端应用开发》作者;
参编《基于服务器无繁殖架构的工具链技术能力要求》等标准CNCF
Sandbox项目Serverless
Devs发起人;
阿里云
FunctionAI产品负责人个人简介01
破局之前
,
先看清这些"坑"Agent开发痛点分析02函数计算AgentRun基础介绍什么是函数计算AgentRun03函数计算AgentRun特性探索AgentRun的特性是什么?有哪些优势?04
案例场景与最佳实践Function
Q案例/A2A协议/
Devpod/
Model2APICONTENT目录01破局之前
,
先看清这些"坑"Agent开发痛点分析什么是Agent?Agent是基于大语言模型构建的智能体,通过
Prompt理解任务、
自主推理规划调用工具(MCP服务)、利用记忆,完成从简单到复杂的各类任务。Planning/ReasoningAgent执行官MCP服务AI
Agent基础架构PromptTemplate
功能简单
,灵活性低
Prompt直给Smartermodelsusing
more
tools
to
accomplishhighervaluetasksPromptResponse记忆Model
大脑LLMAI观测UniversalAgents
Multi-AgentsPlatform-Level
AgentsSiloed,Single-Purpose
Agents
功能复杂
,
ReAct推理
快速构建
,统一管理AI
Agent平台
AI
Agent之间自行交互LevelOf
IntelligenceInstructions多模态模型Usefu
lness技能池进行中业务高峰期API突然限流封号流量上来就触发限流
,
严重时账号直接被封,用户请求积压
,
业务被迫中断批量生成内容效果全靠抽卡同样prompt生成十次九不同
,
商品图、
营销视频质量飘忽不定
,
必须人工筛选才能用Agent出错不知道哪里要改客服助手回答质量不理想
,
缺少评估工具和测试集
,不知道是prompt问题还是工具调用有bug自建降本却抢不到GPU资源想省API费用自己部署模型
,
结果高峰期算力被占满用户排队
,
临时扩容采购周期长预算也吓人企业知识问答怕数据泄露调用外部API担心敏感数据出域泄露
,
想基于自己知识库搭建专属问答
,但不知道怎么落地实施智能助手经常答错或瞎编客户问答、
文档助手频繁出现幻觉瞎编答案
,
用户投诉率居高不下
,试了各种方法还是没法根治456行业“迷茫”大流行123AI之路开发模式多样难以持续演进开发Agent时的挑战/痛点不同层次的开发者需要无代码
,低代码
,高代码多种开发模式,
同时期望能够持续演涉及知识库、用户数据、业务逻辑等敏感信息
,数据安全和Agent运行是黑盒
,无法评估效果好坏
,不知道如何优化,Agent依赖大模型和外部工具服务
,但这些服务经常不稳定
,缺Agent需要安全隔离的执行环境来运行代码、操作系统、调效果安全稳定构建效果评估和持续优化困难企业数据安全和合规挑战用工具
,但自建成本高、性能差、安全隔离困难执行环境难构建服务稳定性差合规成为企业应用的最大顾虑模型和工具高性能安全乏统一的容错和治理机制运行时进
,挑战高成本不透明部署02函数计算AgentRun基础介绍什么是函数计算AgentRun调用统一治理Model,工具,Agent调用治理AI组件统一管理Model、工具、Agent市场可评估基于可观测数据的多种评估模式可观测全链路跟踪,根因定位,成本洞察灵活组装支持用户多样记忆或知识库数据安全IDC/VPC互通,据不出域什么是函数计算AgentRun是以高代码为核心、
生态开放、
灵活组装的一站式Agentic
AI基础设施平台
,
为企业级Agent提供开发、
调多种开发模式高低代码,一键转换生态开放拥抱主流
AI开发框架与应用运行时与沙箱开箱即用、安全隔离、高性能全栈Serverless极致弹性、按需付费、免运维安全效果稳定构建试、
部署、
运维的全生命周期管理。?Agent
Run运行时部署便捷开发与企业级能力天然加持03函数计算AgentRun特性探索AgentRun的特性是什么?有哪些优势?零运维、极致弹性、按量付费
自动应对从0
到百万级并发的流量
毫秒级冷启动和弹性伸缩
真正的按量付费,不使用不计费
无需管理服务器、容器、K8s彻底解放运维负担
,成本和性能最优平衡数据不出域,灵活集成,平滑演进
兼容主流框架(AgentScope等top5框架)
无代码一键转高代码,支持持续演进
深度集成开源生态(RAGFlow、mem0等)
支持一键托管或绑定已有部署(VPC/IDC)
模块化使用,可散件集成到现有系统AgentRun企业级Agent最佳运行底座
高性能多语言,多种类Sandbox
多维度隔离(会话亲和/隔离,请求隔离)
统一模型代理、熔断降级、多模型Fallback
工具市场与MCP标准化治理提供生产级的执行环境和多租户安全保障看得清、管得住、优化快
端到端全链路
Trace,问题秒级定位
细粒度成本归因,每分钱都知道花在
哪
实时性能监控、智能异常诊断
多维度统计分析,持续优化依据Serverless基础设施开源开放数据/框架无锁定企业级
Runtime与安全隔离全链路可观测函数计算AgentRun的四大优势用户掌握技术选择主动权
,避免供应商锁定Agent
不再是黑盒
,每个环节都清晰可控高性能、高安全、开箱即用流量不可预测易受注入攻击从传统架构到
AI
原生架构
智能体Agent
从
Serverless
架构到
AI
原生架构安全隔离弹性优势1:Serverless基础设施零运维、极致弹性、按量付费;彻底解放运维负担,成本和性能最优平衡VM/容器运行时AI时代需求
Serverless运行时状态持久化内置状态持久化集成工作流
,支持快照/会话管理,
自带3AZ容灾
事件驱动通过云产品事件驱动自动执行
,架构原子化解耦
,协作更容易API驱动依赖网关/MQ实现同步和异步调用或
,微服务架构复杂度高免运维安全隔离的多语言运行环境
,自带监控日志告警等配套设施动态弹性按请求弹性
,毫秒/秒级供给资源
,支持低峰缩0弹性降本运维负担沉重依赖专业运维团队配置集群、环境,
自建监控日志代价高状态管理复杂依赖
Redis/DB管理
,故障恢复复杂
,跨节点迁移不可行静态资源分配预留固定资源
,利用率低
,无弹性或分钟级弹性多租户数据敏感优势2:
企业级
Runtime与安全隔离高性能、高安全、开箱即用,提供生产级的执行环境和多租户安全保障5倍
规格粒度最小规格:
FC0.05C128MB,虚机
1C512MB,容器
0.25C512MBQwen,
DeepSeek,etc.高密部署,
主动调度第四代神龙架构ComfyUI,
SD,etc.安全隔离,自动容灾沙箱容器
2.00不使用不计费按请求调度,
毫/秒计费
,低峰自动缩0虚机包月浪费多,容器为集群持续付费FC
无需为
3AZ
容灾额外付费,虚机/容器则需额外付费Serverless平台底座50+内置环境Python/Node/Java/PHP/Go/.NET等
50+
内置运行时环境,
支持自定义运行时和自定义镜像,便于灵活定制GPU
函数产品集成,
事件驱动云产品
Serverless
化异构算力
Serverless
AI运行时
生态集成 GPU算力(
Tesla,Ada,
Hopper,etc.)冷启动速度:
FC
毫秒~秒级虚机数分钟
容器
30+秒~数分钟事件函数Web函数任务函数100倍启动效率AI应用
开箱即用内置多语言运行环境快速交付,
极致弹性资源池化
2.0低代码编排、
高代码编码MCP
&
Sandbox函数类型自定义镜像自定义运行时Python3.6
~3.11Java
8
~21PHP/Go/.NET/…Node.js
17
~22 CPU算力(x86)AI
工具模型服务图像生成智能体Agent XPU算力异构算力开箱即用AgentSandbox运行时隔离细粒度资源内置多语言执行引擎GPU算力解耦&
1/N切分Serverless
运行时Serverless
平台底座GPU算力(
Tesla,Ada,
Hopper,etc.)Agent与Sandbox运行时高性能、高安全、开箱即用,提供生产级的执行环境和多租户安全保障Agent&
Sandbox
Runtime轻量化的函数管理&Session亲和与安全隔离内置多语言执行引擎提供开箱即用的沙箱服务Serverless弹性效率请求感知调度
,无请求时自动休眠
,有请求时毫秒唤醒毫秒级CPU实例&秒级GPU
实例极速伸缩Serverless
降本提效缩容到0
&休眠时更低单价GPU/CPU/MEM算力解耦&
1/NGPU卡灵活切分产品集成
,
事件驱动云产品Serverless
化安全隔离
,
自动容灾沙箱容器2.0快速交付
,
极致弹性资源池化2.0高密部署
,
主动调度第四代神龙架构LlamaIndex函数
&会话规模百万级冷启动加速毫秒级平均TCO60%AgentScopeCode
SandboxComputerSandboxBrowserSandboxLangChainAIO
Sandbox CPU算力(x86)异构算力 XPU算力轻量化函数毫秒级弹性会话亲和存储隔离•开箱即用
,
DevPod二次开发
,
弹性交付GPU
,低峰缩0•
内置vLLM/SGLang/Ollama/LMDeploy推理框架•最快30s将开源模型转化为生产级OpenAI兼容API模型请求治理单模|多模型负载代理Fallback
机制并发控制
响应缓存
超时控制模型部署可选择开源主流模型直接部署大语言模型2万+热门模型一键托管到云上环境Serverless
模型运行时API
直连可选择主流模型厂商DeepSeek支持30
+模型服务提供商直连模型服务提供商插件管理•统一管理认证凭证
,
防止关键信息泄露•实时更新模型
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 山东英才学院《化工原理D》2024-2025学年第二学期期末试卷
- 2026湖南长沙天心区仰天湖桂花坪小学语文教师、实习教师招聘考试参考题库及答案解析
- 2026年甘肃天水武山县职业中等专业学校招聘考试参考题库及答案解析
- 2026浙江宁波市医疗中心李惠利医院招聘编外(劳务派遣)护理人员10人考试参考题库及答案解析
- 2026广西百色市田阳区南山实验小学就业见习生招聘1人笔试备考题库及答案解析
- 2026安徽省庐江县人民医院招聘劳务派遣人员10人笔试备考试题及答案解析
- 安徽省阜阳市界首市2024-2025学年下学期七年级数学期末试卷(含部分答案)
- 2026贵州贵阳市云岩区巫峰幼儿园招聘带班老师3人考试参考试题及答案解析
- 会计局内部监督制度
- 医院内部闭环管理制度
- 钢结构防火涂料应用技术规程TCECS 24-2020
- 北京市五年(2021-2025)高考地理真题分类汇编:专题06 自然环境的整体性与差异性(解析版)
- 循环水加药培训课件
- GB/T 17456.1-2025球墨铸铁管、管件和附件外表面锌基涂层第1部分:带终饰层的金属锌及锌合金涂层
- 容积与容积单位课件
- 70岁以上驾驶员换证三力测试题库(附答案)
- 2026水电站全生命周期碳排放量化方法及评价标准
- 标准离职证明模板及注意事项
- 渠县石佛滩水电站环评报告
- 抽水蓄能项目施工安全管理手册
- 2026届山东省菏泽市曹县中考物理最后一模试卷含解析
评论
0/150
提交评论