版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
AI原生应用开发最佳实践从企业级生产痛点到解决方案探索2026/01/13AICoding:需求、产品设计、开发、测试全流程演进AIOps:运维关注度高,期望能辅助资源管理、快速定位系统问题(Infraor业务)并给住自愈方案,甚至自动化自愈内部工具:BI助手、内外小密、会议助手…汽车出行:智驾训练、座舱推理(ASR、TTS、知识库)、市场营销(AIGC)、汽车设计(AIGC)具身智能:大脑、小脑训练,部分云端推理(LLM、TTS等AI玩具(类具身智能ASR+LLM+TTS+MCP)互娱游戏:搜索推荐、情感陪聊、AIGC-生图/视频/音乐、视频剪辑、智能客服(Chat、语音)、AI网剧教育:虚拟老师、作业批改、答题辅助、AI编程互联网-工具:基模公司-通用Agent、机器人外呼零售:智能选品、市场营销、AIGC-商品图合成/模特换装/辅助设计、智能客服泛企业:丰富的垂类Agent,如智能眼镜、智能音响、合同审核、商标查询、建筑报告…医疗健康、生物医药、法律咨询、物流…CONTENTAI原生、Agent驱动了解现状,直面行业挑战,诞生AI原生应用架构和《AI原生应用白皮书》为AI而进化的基础设施AI网关、AI原生应用开发框架、上下文工程、AI工具、AI应用运行时、AI可观测、AI评估、AI安全案例场景与最佳实践大规模生成使用的AI案例几分钟就能生成高质量内容?几分钟就能生成高质量内容? 在AI领域已经积累什么经验? 得最麻烦的是什么?AI原生应用白皮书背景行业报告•据MarketsandMarkets预测,全球AIAgent市场规模将从2024年的51亿美元增至2030年的471亿美元,年复合增长率达44.8%;Gartner预计,到2028年,至少15%的日常工作决策将通过AIAgent自主完成。•《国务院关于深入实施“人工智能+”行动的意见》到2030年,智能体等应用普及率超90%。改变世界机器人(改变世界机器人(PhysicalAI)具身智能/自进化/脑机接口接管数字世界APP(AgenticAl)私域数据/Tools/场景模型性能突破大数据/大模型/多模态/空间智能行业趋势AIAgent趋势AI云原生应用架构定义AI原生应用架构ToolsAgentAIAI原生应用架构模式单Agent高代码/零代码单任务多Agent高代码/零代码Workflow低代码/高代码AIAgent的核心组件躯体,既运行环境(AgentRuntime)作用:结合AgentFramework,使AIAgent主程运行起来原则:运行环境需要隔离、弹性作用:识别自然语言,然后进行推理并做出决策。原则:选择最合适的大语言模型。(不同的大语言模型有自己擅长的领域和业务场景)记忆:让Agent记得目标、偏好,以及过往的知识库:存的是「知识片段」,能回答具体问题,但不是一个完整的操作流程指令,既系统提示词(SystemPrompt或上下文工程(ContextEngineering)系统提示词:定义Agent的目标和行为,为获得最佳推理结果而编写和组织LLM指令的方法上下文:在LLM推理过程中,动态规划和维护最优的输入token集合各类工具及能力(MCPServer、Skills、沙箱Sandbox、观测、评估评测)Skill是「操作手册」,告诉当前Agent遇到问题该按什么步骤来。Agent还是自己干活,只是有了指导。就像给新人一份SOP,他还是自己操作,但知道该怎么做了沙箱SandBox:提供安全隔离、自动弹性伸缩的、独立的扩展环境,如Code、效果评估和持续优化困难高性能安全模型和工具企业数据安全和合规挑战开发模式多样效果评估和持续优化困难高性能安全模型和工具企业数据安全和合规挑战执行环境难构建服务稳定性差难以持续演进执行环境难构建服务稳定性差模式,同时期望能够持续演运行时稳定稳定实现快维护成本高模块化负载均衡服务管理高密度部署按量使用极致弹性??流量网关流量网关ESB微服务网关云原生网关AI网关应用发展与基础设施升级的双向驱动存量应用引入智能体应用让业务系统更智能AI应用架构落地难点Web单体应用CodeAgent存量应用引入智能体应用让业务系统更智能AI应用架构落地难点Web单体应用CodeAgent发、部署与市场验证微服务应用ChatAgent异步任务事件驱动应用多智能体编排异步任务事件驱动应用多智能体编排AI基础设施APIGatewayALBAPIGatewayALB云原生流量流量应用运行时容器与存量应用打通复用已有业务能力容器Agent云原生可观测Actions云原生可观测ActionsToolsToolsAI时代开发者关注业务创新而非基础设施静态资源分配静态资源分配无弹性或分钟级弹性状态管理复杂状态管理复杂从传统架构到AI原生架构从从传统架构到AI原生架构从Serverless架构到AI原生架构API驱动事件驱动事件驱动依赖网关/MQ实现同步和异步调运维负担沉重运维负担沉重免运维VM/容器运行时AI时代需求Serverless运行时AI全栈统一监控AI应用统一入口基于Prometheus构建AI全栈监控大盘,包括模型性能分析、Token成本分析、GPU资源异动分析等云工作流AIStudio通义千问DeepSeek模型调用OpenAIGeminiPAI/百炼/FCGPU节点A节点CSAE/ACK/托管Dify端到端链路追踪(代理Agent)基于OpenTelemetryTrace实现用户终端、网关、模型应用、模型服务、外部依赖工具等全链路追踪。 AI全栈统一监控AI应用统一入口基于Prometheus构建AI全栈监控大盘,包括模型性能分析、Token成本分析、GPU资源异动分析等云工作流AIStudio通义千问DeepSeek模型调用OpenAIGeminiPAI/百炼/FCGPU节点A节点CSAE/ACK/托管Dify端到端链路追踪(代理Agent)基于OpenTelemetryTrace实现用户终端、网关、模型应用、模型服务、外部依赖工具等全链路追踪。 一键转化存量业务MCP化存量业务Agent异步……日志存储与评估分析函数计算FC(CPU+GPU)Agent构建统一日志分析平台,对模型调用日志进行二次评估分析,实现质量、安全、意图提取等语义检测。工具调用运行时构建部署AIAgentFunction节点BWorkflow构建部署AIAgentFunction节点BWorkflowAgent运行时Agent运行时为AI而进化的基础设施从AI原生应用架构到Agent构建平台AgentRunAgentFrameworkAI应用运行时AI工具上下文工程AI观测AI评估AI安全(应用、模型、数据、身份、基础设施安全)企业大模型市场企业MCP工具市场企业大模型市场企业MCP工具市场企业Agent市场后端服务鉴权LLMs后端服务鉴权数据脱敏消费者鉴权数据脱敏消费者鉴权AIAI安全防护API-KEY管理WAF集成API-KEY管理WAF集成ComfyUITTS通义千问deepseek……OpenAI……Tools动态组装Tools智能路由MCPTools动态组装Tools智能路由MCPServer动态发现AgentDiscoveryA2A百炼/Dify协议转换多模型流量分发智能路由智能负载均衡模型fallbackLangChain等开源框架第三方MCPServer市场通用功能通用功能AI安全护栏会话保持消费者认证/鉴权自定义策略与插件……AIAI观测协议增强适配协议增强适配HTTP/WebSocketComfyUI/TTSWebRTC(Q4)————流量防护弱管控与数据链路耦合无任何防护措施,很容易被穿透AI应用设计与智能体的执行耦合,高并发无法保证稳定性,QPS不到5033数据源存储格式单一推理服务需要大量计算资源,资源分配不均会导致性能瓶颈。55缺乏多租隔离能力44版本升级困难Dify社区更新频繁,每次版本升级都简单易用终端用户——浏览器/APP/小程序简单易用高可用高可用持指定三持指定三AZ成本经济成本经济持续迭代Serverless应用平台(SAE)持续迭代数据库调用业务接口调用Serverless应用平台数据库调用业务接口调用Serverless应用平台AgentScope——阿里云官方开源Agent开发框架AgentScope官方文档:https://doc.agentscope.io/zh_CN/index.htmlAgentScope是阿里云官方的Agent框架AgentScope-PythonAgentScope-JavaSpringAIAlibaba合入AgentScope•后续Java语言的Agent开发框架以AgentScope为主•AgentScope-Java版本已追评Python版本的能力。国内依然有50-60%的Java开发者或Java系企业AgentScope-Java性能优化,启动速度提升60%AgentRun是以高代码为核心,开放生态、灵活组装的一站式A无需管理服务器、容器、GPU卡Agent无代码一键转高代码,支持持续演进AgentRun企业级Agent最佳运行底座细粒度成本归因,每分钱都知道花在哪用户掌握技术选择主动权,避免供应商锁定模型Serverless模型运行时2万+热门模型一键托管到云上环境模型Serverless模型运行时2万+热门模型一键托管到云上环境内置vLLM/SGLang/Ollama/LMDeploy推理框架最快30s将开源模型转化为生产级OpenAI兼容API工具Serverless工具运行时业界首个全生命周期MCP服务市场零改造将开源STDIOMCP升级为SSE/StreamableHTTP智能体智能体助力Qwen助力Qwen3-Coder成为领先的的代码模型会话亲和/隔离架构,满足Agent/Sandbox上下文保持需求零运维、毫秒级弹性、按量付费的企业级安全沙箱,兼容E2BServerless智能体运行时Serverless智能体运行时Serverless运行时已经成为阿里云AI原生应用的核心载体函数计算AgentRun——Serverless智能体AgentAgentAgentScopeLlamaIndexLangChainSandboxCodeSandboxCodeSandboxComputerSandboxBrowserSandboxAIOSandboxServerlessServerless运行时高密部署,主动调度第四代神龙架构安全隔离,高密部署,主动调度第四代神龙架构安全隔离,自动容灾沙箱容器2.0产品集成,事件驱动云产品Serverless化快速交付,极致弹性快速交付,极致弹性ServerlessServerless平台底座GPUGPU算力(Tesla,Ada,Hopper,Agent&SandboxRuntime擎冷启动加速Serverless弹性效率平均TCOServerless降本提效传统共享存储问题(虚机/容器)传统共享存储问题(虚机/容器)生成的代码具有不可预知性,访问共享存储会有安全问题。引入会话粒度度存储粘性,将会话和一个持久化的、归属特定租户的存储子目录进行强绑定,在Sandbox运行的时候动态把目录挂载到实例。平台基于POSIX标准多租存储安全实践框架,落地层次化纵深防御体系Sandboxx-custom-affinity-header:实例-1会话-1x-custom-affinity-header:S会话-2OSSOSSx-custom-affinity-header:S会话-3AgentRun浏览器沙箱——舆情分析AgentRunCode沙箱——AICoding通用型Agent——智谱Z.AIAgent函数计算模型服务——AI模型转化为Serve开源模型一键部署,AI模型一键Serverless化,云端模型开发部署零门槛语音计算机视觉计算科学多模态语音计算机视觉计算科学多模态模型服务享受PaaS自由度的同时获得SaaS便捷性模型服务享受PaaS自由度的同时获得SaaS便捷性,按调用量付费,模型部署成本降低90%免运维/低运维百万级实例规模*与ComfyUI百万级实例规模*与ComfyUI/SD100+热门模型在线体验200+模型一键部署与Agent服务一键集成DevpodDevpod模型在线开发/构建按量付费CPU+GPU集群函数计算-函数计算-ServerlessGPU*毫秒级弹性和百万规模集群紧针对部分模型的测试结果,并不代表全部模型都可以具备随着AI浪潮的发展,吉利汽车在今年推出新一代AI智能化服务,成为核心竞争基于阿里云函数计算的ServerlessGPU算力集群为AI座舱的交互和娱乐功能提供大模型推理服务,共同打造大规模、高可用、高性能的推理引擎。场景涵盖意图解析、文生图、情感TTS等。尤其在语音交互方面,吉利自研超拟人TTS,采用大量微调和训练,打造吉利汽车专属的逼真、富有情感、自然生动又稳定一致的语音交互体验。高性价比的GPU弹性算力;支持一键将Co义乌小商品城“世界义乌”APP——AI玩具&电商换背景AI工具——MCP/Skills灵活集成、平滑演进;用户掌握技术选择主动权,避免供应商锁定统一工具接口•支持MCP和FunctionCall双协议•API统管工具调用,开发复杂度降低80%,集成时间从天缩短到分钟智能工具生成与发现•AI驱动的工具推荐引擎,根据Agent任务自动匹配•开放式工具市场,支持自定义工具发布和分享,构建Age知识库存储参数形式记忆对话记录存储知识库存储参数形式记忆对话记录存储Python3.6~3.11Node.js17~22Java8~21KnowledgeSessionMemory记忆存储记忆提取SummaryAgentRunPython3.6~3.11Node.js17~22Java8~21KnowledgeSessionMemory记忆存储记忆提取SummaryAgentRunMemorTextTextJsonVectorGraph全文索引向量索引Json索引标量索引存储AgentRunAgentRun一键部署一键绑定一键部署一个典型的AI原生应用架构及可观测诉求用户业务层客户端Web小程序模型服务层托管模型服务用户业务层客户端Web小程序模型服务层托管模型服务通义千问DeepSeekOpenAI…….自建模型服务AI网关AI网关LLM应用LLM应用LLM链路上下文链路上下文链路上下文链路上下文链路上下文链路上下文链路上下文链路上下文LLM应用开发平台/编排集成框架(Dify/Langchain/Llamalndex)API管理AIAPI管理AIProxyToken限流流量防护KubernetesSAE实例AndroidWAF防护WAF防护服务发现通义千问DeepSeekLlama3…….Cache/RAGCache/RAG推理加速框架(SGLang/VLLM等)向量数据库缓存对象存储Tools…….Tools…….AI全栈统一监控模型调用端到端链路追踪应用、模型服务、外部依赖工具等全链路追模型日志存储与评估分析基于Trace或日志中记录的大模型应用输入输出内容,通过LLM/Code/人工等方式对智能体进行在线和离线评估,持续提升Agent效果和Agent链路模型日志Agent链路模型日志评估器评估器Trace数据和模型调用日志对Agent离线评估AgentAgent可观测数据集Agent数据飞轮——持续提升Agent使用效果•低代码白屏化脚手架•高代码无框架绑定开发•版本的无损平滑升级•支持ServerlessGPU算力•支持微调后的模型进行私域一键部署•无侵入式的全链路采点•一键开启,默认集成•除基础监控外,提供全链路的tracing•基于反馈的高质量数据集,对模型进行微调•支持主流的强化学习框架运行•预集成微调生态的插件•全链路的数据标注•反馈数据收集•基于数据测试集的回放基于AI原生应用架构打造——AI驱动的全新应用平台AI驱动的下一代应用平台WebAppWebAppAgentAPI(南北向流量管理/策略管控)AgentAPI(南北向流量管理/策略管控)Agent基于原子能力构建方案基于AgentRun基于原子能力构建方案基于AgentRun构建方案模型市场工具市场/API/数据源模型市场AI原生应用架构落地实践——从原子能力演进到Agent构建平台构建构建AI原生应用架构构建构建原子能力构建一站式构建AI原生应用架构展望——AGI通向ASI让AI扩展自己和组织边界?Agent台构建难,性能差毫秒级冷启动,百万级并发提供Agent,模型,沙箱运行时(Sandbox支持自定义镜像)基于函数计算构建开源自建维护成本高,性能差(单核<5QPS)支持Mobile/Computer/BrowserUse等沙箱GUI绑定,秒级启动延迟1000活跃会话,会话隔离2vCPU/8GB资源限制门槛高,成本高稳定性差多模型接入(支持私有化)Serverless模型托管服务模型治理(负载均衡、安全、多级Fallback)通义千问系列模型平台锁定多模型接入缺乏模型治理与模型安全能力不提供模型服务模型Fallback机制25TPS限制,仅限AWS生态模型参差不齐,性能差工具市场(海量工具,一键部署)一键转MCP(Agent、Sandbox、API等)MCP扩展(Hook、语义分析、智能路由)开发框架集成(ADK,AgentScope,Langchain,CrewAI等主流Top框架)提供工具市场不支持异步调用,无Hook机制Langchain,CrewAI等高代码框架难以直接调用插件系统,支持扩展Agent可作为MCP被集成每个工具需单独适配,无统一标准支持MCP协议工具生态有限,无框架集成MCP不支Hook、智能路由等功能AWS工具库工具需符合AWS标准,灵活性差黑盒执行,难以评估在线调试,全链路可观测Token级成本归因在线调试,全链路可观测Token级成本归因无端到端可观测能力与成本分析只提供工具基础运行监控无端到端可观测能力与成本分析CloudWatch全套能力私域,安全合规请求、实例、会话等多层级强隔离支持模型、知识库,Memory私有化部署数据不出域,支持VPC/IDC网络打通基础安全措施,合规认证数据必须上云,不支持IDC打通支持私有化部署需自建安全隔离能力,缺乏企业级特性只提供沙箱隔离企业级安全与审计锁定AWS生态,国内合规挑战?AgentRun理构建难,性能差毫秒级冷启动,百万级并发提供Agent,模型,沙箱运行时(Sandbox支持自定义镜像)基础版性能限制严重响应时间:1.1秒¹)支持高并发处理,适合规模化部署³Serverless架构,按需秒级扩缩容5基于IntelTDX机密计算环境‘门槛高,成本高稳定性差多模型接入(支持私有化)Serverless模型托管服务模型治理(负载均衡、安全、多级Fallback)海外版本多模型支持:豆包、Deepseek等7通过统一接口适配主流模型8国内版仅提供豆包系列模型模型生态高度绑定:主要对接豆包大模(生态锁定)缺乏多云模型支持企业级模型管理与火山方舟深度集成(生态锁定)参差不齐,性能差工具市场(海量工具,一键部署)一键转MCP(Agent、Sandbox、API等)MCP扩展(Hook、语义分析、智能路由)开发框架集成(ADK,AgentScope,Langchain,CrewAI等主流Top框架)开源版工具生态严重不足:开源版仅十几个个插内置MCP客户端能力¹³基于MCP协议标准化集成¹4支持CRM/ERP系统API连接缺少开放的工具/插件市场(仅内置60+插件,其余需要用户自行添加)长短记忆管理¹5多框架兼容扩展(侵入性)黑盒执行,难以评估在线调试,全链路可观测Token级成本归因工作流可视化调试,类Figma拖拽界面¹‘模型性能和并发指标监控¹7智能体多维度评测¹8缺乏Token级细粒度分析在线调试AgentDevOps全流程管理¹9全链路应用观测¹5私域,安全合规请求、实例、会话等多层级强隔离支持模型、知识库,Memory私有化部署数据不出域,支持VPC/IDC网络打通部署模式严重分离:开源版:可私有化但缺企业特性²²支持私有化集成²³IntelTDX机密计算‘代码全链路加密²4不支持数据不出域能力生态锁定(尤其模型、框架生态)开发模式转换能力不足(无代码-低代码向高代码转换)Infra性能(启动、并发等)与Sandbox安全(多级隔离生态锁定(尤其模型、框架生态)开发模式转换能力不足(无代码-低代码向高代码转换)Infra性能(启动、并发等)与Sandbox安全(多级隔离数据不出域AgentRunSandboxACS沙箱能力AgentBay沙箱类型AllinOne、RL、Sim、Code、BrowseBrowser、Computer、Mob镜像能力文件挂载弹性效率规模瓶颈集成能力与AgentScope、ADK、Lan计费模式):企业级一站式AIAgent基础设施平台江昱阿里云产品经理2026/1个人简介阿里云产品经理AgentRun产品负责人,阿里云Serverless产品专家,云计算领域博士(主要研究方向为Serverless架构)畅销书《Serverless架构》《Serverless工程实践》《Serverless架构下的AI应用开发》《Serverless架构下的前端应用开发》作者;参编《基于服务器无繁殖架构的工具链技术能力要求》等标准CNCFSandbox项目ServerlessDevs发起人;阿里云FunctionAI产品负责人CONTENT01破局之前CONTENTAgent开发痛点分析02函数计算AgentRun基础介绍什么是函数计算AgentRun03函数计算AgentRun特性探索AgentRun的特性是什么?有哪些优势?04案例场景与最佳实践FunctionQ案例/A2A协议/Devpod/Model2API01破局之前,先看清这些"坑"Agent开发痛点分析什么是Agent?Agent是基于大语言模型构建的智能体,通过Prompt理解任务、自主推理规划调用工具(MCP服务)、利用记忆,完成从简单到复杂的各类任务。AIAgent平台AIAIAgent平台AIAgent之间自行交互UniversalUniversalAgents多模态模型多模态模型快速构建,统一管理AgentPlatform-LevelAgents功能简单功能简单,灵活性低Prompt直给SmartermodelsusingmoretoolstoaccomplishhighervaluetasksSingle-PurposeAgentsAI观测AI观测业务高峰期API业务高峰期API突然限流封号流量上来就触发限流,严重时账号直接被封,用户请求积压,业务被迫中断自建降本却抢不到GPU资源想省API费用自己部署模型,结果高峰期算力被占满用户排队,临时扩容采购周期长预算也吓人批量生成内容效果全靠抽卡同样prompt生成十次九不同,商品图、营销视频质量飘忽不定,必须人工筛选才能用Agent出错不知道哪里要改客服助手回答质量不理想,缺少评估工具和测试集,不知道是prompt问题还是工具调用有bug企业知识问答怕数据泄露调用外部API担心敏感数据出域泄露,想基于自己知识库搭建专属问答,但不知道怎么落地实施智能助手经常答错或瞎编客户问答、文档助手频繁出现幻觉瞎编答案,用户投诉率居高不下,试了各种方法还是没法根治开发Agent时的挑战/痛点高性能安全模型和工具效果评估和持续优化困难企业数据安全和合规挑战开发模式多样高性能安全模型和工具效果评估和持续优化困难企业数据安全和合规挑战执行环境难构建服务稳定性差难以持续演进执行环境难构建服务稳定性差运行时稳定稳定02函数计算AgentRun基础介绍什么是函数计算AgentRun?AgentRun什么是函数计算AgentRun是以高代码为核心、生态开放、灵活组装的一站式AgenticAI基础设施平台,为企业级Agent提供开发、调试、部署、运维的全生命周期管理。多种开发模式多种开发模式生态开放生态开放运行时与沙箱运行时与沙箱调用统一治理调用统一治理AIAI组件统一管理察灵活组装灵活组装数据安全数据安全运行时稳定运行时稳定便捷开发与企业级能力天然加持03函数计算AgentRun特性探索AgentRun的特性是什么?有哪些优势?函数计算AgentRun的四大优势AgentRun企业级Agent最佳运行底座细粒度成本归因,每分钱都知道花在哪优势1:Serverless基础设施零运维、极致弹性、按量付费;彻底解放运维负担,成本和性能最优平衡静态资源分配动态弹性状态持久化静态资源分配动态弹性状态持久化 事件驱动状态管理复杂API驱动依赖网关/MQ实现同步和异步免运维运维负担沉重从传统架构到AI原生架构智能体Agent从Serverless架构到AI原生架构VM/容器运行时AI时代需求Serverless运行时优势2:企业级Runtime与安全隔离高性能、高安全、开箱即用,提供生产级的执行环境和多租户安全保障异构算力ServerlessAI运行时生态集成模型服务智能体Agent模型服务智能体AgentComfyUI,SD,etc.低代码编排、高代码编码MCPComfyUI,SD,etc.低代码编排、高代码编码MCP&SandboxPHP/Go/.NET/…PHP/Go/.NET/…Java8~21任务函数事件函数Web函数任务函数事件函数Web函数高密部署,主动调度第四代神龙架构安全隔离,自动容灾沙箱容器高密部署,主动调度第四代神龙架构安全隔离,自动容灾沙箱容器2.0快速交付,极致弹性资源池化2.0产品集成,事件驱动云产品Serverless化CPU算力(x86)GPU算力(Tesla,Ada,CPU算力(x86)GPU算力(Tesla,Ada,Hopper,XPU算力Python/Node/Java/PHP/Go/.NET等50+内置运行时环境,支持自定义运行时和自定义镜像,便于灵活定制0不使用不计费按请求调度,毫/秒计费,低峰自动缩0规格粒度最小规格:FC0.05C128MB,Agent与Sandbox运行时高性能、高安全、开箱即用,提供生产级的执行环境和多租户安全保障AgentAgentAgentScopeSandboxSandboxComputerSandboxBrowserSandboxAIOSandboxServerlessServerless运行时高密部署,主动调度高密部署,主动调度第四代神龙架构快速交付,极致弹性沙箱容器2.0产品集成产品集成,事件驱动云产品Serverless化ServerlessServerless平台底座CPU算力(x86)XPU算力函数&会话规模Agent&SandboxRuntime轻量化的函数管理&Session亲和与安全隔离内置冷启动加速Serverless弹性效率平均TCOServerless降本提效模型运行时高性能、高安全、开箱即用,提供生产级的执行环境和多租户安全保障•实时更新模型服务提供商连接插件,加载最新功能••实时更新模型服务提供商连接插件,加载最新功能•统一管理Token,以最低成本应对业务需求•内置vLLM/SGLang/Ollama/LMDeploy推理框架•最快30s将开源模型转化为生产级OpenAI兼容API模型请求治理单模单模|多模型负载代理Fallback机制并发控制响应缓存超时控制API直连API直连可选择主流模型厂商可选择开源主流模型直接部署可选择主流模型厂商模型服务提供商插件管理优势3:开源开放、无框架锁定–支持主流Agent开发框架灵活集成、平滑演进;用户掌握技术选择主动权,避免供应商锁定AgentScopeAgentRun快速构建高可用AgentRun快速构建高可用,低时延,零运维的AIA开发者工具(开源+拥抱开源)一键托管,绑定VPC/IDC资源,企业数据AgentRun服务(拥抱开源)/serverless-devs上下文工程插拔式支持企业知识库,记忆系统知识库存储参数形式记忆对话记录存储知识库存储参数形式记忆对话记录存储PHP/Go/.NET/…Node.js17~22JKnowledgeSessionMemory记忆存储记忆提取SummaryPHP/Go/.NET/…Node.js17~22JKnowledgeSessionMemory记忆存储记忆提取SummaryAgentRunMemorMemory全文索引引标量索引TextJson全文索引引标量索引TextJsonVectorGraphJson索引AgentRunAgentRun一键部署一键绑定一键部署灵活集成、平滑演进;用户掌握技术选择主动权,避免供应商锁定统一工具接口•支持MCP和FunctionCall双协议•API统管工具调用,开发复杂度降低80%,集成时间从天缩短到分钟智能工具生成与发现•AI驱动的工具推荐引擎,根据Agent任务自动匹配•开放式工具市场,支持自定义工具发布和分享,构建Age优势4:可观测与评估-全链路可观测看得清、管得住、优化快;Agent不再是黑盒,每个环节都清晰可控AI应用统一入口AI全栈统一监控构建部署AIAI应用统一入口AI全栈统一监控构建部署AIAgent流程式流程式基于Prometheus构建AI全栈监控大通义千问盘,包括模型性能分析、Token成本分云原生API网关通义千问盘,包括模型性能分析、Token成本分云原生API网关WorkflowFunction云工作流AIStudio云工作流AIStudioAIAI网关SAE/ACK/托管基于SAE/ACK/托管终端、Agent异步Agent异步SDK……SDK……一键转化Agent运行时Agent运行时AI网关存量业务志进行二次评估分析AI网关存量业务GPU)AIAI应用观测:OpenTelemetry可观测标准协议应用评估基于Trace或日志中记录的大模型应用输入输出内容借助LLM能力对智能体进行在线和离线评估解决幻觉,安全,回归等问题,持续提高Agent效果和质量在线评估Agent链路Agent链路评估器在线在线模型日志模型日志离线评估评分AgentAgent可观测数据集可观测数据集案例场景与最佳实践业务人员无需编程,通过可视化界面选择模型、描述需求、配置工具,即可快速创建Agent并上线验证想法,大幅缩短从想法到落地的周期。一键转换高代码演进当业务需求变复杂时,可一键将无代码Agent转换为结构清晰的高质量Python代码,保留所有配置,实现从原型到生产的零成本平滑演进,无需推倒重来。深度定制与企业级能力转换为高代码后,可实现个性化策略、智能成本优化、复杂业务流程等深度定制,并深度集成平台提供的模型代理、熔断机制、异步调用等企业级基础设施能力。功能案例:上下文工程能力扩充拥抱开源,数据不出域在支持以OTS/ADB-PG为基础构建的高性能、高可用知识库基础上,积极业务需求,并可以通过几行代码与常见Agent框架集成。生态能力加持,让集成更简单知识库与记忆能力天然支持MCP能力,可以快速与多平台Agent进行集成;知识库支持跨平台知识检索,让零散的知识可以快速被使用起来。使用模式多样,业务效果更可靠记忆服务不仅仅是短期记忆和长期记忆,更包括全量会话记忆与会话缓存,支持上下文模式和工具模式,不同业务场景可以采用不同的使用模式;函数计算:ServerlessAI最佳运行时半数以上基模厂商选择函数计算作为企业级智能体和沙箱运行时,峰值规模已达数十万核•AgenticCoding:面向开发者的AI全栈开发平台•通过对话生成代码,支持在云端沙箱调试和验证,且支持将项目发布并分享题用户云原生API网关K8s推理服务函数计算FC 打包函数项目分享函数数存储OSSNASOpenWebUIGLM45案例:案例:QwenCoder•AgenticCoding:面向开发者的AI代码助手•将代码编辑器、开发环境和强大的大模型能力深度整合的一站式工作台•通过对话理解和生成代码或注释,并在云端沙箱环境自动调试、验证和部署运维诊断账单问题解惑规划与代码专家通用专家机器人垂类领域专家规划与代码专家通用专家机器人知识库垂类工具集多智能体引擎知识库垂类工具集多智能体引擎私有化部署Deepseek私有化部署Deepseek*即将开源全部技术栈,可快速构建私有化的FunctionQA2A协议演示:稀稀咖啡厅A2A协议演示:稀稀咖啡厅浏览器沙箱:舆情管理助手AICoding案例阿里云云原生技术专家2026/01/27CONTENT0101AIGC在设计领域的渗透曲线02FunArt:从创意到上线的一站式解决方案Serverless助力成本低、高效率、高性能的可控图片视频生成03设计、营销新范式下的案例AIGC技术呈现出前所未有的创新和想象力,提高企业内容生产的效率和质量01AIGC在设计领域的渗透曲线AIGC如何逐渐重塑设计领域下的效率与创造力?AIGC在设计行业的渗透曲线多类技术大融合•多类技术大融合•生成式技术萌芽•OpenAI和Google分别输出自研方案,Midjourney上线技术快速发展•StableDiffusion开源•WebUI上线,普世化插件层出•Lora、Dreambooth,支持灵活•ComfyUI上线,插件灵活组装行业可控、行业充分应用•Controlnet面世,补齐可控生成的版图•ComfyUI一年更新节点3000+•抽卡机制,行业自主可控的训练•工作流程搭建、相关技术逐渐•保ID技术快速迭代,多视角、多动作序列帧一致性问题解决•3D重建与渲染技术逐步突破•环境融合等技术渐趋成熟•3D生成技术效果向实际应用靠拢•可控视频生成技术萌芽到开源生态的繁荣技术萌芽到开源生态的繁荣AIGC席卷了设计领域DESIGNABILITYAIGCSCENARIO-BASEDINDUSTRYAPPLICATIONAIGC设计技术能力AIGC场景化行业应用算法能力编排算法能力编排AIGCAIGC辅助商品设计AIGCAIGC辅助平面设计AIGCAIGC辅助空间设计AIGCAIGC辅助电商设计AIGC产品外观设计AIGC插画绘制AIGC空间外观设计AIGC虚拟模特AIGC包装设计AIGC服装设计AIGC海报生成AIGC建筑效果绘制AIGC环境艺术AIGC场景替换AIGC试衣某头部客户影视行业的AIGC最佳实践02FunArt:让AIGC创意一键直达生产环境Serverless助力成本低、高效率、高性能的可控图片视频生成阿里云提供全流程的可控生成场景策划与测试场景落地底层算力FunArtFunArt是阿里云函数计算团队打造的企业级AIGC平台,专为解决企业AI生图需求而生。平台支持一键托管ComfyUI、StableDiffusionWebUI等主流生图工具,调试完成后即可发布为高性能API,提供从模型管理到工作流编排的全链路企业级服务。业务场景电商场景广告场景业务场景电商场景广告场景教育场景游戏场景辅助设计场景…产品功能文件管理实例登录模型广场Lora训练异步调用弹性APIFunctionAI图像生成平台能力应用开发应用调试应用部署应用监控应用运维文件存储文件存储云基础设施对象存储OSSFunArt,简化从灵感到API调用的每一步开箱即用一键拉起图像生成项目,分钟级完成端到端环境搭建灵活开放支持上传自定义模型、插件、适配个性化需求一键发布项目开发阶段调试通过的流程可直接发布为APIServerless算例与定价按实际使用算力计费模型加载加速FunctionAI底层算例在网络层、容器层、模型层做了优化,模型加载速度提升约30%应用推理加速使用Int4、DeepGPU等加速方案对文生图生图/文生视频提供开箱即用的云端ComfyUI,StaLoRA模型训练企业级ServerlessAPI调用FunArt联合ModelScope推出一站式LoRA模型训练平台。支持租户隔离及私有化部署,完成从数据集打标-模型训练的全流程。通过微调LoRA模型训练,得到一个03设计、营销新范式下的案例AIGC技术呈现出前所未有的创新和想象力,提高企业内容生产的效率和质量杭州亚运会:长卷设计AIGC风格化海报:产品艺术海报AIGC风格化海报:产品艺术海报AIGC风格化海报:视觉海报超级符号|大疆的视觉海报保持符号的稳定可见呈现强化品牌符号AIGC风格化海报:海报重绘AIGC风格化海报:电商头图排版AIGC试衣:平铺图试穿深的意义。框合影。大提升了社交价值。人脸迁移AI网关搭建与落地实践梓洋AI原生产品解决方案架构师2026/01/27CONTENT02AI网关产品核心能力与落地实践03AI网关应用场景及案例一、AI应用落地的核心挑战AI应用落地过程中遇到的核心挑战安全与合规风险lAPI-KEY泄漏风险l敏感数据泄露l生成内容不可控集成复杂度l统一多模型代理l权限管理复杂高可用保障l模型服务中断lRT和成功率波动影响用户体验成本失控二、AI网关产品核心能力与落地实践AI网关产品核心能力AI安全防护模型代理LLMAPI(百炼、OpenAI、豆包等)http转mcp存量HTTP服务API工具代理AI安全防护模型代理LLMAPI(百炼、OpenAI、豆包等)http转mcp存量HTTP服务API工具代理AI网关proxyAgent代理AI观测AI限流AI缓存MCPproxyAgent代理AI观测AI限流AI缓存MCPServeronFCAgentAPIAgentAPIAI安全护栏百炼应用等AI安全护栏百炼应用等Redis/VectorDBAI网关落地实践--解决用户管理失控问题核心问题1:我以什么样的方式将LLM服务暴露给大家呢?如何进行权限管控?解法:OpenAIAPI的协议基本已经是标准协议,目前市场面上大部分LLM都支持OpenAIAPI协议。所以提供遵循OpenAIAPI协议的HTTP接口就可以让企业员工通过各种方式使用LLM服务和能力。通过创建消费者,对模型侧的API-Key进行保护,防止泄露导致的盗刷。核心问题2:企业内部部署DeepSeekR1满血版,公司好几千人,但GPU资源有限,如何限制用户?解法:AI接口一旦暴露出去,基本上不可能只让一小部分人知道,所以需要对访问LLM服务的用户做以限制,只让能访问的人访问,不能访问的人即便知道了接口也无法访321创建消费者可以对应一个团队、一个组织等。321创建消费者可以对应一个团队、一个组织等。消费者授权给消费者分配可以访问哪些LLM服务接口。给消费者分配可以访问哪些LLM服务接口。新增或重置。建议建议建议可以将一个消费者对应到一个团队不同的LLM服务接口权限。请消费者的流程接入企业的审批流分发AI网关落地实践--解决安全合规的问题核心问题:模型托管平台自带好几层内容安全审核机制,但是我们在IDC部署或者在FC部署的,如何能方便的接入内容安全审核服务?解法:AI网关中的AIAPI集成了阿里云的内容安全防护和AI安全护栏服务,可以一键开启。安全防护的规则还是要在内容安全服务侧配置。支持请求内容检测。支持响应内容检测。支持防护等级配置。支持消费者级别拦截。AI网关落地实践—联网搜索降低模型幻觉问题核心问题:公司部署了DeepSeekR1671B的模型,但推理的结果和DS官网推理的结果有差距,似乎不满血?解法:推理的结果和DS官网推理的结果有差距大概率是因为DS官网开启了联网搜索。DeepSeekR1671B的模型推理能力是很强,但训练的数据也是有限的,所以要解决幻觉还需是要在推理前先搜索和处理出比较确切的信息后,再由DSR1推理,所以联网搜索是非常关键的。目前模型托管平台提供的DSR1API和自己部署的DSR1都需要自己实现联网搜索。1支持夸克联网搜索AI网关在AIAPI维度集成了夸克和必应的联网搜索能力2搜索结果自动融合搜索策略有多种配置项。搜索结果自动融合进输入的问题意图识别3问题意图识别3默认使用小模型对用户的问题做意AI网关落地实践--解决同一域名/API访问不同模型的问题核心问题1:公司GPU资源有限,部署了满血版DeepSeekR1,还有其他一些小模型以及使用百炼的模型服务,现在域名都不统一,分发、管理、集成的成本都很高,如何使用同一个域名来访问不同的模型?解法:满血DSR1和其他模型或者闭源LLMAPI服务共存,保持同一个API接口,不同业务通过请求中的模型名称,切换不同的模型。满血DSR1和其他模型或者闭源LLMAPI服务共存,保持同一个API接口,不同业务通过请求中(Header,Cookie等)携带3同一个API请求3不同模型2维护多个模型服务型服务被维护在AI网关。建议在一个AIAPI中可以添加多个模型服务。建议模型名称通过Glob语法进行匹配。优先推荐使用模型名称匹配切换的AI网关落地实践--解决百炼DSR1QPM/Token限制的问题核心问题:我们使用百炼平台上提供的DSR1671B模型的API,但是有15000QPM和1200000TPM的配额限制,不能满足业务需求,但是每次升配很麻烦。解法:不只是百炼,目前所有的模型托管平台都有QPM和TPM的限制,并且有些平台是很难升配这个限制的,所以大多数用户都会选择申请多个帐号(APIKey变相的撑大这个配额限制,但缺点是在业务里管理多个APIKey是一件很麻烦的事。对输入/输出内容做缓存,减少对模型服务的请求次数以及Token消耗,从而提升业务侧的请求性能。32APIKey可实时维护32APIKey可实时维护AIAIAPI维度支持将输入和输出缓存到支持精确匹配支持向量化检索匹配模型服务支持多建议建议在非常垂直类的应用场景下适合开启结果缓存,但建议开向量化检索匹配在非常垂直类建议建议在非常垂直类的应用场景下适合开启结果缓存,但建议开向量化检索匹配在非常垂直类,问题和答案非常固定的应用场景下可以开精确匹配在泛业务场景下开启结果缓存可能会降低推理精度或准确性,需要结合业务判断和考量通过AI网关OpenAPI将添加APIKey的行为集成到客户自己的自动化平AI网关落地实践--解决模型服务高可用的问题核心问题:公司的主力模型是FC上部署的DSR1671B,但GPU资源并不是基于流量峰值储备的,所以当高峰期时,DS服务会请求失败,有什么办法可以保证业务健壮性?解法:有两种做法,并且可以搭配使用:可以构建多个个兜底模型服务,如果要保证模型一致,可以主力使用FC上部署的,兜底使用百炼平台提供的。实现当FC上部署的DS服务请求失败时,Fallback到百炼平台托管的DSR1服务。从而保证业务的连续性和健壮性。通过基于Tokens的限流策略,解决Burst流量,保护后端开启ModelAPI维护多个模型服务开启ModelAPI维护多个模型服务模型服务被维护在AI网关。QPS、并发等维度限流支持多种限流判断条件:AIAPI一键开启Fallback策略。当主LLM服务出现异常后Fallback到指定的其他LLM服务。支持配置多个Fallback模型服务。AI网关落地实践—LLM可观测最佳实践&货币化核心问题:如何统计不同模型的调用情况,如何了解不同消费者对于模型的调用量?如何确认Fallback的情况?解法:AI网关集成可观测能力,能够统计整体调用上的Token消耗、模型消耗、各消费者使用情况、QPS、首包RT等信息,提供全面的可观测指标。AI网关落地实践–0代码转换MCPServer解法:通过AI网关,可以实现0代码将原有的OpenAPI服务转化成MCPServer,无需重新开发解决客户痛点开发一个AI应用或者做现存业务的AI增强,AIAgent是需要和大量现存业务做交互的,MCP虽然统一的协议,但将现存业务重构为MCPServer的成本是非常高的,并且目前支持的开发语言有会让很多企业想拥抱MCP,但又无从下手。解法:通过AI网关,可以实现0代码将原有的OpenAPI服务转化成MCPServer,无需重新开发解决客户痛点开发一个AI应用或者做现存业务的AI增强,AIAgent是需要和大量现存业务做交互的,MCP虽然统一的协议,但将现存业务重构为MCPServer的成本是非常高的,并且目前支持的开发语言有会让很多企业想拥抱MCP,但又无从下手。Serverless应用引擎SAE各种服务来源A领域MCP服务AIAgent通义灵码B领域MCP服务组装服务来源快速实现协议转换C领域MCP服务AI网关通过白屏化操作,将各类服务快速接入AI网关。AI网关可以将多个后端现存服务组装为一个MCP服务。AI网关提供多种方式配置MCPTool描述信息。AI网关提供消费者认证体系,可以对消费者授权可使用的MCP服务。D领域MCP服务CustomAgent负责协议转换,将HTTP转换为MCP多种方式配置MCPTool信息消费者授权MCP服务针对MCP服务配置各类策略/插件…虚拟MCP语义检索后端服务……0代码改动AI网关落地实践–MCPserver的统一代理和鉴权核心问题:建设企业内部的MCPMarketplace,能够将企业自有的工具以MCPserver的形式提供给大模型调用,同时能够将企业管理的外部API(如地图API等)以MCPserver的方式提供给内部AIAgent使用,且能支持对外部工具鉴权的统一收口和二次签发。解法:通过AI网关(withMCP为AIAgent调用工具,提供统一的接入点和管理界面,支持对接各类内外部API和运行时,能够在网关上统一对MCP调用进行观测和治理,从而降低AIAgent使用工具的门槛,提升企业AI应用的安全性和稳定性。包含3种接入形式:ladapt用户API或服务为MCPserversAI网关落地实践–AIagent代理、鉴权、观测核心问题:公司当前已经在使用百炼应用、dify等平台构建AIAgent,不支持二次API-KEY签发和更细力度的限流等策略,也不支持openAI的兼容协议。希望能够统一代理和管理A
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年金湖县招教考试备考题库含答案解析(必刷)
- 2025年旺苍县招教考试备考题库含答案解析(夺冠)
- 2026年伊犁职业技术学院单招职业适应性测试题库带答案解析
- 2024年红安县招教考试备考题库带答案解析(必刷)
- 2025年徐水县招教考试备考题库及答案解析(夺冠)
- 2025年内蒙古警察学院马克思主义基本原理概论期末考试模拟题附答案解析
- 2025年天津传媒学院马克思主义基本原理概论期末考试模拟题含答案解析(夺冠)
- 2025年石家庄农林职业学院马克思主义基本原理概论期末考试模拟题带答案解析(必刷)
- 2025年四川大学马克思主义基本原理概论期末考试模拟题带答案解析
- 2025年广西水利电力职业技术学院单招综合素质考试题库附答案解析
- 2026年中央网信办直属事业单位-国家计算机网络应急技术处理协调中心校园招聘备考题库参考答案详解
- 老友记电影第十季中英文对照剧本翻译台词
- 2025年黑龙江省大庆市检察官逐级遴选笔试题目及答案
- 2025年银行柜员年终工作总结(6篇)
- 电力工程质量保修承诺书(5篇)
- 英语词根词缀词汇教学全攻略
- T-GDDWA 001-2023 系统门窗应用技术规程
- 液压计算(37excel自动计算表格)
- 机房网络架构优化计划
- 网络工程公司信息安全管理办法
- 消毒供应中心风险评估与改进措施
评论
0/150
提交评论