云治理企业成熟度发展2025年度报告_第1页
云治理企业成熟度发展2025年度报告_第2页
云治理企业成熟度发展2025年度报告_第3页
云治理企业成熟度发展2025年度报告_第4页
云治理企业成熟度发展2025年度报告_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一阿里云O云治理企业成熟度发展2025年度报告埃森哲为本报告提供智库支持今年,我们调研了353家企业客户,覆盖互联网、金融、新零售、交通等多个行业。本篇报理解云治理的概念和企业用云实践的现状以及变迁趋势,并基于云治理框架的五大分类(即稳定性、安全合规、成本效益、高效性能、运营效率),对2024年~2025年两年间调研数据性、安全合规、成本效益、高效性能、运营效CONTENTS01/KEYFINDINGS核心结论CLOUDGOVERNANCECONCEPTANDTRENDINSIGHT云治理概览与发展趋势洞察CLOUDGOVERNANCEJOURNEY开启全面的智能化云治理旅程CUSTOMERCASES客户案例CLOUDGOVERNANCEFUTUREGUIDANCE企业云治理正处于以资源整合与效率提升为核心的策略化阶段,并加速向以智能化驱动与价值化交付为标志的新纪元演进。企业对AI上云的拥抱意愿呈现“全层级共识”特征——96.6%的高成熟度企业、88.5%的低成熟度企业均表达了坚决的拥抱态度。但在落地过程中,数据主权归属、系统稳定性保障、安全合规适配等衍生风险维度,成为企业普遍的顾虑焦点,需构建“技术应用+风险防御”的双轨治理体系。97%97%的高成熟度企业表现出低成熟度企业在容灾治理上存在显著短板,仅有14.3%的低成熟度企业的云资源部署采用了多可用区架构,而高成熟度企业这一比例为51.3%。这一现状反映出低成熟度企业在稳定性体系建设上存在明显滞后。构建多可用区的分布式能力,不仅能够有效应对基础设施层故障,更为AI业务的稳定运行提供了至关重要的架构保障。低成熟度企业需重点推进多可用区架构建设,从“被动应对”转向“主动防御”的全链路容灾治理。14%仅有14%的低成熟度企业的架构。身份安全:仍是全层级企业云安全治理的“最高关注度维度”,高成熟度企业采用STS(SecurityTokenService)方案的比例从17%提升至22%,体现身份治理的精细化趋势。数据安全:低成熟度企业存在严重风险敞口,77.3%的企业数据库允许公网IP直接访问,这类高危配置需通过“最小权限原则+网络隔离策略”快速整改。22%高成熟度企业采用STS方案的比例从17%提升至22%。高成熟度企业的云成本治理呈现“理性化、多维化”特征:随着云治理成熟度提升,企业对“云与AI赋能业务的价值”更易量化、更具笃定感,因此成本控制从“单纯降本”转向“价值导向的理性治理”。这一转变直接反映在预算意愿上——高成熟度企业维持或增加云上预算的比例从47%提升至57%。57%预算的比例从47%提升至57%。基础资源管理:资源标签、资源分组等标准化管理动作的覆盖率大幅提升,成为企业云资源治理的“标配能力”。高成熟度企业的资源标签覆盖率已达82%,资源分组率达到62.8%。而低成熟度企业也从11.6%跃升至55.6%,资源分组率从23.5%提升至53.4%。自动化水平:仍处于较低水位,调研显示,62%的企业在创建云资源时仍把“控制台手工操作”作为首选;即便在高成熟度企业中,这一比例也高达66.8%。需进一步加强laC成熟度建设(基础设施即代码),推动资源治理从“标准化”向“自动化、智能化”跃迁。82%率已达82%。综上,企业云治理需围绕“AI风险平衡、容灾分层建设、安全重点突破、成本价值导向、资源自动化升级”五大维度,构建适配自身成熟度的治理体系,才能在云治理新纪元中实现效率与价值的双重进阶。与发展趋势洞察03/04人工智能技术进入体系化突破新阶段,推动软件工程向智能化演进。大语言模型(LLM)重塑软件开发模Al安全与模型监控正成为企业治理架构中的关注行业的差异化需求涌现,对AI算力、平台、算法模型和行业解决方案的技术治理、标准治理、生态治理提出了更精细的要求。数据依赖度高,高质量数据供给难度大,数据漂移可能导致模型性能退化,考验企业数据全生命周期治理能力。超过5模型迭代复杂,生命周期涵盖训练、验证、部署、监控与回滚,迭代过程对系统稳定性要求高,需构建模型治理闭环机制。34.6%的高成熟度企业期望将Al能力应用于风险监控,定期扫描环境配置漏洞与性能瓶颈,而低成熟度企业也有30.4%。控体系。56.8%的低成熟度企业将成本优化作为首要Al应用方向,30.7%的高成熟度企业担忧成本不可控风险。度企业变更影响预测等深度应用采纳率偏低,仅11.2%。有42.4%优先推进成本优化,同时47.8%关注AI服务自身故障引发的系统稳定性风险。2025年云治理企业成熟度发展报告在智能运维(AIOps)领域,贵公司最优先成本优化风险巡检故障根因诊断智能容量规划变更影响预判智能诊断自动化●57%34.6%30%●17.6%●11.2%30.2%数据主权风险合规与法律风险成本不可控风险数据主权风险合规与法律风险成本不可控风险系统稳定性风险51%36%30.7%23.0%48%22.3%21.0%决策黑盒风险衍生风险名词解释05/0605/06安全从“数据合规”到“可信AI治理”的升维。生成式AI的数据来源复杂(含个人隐私、企业敏感信息、跨域数据流动),这要求企业将安全从“数据全生命周期合规”升级为“可信AI治理体系”。领导者洞察需将“AI可信性”纳入企业战略治理层,建立覆盖“数据安全、模型可解释性、输出可控性”的全链路治理机制,这不仅是合规要求,更是赢得用户信任、规避业务风险的核心竞争力。巫稳定从“系统可用”到“面向AI失效的韧性架构”。大模型训练/推理任务周期长、规模大,单点故障可能引发重大损失。领导者洞察要以“业务连续性”为核心,推动架构具备“面向失败的设计能力”,构建全链路容灾方案与多层级可观测体系,将AI系统的稳定性转化为业务持续创新的基石。从“开发迭代”到“AI全周期闭环运维”。生成式AI迭代速度远超传统软件,企业需从“单一开发效率效率”转向“多模型协同、灰度发布、持续监控的闭环运维效率”。领导者洞察效率的本质是“AI价值交付速度”,需重构运维模式,打造从开发到上线的自动化闭环能力,让技术迭代速度匹配业务创新需求。成本从“资源消耗”到“算力精益治理”。GPU高性能算力需求突出,资源浪费或成本失控风险极高。领导者洞察成本管理需上升为“算力精益治理战略”,通过弹性调度、算力池化、混合精度计算等手段,在“性能体验”与“成本可控”间找到平衡,实现长期投入的ROI最大化。性能从“系统响应”到“端到端AI价值交付”。模型规模扩张倒逼存储I/O、网络带宽、推理延迟等性能极限升级。领导者洞察性能优化的目标是“用户体验与业务价值的双交付”,需布局分布式训练、推理加速引擎、边缘侧优化等技术,让技术性能转化为业务场景的价值增量(如用户留存、交易转化)。综上,对企业领导者而言,生成式AI的五大支柱已不是孤立的技术维度,而是“业务价值-技术治理-风险控制”的战略融合点。需开启全面的智能化调研数据显示,2025年企业云治理优先级呈现显著变化:稳定性与成本效益以27.6%的被关注度并列首位。稳定性优先级的持续被关值得关注的是,安全合规的优先级相对下降至20.0%,但这并非意味着其重要性降低。恰恰相反,随着技术架构的演进和业务模式的与此同时,运营效率(16.6%)和高效性能(8.3%)被关注度虽相对较低,但运营效率的稳步提升反映出企业对自动化工具的重视,稳定性27.6%32.9%22.2%成本效益27.6%30.6%安全合规20.0%39.0%22.2%运营效率8.5%8.3%高效性能8.3%3.7%支柱1:稳定性支柱1:稳定性理,以增强企业系统及应用的稳定性(RTO/RPO),保证业务7*24小时可靠运行为核心目标。企业实践现状容灾的核心在于确保关键业务在遭遇重大故障的关键。然而,调查数据显示,当前企业客户在成熟度较低的企业中,缺乏专用容灾架构的比例从去年的27.5%显著上升至49%;即便在成熟度较高的企业中,这一比例也从4.7%攀升至11.7%。这一趋势反映出,在AI等技术浪49%2025年云治理企业成熟度发展报告贵公司当前核心业务系统的容灾架构能力达到以下哪个层级?同城容灾(热备/双活)异地容灾(冷备/温备)02巡检网络安全(56.1%)与高可用架构(40.5%)是高成熟度企业最为关注的两大稳定性领域,时,监控覆盖度(39.5%)作为发现潜在隐患的窗口,也获得了高度重视。相比之下,低成熟度企业虽同样关注高可用架构(43.2%)与网络安全(41.9%),但其对监控覆盖度(14.1%)的关注比例显著偏低,这反映出其运维模式可能仍处于“重应急、轻预警”的针对核心业务使用的云资源,贵公司日常运维中最关注以下哪些巡检任务?22.3%7.4%26.3%03多可用区部署高成熟度企业在多可用区架构的采纳率从去年的43.2%提升至51.3%,首次突破半数门槛,的多可用区架构采纳率从18.1%下降至14.3%,这一反差凸显出不同成熟度企业在稳定性建56%14%高成熟度群体低成熟度群体04ACK集群监控在云原生环境中,对ACK集群实施全面监控是保障容器化业务连续性与性能稳定的关键技术基石。然而,企业在容器集群监控能力的建设上呈现出显著的“马太效应”。在基础的ACK集群监控覆盖率上,高成熟度企业从去年的70.2%提升至79.4%,体现出其在可观测性基础建设上的持续巩固。然而,低成熟度企业的覆盖率却从56.5%急剧下滑至26.2%,与前者形成巨大落差。79%在基础的ACK集群监控覆盖的70%提升至79%。是否配置云监控高成熟度群体低成熟度群体ACK集群监控覆盖率26.2%56.5%总结而言,企业的稳定性巡检关注点,与其监控能力的实际落地情况相互印证:高成熟度企业不仅关注架构与安全,更将监控作为核心工程实践,构建了闭环的稳定性体系;而低成熟度企业则因对监控的投入不足,使其对高可用与安全的追求面临落地挑战,这在AI驱动的新技术周期中,将进一步放大其运营风险。AI时代的稳定性支柱演进路线EvolutionoftheStabilityPillarsintheAIEra生成式AI工作负载的引入,为稳定性带来了新的变化。数千卡分布式训练的长周期特性和亿级并发推理的智能调度需求要求稳定性架构向更智能、更弹性的方向演进。更智能的弹性调度在调度层面,AI工作负载的动态特征要求弹性调度的动态智能。基于大规模算力调度平台,系统能够根据训练任务和推理服务的实时需求,实现GPU/TPU等异构资源的动态编排与分配。更完善的容错保障在训练保障方面,AI任务的特殊性推动了容错机制的升级。通过分布式训练框架的深度优化,实现节点级故障的智能隔离与任务自动迁移;更深入的可观测能力在可观测性领域,AI业务的复杂性驱动监控体系向全链路延伸。监控范畴从基础资源层扩展到A1业务层,关键指标涵盖从GPU利用率到TTFT(首TOKEN延迟)、TPS(每秒生成TOKEN数)等核心维度。更高的容灾要求在容灾设计上,AI业务的关键性促使容灾体系向智能化发展。建立涵盖基础设施、数据、模型层的分层容灾架构,通过多可用区部署、跨地域备份和模型热备机制,结合智能Fallback和定期演练,形成完整的业务连续性保障体系。2025年云治理企业成熟度发展报告支柱2:安全合规>>>如何利用云技术来保护数据、系统和资产,对于企业来说至关重要。对于不同发展阶段企业现状的洞察发现,随着云计算的应用逐步加深,企业在安全合规上的关注与能力建设同步持续加强。云上安全合规的范围广阔,本次调研分析中,我们集中针对企业实践中最为关注的四大重点领域展开:身份和访问控制、数据安全、基础设施安全、合规审计。企业实践现状EnterpriseCurrentStatus2025年,企业对云上安全的关注焦点呈现出显著的延续性,身份安全(45.9%)继2024年后仍居首位。与此同时,网络安全(45.0%)关注度大幅回升,从去年的第三位跃居第二,这反映出在业务全面云化与外部攻击常态化的背景下,企业对网络边界防护、DDoS攻击防御等基础能力的重视程度被重新拉高。数据安全关注度位于第三(34.3%),在高成熟度企业中关注度高达46.8%,这与其AI时代核心业务数据资产化进程加速、以及满足日益严格的合规要求紧密相关。身份安全网络安全主机安全21.0%24.3%数据安全应用安全26.8%审计与合规45%2025年,企业最关注云上安全风险仍为身份安全,关注度为45.9%。02身份安全身份与访问管理是云上安全体系的基石,在AI工作负载加速部署的背景下,采用STS临时凭据的身份方案的重要性日益凸显——通过自动颁发短期有效的访问令牌,实现权限的精准控制与自动回收,从根本上避免长期凭据泄露风险。然而,企业在推进这一关键实践方面进展相对缓慢。在高成熟度企业中,开始尝试STS临时凭据方案的比例从去年的17.4%提升至22.4%,增长态势温和但绝对比例仍然偏低。而在低成熟度企业中,这一比例仅从0.5%微增至0.7%,绝大多数企业仍停留在传统的AK管理方式。这一现状反映出,尽管STS临时凭据方案能够有效避免硬编码凭证泄露、密钥轮转不及时等传统风险,但在实际落地过程中仍面临认知、技术和流程层面的障碍。特别是在AI应用快速部署的压力下,企业往往倾向于沿用既有的身份管理方式,未能及时升级到更安全的凭证管理体系。高成熟度群体低成熟度群体03网络安全网络安全作为云上安全体系的第一道防线,其核心在于通过精细化的访问控制策略,有效防范未授权访问和网络攻击,企业在基础网络安全实践的落地方面呈现出明显的两极分化趋势。高成熟度企业网络安全落地实践显著优于低成熟度企业。在安全组基础配置方面,高成熟度企业保持了较高水准,其禁止全开放规则(/0)的资源合规率达到85.7%,与去年(84.5%)基本持平。然而,低成熟度群体的合规率从去年的82.7%下降至71.6%。在高危端口管控层面,问题更为突出。高成熟度企业对公网开放高危端口的禁止率达到86.6%,虽较去年略有下降但仍处于较高水平。相比之下,低成熟度企业的合规率仅为38.1%,较去年的46.4%出现显著下滑,这意味着超过六成的低成熟度企业资源仍存在高危端口暴露风险。值得特别关注的是“禁止ECS绑定公网IP”的管理实践。作为今年新增的评估维度,数据显示高成熟度企业的合规率为60.4%,而低成熟度企业仅为9.1%。这一巨大差距反映出企业在网络层最小权限原则落实方面的严重不足。84.5%71.6%84.5%71.6%安全组不允许对公网开放高危端口(22/3389/……)86.6%高成熟度群体46.4%低成熟度群体46.4%在高成熟度企业中,开始尝试STS临时凭据方案的比例从去年的17%提升至22%仅有9%的低成熟度企业ECS高成熟度群体高成熟度群体60.4%低成熟度群体2025年云治理企业成熟度发展报告随着AI应用对训练数据和模型资产依赖度的加深,基础数据安全配置的重要性正愈发凸显。高成熟度企业在数据安全基础能力建设方面持续展现优异,而不同成熟度群体间的安全水位差距依然明显。在数据库基础防护层面,高成熟度企业保持着领先的安全实践水准。其中,数据库实例公网地址的禁止率达到81.3%,较去年提升3.1个百分点;数据库IP白名单设置方面,94.3%的资源严格遵循最小授权原则,体现了头部企业对基础安全配置的重视。相比之下,低成熟度企业的数据安全建设仍面临挑战。数据库公网地址的禁止率仅为22.7%,较去年(33.2%)出现下滑;同时,接近半数的数据库资源仍将IP白名单设置为全网段,暴露出在基础访问控制方面的明显短板。在数据存储安全维度,高成熟度企业同样表现优异。OSS存储桶禁止公共写的合规率高达99.1%,展现出对数据写入权限的严格管控;在禁止公共读方面,78.5%的合规率仍有提升空间。反观低成熟度群体,禁止公共读的合规率仅为37.9%,反映出在存储权限管理方面的认知差距。低成熟度企业的数据库公网地址的禁止率仅为23%。数据库实例禁止配置公网地址(RDS/PolarDB/Redis/MongoDB)高成熟度群体81.3%78.2%低成熟度群体●22.7%33.2%高成熟度群体OSSBucket是否禁止公共读(NEW)高成熟度群体高成熟度群体78.5%低成熟度群体OSSBucket是否禁止公共写(NEW)84.4%高成熟度群体低成熟度群体84.4%AI时代的安全性支柱演进EvolutionofSecurityPillarsintheAlEra在生成式AI架构中,安全面临前所未有的复杂度与纵深挑战。面对模型训练与推理服务带来的全新风险特征,安全支柱正向数据驱动、智能协同的新一代架构演进。从数据采集的合规性验证、存储环节的加密与隔离,到训练过程的数据防污染、推理阶段的内容过滤,再到归档销毁的自动化管理,构建覆盖数据流动全链路的防护体系,确保敏感数据在AI业务中的合规使用。通过虚拟化与沙箱技术实现GPU/TPU等多租户环境下的严格隔离,结合可信镜像扫描与容器运行时防护,建立从硬件到应用层的纵深防御体系。模型来源的多样化要求建立完善的供应链安全管理机制。从预测量模型引入的完整性校验,到模型权重的加密存储与访问控制,再到推理服务的输入过滤与输出审计,形成模型全生命周期的可信保障,有效防范后门植入与恶意篡改风险。生成式Al的独特风险推动ResponsibleAI体系建设。通过数据质量检测与偏差分析确保模型公平性,借助特征重要性分析与结果可视化实现决策可解释,结合内容过滤与滥用防护机制防范技术滥用,构建涵盖公平性、透明度、合规性的综合治理框架。支柱3:成本效益支柱3:成本效益企业实践现状企业在成本治理层面展现出明显的认知分化。高成熟度企业采取均衡策略,57%的企业选相比之下,低成熟度企业表现出更强的成本压缩倾向,36.49%期望缩减50%以上成本,较成熟企业高出近30个百分点。这一差异折射出深层的治理认知偏差——低成熟度企业可能将“云治理”简单等同于“降成本”,未能理解云治理是“成本管理+风险防控+价值交付”的体系化工程,忽视了安全、稳定等基础能力建设,例如:容灾设计的缺失、数据库公网访问的高危配置、自动化运维能力的不足,看似“节省”了短期投入,却埋下了安全57%上预算的意愿从47%提升至2025年云治理企业成熟度发展报告2025年云治理企业成熟度发展报告与上一年度实际云支出相比,贵公司对今年的云成本管理目标更符合以下哪种情况?2025年2025年期望缩减50%以上期望缩减30%以下云上消费计划增长30%以下云上消费计划增长50%以上●高成熟度企业36%20%2024年2024年期望缩减50%以上期望缩减30%以下增长小于30%增长30%~50%增长50%以上02分账76%76%的高成熟度企业达到成本分摊基本清晰。分账能力作为云成本精细治理的核心环节,直接关系到企业的资源优化效果。不同成熟度企业在分账管理上展现出明显差76%76%的高成熟度企业达到成本分摊基本清晰。高成熟度企业持续推进成本分摊的精细化建设。2025年有75.6%的企业实现了大部分或全部成本的清晰分摊。显示出在成本透明化方面的持续进步。62.2%的低成熟度企业实现了大部分或全部成本的清晰分摊,与去年基本持平。所有云资源成本均可清晰明确地归属至具体部门或业务线27.8%44%大部分云资源成本可归属至部门或业务线,仅少量共享资源成本难以分摊48%大部分云资源成本归属不够清晰,难以有效分摊至部门或业务线目前没有进行成本分摊的需求10.2%25.0%所有的云资源账单费用,都能够归属到部门/业务,31.7%32.5%大部分云资源能够拆分到部门/业务,仅少量共享资源,无法拆分46.3%30.0%大部分云资源费用归属比较混乱,无法拆分到部门/业务目前不需要分账,没有这块的诉求30%AI时代的成本效益支柱演进AI算力特性推动GPU资源管理向精细化发展。针对训练阶段的高并发需求与推理阶段的实时性要求,通过混合实例支柱4:高效性能>>》如何高效利用云平台的资源,以更好地满足用户对它的需求,是企业在深入云资源利用之后常见的痛点,尤其是面对海量用户量和高并发场景的行业,如互联网等,对高效性能的关注度显著更高。高效性能,指借助云原生产品和能力,设计和优化应用架构,通过监控、压测等发现性能问题,持续进行性能优化,打造高效性能的业务应用。企业实践现状EnterpriseCurrentStatus性能压测作为保障系统性能的关键环节,高成熟企业落地实践显著优于低成熟度企业。高成熟度企业已建立相对完善的压测体系,87.8%的企业会在不同场景开展性能测试,其中62.4%在核心功能上线前必做压测,46.8%在重大业务活动前进行专项测试。相比之下,低成熟度企业的性能保障能力亟待提升。46%的企业从不进行性能压测,这一比例较去年进一步上升,仅有36.5%的企业在新功能上线前进行测试,反映出预防性质量意识的不足。在以下哪些场景中,您和团队会对核心的业务从不进行性能压测(选择此项时,请勿选择其他选项)核心链路改造或新功能上线前62.4%36.5%定期执行(如季度/年度压测)30.4%重大业务活动前(如双11/618大促)突发流量事件后(如故障恢复/流量激增)●32.7%2024年设计核心新功能时,上线前会进行系统性能压测80.5%52.5%业务大促前(例如双11/618)会进行性能压测,其余不会39.0%定期对业务系统进行性能压测22.5%不进行压测46%仍有高达46%的低成熟度企敞口进一步扩大。2025年云治理企业成熟度发展报告在数据库性能保障方面,高、低成熟度企业展现出巨大差异。高成熟度企业已在数据库性能管理方面建立起完善体系。调研显示,其RDS实例的性能负载达标率达到96.6%,Redis实例更是高达98.9%,几乎实现了全方位的数据库性能稳定保障。这表明头部企业通过系统化的监控预警、容量规划和性能优化机制,构建了坚实可靠的数据库性能底座。相比之下,低成熟度企业的数据库性能状况令人担忧。RDS实例性能负载达标率仅为24.9%,Redis实例更是低至21.2%,意味着超过四分之三的数据库实例面临不同程度的性能风险。这一数据反映出起步阶段企业在数据库性能能力建设上的明显短板,缺乏系统性的性能管理能力。99%99%的高成熟度企业不存在Redis负载风险。而低成熟度仅有21%。RDS实例不存在性能负载过高风险高成熟度群体96.6%低成熟度群体Redis实例不存在CPU或内存超限导致的性能风险高成熟度群体98.9%低成熟度群体21.2%AI时代的高效性能支柱演进EvolutionofHigh-PerformancePillarsintheAIEra生成式AI工作负载对性能提出了前所未有的要求。大模型训练与推理在算力效率、数据处理及服务响应等方面都面临全新挑战,推动性能优化从单点突破向全链路协同的体系化建设演进。AI业务的数据密集型特征推动存储架构向高性能方向演进。通过高并行文件系统与对象存储的有机结合,构建支持海量数据并发读写的存储底座。分布式训练的规模扩展需求驱动训练框架持续进化。借助分布式Profiling工具进行全链路性能分析,精准识别并消除训练过程中的性能瓶颈。在线推理的实时性要求推动服务架构向极致性能发展。通过模型量化、剪枝等轻量化技术压缩模型规模,结合动态批处理与流批混合架构提升吞吐能力。异构算力的高效利用需求催生新一代调度体系。通过统一编排平台实现GPU、NPU等多元算力的智能分配,基于任务优先级与SLA要求进行动态调度。支柱5:运营效率支柱5:运营效率运营效率包括企业运营组织搭建,以及企业的自动化高效部署管理,使团队能够将更多时间和精力用在构建让业务受益的新功能上,减少用于维护和处理突发事件的资源,帮助开发人员始终如一地实现高质量的结果,推动持续集成和持续交付,构建适合企业自身的云运营流程和模型。企业实践现状EnterpriseCurrentStatus云资源开通方式体现企业自动化运营成熟度。整体来看,企业的自动化运营建设仍处于初级阶段,但企业自动化转型意愿显著。调研显示,控制台操作仍是当前资源开通的主流。2025年,66.8%的高成熟度企业和55.4%的低成熟度企业将控制台作为首选,这表明无论企业处于哪个发展阶段,手动操作模式仍然占据主导地位,自动化实践整体上仍处于探索阶段。低成熟度企业正在积极探索、快速拥抱自动化。其控制台使用率(55.4%)较去年(72.5%)出现显著下降,同时自定义脚本和API调用的采纳率呈现上升趋势。这一变化表明,低成熟度企业正在积极尝试从纯手工操作向基础自动化过渡,试图通过技术手段提升运营效率。62%62%的企业在创建云资源时,2025年2025年云服务控制台67%自定义脚本/编程调用(使用云API或SDK)企业云管理平台(内部或第三方工具)9.3%其他IaC工具2025年云治理企业成熟度发展报告控制台64.6%72.5%脚本调云API●9.8%●10.0%企业云管●7.5%●14.6%其他laC工具SDK)1.2%2.5%其他0%资源标签与分组管理作为云上精细运营的基础能力,不同成熟度企业间的差距正在基础管理层面快速收窄。高成熟度企业的资源标签覆盖率已达81.9%,较去年提升22个百分点;资源分组率达到62.8%,提升12.3个百分点,展现出成熟的标准化管理能力。值得关注的是,低成熟度企业实现跨越式进步,资源标签覆盖率从11.6%跃升至55.6%,资源分组率从23.5%提升至53.4%,增幅分别达到44和30个百分点。这一爆发式增长标志着基础资源管理正从先进实践加速普及为行业标配。然而,在多账号管理的复杂治理领域,差距依然显著。高成熟度企业的采用率达50.3%;而低成熟度企业仅为8.1%,虽较去年有所提升,但仍处于起步阶段。这一对比体现出当前云资源管理的基本格局:基础管理能力快速普及,而复杂治理架构的建设仍需要持续投入和积累。82%率已达82%。81.9%高成熟度群体低成熟度群体59.9%55.6%资源分组率的对比情况高成熟度群体50.5%低成熟度群体53.4%23.5%21/22高成熟度群体低成熟度群体50.3%42.4%AI时代的运营效率支柱演进EvolutionofOperationalEfficiencyPillarsintheAlEra生成式AI应用的快速迭代特性正推动运营效率体系实现根本性变革。面对从数据准备、模型训练到推理上线的全链路复杂度,传统运营模式已难以满足AI业务对敏捷性的要求,运营效率建设正从工具化支撑向平台化、自动化、智能化方向演进。AI业务的连续性要求推动运维范围向全生命周期扩展。通过自动化工具链实现从数据采集、标注清洗到模型训练、部署上线的闭环管理,建立涵盖数据版本、实验追踪、模型注册的统一管控体系,显著提升AI业务的迭代速度和交付质量。AI工程的复杂性催生DevOps与MLOps一体化新范式。通过统一平台整合代码开发、数据管理与模型运维流程,打破算法团队与运维团队之间的协作壁垒,实现跨角色的高效协同。AI系统的规模化运营推动治理方式向自动化演进。通过策略引擎实现资源配置的自动优化与异常行为的实时修正,结合预置合规模板与审计追踪机制,在保障合规要求的同时降低人工干预成本,提升整体运营效率。23/24企业概况全球知名日用消费品生产及销售商,中国区是企业最大的子公司,2019年中国区业务中台及数据中台开始迁移上云。目前,客户全量业务均已经稳定运行在云上,客户逐渐进入了用云深水区,为此专门成立了云基础资源管理团队对云企业云治理痛点企业没有规划化的账号体系,账号管理混乱身份与权限与密钥安全风险(明文AccessKey混用)且轮转不足;各账号分别接入企业IdP做SS0,入口业务稳定性压力信息分散与运维效率低2025年云治理企业成熟度发展报告25/26A5如闲置AK、人和程序混用AK、AK明文硬编码等多种不符合最要访问云上服务的场景,因此采用了TVM(TokenVendingMachine以钉钉机器人为统一入口,使用百炼智能体与OpenAPIMCP通过系统化的安全治理和临时凭证方案改造,从根本上消除AK

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论