2025QECon全球软件质量效能大会:平台工程2.0:面向AI构建下一代DevOps平台_第1页
2025QECon全球软件质量效能大会:平台工程2.0:面向AI构建下一代DevOps平台_第2页
2025QECon全球软件质量效能大会:平台工程2.0:面向AI构建下一代DevOps平台_第3页
2025QECon全球软件质量效能大会:平台工程2.0:面向AI构建下一代DevOps平台_第4页
2025QECon全球软件质量效能大会:平台工程2.0:面向AI构建下一代DevOps平台_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

谢保龙|Thoughtworks

DevOps/研发效能咨询业务负责人拥有16+年软件工程从业经验,目前主要带领团队聚焦于国内大型客户的敏捷、

DevOps转型工作以及研发效能相关咨询业务。对敏捷项目管理、研发效能度量与提升、

大型企业组织转型等有丰富经验。•2024年被聘为华东师范大学国家级全民数字素养与技能培训基地企业讲师•

中国电子学会《BizDevSecOps标准》框架核心专家成员•信通院《研发运营一体化(DevOps)能力成熟度模型第2部分:敏捷开发管理》标准及评

估指南制定专家•公开演讲:腾讯云TVP《大模型时代的新质生产力》•公开演讲:DevOpsDays《BizDevSecOps行业生态建设和发展趋势》•公开演讲:Qcon《探索软件开发新工序:LLM+赋能研发效能提升》•公开演讲:DevOpsDays《金融企业的DevOps规模化转型》谢保龙Thoughtworks

DevOps/研发效能咨询业务负责人目录CONTENTS02平台为谁而建:

AI将成为"头号客户"03

从"自动化"到"授权"的理念转变04

搭建授权式平台的四大支柱引言:在现有DevOps实践上+AI不是真正的技术升级05

AI友好度成熟度模型:从L1到L501PART

01引言:在现有DevOps实践上+AI不是真正的技术升级马赛克这不叫Code

Review,这只是在用

AI

进行代码扫描!一个由机器主导的闭环,

无法带来代码质量提升,只会让我们离真正的工程卓越越来越远。自动化流水线,通过代码扫描串联流水线,通过代码扫描自动化部署与自动化测试自动化部署到指定环境,并进行全面的自动化测试VibeCoding成为必然趋势,但不应该仅仅在IDE

中发力

。企业亟需一个能够承接并优化这一流程的现代化平台,这个平台需要能够将AI能力与DevOps流程深度融合。AI辅助开发利用AI生成代码,加速应用构建生产环境发布发布至生产环境,实现快速,安全上线企业曾投入巨资构建的传统DevOps平台,在AI时代正迅速成为转型阻

碍。这些平台为人类的点击和线性思维而设计,

无法满足AIAgent对机器可读契约和动态执行空间的需求。仅仅在旧地基上“+AI”是不足以支撑起AI这座全新大厦的。我们必须寻找一条真正的创新之路。真正的出路:从"

自动化"到"授权"的思维革命,从面向人类构建到面向AI构建平台许多企业在已有工具中集成AI实现工作提效(如AI做代码审查、

生成测试用例)企业投入巨资构建的工具平台在AI时代正变成历史包袱这忽略了问题的本质:

Code

Review

、用户故事等实践只是手段,不是目的人类回归战略核心人类团队回归其核心价值创造角色,

专注于“做什么”和“为何做”

的战略创新。智慧转向AI评估人类的智慧转向评估AI行为并应对未知挑战,

成为AI平台的监督者与引导者。AI

自主编排DevOpsAI基于高层业务目标,

自主编排并执行端到端的DevOps活动,

深度参与从模糊概念到价值交付的

全过程。AI高效执行落地AI平台则高效执行

“如何做”

的具体实施

,确保价值交付的高效与精准。AI具备自主驱动能力,

能基于高层业务目标,

自主编排并执行端到端的DevOps活动,

深度参与从模糊概念到价值交付的全过程。如果我们还用过去服务人类开发者的思路去服务AI,

无异于给火箭修登月的梯子

。1234PART

02平台为谁而建:

AI将成为"头号客户"承认并服务好这位新客户,是平台工程迈向2.0的起点。必须把面向AI的交互设计,放到和面向人类同等重要的战略高度。•

机器可读的API契约

(如OpenAPI规范)•

毫秒级响应延迟

高效执行•

结构化的错误信息,便于解析•

无需图形界面的认证流程•

精美的UI,视觉体验优先•

清晰的文档,易于理解•

顺滑的工作流,操作便捷•

平台像个贴心的管家

人类开发者关心什么?

AIAgent关心什么?平台工程与AI的融合,其终极形态并非简单的AIOps(智能化运维),

而是向完全的自主运营(AutonomousOperations)演进。这一跃迁标志着AI从一个被动的分析和建议引擎,转变为一个主动的、构成平台核心控制平面的决策与执行实体。从"自动化"到"授权"的理念转变PART

03平台工程2.0——从"自动化"到"授权"的理念转变核心理念与目标•

开发者体验(DX):

平台工程的核心目标是改善开发者体验,减少他们在日常开发中遇到的各种痛点,例如基础设施配置、环境部署和工具管理等。•自助服务:通过IDP提供标准化的工具、模板和工作流,使开发人员能够自主地完成所需的操作,

无需依赖其他团队。•

降低认知负荷:平台工程通过简化和抽象化底层基础设施的复杂性,将通用功能封装成可重用的组件,让开发人员能够专注于业务逻辑的开发。•

标准化和自动化:构建标准化的开发环境和自动化流程,减少手动操作和人为错误,提高一致性和效率。/zh-cn/platform-engineering/what-is-platform-engineering平台工程标准规范基础设施工具平台平台工程是一门专注于构建和维护内部开发者平台(IDP)

的工程学科,旨在通过标准化、

自动化和自助服务的能力,减少开发人员处理基础设施的复杂性,从而提高其生产力和效率,加速软件交付,并增强企业IT运营的安全性、合规性和可扩展性。核心构成•

践行全局体验观你无法通过改进某一个功能来修复一个糟糕的平台。应将你的平台视为完整的产品,聚焦从反馈闭环到自动化流程的开发者全链路体验。•

将平台工程打造为AI

战略基石平台工程是释放

AI

组织价值的战略前提。更是将

AI

投资转化为真实竞争优势的引擎。•

以平台工程为尺度校准风险偏好卓越的平台工程通过降低失败成本与实现快速回滚,重塑组织与风险的关系。应用AI

对组织效能的积极影响,根本上取决于内部平台的质量水平。当平台质量较低时,

AI

应用对组织效能的促进作用微乎其微;而当平台质量较高时,其提升效应则变得显著而强劲。这一关键发现,值得所有

AI

领域投资者高度重视。平台工程时代的三大战略要务一场彻底的思维革命。在这个新范式下,平台的目标是“授权”AI,使其具备自主驱动能力,能够基于高层业务目标,自主地编排和执行从需求到价值交付的端到端活动。新的工作方式旧的工作方式平台工程2.0不再是为人类开发者设计,而是转向为AI(尤其是AIAgent)构建下一代DevOps平台。它不是简单地在现有工具上增加AI功能(

“+AI”),而是提供一个AI能够完全理解、控制和演化的环境,实现从需求到结果的全自动化。面向人类构建,大量的人工操作界面缺少开放的API,系统生态未必打通需求的提出者、目标的设定者和结果的验收者、内容审核成为应用/系统的构建者、部署者、运维者和演化者。平台工程2.0VSVSVS内容生产、执行者平的核心能力点状能力增强人类角色AI角色

自动化告诉机器一个目标

:"把这台宜家椅子装好"。机器需要自己看懂说明书,规划步骤,发现螺丝拧反了能自己纠正,甚至发现少了零件会主动报告。给机器一本详细的操作手册,上面写着"第一步,拧螺丝A;第二步,拧螺丝B"。机器是老实的执行者,但手册上没写的,它一概不会。在授权模式下,AI不再是被动的工具,

而是能干活、能思考、能解决问题的"智能系统"

授权维度传统自动化平台(平台工程1.0)下一代授权式平台(平台工程2.0)核心理念人设计,机执行。机器遵循预设的、详细

的指令手册。人出题,AI作答,赋予AI目标和规则边界,让其自主规划和执行。关键接口给人

看的开发者门户(IDP)给机器用的API网关工作流静态的、固定的"黄金路径"动态的、基于策略的、可适应的工作流API设计人类可读性优先机器可解析性优先(Agent-First)安全范式防止人犯错的"护栏"限制AI破坏力的"隔离舱"成功指标部署有多快?AI任务成功率有多高?PART

04平台工程2.0核心构成:搭建授权式平台的四大支柱告别"黄金路径",拥抱"动态策略"用动态策略取代静态路径,给AI一张地图和交通规则,而不是固定的导航路线。02API的未来:Agent优先和"工具市场"从"给人看"转向"给机器读",建立内部MCP工具市场。03高级安全:从"护栏"到"隔离舱"采用

"默认不信,强制隔离"的安全范式。04深度可观测性:看穿AI的"心思"记录AI的完整"思考链",理解AI为什么这么做。01实例平台规定:

"上线生产环境前,须通过质量要求"但具体是否需要人工代码评审、

几个人评审,由AI代理根据上下文、历史数据自行决定"动态策略"AI代理是天生的"越野玩家",需要在规则边界内自由探索"黄金路径"曾是平台工程的骄傲,为开发者

铺设标准化的康庄大道平台提供"你应该怎么做"的剧本,同时定义"你可以做什么"和"你绝不能做什么"的动态规则授权式平台要用动态策略取代静态的"黄金路径"•

影响范围:一段代码被引用的越多,修改它的风险越大;•

代码变更热度:变更频率;•

代码风险值:

出问题的个数;•

代码复杂度:越复杂越难修改,出错概率也越高。AI根据计算出的综合风险分值,动态调整评审规则并实现流程自动化

。比如当它检测到对核心逻辑的修改时,可以根据团队风险控制策略,

自动触发规则,并显示:“AI规则触发:已自动为此

CodeReview添加@资深工程师A

和@安全工程师B作为必须评审人

。力AI分析代码的影响范围(被引用的多少)、

变更热度(修改频率)、历史风险值(出过问题的数量)和代码复杂度(如圈复杂度),并将这些要素结合起来。内部"MCP市场"平台团队角色从"所有工具的制造者"转变为"工具生态的运营者"•封装现有工具:把成熟的CI/CD、测试、监控等工具用MCP包装•开放接入:让业务团队也能将他们开发的工具上架,供所有AI使用MCP(模型上下文协议)解决AI代理和工具之间的"集成地狱"•

像一个"万能转换插头",任何符合MCP标准的AI都能使用任何符合MCP标准的工具•避免100个AI代理和1000个工具之间产生10万次方的配对问题Agent优先从"给人看"转向"给机器读"•

机器可读的契约(如OpenAPI规范)是灵魂•

像一份详尽的产品说明书,AI代理拿到手就能明白工具用途和使用方法Gartner预测:到2027年,API的主要消费者将是AI,

而不是人内部MCP市场,

目的是创建一个生态系统。在这个生态系统中,不同的部门

(包括业务部门)既可以作为工具提供者,发布其封装了业务能力或数据访问权限的MCP服务;也可以作为智能体消费者,安全、便捷地发现和调用这些服务来构建智能化应用

。封装现有工具将公司成熟的CI/CD、测试、监控等工具,通过MCP标准化封装,上架至内部市场。开放接入能力让业务团队也能把他们开发的工具、甚至是业务系统上架,供所有AI使用

。最终,

DevOps平台将从一个封闭的工厂,演变为一个生机勃勃的“AI工具应用商店”。平台团队的角色由此升级:从单纯的工具“制造者”转变为繁荣的“工具生态运营者”。传统

Π护栏

Π•

防止人犯错的安全机制•

假设用户意图良好,但可能操作失误•

在AI时代已不够用新型

Π

隔离舱

Π•

核心思想:默认不信,强制隔离•

不指望AI永远正确,

而是确保它就算"发疯",造成的破坏也被限制在最小范围•

"护栏"防止好人犯错,"隔离舱"让"坏人"无法作恶落地

Π遏制

Π范式的两大举措独立的AI服务账户:为每个AIAgent建立专用账户,分离操作日志,确保问题发生时能清晰追溯、快速定位M2M认证与动态令牌:杜绝长期有效的静态密码,通过OAuth2.0等标准提供动态生成、

用完即毁且权限最小化的临时令牌把任务授权给AI,就像是给了实习生一把服务器的钥匙,既

希望他能干活,

又怕他搞破坏监控系统需要能清晰回答谁(什么事件)触发了

AI?它为了达成目标,调用了哪些工具?调用工具时,传入的参数是什么?返回的结果又是什么?最关键的:它当时是怎么"想"的?(把AI的推理过程作为追踪日志的一部分)传统监控的局限•传统监控工具在AI代理面前几乎是"睁眼瞎"•AI的决策路径不是线性的,可能会重试、会分叉•用传统工具调试AI,就像看一部没有字幕的外语电影深度可观测性•

平台必须投资于深度可观测性•

利用OpenTelemetryGenAI等新兴标准•

记录AI代理的完整"思考链"(Chain-of-Thought)在授权模式下,理解AI"为什么"这么做,比知道它"做了什么"更为重要PART

05AI友好度成熟度模型:

从L1到L5评估模型7个维度接口可程序化程度54310配置与管理的自动化水平状态透明性与可观测性生态系统与集成性文档与开发者体验安全性与合规性错误处理与韧性等级1:基础自动化(FoundationalAutomation):开始引入点状的自动化

,例如使用脚本进行构建和部署。1等级0:手工与孤岛(Manual&

Siloed)

:主要依赖人工操作和纸面流程

,缺乏自动化。0等级3:AI协同与端到端打通(AICollaboration&

End-to-EndAutomation):AI不仅仅是辅助

,而是实现了端到端的打通

,实现AI协同的全流程自动化与智能化。等级2:标准化、集成与辅助增强(Standardized,Integrated&AI-Augmented)

:实现了较为完整的CI/CD

流水线自动化

,流程趋向标准化。等级5:AI原生与完全自治(AI-Native&

FullyAutonomous):整个生命周期高度自动化和智能化

,AI能够理解模糊的需求并自主优化流程。5等级4:AI

自主驱动与智能编排

(AI-Driven&

IntelligentOrchestration):AI具备自主驱动能力,能够理解复杂关系并自动编排DevOps活动。32428评估等级说明评估维度L1

级:基础自动化L2

级:标准化、集成

与辅助增强L3

级:AI

协同与端到端自动化L4

级:AI

自主驱动与

智能编排L5

级:AI

完全自治目标状态描述引入点状自动化实现CI/CD

自动化,

AI辅

助AI触发并完成交付流程AI

自主编排DevOps

活动AI全生命周期智能交付接口可程序化程度有

CLI,API

有限有核心

API,缺AI

化API

全面

,支持AI

议API

为AI

设计,可自

发现接口为AI

深度优化配置与管理的自动化

水平CLI

执行部分任务核心配置可API

操作支持“配置即代码”AI

管理策略,优化配

置配置与AI

融合,AI

自主优化状态透明性与可观测

性CLI

输出有限信息API

可访问基本信息系统状态全可查,供

AI

决策深层信息对AI

透明AI

有“上帝视角”,

闭环决策错误处理与韧性CLI

有退出码,难

解析API

返回结构化错误,难恢复错误信息详细,AI

修复AI

设计复杂修复流程工具自愈或助AI

复安全性与合规性AI

共享权限,

无审

计基础认证,日志缺关

联AI

独立认证,考虑合

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论