2025QECon全球软件质量效能大会:从辅助工具到研发队友-Coding Agent的演进与实践_第1页
2025QECon全球软件质量效能大会:从辅助工具到研发队友-Coding Agent的演进与实践_第2页
2025QECon全球软件质量效能大会:从辅助工具到研发队友-Coding Agent的演进与实践_第3页
2025QECon全球软件质量效能大会:从辅助工具到研发队友-Coding Agent的演进与实践_第4页
2025QECon全球软件质量效能大会:从辅助工具到研发队友-Coding Agent的演进与实践_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

从辅助工具到研发队友:CodingAgent的演进与实践王一男|华为智能化DevOps产品专家担任华为云智能化DevOps产品专家。拥有北京航空航天大学软件工程专业本科及硕士学位

,具备多年软件工程与管理实践经验

,专注于通过方法与工具的结合提升组织研发效能。王一男华为目录CONTENTS

01

Agent技术驱动的软件研发演进趋势02

全流程智能辅助开发实现端到端提效03

多Agent协同开发驱动企业研效跃迁AI增强开发是软件开发工具最大趋势AI增强开发已经进入Gartner2024年五大战略技术趋势中,成为软件工程工具领域最大趋势AI4SE涌现大量初创公司AI4SE各研发阶段涌现出大量创新公司,对传统工具能力进行升级,布局新一代的智能化研发能

AI4SE逐渐走向成熟和应用在Gartner平台工程技术成熟度曲线中,AI增强开发成为当前领域内关注的“最高点”,即将逐

渐走向成熟和应用 AI增强开发是软件工具关键趋势,AI4SE即将进入规模应用阶段•到

2026年,生成式AI

将显着改变新应用生产70%的设计和开发工作•到2027

年,使用人工智能来增强研发SDLC每个阶段的平台工程团队的数量将从

5%增加到40%•到2028

年,

75%

的企业软件工程师将使用人工智能编码助手,这一比例2023

年初仅10%AI自主编程典

型代

表25年24年23年

Devin(24.03)

Claude

Code

(25.02)

Bolt.new(24.10)Copilot(2023年)Cursor(24.09)

MGX(25.02) Lovable(24.11)Windsurf(24.11)NoCode(25.06)未来软件开发将是“人+AI代理”协作模式:●开发者提供需求、设计目标、技术约束●AI代理负责拆解任务、生成代码、跑通测试●人类开发者审核关键逻辑,控制方向和最终质量Gartner:到2026年,

Gartner预测超过80%的企业将使用生成式AI的API、模型或部署AI应用;到2027年,

15%的AI应用将由人工智

能自动生成。80%5%2023

2026100%80%60%40%20%0%15%0%AI自动生成应用比例20%15%10%5%0%2023

2027特点••••代码补全注释

代码生成

代码解释/翻译IDE插件•自然语言需求/问题代

码•

项目级,跨文件生成•

Agent、AINative

IDE•自然语言需求软件实例•自主开发、自主验证、自主修复、沙箱部署•

Web对话、零代码、

Multi-Agent AI辅助编程→AI结对编程→AI自主编程向深水区探索下一代软件生产方式业界大厂和AI新秀都在积极探索,新应用发布节奏加快企业AI应用部署比例CodeX(25.05)AI辅助编程AI结对编程•

SequoiaCapital:AI未来将达到万亿规模市场(TheTrillion-DollarOpportunity),应用层将是价值高地,智能体

(Agents)和智能体经济(Agent

Economy)必定会成为全球经济活动最核心的构成。•

AI独立研究机构

METR:Agent能够完成的任务长度正以指数级增长,大约每7个月翻一倍。2022年ChatGPT刚发布时能够实现的coding任务差不多等同于人类耗时30s的任务;2025年Agent

已经能够自主完成人类一小时coding

任务;预计2029年能够完成

1个工作月的任务。 AgentScalingLaw:Agent使能软件工程变革已成为行业共识和趋势Source:SequoiaCapital,METRSingleAgentCognition:单智能体上下文一致、架构简单、可靠性高MultipleAgentsAnthropic:多智能体可并行化、突破上下文窗口限制、适合开放式复杂任务

开发者启示•多Agent->单Agent:所有Agent共享同一上下文(长对话)、Agent之间存在大量依赖关系的任务(编程)

,则需要合并为一个Agent。•单Agent->多Agent:当可拆解为多个并行任务,或单Agent难以执行复杂指令、经常选择错误工具时,则需要进一步细分引入多Agent。•生产落地实践:优先挖掘单Agent

能力,做好上下文管理;开放式复杂任务逐步引入多Agent,重点设计各Agent分工、优化提示词、并行工具调用、错误恢复机制、token管理等。Source:Anthropic,Cognition

更强的SingleAgent,还是更多的MultipleAgents?目录CONTENTS

01

Agent技术驱动的软件研发演进趋势02

全流程智能辅助开发实现端到端提效03

多Agent协同开发驱动企业研效跃迁软件开发生产线IDE

Online

IDE

ForC/C++TestPlanPerfTestAPIMock

ATGenIDE

ForPythonIDE

ForJavaPipelineDeployReleaseArtifactAPITestRepoDefectCheckSBOMBuild读代码业务经理

需求&监督知识沉淀引擎

Agent开发

Agent工作流长短期记忆盘古大模型

模型扩展

DeepSeek编码智能助手

DevOps全流程AI助手

智体化DevOps平台工具扩展工具链集成项目经理开发Agent发布Agent测试Agent安全合规API从单点到整体增强倍级效率提升+调代码从人主导输出到Agent主导输出智能化产品底座Prompt工程架

计Req

Board测代码写代码…….

软件研发工具:从编码助手到智体化DevOps平台,逐步解锁AI驱动的应用开发能力核心能力代码生成、研发知识问答、单元测试、代码解释、代码注释、代码调试、代码翻译和代码检查基于盘古代码大模型代码生成研发知识问答代码检查代码注释单元测试用例生成代码翻译代码调试代码解释AI编码助手,8大特性,助力开发效率提升•

软件开发全流程智能助手全流程助手包含智能问答、需求管理、代码托管、代码检

查、测试管理、

C

ICD、知识库和Agent

管理等功能,覆

盖开发、测试、部署全流程,实现研发效率提升30%

以上。•多模协同,用最合适的模型解决问题支持自定义接入“deep

seek

”等多种业界SOTA

模型,用户可在业务操作中灵活切换,

用最适合的模型高效解决

研发问题。•本地企业知识库提供全面的知识库管理功能,支持卡片和列表两种视图模式,可新建知识库,

并通过上传本地文档、代码文件等多种方式添加知识资产,支持入库配置和文件管理。•可视化智能中枢支持智能化数据看板,提供总用户数、活跃用户数、点赞点踩次数、智能问答请求数等指标的按日、周、月的统计数据和报表。多模型协同(和其他开源模型)全流程AI助手统一智能助手:规划-设计-开发-测试-发布-运维全流程研发知识问答、检索及轻量交互操作能多模型协同

RAG

强代码托管•

释•

视•

MR总结自动生成CI/CD持续交付•

任务问题智能定位•

流水线配置智能辅助(ToBe)测试管理•

测试点智能生成•

例生成代码检查•

智能问题检查•

智能修复建议提示词工程Agent

管理Gen

AI

安全工具管理 DevOps全流程AI助手,端到端提效30%Rep

o

Ch

eck

BuildI

D

E

O

n

l

i

n

e

I

D

E

F

o

r

C

/C++

P

i

p

e

l

i

n

e盘古助手I

D

E

For

Java

S

BO

M产品管理

系统设计

开发

构建

测试

开源漏洞

发布

/

部署需求管理•

需求智能分解•需求润色•

需求智能检索T

e

stPl

anP

er

f

T

e

stAPI

T

e

stD

epl

oyAr

ti

f

a

c

tR

ele

a

s

eSCA开源中心仓D

efe

ctAPI

Mock研发生产线Modeli

ngAPI智化引擎IDE

F

or

Pyth

on场景化能力Re

qIn

sp

e

c

t

orG

ove

r

na

nceB

oardAP

P

SecAT

G

e

n•

高效提供经典算法思路常规人工耗费3天

;AI协助端到端2小时完成•

领域业务逻辑实现输出源码,开发人员梳理思路时间缩短xx%•

Scala代码自动翻译为Java代码实现存量x万行Scala源码xx%自动翻译,解决维护难问题。

AI协助翻写可用率90%•

非常规问题定位,一杆进洞纯人工:定位2天毫无进展和定位思路大模型:

引导分段分析分钟级完成定界盘古研发大模型+SFT+RAGSFT(

supervised

fine-tuning,监督微调)RAG(

Retrieval

Augmented

Generation,检索增强生成)代码辅助生成降低无脑工作量辅助替代人工编码编码经验/技能不足辅助替代人工写用例测试脚本生成足

业务强依赖算法:代码复杂设计难度高耗时长,依赖大数据处理性能算法。•

非主流语言维护困难:非主流语言代码量大,

耗费开发人员大量维护精力•

复杂问题定位困难:

版本发布迭代节奏快,长时间的问题定位严重影响版本发布节奏。华为xx开发部。拥有xxx人开发团队规模,

xxx代码仓共xxxx万行代码;每年发布xxx个版本,版本节奏紧凑,发布时间要求严格;业务主要为网络优化进行大数

据分析。华为xx开发部嵌入式应用开发(代码生成/解释/翻译)

客户痛点

解决方案

业务价

RawCode研发大模型PRE研发大模

L1SFT研发大模型L2V1无法使用跨文件接口和结构体可以使用结构体,无法使用外部接口可以使用结构体和外部接口,异常截断,对空行敏感SFTV2SFTV1SFTV3SFT

V3.1非指令跨文件信息:结构体指令跨文件信息:结构体、宏定义、

API接口指令复杂跨文件:结构体、宏定义、

API接口开发编码测试验证聚焦6大开发场景+3大测试场景提升研发效率研发大模型L2V3研发大模型L2V3.1研发大模型L2V2团队介绍安全函数识别纠错开发技术知识问答单元测试用例生成产品领域API推荐测试经验/技能不研发大模型研发大模型研发大模型原生代码仓数据(数据质量较差)测试设计分析代码智能检视测试用例生成1.2.1.2.1.2.1.2.3.有严重复读情况SFTSFT非指令无跨文件13版本迭代语法完整性SFTAICopilot模型微调

提示词工程检索增强AIAgent规划反思

长短记忆

工具调用CodeMate

TestMate编码智能助手测试智能助手研发大模型(多场景模型+多尺寸模型,

1300万经典技术文档+760亿行精选代码)识别7大价值场景

,覆盖70%研发作业流

,端到端提升30%研发效率DevMate:研发端到端智能助手(问答/公共调度)5w+采纳测试用例数量62%+测试代码接纳率4100w+采纳代码行879w+知识问答次数14w+研发人员使用编码(开发)

①②③17%测试设计(测试)

⑤19%40%+代码接纳率DesignMate设计智能助手ReqMate需求智能助手检查&合入④11%CodeArts智能版需求(开发)10%其他活动⑦14%问题发现⑥7%问题定位⑥7%执行构建+分析7% 华为AI4SE实践:AI赋能研发全流程智能化,聚焦7大价值场景,端到端提效30%能力外溢智能助手原子能力≥目录CONTENTS

01

Agent技术驱动的软件研发演进趋势02

全流程智能辅助开发实现端到端提效03

多Agent协同开发驱动企业研效跃迁上下文感知智能调

多Agent协同平台

合规性度中枢

保障产品管理开发构建测试发布/部署智能体基座知识沉淀引擎

思维链视图

长短期记忆

工具链集成盘古大模型

DeepSeek…

….ReqBoardRepo

IDE

Online

IDE

For

IDE

For

IDE

ForCheckBuildPipelineSBOMDefectTestPlanPerfTestDeploy

Artifact

ReleaseC/C++JavaPython构建工程师Agent构建问题修复效率提升60%产品经理Agent需求分析准确率提升50%开发工程师Agent代码开发效率提升31%Committer

Agent基础编码问题拦截75%运维工程师Agent问题修复效率提升45%测试工程师Agent测试效率提升35%软件开发生产线APITest

APIMock

ATGen 智体化DevOps,让每个开发者都拥有一个开发助手应对挑战•

开源框架无法满足产品和工程要求•自研多企业级智能体服务架构•

对接AI安全风控平台保障安全合规•

Agent怎样“智能”描述不清?•

需要的“知识”长什么样?•

怎样测试验证?•

指令分类;举实际例子•

使用知识库工具

,举实际例子•

按照指令分类

,分场景验证 构建多Agent协同DevOps平台的挑战与应对挑战应对•

开源的多智能体框架?•

性能稳定性扩展性?•

安全性?产品架构•加强智能体端到端评测用例集构建及效果落地工程工具能力探索•通过自动化提升性能稳定性测试能力•

对接AI安全风控平台保障安全合规•

智能体场景怎样测试?•

多智能体系统性能稳定性怎样测试?•

产品安全合规怎样测试?•

按智能化场景重新组织团队•

每个Agent都配备模型专家角色•

模型专家为效果兜底 构建多Agent协同DevOps平台的挑战与应对挑战

应对•

组织阵型不支持Agent开发•

缺少模型专家角色•

谁来保证质量?挑战应对测试开发CodeArts研发生产线产品管理系统设计

开发

构建测试开源漏洞发布/部署GovernanceSCAAPI

IDE

OnlineIDE

For

C/C++Pipeline盘古助手

IDE

For

Java

SBOMIDE

For

Python需求

开发

构建

测试时间占比15%时间占比30%时间占比15%时间占比30%时间占比10%需求开发构建测试发布/部署 更快:从研发工具到研发队友,赋能研发各角色产品经理开发工程师代码评审构建工程师测试工程师运维工程师AgentAgentAgentAgentAgentAgent研发队友Softwareas

Co-worker软件研发效率提升40.8%研发工具Softwareas

Tool工程师Agents50%需求分析效率提升35%用例生成效率提升60%问题修复效率提升l31%编码效率提升45%运维效率提升更快Inspector

开源中心仓ModelingAPIMockDeployTestPlanAPPSecPerfTestReleaseAPITestATGenArtifactRepoDefectCheckBoardReqBuild代码采纳率测试行覆盖率77%+代码纠错准确率65%+50%+CodeArtsDoer遇到编译、测试、检查问题

,尝试不同解法解法1

失败

解法2

失败解法N成功对每个代码文件修改修进行PDCA循环

,确保修改正确规划

执行长期研究华为IPD流程

反思

观察产品Agent解决方案开发服务产品开发产品&平台开发技术开发多角色按流程验证

,确保任务按要求完成创

理洞

理需

理产品验收代码检查测试验证开发验证发布验证开发

Agent测试

AgentCharte开r

发项目Agent生命

期路标开发组合管理开发计划概念 更准:企业研发知识自动沉淀学习,让智能助手更懂项目自主学习1.2亿代码仓/980PB战备资料/470亿行实战代码打造基础模型CodeArts

Doer动机性遗忘算法记忆宫殿-ArchRAG经验复盘分层规划拆解用户需求,确保研发目标精准落地知识沉淀IDE插件代码生成代码续写更稳代码重构错误检查需求管理规范•

需求智能总结•

需求描述润色需求分析•••

部署脚本生成•

部署错误定位部署监控•

故障预测全流程无断点端到端安全合规上线前业务逻辑问题拦截率提升30%计划需求阶段

开发阶段

运维阶段编码代码生成单元测试自动生成代码注释生成代码自动修复制品安全

软件供应链安全

数据安全

软件包安全

运行运维安全•需求设计设计文档生成设计优化编译构建•

工程自动生成•

错误智能诊断CodeArts

Doer•

自动生成合并请求•

自动生成检视意见•

自动修复检视意见•

事件单关联反馈•

测试脚本生成•

测试用例生成•

测试日志分析•

设计生成代码

••需求设计规范

代码安全软件包防篡改规范检查企业级构建封闭规范流水线管理规范运行态漏洞检查软件包管理规范软件包部署规范代码编程规范代码入库门禁规范流水线运行规范部署环境合规检查源代码管理规范需求设计规范任务自动分解分配Story设计任务分解代码合入发布测试•• 更稳:依托

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论