2025QECon全球软件质量效能大会:上下文工程引领TEAM AI研发协作模式变革探索实践_第1页
2025QECon全球软件质量效能大会:上下文工程引领TEAM AI研发协作模式变革探索实践_第2页
2025QECon全球软件质量效能大会:上下文工程引领TEAM AI研发协作模式变革探索实践_第3页
2025QECon全球软件质量效能大会:上下文工程引领TEAM AI研发协作模式变革探索实践_第4页
2025QECon全球软件质量效能大会:上下文工程引领TEAM AI研发协作模式变革探索实践_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

秦思|北京兴云数科技术有限公司IT架构规划姓名秦思北京兴云数科技术有限公司

IT架构规划•10+年大型企业供应链产品规划•

资深IT架构规划•

企业AI需求教练

,产品团队人员能力提升EPG•

负责牵头企业AI知识工程建设、

评测集建设目录CONTENTS04

效果评价及总结03

实践与实施01

问题锚定02

破局之道PART01问题锚定:局部效率提升VS整体效率瓶颈

基于Cursor的系统核心模块重构实现重点发现当系统中某个环节效率大幅提升时

,如果其他环节未能同步提升

,整个系统的整体效率提升会受到最薄弱环节的制约

,这正是我们在AI工具应用中遇到的核心挑战。

组织演进策略:

未来已来加速向AI组织转型未来已来

,AI时代多种组织形态可能共存

,我们可能看到组织的去中心化

,角色被重新定义

,组织的边界更加模糊

自上而下或自下而上地形成更加动态开放的生态系统。未来

,敏捷特性团队演进为2-3人+AI构成的AI特性团队(人机组队)已经形成业界共识

,工具迅速演进到业界最牛水平

,最终演化成数字员工

,是组织演进的基础。BCG观点洞察:对组织而言

,部分任务或智能线条会实现完全自动化和硅基化

,但组织的整体结构仍将由人类和AI共同构成

,需要协作共赢。原因有三:特定任务AI难以超越人类

,人机协作的增强可能更有效;战略目标组织架构等顶层设计仍需要人类在系统中定义;组织需要人类对AI伦理道德等进行监管。•角色演进

:从工具到第二大脑•流程重构

:从串行到并行协作•能力模型转变

:从补短板到强化长板•组织形态演变

:从科层架构到液态小组•风险与边界

:避免AI成为失控的同事低代码现有流程AI应用基本趋势论断:1)三种流程将是长期存在的

,2030年前

,聚焦在现有流程优化

,不会出现大的变革2)企业大部分应用属于大型应用(约70%)

,主体研发流程仍然会和现有流程保持一致3)基于AI的原生应用开发会是最终形态大型应用:①受限于工具能力,“需求-开发-测试”这些活动都会存在。流

程不出现大的变革②活动向“AI全部生成+人工检查”演化③流程会出现局部优化

研发流程趋势:

代码交付->低代码->AI原生AI研发新流程

<NoCode>小型应用:①未来以低代码开发

,AI原生应用开发的流程为主

部门AI提效策略:

个人作业提效与团队吞吐提升★

个人作业提效团队吞吐提升部门虚拟人头数增加产品线重点产品突破个人作业提效与团队吞吐提升

,核心就是AI时代研发模式的探索与实现。需求产能倍增

虚拟人头数和实际人头数持平AI研发模式

=不申请新编制

,腾挪人力干成重点项目AI全量生成+人工检查辅助PART02破局之道:上下文工程打通跨环节信息断层

基于效率悖论理论的系统性设计思路固

核心设计理念人机协同

,而非替代:AI作为人的能力放大器系统性变革:从工具应用到组织模式的全面转型可持续发展:建立自我强化的能力提升循环乌三大核心问题识别矩阵问题类型核心矛盾根本原因解决方向效率悖论编码效率2-3倍vs整体交付有限研发管道平衡被打破重构协作模式管道失衡BA/测试成瓶颈vs开发能力溢出传统7-10人配比失效角色能力融合协作鸿沟面对面沟通vs结构化交互人机协作方法缺失标准化规范不变:•

对于复杂系统

,产品定义、规划、需求

分析、编码、测试的研发主体过程不会

改变•

与客户、用户的交流不会消失

,产品定

义、需求分析仍以人为主改变:•

终态场景下编码工作100%由AI完成,从人与人的高频互动演进为人与AI的

高频互动•

微观的过程将会大大简化

,过程文档

进行简化、合并

,交付周期从敏捷时

代以周、月为单位提升到以天为单位阵型:原来的研发管道配比被打破

1个BA+1个TL+AI可独立交付产品产品

,未来需要更多的BA角色融合才能让研发管道形成新的平

衡•

UX、

QA技能方面与BA接近

先向BA融合•

部分DEV向BA转型

,尤其是前

端DEV•

保留少量QA从事安全测试、系

统集成工具能力工具能力:•L3是研发模式跃迁分水岭

自研工

具应尽快达到L3能力要求•最优秀AI工具Cursor、Claudecode已接近L3能力要求

文生Demo

多轮对话

模型增强

AI模式重塑范式客户需求快速迭代验证、AI自主开发用户调研

研发模式重塑:

基于约束理论的组织重构层级特征L5自主完成软件全生命周期的开发L4独立完成需求到编码、测试全流

程L3AI能独立进行完整功能的生成L2完整的生成代码块、

函数级L1基础的代码检查、

片段补全阶段原来的时间占比新模式时间占

比需求20%50%开发60%40%测试20%10%角色原来的占比新模式占比BA15%45%开发70%45%测试15%10%路径:重新定义研发过程、

团队和能力流程

组织上下文工程智能体框架智能体评测部

署测试运

维TOBE设计需求开发BA350+应用的分布大型应用<WEB+微服务+DB+PaaS,

100W行级代码规模>小型应用<10个页面左右,

10W行级代码规模>业务方自己开发的应用小型应用<10个页面左右,

10W行级代码规模>企业IT应用分类分析示例75%25%软件产品用户需求主要经验:1)

围绕cursor

,在内部AI研发提效Agent平台加持下

,打造可横推的价值交付流水线(重点

:产出物的流转、

知识库服务、

任务拆解、

Rules定义)2)

【优化点】

文生Demo

,提升BA作业效率3)

【优化点】

文本用例前移到需求环节

,支持BA和QA的融合4)

【优化点】

设计环节拆解成四个任务

,结合cursor的rule

,提升写代码的准确性5)

组织阵型从7人(1BA、

4Dev

1QA

1UX)

,调整为3/2人/1人(1BA、

1Dev

1QA)

,提升BA和QA的相对比重

大型应用策略:

基于Cursor对流程进行局部优化低(零)代码应用

小型应用策略:

人人都是开发者+企业级多智能体超级应用企业级多智能体应用成为超级入口,已有应用下沉为可编排能力3万业务人员

,人人都是开发者,自助开发应用繁荣RN小程序AI应用

当前LLM/Agent应用局限性大型语言模型面临计算和内存开销的限制

,导致其在处理长序列时性能下降

,并出现幻觉、欺骗等可靠性问题。上下文工程旨在通过更精细的信息管理来克服这些内在的限制

,例如在处理长文本时出现lost-in-the-middle现象。ContextPoisoning上下文污染:当幻觉内容进入上下文时ContextDistraction上下文干扰:当上下文超出训练范围时ContextConfusion上下文混淆:当多余上下文影响响应时ContextClash上下文冲突:当上下文各部分相互矛盾时LLM简单的交互流程示例

上下文工程决定了Agent能力的上限[Context

engineeringisthe]”…

delicateart

andscienceoffillingthecontextwindowwith

justtherightinformationforthenext

step.

”--AndrejKarpathy WHY上下文工程是解决问题的底层钥匙当前组织面临的核心痛点是跨环节信息断层导致AI工具无法联动

,效能失衡

,而上下文工程通过三大逻辑破解该问题

:它不是单一工具优化

,而是重构全链路信息传递逻辑

,从根本上解决薄弱环节制约整体效率的问题

,最终实现端到端TEAMAI研发效能的提升。持续资源优化机制:下文工程通过智能内容过滤、知识直接传输和动态上下文优化等方法落地

,为传统资源密集型方法提供了高效替代方案。它能有效减少计算开销和token消耗

,这对于数据获

取困难的领域尤为重要标准化信息输入:为AI工具提供高质量数据,激活需求/测试环节的AI价值打通信息联动闭环:实现需求-开发-测试双向信息流动

,消除多环节信息断层可持续闭环输入PART03实践与实施:

深化上下文工程落地

应该如何优化上下文工程由于LLM的上下文窗口资源有限

,不加选择地注入上下文将导致成本上升、响应延迟、性能退化甚至幻觉增强。因此

,对上下文的管理与设计

,必须借助系统化策略。来自Langchain团队提供的Agent应用框架的实践,

四大上下文工程策略:写、选、压缩、隔离。https://rlancemartin.github.io/2025/06/23/context_engineering/https://blog.langch/context-engineering-for-agents/ AI研发效能提升策略:需求+测试+开发的深度上下文协同与重构实践

需求端到端提效牵引

,驱动需求价值交付落地重新定义自我价值

,对BQA角色的价值、边界、

目标的底层认知

,是驱动行为的源动力。从线性思维到结构化思维、系统性思维的转换

,驱动质量前移&全生命周期质量思维模式。Step5.思维升级知识库、设计rules、MCP、Tools规则圓生成PRD文档圜结构化分析输入粵生成DemoStep4.实践深化Step3.实战指导Step2.技能构建Step1.认知破冰记忆选择:类Scratchpads的短期记忆

,上下文的选择主要依赖其实现方式。如果是一个工具

,Agent可以通过工具调用进行读取。如果是Agent运行时状态的一部分

,可以选择在步骤中向Agent公开哪些状态部分。长期记忆的存储主要定义了三种类型(情景、语义、程序)

,Agent在具有保存记忆能力的前提下还需要能够选择和任务相关的记忆。Agent可能会选择少量示例作为所需行为的示例

,选择指令来引导行为

,或选择事实作为任务相关上下文。工具选择:大模型面对多种工具时

,可能会因描述相似产生混淆。

RAG-MCP架构通过将工具说明索引入库

,仅检索任务相关的工具描述

,实验证明工具选择准确率提高N倍。知识选择:以Windsurf为例

,其代码RAG架构并非简单做文本嵌入

,而是结合AST分块、语义重排、多源索引等手段

,在千万行代码中快速定位任务相关逻辑模块

,从而大幅提升智能体响应的专业度。

选上下文(Select

Context)核心目标是指将其纳入上下文窗口

,以协助智能体执行任务。以记忆系统为例

,记忆系统通过实现持久的信息存储、检索和利用机制

,使LLM能够超越无状态交互

,转变为具备学习、适应和长期理解能力的智能体。

构建结构化需求分析框架

持续改进循环通过系统性的技能训练和综合项目实践

,非BA人员可以逐步建立起BQA所需的核心技能体系

,为最终的实战应用和价值创造奠定坚实的技能基础

,通过PDCA持续改进转化机制循环。PDCA圓构建结构化需求分析框架-业务场景分析

:Who-What-When-Where-Why-How-功能需求拆解

:输入-处理-输出的逻辑链-约束条件识别

:技术约束、

业务约束、

法规约束

圓设计rules规则自生成PRD文档圜结构化分析结构化需求输入模版需求要素检查清单需求完整性验证标准囚构建全流程需求分析体系生成Demo AI时代测试人员的角色变革与能力重构固

变革驱动力:

AI重塑测试生态随着AI编程工具(Cursor等)大幅提升开发效率

,传统的测试-开发配比失衡

,测试成为新的瓶颈。测试人员必须从"后置验证者"转向"全流程质量保障者"

,实现角色的根本性变革。回角色变革的三个层次驴

能力扩展的四个维度

转型价值的三重实现难点类型具体表现影响程度解决策略用例生成准确性AI理解需求偏差导致用例错误高明确需求DOD纳入结构化需求Rules用例覆盖率完整性边界/异常/波及遗漏中Rules制定强制执行步骤+

自检机制自动化生成稳定性AI自我发挥不聚焦不稳定高Rules详细定义各层模板要求+执行步骤

测试三大难点的深度分析与实施策略⚠

难点1:角色编辑模糊与责任重新定义

难点3:

团队文化与工作方式的深度变革具体难点•

BQA能力要求大幅提升•

传统BA和QA工作边界重新划分•

团队协作模式根本性改变文化变革挑战•

个人专业化--团队协作化•

手工作业--AI辅助工作•

质量检查--质量内建创新文化建设•

AI提效助力角色融合•

质量沉淀奠定规则底色•

质量第一但包容试错创新解决•

T型人才培养体系•

责任矩阵重新设计•

BQA+TL结对协作囡

难点2:

AI生成质量把控上下文摘要:如ClaudeCode在上下文窗口使用率达到95%后会自动对对话轨迹进行总结

,再替代注入。这种方式可以采用递归摘要、层次摘要等策略

,也可以训练微调模型用于关键事件提取

,做好上下文摘要其实非常困难。上下文修剪:使用规则剔除老旧、无效或冲突上下文。例如清除最早回合信息、剔除中间无关路径等。这种策略操作简便,在工具调用频繁或成本敏感场景中尤为常用。

压缩上下文Compressing

Context核心目标是在Agent每一轮对话中只保留最有价值的Token。

基于AI的测试规范化与标准化建设固

核心创新:

基于Cursor的测试规则体系通过建立标准化的测试规则库

,实现测试用例生成和自动化脚本开发的规范化

,大幅提升测试效率和质量一致性。文本用例&自动化脚本生成规范体系

效果反馈

引入企业级Cursor辅助开发模式突破瓶颈CursorAI协作编程带来显著价值。代码生成速度提升2-3倍

,极大提高开发效率;

项目交付周期缩短

30-50%

,能更快响应市场需求;缺陷率降低95%

,保证了代码质

量;

代码风格实现100%统一

,便于团队协作。在人机协作模型中

,人负责架构设计、

业务逻辑和质量把控,发挥专业判断和创造力;

AI负责代码生成、

模板填充和规范执行

,提高效率和准确性。

通过持续对话、

迭代优化和知识传递实现协作。RAG+MCP具有创新突破。

解决了企业私有API学习痛点

,通过中文语义理解技术突破、

动态知识库更新机制和精准搜索匹配算法

为企业级开发提供有力支持。四大能力建设包括规范文件优化管理、

用户操作导向拆分、公共组件识别复用和智能规范自动执行

,有助于提升开发的规范性、

效率和可维护性。RAG+MCP突破核心价值人机协作四大能力便签:Anthropic提出的研究显示

,AI智能体通过工具调用或状态字段记录计划信息

,可帮助其在任务过程中持久化策略、参数或状态例如

,研究人员将超过20万tokens的长任务拆解为阶段性步骤

,并通过便签记录每一阶段决策

,从而避免窗口溢出。记忆:指AI智能体自动从多轮历史对话中提取高价值事实(语义记忆)、行为流程(程序记忆)、案例轨迹(情景记忆)并长期保留。这一机制已被ChatGPT、Cursor、Windsurf等集成

,用于实现“个性化响应”。如ChatGPT能记住用户的写作风格和工作场景

,并在未来会话中主动融合。核心目标是指将关键任务信息保存在上下文窗口之外

,但又可被模型间接利用的手段

,类似人类“写便签”、“做笔记”的行为。

写上下文Write

Context

用户操作导向拆分方法论

提升开发实施质量传统拆分方式存在诸

多弊端。按技术层次

拆分

,Controller、Service、DAO各自为营;按功能模块拆分,用户模块、订单模块

耦合严重;跨模块依

赖复杂

,修改一个功能会影响多个模块。50%操作导向拆分具有明显优势。原子性操作构成完整业务闭环

,可独立开发测试

,实现85%的并行开发

,远高于传统的30%

,且易于扩展

,新增操作不影响现有功能。拆分实施需遵循一定原则。识别用户操作场景

,定义操作边界

,进行接口标准化

,确保操作原子性

,以保证拆分的科学性和有效性。85%15%传统弊端实施原则操作优势

构建智能规范自动执行体系

驱动良性循环通过Cursor的AI能力实现"规范驱动成长、AI赋能提升"的良性循环

,通过Cursor工具配置与优化实践、基于RAG+MCP私有知识管理创新等系列活动建设学习型技术团队

,形成组织的核心技术竞争力。实施成果实施智能规范自动执行体系取得

了良好成果。代码风格实现100%

统一

,架构模式标准化

,命名规

范完全一致

,提升了代码的整体

质量和可维护性。AI优势AI自动执行具有显著优势。

100%

自动执行Cursor规则文件

,实时

进行规范检查

,智能代码生成天

然符合规范要求

,规范变更能立

即生效

,提高了开发效率和质量。传统问题传统规范执行存在问题。依赖开

发者记忆

,易遗忘且不一致;通

过代码审查发现问题

,事后修复

成本高;执行率仅为40-60%

,难

以保证代码质量。优化策略规范文件优化策略包括按类别拆

,按需引入规范

,精简内容

突出核心要求

,减少冗余说明

以提高规范文件的可管理性和实

用性。多智能体架构:如OpenAISwarm和Anthropic多智能体团队研究

,每个子Agent管理自己的上下文、工具与指令

,适用于分布式复杂任务。环境隔离:

Hugging

FaceCodeAgent架构将代码工具执行放入沙箱环境

,工具调用参数与返回值在沙箱中完成状态隔离,仅返回结果注入LLM

,从而防止上下文污染。运行时状态对象

:以LangGraph为例

,系统状态由结构化字段组成。开发者可精确控制哪些字段在每步注入模型

,哪些信息保持隔离

,仅在特定回合暴露

,从而实现“动态上下文管理”。

隔离上下文Isolating

Context核心目标是在不同Agent或环境间划分上下文的方法。环境隔离的上下文管理:多Agent

发布企业通用Agent

Memory框架1.0企业内部已进行小范围试点应用

,让Agent有更聪明的记忆大脑

,其核心特性包括:•

三层记忆架构:短期记忆、中期记忆、长期记忆•

异步处理:支持异步队列管理

,避免阻塞主业务•

多记忆类型:支持对话记忆和任务记忆•

灵活配置:支持多种LLM、嵌入模型和向量数据库•

隔离管理:支持多用户/多智能体的隔离记忆管理•

提示词模板:可自定义各种提示词模板公司内部通用的Agent

Memory能力不在于做一个更强的记忆模块

,而是打通

“记忆”嵌入一条端到端的

“上下文管道”的实践范式

:从获取什么信息、

如何加工、

如何在推理时编排与交换、

如何在约束下最优分配

,到如何在交互后回写、

巩固和清理。值得关注:试点项目使用沙盒为CodeAgent提供

命令的交互执行环境以及软件仓库环境,凸显出sandbox的重要性。下一步计划:•基于采集到的SWE-bench-lite数据,初步评估开发Agent解决问题的能力;•开发Agent配备Sandbox;•使用SWE-smith为公司内代码库生成训练数据

,微调开源代码模型

,以支持CodeAgent、提升其对公司内代码问题的解决能力

基于SWE-bench-Lite评测CodeBase的检索能力实践ClaudeCode上下文构建的关键细节:记忆分层思想:将记忆/上下文管理分解为高速的短期层、负责整理的中期层和用于持久化的长期层

,是一种非常清晰和可扩展的架构。优雅降级

,而非硬性限制:并非在达到Token上限时粗暴地截断

,通过设计的一套智能压缩和摘要机制显著提升应用的“智能感”和鲁棒性。细节上的性能优化:反向遍历查找Token、结构化摘要、向量化检索等技术

,都是在细节之处提升系统性能和用户体验的典范。记忆管理可视化交互:将系统内部状态(如内存使用率)通过渐进式警告的方式暴露给用户

,将潜在的负面体验转化为正向的互动。

当前实现上下文工程主流应用实践示例这里以ClaudeCode为例

,业界通过逆向工程深度分析其源码实现

,在记忆管理方面

,ClaudeCode通过多层次的记忆存储

,动态注入机制和状态持久化

,实现了在有限上下文窗口中维持长时间对话的能力。

沉淀AI研发端到端提效实践总册

赋能全员PART04效果与收益:

从局部高效到全局最优的价值跃迁24~3倍,0%13代码质环境缺四个目标

试点项目关键成功指标验证实践成果全员AI能力指标突破新技术学习周期缩短60%

,AI工具适应能力显著增强

,AI助力工作模式重塑及全员作业提效学习型组织指标增强学习型组织文化增强

,持续改进成为团队常态效率指标达成开发个人效率提升2团队协作效率提升5代码质量指标改善量全面提升

,生产陷率明显降低01

项目信息XX系统项目规模为15个核心功能

模块

,开发周期从1.5个月缩短至2周

,代码质量达到SonarQubeA级,测试覆盖率85%

,缺陷率大幅降低。03团队跃升团队能力得到跃升。

初级开发者能

独立完成复杂功能

中级开发者掌

握企业级架构

,高级开发者实现设

计指导转型

团队整体价值提升。02

验证成果技术方案验证取得多项成果。RAG+MCP解决企业级应用痛点

,操作导向拆分实现高并行开发

,智能规范执行保证高规范执行率

,组件化复用减少重复开发。04

成功经验关键成功经验包括规范管理的细化、

RAG+MCP的渐进建设和拆分策略的合理应用

为项目开发提供了

有效指导。

关键成果:

多个项目综合验证与效果评估

引导学习型组织理论下的工作坊+战训营模式沉淀固战训营培训概述•

覆盖人员:

需求人员/交付经理/其他核心人员•

实战目标:

从传统"人与人交互"向"人与AI交互"转变•

实现BQA+开发结对模式能力进阶持续开展基于组织、

流程、

人、

工具的学习型组织持续进化;

沉淀优秀案例

,扩大影响力

驱动AI组织架构演进

,研发模式转型2025-07完成LTC三大领域的AI应用团队的组建和人员调整

为后续AI技术在业务场景中的深度应用提供了专属人力支撑

,加速了AI能力与业务需求的精准对接2025-08各产品团队完成第一轮研发新模式下的团队阵型调整

为研发模式转型提供人才基础基于新组织架构的特性团队持续运作落地和改进

为研发模式转型注入源源不断动力0032025-0904021PART05总结参考&未来展望工具先行始终优先关注数据

构建Agent时务必建立Token追踪机制。思考Agent状态要像你的Agent一样思考

实现方式之一是梳理Agent在运行时需要收集和使用的信息

明确定义的状态模式能有效控制Agent运行过程中暴露给LLM的内容。从简单的记忆功能开始记忆是实现Agent个性化的有效手段

,但正确实现可能颇具挑战。

可采用基于文件

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论