2025QECon全球软件质量效能大会:CodeFuse:大模型驱动蚂蚁研发提效的创新之路_第1页
2025QECon全球软件质量效能大会:CodeFuse:大模型驱动蚂蚁研发提效的创新之路_第2页
2025QECon全球软件质量效能大会:CodeFuse:大模型驱动蚂蚁研发提效的创新之路_第3页
2025QECon全球软件质量效能大会:CodeFuse:大模型驱动蚂蚁研发提效的创新之路_第4页
2025QECon全球软件质量效能大会:CodeFuse:大模型驱动蚂蚁研发提效的创新之路_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

QECon2025全球软件质量&效能大会

·深圳站2025

GLOBAL

SOFTWARE

QUALITY&EFFICIENCY

CONFERENOE

SHENZHENZHANCodeFuse:

大模型驱动蚂蚁研发提效的创新之路肖斌|蚂蚁集团技术专家肖斌蚂蚁集团技术专家就职于蚂蚁集团

CIO

技术部,自2021年加入蚂蚁以来,探索与研发效能领域的前沿技术落地,主要从事软件工程智能化方向的研究和探索,致力于研发效能领域的前沿技术落地,当下专注

于代码生成,AI

对话等方向,目前是CodeFuse研发助手技术负责人。从0到1建设

CodeFuse

IDE系列插件,为代码大模型在蚂蚁研发领域落地铺平道路。QECon全球软件质量&效能大会QECon全球软件质量&效能大会01

AI在研发领域带来的变化02

CodeFuse

插件技术架构

03

本地核心服务模块详解04

经验和总结未来展望目录CONTENTSPART01AI在研发领域带来的变化一回顾2024888全球软件质量&效能大会·

2023年:GPT-4发布,具备了多模态理解与多类型内容生

成能力,进一步推动了大模型技术的发展·

2023年:中国掀起“百模大战”,发布各类大模型数量超过100个,涵盖通用大模型、行业大模型、基于通用大模型

或行业大模型的应用服务型大模型等·2024年1-7月,中国央国企采购大模型项目数量已超过

950个·截至2024年11月,中国获得备案的大模型数量达到

309个,中国大模型开始在垂类行业众多场景落地·截止2024年底,中国大模型产品使用价格进一步下降,

为大模型广泛商用落地提供了基础2023-2024年国产大模型价格走势(元/百万Tokens)500400

300300200100

50

20

1.5

0

2023年H1

2023年H22024年H1

2024年H2数据来源:第一新声研究院整理120100806040202024年生成式人工智能服务备案数量11797

952024年4月(第一批)2024年8月(第二批)2024年11月(第三批)

数据来源:第一新声研究院整理其他工业10%政务11%教育

12%互联网21%金融16%12%QE

Al大模型发展趋势2023

Al大模型井喷期

2024

Al大模型加速商用期信息来源:2024年中国AI大模型产业发展与应用研究行业结构0Task

reliance

on

AlCodebasemodemiation40%Percentage

of

respondentsErrorbarrepresents89%credibilityintervalFigure

3:Percentage

of

respondents

relying

onAl,at

least

in

part,to

perform

twelve

common

development

tasksPerceptionsofproductivitychangesduetoAlExtremelyincreased

my

productivityModeratelyincreasedmy

productivitySlightlyincreasedmy

productivityNo

impact

on

my

productvitySlightlydecreasedmy

productivityModerately

dereased

my

productivityExtremelydecreasedmy

productivity20%

30%40%Percentage

of

respondentsError

bar

represents

89%uncertainty

intervalFigure

4:Respondents'perceptions

of

AI's

impacts

on

their

productivity.DORA

22Artificial

intelligence:Adoption

and

attitudesQE

研发领域的AI调研报告(1)AnswerDevelopersquicklyfoundvalueinGitHubCopilot

andadopted

itaspart

oftheirdailytoolkit

#More

than50,000organizations

have

adopted

GitHub

Copilot

so

far,

but

we

haven't

yet

had

a

clear

view

into

what

those

adoption

rates

look

like

on

the

individual

level.

Whenwedugdeeperintotheusage

patternsofGitHub

Copilot

amongAccenturedevelopers,67%ofrespondentsreportedutilizingGitHubCopilot

at

least

5

days

per

week,with

an

average

usage

frequency

of3.4daysperweek.

Moreover,asubstantial70%of

respondents

relied

on

GitHub

Copilot

for

coding

tasks

in

a帮

于Highlevel任

务respondents

inthe

U.S.andGermany

usedthisextratimeforcollaboration

andsystemdesign.Thiscontinuesatrendwefirstobservedlastyearin

a

survey.measuringAl'simpact

on

developer

experience

amongUS-based

developerswhererespondentsthenreportedthaiAlhelpedthemfocuson

high-leveltasks.ThetimerespondentssavewithAlisbeingusedto

collaborate,learn,and

design

systemsTASKS

RESPONDENTSAREABLETOSPEND

MORETIME

DOINGAFTER

USINGAICODINGTOOLSGERMANYM=49546%42%46%46%42%BEEACTORTMS8CPTINLZINGCODE37%42%43%37%TAKTNG

BREAKS

34%

29%31%Whichofth

foloningresubetosendmoretimedonduetousngAlodintosotwork?Peoseselectathot

pob.NoteUndethedstohdcatesthenhshestcommonurneyespon8.QE

研发领域的AI调研报告(2)信息来

:survey-ai-wave-grows

等47%44%45%45%39%BRAZILINDIA44%40%43%QE

CodeFuse的落地现状面向研发团队·CodeFuse

研发助手构建平台面向其他工具平台·CodeFuse

APIs·智能CR·Commit

Message提交部署面向开发者·CodeFuse

智能助手(IDE

件)·CodeFuseIDE·

普通/仓库问答·

知识库问答·

解释代码系统分析

测试验证·

AIPartner·

Sql生成/纠错/优化·

单元测试·

集成测试·

补充更多·

代码补全·

添加注释·TextToCode优化代码

图生代码

异常分析研发编码context.subscriptions

,push

(ands

.registercComand('

codefuse.mans

.registerComnan('codefuse(this

.create(gitInfo,

true

);实时的代码修改和预测升级现有补全能力,光标后新增代码=>光标前后代码新增/修改/删除代码publLicclassFunutils

{入需求描述,支持shift+回车换行。例如增加逻辑。poblic

static

vid

quicksot(int[]ar,intleft,int

right){

if

(left<right){intpivot:partition(ar,lLeft,right);quickSort(ar,Left,r

ight

pivot·1);quickSot(ar,l

et

pivot+1,right);AIPartner智能编程搭档,根据需求描述完成编码任务,支持生成/修改多个代码文件QE

CodeFuse插件的新变化TextToCode基于用户开发过程中的诉求,一键改写指定代码。支持重构/简化/注释等能力PART02CodeFuse插件技术架构--CodeFuse核心的工程原理888全球软件质量&效能大会输入的上下文信息准确、完整,

有助于AI更好地理解用户需求,

生成更符合预期的结果,提升整

体效果。上下文质量先进的AI模型保证了理解和生成

内容的能力,决定了插件的智能

水平和功能强大程度。模型能力QE

如何提高CodeFuse插件优良的用户界面和流畅的操作流程提升

用户满意度,直接决定插件的受欢迎程

度和使用频率产品体验QE

CodeFuse

工程链路模块CodeFuse评测服务模型1)

模型2)模

3CodeFuse

插件服务本地核心服务

索引检索本地数据和用户在IDE侧行为的数据建模和

分析,为AI功能提供对应的检索能力

CodeFuse

插件服务数据的前后处理+Prompt

拼装,,模型调度,全链

路AB实验,跨仓库检索能力在线模型索引CodeFuse插件

CodeFuse

插件AI能力的具体露出形态,例如代码补全,对

话等。多维度(本地/api/模型),多语言对插件AI能力的评测和模型上线前审核CodeFuse评测服务清洗一预处理本地核心服务正/负样本数据集迭代模型

模型1)训练数据集CodeFuse

插件技术架构动态workflow按需加载串行/并行prompt

拼装

数据前/后处理多维度评测本地核心

OpenAPI模型推理全链路AB

实验插件功能

检索策略prompt拼装

模型选择等多语言javakotlin其他限流开放能力数据来源线上埋点

用户上传基座框架通用能力默认能力实现数据层RPC

通信协议

模块组装

SPI接口定义

通用工具

多维索引构建

补全检索策略

向量索引

文本索引动态配置

多系统兼容

数据建模

对话检索策略AST

解析CodeGraph多端兼容Local

IDEWEBCloud

IDE业务定制AI

模块侧边栏对话InLinechat代码补全AI

Partner等通用组件HPF防抖队列合理性检查片段级缓存事件监听等产品体验上下文质量模型能力CodeFuse插件本地核心服务CodeFuse插件

服务CodeFuse

评测

服务鉴权数据大盘ts/issql等PART

03本地核心服务模块详解—-探索上下文的组装流程全球软件质量&效能大会888QE

上下文质量的思考数据来源代码仓库/知识库

用户行为检索策略BM25/向量/图

单轮/多轮检索Prompt工程检索结果拼装

数据前后处理QE

本地核心服务的索引切分

核心思路代码层面,提供多维度切分方

式和关联关系数据(CodeGraph),支撑后续补全/对话/AI

Partner不同的检索

方案用户行为方面,针对部分AI能

力,尝试将用户行为信息添加

到上下文,让AI能力进

步贴

近用户习惯代码仓库信息文件级文件级索引+file_url文件级索引+file_url+total_snippet_num文件级索引+file_url用户行为信息补全补全traceGitgit

LogIDE操作

trace函数级片段级级索引+id+end_no+index片段级片段级级索引+start

no+end_no+index仓库级仓库级索引+project_url+file_record_vec+record_millis仓库级索引仓库级索引+total_snippet_num+total_snippet_num+next_keyQE

补全过程的上下文以及问题相似片段目的:学习逻辑Useruser=newUser();user

1相关片段问题:耗时检索步骤包含了大量计算,如何保障耗时?目的:减少幻觉userService.addUser

(user)目的:预测行为User

user

=

new

User();历史动作QE

一次补全流程的耗时分布动态延迟

RAG

Prompt工程

模型推理全仓库片段相似度对比补全上下文

动态类型推导引用链路追踪历史信息Diff全链路:<500ms结果加工QE

补全加速-减少相似计算压力按规则过滤无效片段过滤无效代码片段:-一相似路径-一相似import数量编码pub

fn

test(){字符串-

>数字[3,1,84,90…]所有代码片段QE

补全加速-用缓存减少IO引用数据

历史编辑DIFF核心思路用户不会频繁切换文件开始编辑的文件不变,相似度对比数据集就不变,可以用缓存加速,减少从索引库中读取数据的IO消耗重建索引

基于URL

重建缓存结束RAG

检索prompt

构造发起远程补全增量更新缓存状态全量更新仓库索

引状态异步异步读取缓存文件url核心思路补全的瞬时,用所有资源尽全

力计算,但同时对速度有限制一般情况下速度很快,用户无

感知。本地mac测试,CPU资源

消耗<3%缓存

相似片段集合

相似片段集合

相似片段集合+similarity_data+reference_data+editor_data相似片段集合相似片段集合QE

补全加速-work

stealing并行计算BinaryHeapscorescore

scorescore

score

scorecpu

1work_thread_0popjobjobjobjobcpu

3work_thread_2popjobjobjobjobcpu

2work_thread_1stealQE

AI

Partener

功能演示Refactorpackage

con.aLipay.codefuse;public

static

void

quicksort(int[]arr,intLeft,intright){2usagesint

pivotapartitionCarr,Left,right);quickSort(arr,letpivot+1,right);□

codefus-demo>SrC>

main>java

>com>alipay

codefuse30:22LF

UTF-8CBReady

4

spaces

2of2100M巴

dQE

对话/AI

Partener

简单流程LLM关键词提取翻译实体识别模型推理加工去重

rerank中英文关键词中英文Query2信息检索3FastApply1Query处理推理

结果目标文件BM25向量目标文

件QE

对话/AI

Partener

的思考-上下文质量需求:编写一个创建用户接口问题:同一个上下文的情况下,人能写出可落地代码么?需要什么数据才能写出来?Ai8publicXXXvoid1.了解业务背景+相关应用基础信息大致判断创建用户接口的流程2.寻找当前应用的接口+领域对象信息寻找可复用的代码片段,判断哪些需要新建,哪些需要修改3.结合1和2信息,梳理代码流程分析并拆解为了完成业务需求,还需要哪些功能4.寻找入口函数,开始编写代码基于1,2,3的分析结果,动手开发。QE

是怎么解决问题的多维度的信息收集。并有多步骤的规划

能力,每步骤执行时基于收集到的信息进行各种决策。从而完成需求需求:编写一个创建用户接口QE对话/AI

Partener

深度思考流程决策结果思考

行动多轮多维度Think

Model+Search深度思考步骤外网workflowSearch

决策Step

记录Tool记录记忆管理本地CodeSearchworkflowSearch

决策QueryNext

StepSubQuery

集合Search

Router单轮单维度SearchSearch

ResultSummarySearch

策远程CodeSearchworkflowSearch

决策内网知识库workflowSearch

决策answerPART04经验和总结业务诉求--效果观测和全球软件质量&效能大会888QE

全链路的AB实验AB实验+用户反馈,推动着产品能力在稳步提高Prompt拼装,任务节点装载等实验多AI能力背后的模型迭代

实验代码切分方式,检索策略

等实验插件业务大盘AI功能,延迟时间等实验本地核心服务端插件模型问题一:同一种通用能力,在不同业务背景下表现有差距案例:同样是Java语言,在服务端,数据研发,终端场景等不同场景有差异问题二:定制化对话诉求如何解案例:A

业务需要定制化检索能力才可以回答问题,通用能力没有覆盖QE

多样化的业务需求基座框架SPI接口定义ServiceProviderCodeFuse默认实现业务定制化策略实现数据层核心思路定义通用SPI接口

,CodeFuse

插件团队提供默认实现同时支持业务定制化,合作团

队基于SPI

规划实现接口定义

后,本地核心服务会合并打包

成一个可执行文件。基于业务

特征自动路由到业务定制化接

口QE

业务定制化方案-RAGQE

业务定制化方案-助手1.定制研发助手定制SystemPrompt,模型,工具集。2.定制助手工具定制对话pipline,业务知识库3.发布助手插件启动后

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论