版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
QECon2025全球软件质量&效能大会
·深圳站2025
GLOBAL
SOFTWARE
QUALITY&EFFICIENCY
CONFERENOE
SHENZHENZHANCodeFuse:
大模型驱动蚂蚁研发提效的创新之路肖斌|蚂蚁集团技术专家肖斌蚂蚁集团技术专家就职于蚂蚁集团
CIO
技术部,自2021年加入蚂蚁以来,探索与研发效能领域的前沿技术落地,主要从事软件工程智能化方向的研究和探索,致力于研发效能领域的前沿技术落地,当下专注
于代码生成,AI
对话等方向,目前是CodeFuse研发助手技术负责人。从0到1建设
CodeFuse
IDE系列插件,为代码大模型在蚂蚁研发领域落地铺平道路。QECon全球软件质量&效能大会QECon全球软件质量&效能大会01
AI在研发领域带来的变化02
CodeFuse
插件技术架构
03
本地核心服务模块详解04
经验和总结未来展望目录CONTENTSPART01AI在研发领域带来的变化一回顾2024888全球软件质量&效能大会·
2023年:GPT-4发布,具备了多模态理解与多类型内容生
成能力,进一步推动了大模型技术的发展·
2023年:中国掀起“百模大战”,发布各类大模型数量超过100个,涵盖通用大模型、行业大模型、基于通用大模型
或行业大模型的应用服务型大模型等·2024年1-7月,中国央国企采购大模型项目数量已超过
950个·截至2024年11月,中国获得备案的大模型数量达到
309个,中国大模型开始在垂类行业众多场景落地·截止2024年底,中国大模型产品使用价格进一步下降,
为大模型广泛商用落地提供了基础2023-2024年国产大模型价格走势(元/百万Tokens)500400
300300200100
50
20
1.5
0
2023年H1
2023年H22024年H1
2024年H2数据来源:第一新声研究院整理120100806040202024年生成式人工智能服务备案数量11797
952024年4月(第一批)2024年8月(第二批)2024年11月(第三批)
数据来源:第一新声研究院整理其他工业10%政务11%教育
12%互联网21%金融16%12%QE
Al大模型发展趋势2023
Al大模型井喷期
2024
Al大模型加速商用期信息来源:2024年中国AI大模型产业发展与应用研究行业结构0Task
reliance
on
AlCodebasemodemiation40%Percentage
of
respondentsErrorbarrepresents89%credibilityintervalFigure
3:Percentage
of
respondents
relying
onAl,at
least
in
part,to
perform
twelve
common
development
tasksPerceptionsofproductivitychangesduetoAlExtremelyincreased
my
productivityModeratelyincreasedmy
productivitySlightlyincreasedmy
productivityNo
impact
on
my
productvitySlightlydecreasedmy
productivityModerately
dereased
my
productivityExtremelydecreasedmy
productivity20%
30%40%Percentage
of
respondentsError
bar
represents
89%uncertainty
intervalFigure
4:Respondents'perceptions
of
AI's
impacts
on
their
productivity.DORA
22Artificial
intelligence:Adoption
and
attitudesQE
研发领域的AI调研报告(1)AnswerDevelopersquicklyfoundvalueinGitHubCopilot
andadopted
itaspart
oftheirdailytoolkit
#More
than50,000organizations
have
adopted
GitHub
Copilot
so
far,
but
we
haven't
yet
had
a
clear
view
into
what
those
adoption
rates
look
like
on
the
individual
level.
Whenwedugdeeperintotheusage
patternsofGitHub
Copilot
amongAccenturedevelopers,67%ofrespondentsreportedutilizingGitHubCopilot
at
least
5
days
per
week,with
an
average
usage
frequency
of3.4daysperweek.
Moreover,asubstantial70%of
respondents
relied
on
GitHub
Copilot
for
coding
tasks
in
a帮
助
研
发
者
专
注
于Highlevel任
务respondents
inthe
U.S.andGermany
usedthisextratimeforcollaboration
andsystemdesign.Thiscontinuesatrendwefirstobservedlastyearin
a
survey.measuringAl'simpact
on
developer
experience
amongUS-based
developerswhererespondentsthenreportedthaiAlhelpedthemfocuson
high-leveltasks.ThetimerespondentssavewithAlisbeingusedto
collaborate,learn,and
design
systemsTASKS
RESPONDENTSAREABLETOSPEND
MORETIME
DOINGAFTER
USINGAICODINGTOOLSGERMANYM=49546%42%46%46%42%BEEACTORTMS8CPTINLZINGCODE37%42%43%37%TAKTNG
BREAKS
34%
29%31%Whichofth
foloningresubetosendmoretimedonduetousngAlodintosotwork?Peoseselectathot
pob.NoteUndethedstohdcatesthenhshestcommonurneyespon8.QE
研发领域的AI调研报告(2)信息来
源
:survey-ai-wave-grows
等47%44%45%45%39%BRAZILINDIA44%40%43%QE
CodeFuse的落地现状面向研发团队·CodeFuse
研发助手构建平台面向其他工具平台·CodeFuse
APIs·智能CR·Commit
Message提交部署面向开发者·CodeFuse
智能助手(IDE
插
件)·CodeFuseIDE·
普通/仓库问答·
知识库问答·
解释代码系统分析
测试验证·
AIPartner·
Sql生成/纠错/优化·
单元测试·
集成测试·
补充更多·
代码补全·
添加注释·TextToCode优化代码
图生代码
异常分析研发编码context.subscriptions
,push
(ands
.registercComand('
codefuse.mans
.registerComnan('codefuse(this
.create(gitInfo,
true
);实时的代码修改和预测升级现有补全能力,光标后新增代码=>光标前后代码新增/修改/删除代码publLicclassFunutils
{入需求描述,支持shift+回车换行。例如增加逻辑。poblic
static
vid
quicksot(int[]ar,intleft,int
right){
if
(left<right){intpivot:partition(ar,lLeft,right);quickSort(ar,Left,r
ight
pivot·1);quickSot(ar,l
et
pivot+1,right);AIPartner智能编程搭档,根据需求描述完成编码任务,支持生成/修改多个代码文件QE
CodeFuse插件的新变化TextToCode基于用户开发过程中的诉求,一键改写指定代码。支持重构/简化/注释等能力PART02CodeFuse插件技术架构--CodeFuse核心的工程原理888全球软件质量&效能大会输入的上下文信息准确、完整,
有助于AI更好地理解用户需求,
生成更符合预期的结果,提升整
体效果。上下文质量先进的AI模型保证了理解和生成
内容的能力,决定了插件的智能
水平和功能强大程度。模型能力QE
如何提高CodeFuse插件优良的用户界面和流畅的操作流程提升
用户满意度,直接决定插件的受欢迎程
度和使用频率产品体验QE
CodeFuse
工程链路模块CodeFuse评测服务模型1)
模型2)模
型
3CodeFuse
插件服务本地核心服务
索引检索本地数据和用户在IDE侧行为的数据建模和
分析,为AI功能提供对应的检索能力
CodeFuse
插件服务数据的前后处理+Prompt
拼装,,模型调度,全链
路AB实验,跨仓库检索能力在线模型索引CodeFuse插件
CodeFuse
插件AI能力的具体露出形态,例如代码补全,对
话等。多维度(本地/api/模型),多语言对插件AI能力的评测和模型上线前审核CodeFuse评测服务清洗一预处理本地核心服务正/负样本数据集迭代模型
模型1)训练数据集CodeFuse
插件技术架构动态workflow按需加载串行/并行prompt
拼装
数据前/后处理多维度评测本地核心
OpenAPI模型推理全链路AB
实验插件功能
检索策略prompt拼装
模型选择等多语言javakotlin其他限流开放能力数据来源线上埋点
用户上传基座框架通用能力默认能力实现数据层RPC
通信协议
模块组装
SPI接口定义
通用工具
多维索引构建
补全检索策略
向量索引
文本索引动态配置
多系统兼容
数据建模
对话检索策略AST
解析CodeGraph多端兼容Local
IDEWEBCloud
IDE业务定制AI
模块侧边栏对话InLinechat代码补全AI
Partner等通用组件HPF防抖队列合理性检查片段级缓存事件监听等产品体验上下文质量模型能力CodeFuse插件本地核心服务CodeFuse插件
服务CodeFuse
评测
服务鉴权数据大盘ts/issql等PART
03本地核心服务模块详解—-探索上下文的组装流程全球软件质量&效能大会888QE
上下文质量的思考数据来源代码仓库/知识库
用户行为检索策略BM25/向量/图
单轮/多轮检索Prompt工程检索结果拼装
数据前后处理QE
本地核心服务的索引切分
核心思路代码层面,提供多维度切分方
式和关联关系数据(CodeGraph),支撑后续补全/对话/AI
Partner不同的检索
方案用户行为方面,针对部分AI能
力,尝试将用户行为信息添加
到上下文,让AI能力进
一
步贴
近用户习惯代码仓库信息文件级文件级索引+file_url文件级索引+file_url+total_snippet_num文件级索引+file_url用户行为信息补全补全traceGitgit
LogIDE操作
trace函数级片段级级索引+id+end_no+index片段级片段级级索引+start
no+end_no+index仓库级仓库级索引+project_url+file_record_vec+record_millis仓库级索引仓库级索引+total_snippet_num+total_snippet_num+next_keyQE
补全过程的上下文以及问题相似片段目的:学习逻辑Useruser=newUser();user
1相关片段问题:耗时检索步骤包含了大量计算,如何保障耗时?目的:减少幻觉userService.addUser
(user)目的:预测行为User
user
=
new
User();历史动作QE
一次补全流程的耗时分布动态延迟
RAG
检
索
Prompt工程
模型推理全仓库片段相似度对比补全上下文
动态类型推导引用链路追踪历史信息Diff全链路:<500ms结果加工QE
补全加速-减少相似计算压力按规则过滤无效片段过滤无效代码片段:-一相似路径-一相似import数量编码pub
fn
test(){字符串-
>数字[3,1,84,90…]所有代码片段QE
补全加速-用缓存减少IO引用数据
历史编辑DIFF核心思路用户不会频繁切换文件开始编辑的文件不变,相似度对比数据集就不变,可以用缓存加速,减少从索引库中读取数据的IO消耗重建索引
基于URL
重建缓存结束RAG
检索prompt
构造发起远程补全增量更新缓存状态全量更新仓库索
引状态异步异步读取缓存文件url核心思路补全的瞬时,用所有资源尽全
力计算,但同时对速度有限制一般情况下速度很快,用户无
感知。本地mac测试,CPU资源
消耗<3%缓存
相似片段集合
相似片段集合
相似片段集合+similarity_data+reference_data+editor_data相似片段集合相似片段集合QE
补全加速-work
stealing并行计算BinaryHeapscorescore
scorescore
score
scorecpu
1work_thread_0popjobjobjobjobcpu
3work_thread_2popjobjobjobjobcpu
2work_thread_1stealQE
AI
Partener
功能演示Refactorpackage
con.aLipay.codefuse;public
static
void
quicksort(int[]arr,intLeft,intright){2usagesint
pivotapartitionCarr,Left,right);quickSort(arr,letpivot+1,right);□
codefus-demo>SrC>
main>java
>com>alipay
codefuse30:22LF
UTF-8CBReady
4
spaces
2of2100M巴
dQE
对话/AI
Partener
简单流程LLM关键词提取翻译实体识别模型推理加工去重
rerank中英文关键词中英文Query2信息检索3FastApply1Query处理推理
结果目标文件BM25向量目标文
件QE
对话/AI
Partener
的思考-上下文质量需求:编写一个创建用户接口问题:同一个上下文的情况下,人能写出可落地代码么?需要什么数据才能写出来?Ai8publicXXXvoid1.了解业务背景+相关应用基础信息大致判断创建用户接口的流程2.寻找当前应用的接口+领域对象信息寻找可复用的代码片段,判断哪些需要新建,哪些需要修改3.结合1和2信息,梳理代码流程分析并拆解为了完成业务需求,还需要哪些功能4.寻找入口函数,开始编写代码基于1,2,3的分析结果,动手开发。QE
人
是怎么解决问题的多维度的信息收集。并有多步骤的规划
能力,每步骤执行时基于收集到的信息进行各种决策。从而完成需求需求:编写一个创建用户接口QE对话/AI
Partener
深度思考流程决策结果思考
行动多轮多维度Think
Model+Search深度思考步骤外网workflowSearch
决策Step
记录Tool记录记忆管理本地CodeSearchworkflowSearch
决策QueryNext
StepSubQuery
集合Search
Router单轮单维度SearchSearch
ResultSummarySearch
决
策远程CodeSearchworkflowSearch
决策内网知识库workflowSearch
决策answerPART04经验和总结业务诉求--效果观测和全球软件质量&效能大会888QE
全链路的AB实验AB实验+用户反馈,推动着产品能力在稳步提高Prompt拼装,任务节点装载等实验多AI能力背后的模型迭代
实验代码切分方式,检索策略
等实验插件业务大盘AI功能,延迟时间等实验本地核心服务端插件模型问题一:同一种通用能力,在不同业务背景下表现有差距案例:同样是Java语言,在服务端,数据研发,终端场景等不同场景有差异问题二:定制化对话诉求如何解案例:A
业务需要定制化检索能力才可以回答问题,通用能力没有覆盖QE
多样化的业务需求基座框架SPI接口定义ServiceProviderCodeFuse默认实现业务定制化策略实现数据层核心思路定义通用SPI接口
,CodeFuse
插件团队提供默认实现同时支持业务定制化,合作团
队基于SPI
规划实现接口定义
后,本地核心服务会合并打包
成一个可执行文件。基于业务
特征自动路由到业务定制化接
口QE
业务定制化方案-RAGQE
业务定制化方案-助手1.定制研发助手定制SystemPrompt,模型,工具集。2.定制助手工具定制对话pipline,业务知识库3.发布助手插件启动后
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026广东广州市白云区人民政府松洲街道办事处第一次招聘项目人员9人备考题库附答案详解(夺分金卷)
- 2026年4月广西梧州市苍梧县城镇公益性岗位人员招聘2人备考题库及答案详解【网校专用】
- 2026河南黄金叶投资管理有限公司所属企业大学生招聘29人备考题库(第一批次)含答案详解(达标题)
- 2026春季新疆克拉玛依市面向高校毕业生招聘事业单位人员120人备考题库有完整答案详解
- 2026山东济南市中心医院招聘博士研究生(控制总量)70人备考题库带答案详解(研优卷)
- 2026吉林四平市事业单位招聘(含专项招聘高校毕业生)25人备考题库(2号)附参考答案详解(精练)
- 2026福建医科大学附属第一医院招聘非在编合同制人员20人备考题库(二)及一套完整答案详解
- 某家具厂涂装操作规范
- 纺织厂客户关系管理规范
- 2026广西来宾合山市融媒体中心招聘见习人员4人备考题库及答案详解【有一套】
- 临床预防呼吸机相关肺炎(VAP)的集束化管理策略
- 翻车机岗位存在的安全风险
- 北京市公路挖掘及路产损坏赔偿指导标准2025
- 足球无人机课件
- 建筑工程项目质量追溯与问题整改方案
- 我的偶像课件文档
- 山东省济宁市兖州区2024-2025学年高二下学期期中考试英语试题(解析版)
- 人民城市人民建-人民城市为人民主题课件(含文字稿)
- 辽宁沈阳卫生高级职称(卫生管理)试题含答案2024年
- 2025年社保业务考试试题及答案
- 大学食堂自营管理办法
评论
0/150
提交评论