2025QECon全球软件质量效能大会:知识挖矿技术在研发体系中的实践应用_第1页
2025QECon全球软件质量效能大会:知识挖矿技术在研发体系中的实践应用_第2页
2025QECon全球软件质量效能大会:知识挖矿技术在研发体系中的实践应用_第3页
2025QECon全球软件质量效能大会:知识挖矿技术在研发体系中的实践应用_第4页
2025QECon全球软件质量效能大会:知识挖矿技术在研发体系中的实践应用_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

QECon2025全球软件质量&效能大会

·上海站2025GLOBAL

SOFTWARE

QUALITY

&EFFICIENCY

CONFERENCE

SHANGHAL知识挖矿技术在研发体系中的实践应用杨吉喆|中兴通讯

AI应用教练杨吉喆中兴通讯Al应用教练·

中兴通用无线院Al应用教练,中国CAC联盟认证技术教练·公司级DDD

SA,曾在公司技术架构大会多次获奖·

参与无线院多个项目的Al提效落地实战工作:在需求域、代码域有多个项目的落地实战工作·负责知识挖矿专题,在无线院横推在多个项目落地QECon全球软件质量&效能大会QECon全球软件质量&效能大会01

Al

效能提升的瓶颈:知识体系构建知识体系的策略:知识挖矿03

知识挖矿的技术路径与解决方案

用户收益与后续演进目录CONTENTS全球软件质量&效能大会PART01AI效能提升的瓶颈——知识体系88需求域实例化分析、可行性分析、波及分析需求库、特性库、场景库知识体系(存量)测试域测试设计文本用例生成测试脚本生成测试设计库、测试用例库设计域业务设计、架构设计、非功能设计特性方案库、子系统方案库、服务方案库开发域详细设计代码生成FT生成智能评审组件/模块方案库、代码库知识增强的两大路径口

外挂知识:RAG、知识图谱口

模型内化:Embedding

微调(语义对齐)、LLM

训练(领域适应)垂直领域核心痛点口

存量知识体系零散、不完整口

存量知识显性化不足,大量隐性知识沉淀于业务专家脑中,难以系统

化沉淀与复用。AI驱动的研发流程变革口

研发层次提升:从指令式到意图式口

研发范式演进:从敏捷式到智能式口

研发资产演变:从代码工程到知识工程·AI

驱动的研发流程变革·

知识增强的两大路径·

高质量知识的重要性·

垂直领域核心痛点高质量知识的重要性口

ICML《Physics

of

LanguageModels》关于知识多样性和质量的研究结论口

项目中AI应用实施经验总结背景与挑战需求/设计/测试/代码域全链路自动化的趋势与挑战内容设计统一平台需求方案空间

研发资产库知识飞轮Al应用平台AI应用流大模型需求体系化需求方案库特性方案库体

完善场景库知识抽取语料

生成Al应用场景波及分析需求实例化业务方案设计支撑生产知识库

知识飞轮内嵌全球软件质量&效能大会PART

02构建知识体系的策略

矿88解决思路结构化、图谱化的知识体系需求库

需求方案库

详设库场景库测试用例库子系统方案库知识挖矿碎

化隐性知

化存量知识特性方案库特性库组件库矿源多样化:文档、图片、用例、代码等

技术壁垒高:数据采集、清洗、知识抽取、知识图谱等知识质量差:模板不一致、术语不规范、关系不明确等

人力紧缺:需求交付、过程改进、Al

提效等任务艰巨用户价值矿

源识

消入

知识飞轮知识沉淀

知识反馈工程化挖矿结构化显性化零碎隐性目标:高效、准确、可推广知识体系化建设面临的挑战知

识正向自上而下:通过存量的文档来进

行初步的知识体系构建特点:依赖存量知识的质量,构

建出来的内容可能会不完整,不

准确。逆向自下而上:代码可以实时反馈真

实的业务功能,通过代码挖矿组

件方案,通过组件方案构建子特

性方案,通过子系统方案构建特

性方案,可以比较准确完整的构

建知识体系。价值流方案设计(特性/子系统/服务)方案设计特性方案

子系统方

服务方案需求分析实例化需求分析(特性/子系统/组件)波及分析GWT库

场景库

应用场景正向挖矿:从存量需求方案中挖√

GWT库√子系统方案库√

特性方案库赖依A

景正向挖矿:从FT文本用例中挖√特性库√

功能库√

接口库代码开发组件/模块详设库库

案库功能库

接口库筑基加速逆向挖矿:从FT代码中逆向挖√组件方案库√

模块方案库逆向挖矿:从代码中逆向挖√

组件方案库√模块方案库模块方案库模块库组件方案库组件库库流程库应用知识库挖矿场景子系统

方案库依赖组件库特性库全球软件质量&效能大会PART

03知识挖矿的技术路径与解决方案88概览01挖矿技术架构平

:基于公司主航道平台

DevOps+技术架构:构建了标准化挖

矿流水线,集成了标准化挖

矿算子,提供可扩展的业务

场景和算子能力02内容域正向挖矿关键技术:提供了数据采集、

数据清洗、知识抽取、知识

关系检索、知识融合等标准

化算子挖矿效果评测:针对知识关

系检索、知识融合等提供了

标准化评测算子代码逆向挖矿关键技术:提供了语法抽取、

语义抽取、业务功能分析、架构分析等标准化挖矿效果评测:提供对业务

功能分析、架构分析维度的

评测算子联

合CI数据处理job控制业务规则job控制RAG

构建job

控制数据采集规则解析策略解析内容域正向挖矿流水线格式转换基于规则知识抽取GraphRAG

部署数据清洗知识结构转换GraphRAGIndex通用质量评估业务规则清洗RAG向量库构建说

明知识挖矿流水线是基于DevOps+

平台开发,基

于正向和逆向挖矿两个维

度,各自定义了一套标准

化job,job

stage

可通过配置文件以及自定

义算子方式进行扩展业务检索job控制知识关系

评测知识关系检索知识融合知识入库GraphRAG

检索RAG检索结果合并技术架构设计代码逆向挖矿流水线代码获取

代码获取

语义抽取知识质量

评估业务功能

分析知识入库QE代码架构落地jobs/components/piplines算子大类层代码域静态代码挖矿(yaml)项目1业务配置(yaml)项目3业务配置(yaml)需求域数(

l)理yam据集处通用配置(yaml)业务配置知识index(yaml)业务规则(yaml)算子配置(yaml)

am索生业务规则处理算子数据集处理算子RAG

构建算子通用配置(yaml)(yaml)流水线配置层语义分析算子质量评估算子语法分析算子用户配置层通用配置算子配置算子配置联合CI项目2构建历史项目关系Open

Blue

OceanWall

DisplayAIls

w图

标:S

M

L名

称1code_kn_minerequirement_kn_mine上次成功没有没有上次失败无无上次持续时间无无Number

of

builds图

例Robot

Results/passed/passedRSS全部

RSS失败RSS最新的构建subtask_pipelineAlIS

W

称↓Pipeline

static_code_knowledge_mineFullrojecname:knowtedge_mine_standard_00D12B4B/code_kn_minerstatir_code_knowledge_mineRecentChan95Stage

Viewbase_dataset_processbusiness_retrieval_generatebusiness_rule_kw_extragraphrag_buildAverage

stagetimes:(Averagefull

run

time:~5min

505)A=24

No095资源准备55s55S语法抽取

语义抽取1min

45

3351min

4s

335业务抽取评测

业务分析生成minOs3851min

Os

3Bs知识质量评估

知识入库81ms

1881ms

15资源准备配置解析数

理j

o

b

发质

判断获

配置规则业

j

o

b

发G

r

a

p

h

R

A

G

J

o

b

发业

J

o

b触发归档报告1min12s533ms22min

4s44ms1s77ms1min

56s38min

48s124ms1min12s533ms22min

4s44ms1s77ms1min

56s38min48s124msQE

知识挖矿流水线落地示例JenkinsJenkinsStatus

knowledge_mine_standard目标知识库知识库中关键要素(章节)矿源矿源对应要素(章节)矿源与且标知识库关系分析矿源位置备注特性库特性基本属性:ID、名称等20240625090153&pVersion=R10&pageNum=3855GW

T(场景描述)需求方案设计库需求方案设计中的:产品需求场景描述子

章节需求方案设计库特性方案库参见:业务场景分析#场景分析知识挖矿的输入知识挖矿技术能力支撑备注1业务规则:部分关联关系已

有特性和需求的关联关系已知,可以直接基于关联

关系抽取对应章节内容。·

ICenter空间信息:空间名称、空

间id、页面id1.数据采集:指定ICenter页面数据采

集规则匹配:·业务定制化算子:读取关联QE

内容域挖矿设计——业务场景分析实例化分析stepl:

知识体系梳理

部分特性对外

·设功能定系统····结论:特性库和特性方案库的内容来自特导和需求方案设计库。因此:聚焦重点在如何找特性与需求的关联关系。3.2.2特性与需求关联关系分析④需求库④需求方面车《需求分析报告》《方案设计》《详细设计》3.2.1矿源与目标知识库关系分析跟业务专家分析,特性库和特性方案库的矿源在需求方案库,分类如下:acom

场景树

竞情库

功能树

特性树

用例协作

维设计

设计·特性设计

架构建模

·功能设计

·

日常维护

·①场跟库_测试设计率GWT

库:城知识库要素设计波及分析·特性波及tep·用例波及·工时估算可行性分析·企标对齐·竞情分析·

自我

审·实现思路·价值排序模块设计业务流程设计结构化业

务逻辑设计(SDL)数据设计·

数据结

构设计·

函数接

口设计·

表设计·源文件规划·代码修改点

分析·代码差异分

析找用户问目的画场景·应急容灾·维测工具·性能可靠

性设计流程库

组件库特性方案库维测库接口库安全库方案库#任务假如你是一名xxx专家,请完成如下xxX。首先:XXX其次:xXX最后:xxx注意:xXX。#需求名称%requirement_name%#需求描述%requirement_desc%#备选的特性列表%text%#输出相关的特性:xxx,xxx,xxx分析过程:xxx,xxx,xxx##输出示例:Prompt

设计:思维链进行任务拆解;给出

个输出示例;

提升指令跟随能力RA

G

向量库检索构建向量库

RAG检索RAG

召回率提升:·

多路召回:三个向量库·

多种检索方式:语义、

全文、混合·

RRK·

数据清洗RAG

检素A应用流需求名称关键技术——知识关系抽取借助公司主航道平台DN

Studio

Al应用和知识库来构建RAG

检索,构建知识之间的关联关系资源准备业旁向量库内容抽取paGVvectorB:file_regrex:“雷求方案设计”。chapter:["5.1需求名称"Vector_DB_Folden“需求名称向量库”DataSet_Source:(chapter["5.1需求描述”,7.1用户目的,"9.1关键按术判LLM_Summary:True,PromptTemplate:”露求评相查节总结”Vector_DB_Folden:“雪求详细意节向量库”向量库需求名称向量库需求总结向量库需求关键段落库切

分需求名称一个chunk需求名称+需求总结

一个chunk需求名称+章节切分DNStudio知识库

DN

Studio

RAG检索

(向量库)特性名称:混合检素+语义检素需求总结向量库特性名称+特性描述;灌合检索+语义检索知识入库合并去重后的需

求名称配置解析LLM

提炼总结AIM电信大模型728需求名称段著内容需求总结的内容结构化数据库丝务质量评

知识转换RAG向量库

构建RAG

构建&RAG

向量检素按照名称

合并RAG

检索需求名称Prompt项目协同∨内容库Q

请输入名称回车搜索田□

U7-01

场景库田□U7-02特性库田□

U7-03

需求分析库曰□

U7-04需求方案库田BU7-04-01田

U7-04-02田□U7-05特性UseCase库田□

U7-06

特性方案库田□

U7-07

(子)系统方案库田□U7-08

需求详设库田□U7-09组件库田□U7-10

功能库田□

U7-11

特性功能库田□U7-12流程库田□U7-13接口库田□

U7-14需求特性库田□

U7-15网元库□U7-16

用户库需求方案(增量特性设计、方案设计)需求方案名称需求方案创建位置守护人关联特性方案关联组件方案术语涉及产品系统架构协作流程性能指标设计特性文档特性名称(标题)特性状态守护人修订记录关联需求关联测试用例关联大场景关联故障术语收益(价值)特性定义相关特性应用场景/功能组件设计文档组件名称守护人组件描述组件结构图组件内的子组件、模块列表组件内的子组件、模块的业务流特性与组件映射组件对外接口1:N(子)系统方案文档(子)系统名称守护人功能简介(子)系统架构图消息模型设计组件间接口设计可维设计安全设计市场需求市场需求编号需求标题市场需求初始描述工作量预估指派给关联任务场景文档守护人铁三角原始述求Want需求洞察Need市场分析Demand研发分

析Requrement

组网架构规格特征用户目的概要方案场景建模4+1视图版本关联(变更记录)需求分析文档需求名称(标题)状

态分析人市场需求初始描述定系统找用户问目的画场景设功能可行性分析波及分析工作量评估关联特性关联场景关联测试用例需求评审记录UseCase

档用例名称用户目的触发时机交互流程验收准则功能大类详设名称(标题)守护人业务逻辑设计数据结构设计源代码规划修改点定位函数设计特性方案文档特性名称特性方案守护人特性描述特性价值特性功能列表整体方案说明算法数据结构特性依赖识别高性能设计可靠性设计特性安全设计功能协作设计关联接口说明维测设计DNStudio需求体系化2.0内容库三规则管理组织级规则项目级规则知识体系示例需求体系化NMNNMDN

Studio

工作台

项目协同

AI应用开发首页

默认空间国基本信息围应用配置可用插件

9

向n

Daba资源库

APi访问图成员配置用户输入援索结果超

误他握索站案口知向nDue5内量配置RRF

进行合并和排序.Datnt

5en□知识向量[Datze基本设置想控索站案RAG

知识关系检索示例文

物假如防是一名50C(5C

哄心腕家内溶列眼口

执得

cpte34Cona+9e1就求列表日知的向量Date肉E

瓶内初理家结来搜索站碳为空A

收生配置Datastle应

用编辑DN

Studio

AI

应用流(向量库)需求名称向量库需求名称需求总结向量库需求名称需求关键段落切分需求总结的内容结构化数据库RAG调优方法●prompt

设计Stageo:

需求内容总结输入

Prompt●top-k特性名称:混合检索特性名称和特性描述

特性描述:混合检索特性名称●内容质量prompt

设计

LLM

能力评估按照名称QE

故障定界定位定

:●通过检索测试查看RAG

向量库内容是否存在

存在:1)通过知识库检索测试分析RAG

相关

参数设置是否合理2)业旁分析内容是否完善3)输入业务分析:是否跟向量库内容关联定

:RAG

向量库没有召回定

:·Prompt

设计是否合理●LLM

推理分析是否正确(业务分

)●业旁内容是否完备(业务分析)定

:Prompt

中包含目标,LLM

没有召回RAG

检索特性名称:混合检索特性名称特性描述:混合检索特性名称特性描述:混合检索DN

Studio知识库

(向量库)需求名称向量库需求总结向量库需求关键段落切分定

:输入源是否内容丢失Stageo:需求内容总结LLM定

:输入内容质量不高

目标测试集不对输

:特性名称和特性描述需求名称需求名称需求总结的内容需求详情●原始需求描述●产品需求场景描述●特性拆分●需求MR

拆分简述●需求背景分析中没有包含目标按照名称合并需求名称需求总结的内容结构化数据库合并去重后的需

求名称Prompt

LLM需求名称

段落内容输

Prompt定界:Prompt1UAB队

CDEFGHIJKLMN1idxtask_tyinputoutputsub_fieDNStudiDNStudiscenariscenariTexecutiraw_T▼11m_no_rag

no

rag_redI8特

析{"feature{"metri~s":「、J17.25

48·

L25.31

t"27.C

0FJ.1

1

2.027Cr244可南

用SI

GV元挥需66.67%66.67%34.24619{"et1

s.「c:1{'R7.22.2set()100.00%)”R:23.5

8=1°.1?J25”,"R7.

:3C21.

2(

02R52.02.”,"R2720.n

5",R72016.02.5","R1.

.

R).1

7.

2043FSNV远

需评测用例示例2

7.【输入】:代码库【输出】:plantuml

或者UML格式的代码架构视图(分层架构、

模块功能、类图等)【加工过程】:首先:分析代码目录结构其次:代码目录/模块/文件职责分析再次:代码目录/模块依赖关系分析最后:上述内容整合生成代码架构视图(视图底部描述关键模

块功能)【输入】:代码库【输出】:功能列表,包含功能描述、功能函数入口

【加工过程】:首先:让LLM分析所有UT/FT用例其次:1

)

让LLM分析总结各个文件内部核心功能2)基于代码目录结构和各个文件内部核心功能提炼功能清单最后:基于上述的两种方式输出功能清单让LLM进行聚合【输入】:功能清单、代码库【输出】:功能设计思路:流程设计、算法设计、数据结构设计

【加工过程】:首先:代码调用链分析其次:函数依赖的结构体分析最终:上述内容整合优化,生成设计思路,生成流程设计,

关键数据结构设计

代码逆向挖矿设计

业务分析

知识加工分析

关键技术穿刺

工程化技术穿刺(Tech)系统整合(System)运营演进

(Operation以PATSO

模型为牵引,以项目化运作方

式,进行AI研发提效各个实践的落地,

减少各自探索的成本。特性方案子系统方案组件/模块方案组件功能是基础,

像堆积木,最小

粒度功能搭建成

一个完整的功能组件代码

架构视图功能清单功能设计分析组件

架构视图分

析功能清单分

功能设计(Prepare)业务分析(Analysis)PATS

O

子过程并行迭代.项目准备QE

代码逆向挖矿设计——关键技术目录结构Repo-Map

是一款先进的工具,用于生成AI增强的软件仓库综合分析报告。它为开发者提供项目结构、文件用语义分析包括:模块功能/文件职责/函数功能自底向上逐层生成函数语义、文件语义、模块

语义以及对象关系语法解析Tree-sitter是一个用于增量解析的解析器生成工具(ParserGenerator),

要用于源代码的语法分析途及多编程语言的潜在注意事项等宝贵见解。QE

挖矿成果展示-语法解析结果量卡…基于知识图谱的知识工程平台C知识图谱管理本体可视化

实例可视化

实体数据源

关系数据源

studio查询

成员管理搜索条件:◎配置项

function.

×

a

口节点长度:搜索实体结

体宏定义函

数functnUTCRUP

Pic

UTCRL

gaisgapp/mainctrl/sourcDiserhcLcM_functouiu

patomap-……yusgusgepmle

tl,ome

smsinctenaMALspururlOumyAsymilnfoDlaform/apcompt/aisg/asepninctro

0AsMreMgHandleh.nUTCARRUJ/app,platfor.l/apn

com

ne.-/aisgapp/m

ainct/urc,p_isgnnctrl

ALAi

MCtrl

ownload日志查询1

+QE

挖矿成果展示-目录结构和语义分析-4db9-97cθ-3d0b4b9b8502":"nameb8502""node_"laye"node_d"responsibility":“是进

刊,"description

":“达米

义了

结5进度百八比和可造的1信息","returnvalue"“无区E佰类曲蜘模卫用于头例化刈象。“DtupFai"Rut###bc3a942c-4957-4847-b26f-c5f10110f9c0":

{"name":"StenFa"uuid":"bc3u⁴2c-49.7-4847-b26f-c5f10110f9ce","node_path":"c-c'nrices/

nLoleis/proyiess

cuncrn'lnn"Layer":

"model","node_desc":{"type":“其他”,"responsibility":

“定义步骤"description";Revlewnextfile"Suepomteemst###1dbb6564-6390-4805-"name":"StepC

…Rq|e","uuid":"1dbb6564-6390-4805-8958-a42bf28f001a"node_path"

:"s-c/in+o-"layer":"model","node_desc":{"type":

赋值”,"responsibility":"Ccepcumplece^u

s

构"description";"1.初

始S

epnmp

ne

ut

类两一可选字段"returnvalue":“该类不具返回直,具重回开、初始化头,\"步

更\"\"\"步骤完成请习m","node_src_content":

"LlasS+p

"child_nodes":[,"referenced_struct":

[]"node_src_content”:"c

、ass

"child_nodes":

[,"referenced_struct":

[](Us

M

1):\noe).n2.1应用层功能描述功能入口功能描述'vst择

m:凶”

比且导待利、下#

?

啁e2.2服务层功能列表2.2.1功能入口:U

功能描述腋函数AIC

看响待北态利作忙

中削主

“T

的二二事立的配香程做理

绿

日吉”态,换4

.

5

.

寸树厂用发调邮Q

E

挖矿成果展示-组件功能以及消费反馈5.业务增效1.生成两个组件列表与组件的子功能介绍;2.将生成的信息内嵌到团队的故障助手中,为故障助手提供素材;内嵌到团队的故障助手的使用反馈;组件方案设计_

227~

-

0010+0(eASom置SO电性心事掣开设置、导效果还可以哦管子

R同张栩1028797916:50A50m件的主警A

下几个方画:e宁周站或全球软件质量&效能大会PART

04用户收益与后续演进QE

用户收益与后续演进Pipelinebase_dataset_process需要如下共数用于构建项目FEATURE_AFTECT_REQUIREMEN|so性波及需求应用AREQUIREMENT_AFFECT_FEATURes

口建师内建

f需求波及特性应用五SCENE

REQUIREMENTF_SMARTDOC_ALARM001工程力孵化成熟借助赛马平台,搭建项目知识挖矿流水线,在需求域、开发域、运维域,均有知识挖矿应用的成熟案例:流水线:

at

rac

hrild2dol21StatusChangesBuildwith

Parameters配置Full

Stage

Vew查有结果JobConlig

HistoryOpen

BlueOcean重命名Test

ResultsAnalyzer流水线语法Build

History

构纭历史=HIST

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论