




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
演讲人:
黄佳01为什么我们仍然在谈论RAG02
RAG落地痛点及优化思路03
企业文档合规性问答系统落地实践04
医疗术语标准化系统的落地实践05知识图谱在医疗术语标准化系统中的应用06
MCP和A2A时代的RAGRAG的落地,往往是面向业务做RAG
,而不是反过来面向RAG做业务——
1.人类与大模型直接对话2.大模型进行知识检索3.大模型进行自主推理大模型时代的知识检索智能体的推理能力落地难点文档的导入和解析(图、表)如何将相关联的内容整体切片或建立起相关联的索引如何处理大规模、分布式向量数据Text2SQL的精细化设计如何构建程序代码的检索系统图数据库和知识图谱和RAG系统的结合如何设计有权限的RAG系统GraphRAG(图
RAG)contextuaRetrieva(基于上下文的检索)Modu
ar
RAG(模块化
RAG)Agentic
RAG(自主
RAG)Mu
ti-Moda
RAG
(多模态
RAG)父子文档索引[0.2I...]文档簇[1.3I...]文档簇检索评估精确率(Precision)F1分数召回率(Reca
)MAPMRR
P@K响应评估BLEU
ROUGEMETEOR扎实性安全性输出解析Pydantic解析器JSON模式工具调用(Function/Tooca
s)压缩查询(问题)RRF、crossEncoder、co
BERTRankGPT、RankLLM排序或过滤、RAG-Fusion校正cRAG如果检索结果不相关再次检索或从新数据源(如网络)检索语义路由
提示词#1
(嵌入/索引)
提示词#2让大模型根据查询问题来自动选择提示词或嵌入/索引方式向量数据库查询(问题)Text-to-cypher自然语言转cypherGraphDB的查询语言查询构建
检索后处理
系统评估向量存储优化思路寻找瓶颈点查询重写
,
查询分解
,
查询澄清子问题、退—步的问题多查询、退—步查询、RAG-Fusion分解或重新表述输入问题生成子问题、退—步的问题或更清晰的问题PDF加载器Directory加载器Unstructured加载器JSON/XML加载器PyPDF、
Unstructured、
PyMuPDFFLAT
、
IVFSQ、PQ、OPQHNSW、DiskANNMi
vus、Weaviate、Pinecone、Qdrant
Faiss、chroma、E
asticsearchSe
f-RAGIRRR基于回答的质量判断是否需要进行查询重写或者重新查询Fine-TuningIcOLBERT基于特定领域的
专用嵌入模型RAGTF-IDFBM25
One-hot编码信息嵌入主动生成
co
heratext-embedding-3-sma文本分块文本块的优化语义分块优化分块可以提升检索和生成的质量查询路由逻辑路由按字符按段落按语义智能分块让大模型根据查询问题来自动选择数据源HyDE生成假设性文档节点-句子窗口递归检索器基于相关性和冗余度进行文档压缩自查询检索器从查询中自动生成复杂RAG范式Langchain
Documents
L
amaIndex
Documents检索前处理层次节点解析器RAPTOR集成检索器多向量检索器 bge-m3选择合适的大模型数据导入查询(问题)Langchainchunks
LamaIndex
Nodesembed-
mu
ti
ingua
-v3.0查询翻译索引优化响应生成自然语言转SQL
SQL结合PGVector稀疏嵌入和密集嵌入多表示索引 [0.
1I...]回答提示工程分块时形成父子文档导入的文档忠实度jina-embeddings-v3分层索引向量数据库——嵌入模型Text-to-SQL习得的稀疏嵌入关系数据库
cSV
fi
e-01.
csv关系数据库分块时形成层级专用嵌入文本块元数据过滤器查询扩展图数据库主动检索图数据库查询(问题)查询(问题)查询(问题)查询(问题)文本块密集嵌入索引重排分块回答fi
e-01.
exce
fi
e-01.jsonfi
e-01.
pdffi
e-01.xm
fi
e-01.txt相关性Foder...?3.
治理
(G)1.反腐败政策、商业道德2.董事会治理、股东权利3.供应链合规
内部审计:企业发布的Sustainability
Report究竟是否符合GRI标准1.
环境
(
E)1.碳排放
(Scope
1,Scope
2,Scope
3)2.能源消耗、用水情况、废弃物管理3.绿色产品和供应链管理2.
社会
(S)1.员工薪酬、
健康和安全2.多样性和包容性(D&I)3.社区发展、客户隐私、数据保护可持续发展报告(Sustainability
Report)是企业或组织自愿发布的一种非财务报告,主要披露企业在环境、社会责任和治理(ESG)
方面的绩效,并展现企业如何管理可持续发展风险和机遇。Q•
如何构建含层次关系的索引(2024年的数据要与其标题有
隶属关系)•
如何在构建索引时保持图表的原始结构化信息•
如何在索引过程中管理文档的元数据信息,进行检索结果的精准过滤与排序•
缺乏统—、有效的评估指标体系•缺少高质量的评估数据集,导致
评估结果不真实•难以追踪评估与改进的闭环,系统难以持续优化•
PDF格式不统一
(文字、图片、
公式、表格)•
文档结构复杂
(章节、标题、子
标题、
段落之间存在多层嵌套关•
表格数据和正文密切相关,强行切分会破坏语义关联信息•
分散在多种来源
(网页、内部文
档库、
第三方数据库等索引设计如何评估文档导入+文档切块向量数据库嵌入索引提取元数据信息
文档入库技术白皮书(公式/图形)财务报表年报文档技术文档API文档政策法规合规文档预处理Agent预处理模块文档文档加载器说明Package/API特点PyPDF使用pypdf加载和解析PDF文件Package高效轻量,适合处理简单PDF文档Unstructured使用Unstructured的开源库加载PDF文件Package/API兼容多种文档格式,支持内容提取和分析AmazonTextract使用
AWSAPI加载PDF文件API云服务支持,适合大批量文档的OCR处理MathPix使用MathPix加载和解析PDF文件API专为数学公式设计,精准解析复杂内容PDFPlumber使用PDFPlumber
加载PDF文件Package丰富的PDF内容控制和处理功能PyPDFDirectry加载目录中的PDF文件Package批量加载,便于处理多个PDF文档PyPDFium2使用PyPDFium2加载PDF文件Package高效解析,支持PDF页面的渲染和转换PyMuPDF使用PyMuPDF加载PDF文件Package速度优化,支持复杂PDF的精细化处理PDFMiner使用PDFMiner加载PDF文件Package适合文本抽取,处理PDF中的嵌入文字内容fromlangchain_unstructuredimportUnstructuredLoader
fromtyping
import
Listfromlangchain_core.documentsimport
Documentpage_url
="https://zh.wikipedia.org/wiki/黑神话:悟空"def
_get_setup_docs_from_url
(url:str)->List[Document]:loader
=UnstructuredLoader
(web_url=url)setup_docs
=
[]#parent_id=None
#初始化
parent_id#current_parent=None
#
用于存储当前父元素
for
doc
in
loader.load
():#检查是否是
Title
或Tableif
doc.metadata
["category"]==
"Title"
ordoc.metadata
["category"]==
"Table":parent_id
=doc.metadata
["element_id"]current_parent
=doc
#更新当前父元素setup_docs.append
(doc)elif
doc.metadata.get
("parent_id")==
parent_id:setup_docs.append
((current_parent,doc))#将父元素和子元素一起存储return
setup_docs除Markdown之外,我还需要构建一套索引系统这个PDF是一个
带表格的结构化数据
,所以直接用SimpleDirectoryReader加载并用SentenceSplitter进行分块后
,
信息可能被破坏
,
从而导致问答效果不佳
嵌入模型密集嵌入embed-mu
ti
ingua
-v3.0[0.
1I...]TF-IDFFine-TuningIcOLBERTOne-hot编码基于特定领域的
专用嵌入模型习得的稀疏嵌入文本分块
数据导入LangchainchunksLamaIndex
NodesDirectory加载器导入的文档文本块Unstructured加载器按语义JSON/XML加载器智能分块Langchain
DocumentsL
amaIndex
DocumentsPyPDF、
Unstructured、
PyMuPDFGraphRAG(图
RAG)contextuaRetrieva(基于上下文的检索)Modu
ar
RAG(模块化
RAG)Agentic
RAG(自主
RAG)Mu
ti-Moda
RAG
(多模态
RAG)父子文档索引[0.2I...]文档簇[1.3I...]文档簇检索评估精确率(Precision)F1分数召回率(Reca
)MAPMRR
P@K响应评估BLEU
ROUGEMETEOR扎实性安全性输出解析Pydantic解析器JSON模式工具调用(Function/Tooca
s)压缩查询(问题)RRF、crossEncoder、co
BERTRankGPT、RankLLM排序或过滤、RAG-Fusion校正cRAG如果检索结果不相关再次检索或从新数据源(如网络)检索语义路由
提示词#1
(嵌入/索引)
提示词#2让大模型根据查询问题来自动选择提示词或嵌入/索引方式向量数据库查询(问题)Text-to-cypher自然语言转cypherGraphDB的查询语言查询构建
检索后处理
系统评估向量存储寻找瓶颈点查询重写
,
查询分解
,
查询澄清子问题、退—步的问题多查询、退—步查询、RAG-Fusion分解或重新表述输入问题生成子问题、退—步的问题或更清晰的问题FLAT
、
IVFSQ、PQ、OPQHNSW、DiskANNMi
vus、Weaviate、Pinecone、Qdrant
Faiss、chroma、E
asticsearchSe
f-RAGIRRR基于回答的质量判断是否需要进行查询重写或者重新查询信息嵌入主动生成语义分块优化分块可以提升检索和生成的质量查询路由逻辑路由co
hera
siva
jina-embeddings-v3bge-m3让大模型根据查询问题来自动选择数据源HyDE生成假设性文档节点-句子窗口递归检索器基于相关性和冗余度进行文档压缩自查询检索器从查询中自动生成复杂RAG范式检索前处理层次节点解析器RAPTOR集成检索器多向量检索器选择合适的大模型BM25
查询(问题)索引优化查询翻译响应生成自然语言转SQL
SQL结合PGVector按字符按段落稀疏嵌入和密集嵌入多表示索引文本块的优化回答提示工程分块时形成父子文档忠实度分层索引text-embedding-3-sma向量数据库Text-to-SQL关系数据库关系数据库分块时形成层级专用嵌入元数据过滤器查询扩展图数据库主动检索图数据库查询(问题)查询(问题)cSVfi
e-01.
csv查询(问题)查询(问题)文本块PDF加载器索引重排分块回答fi
e-01.
exce
fi
e-01.jsonfi
e-01.
pdffi
e-01.xm
fi
e-01.txt相关性Foder...1.
构建两个向量数据库(Summary和
Details),通过Metadata进行链接2.
通过LlamaIndex的IndexNode和PandasQueryEngine3.
也可以通过查询先检索相关表名,然后做Text2SQL4.
对于这个例子,也可以提取年份,用元数据进行Filter思路2:直接检索Summary节点2023年的碳排量2024年的碳排量2025年的碳排量思路1:元数据提取Year
=
2023向量存储语义路由
提示词#1
(嵌入/索引)
提示词#2让大模型根据查询问题来自动选择提示词或嵌入/索引方式让大模型根据查询问题来自动选择数据源索引优化多表示索引[0.2I...]...[1.3I...]文档簇集成检索器
多向量检索器信息嵌入检索评估精确率(Precision)F1分数召回率(Reca
)MAPMRR
P@K响应评估BLEU
ROUGEMETEOR扎实性安全性cSVfi
e-01.
csv提示工程Pydantic解析器JSON模式工具调用(Function/Tooca
s)主动生成回答Se
f-RAGIRRR基于回答的质量判断是否需要进行查询重写或者重新查询稀疏嵌入和密集嵌入密集嵌入embed-
mu
ti
ingua
-v3.0[0.
1I...]TF-IDFFine-TuningIcOLBERTOne-hot编码基于特定领域的
专用嵌入模型习得的稀疏嵌入Langchainchunks
LamaIndex
Nodes按字符按段落分块按语义智能分块语义分块优化分块可以提升检索和生成的质量压缩查询(问题)RRF、crossEncoder、co
BERTRankGPT、RankLLM排序或过滤、RAG-Fusion校正cRAG如果检索结果不相关再次检索或从新数据源(如网络)检索向量数据库查询(问题)Text-to-cypher自然语言转cypherGraphDB的查询语言Foder导入的文档fi
e-01.txtPDF加载器PyPDF、
Unstructured、
PyMuPDF查询构建
检索后处理
系统评估响应生成选择合适的大模型输出解析寻找瓶颈点查询重写
,
查询分解
,
查询澄清子问题、退—步的问题多查询、退—步查询、RAG-Fusion分解或重新表述输入问题生成子问题、退—步的问题或更清晰的问题Modu
ar
RAG(模块化
RAG)Agentic
RAG(自主
RAG)分块时形成父子文档节点-句子窗口递归检索器FLAT
、
IVFSQ、PQ、OPQHNSW、DiskANNMi
vus、Weaviate、Pinecone、Qdrant
Faiss、chroma、E
asticsearchDirectory加载器查询路由逻辑路由Mu
ti-Moda
RAG
(多模态
RAG)contextuaRetrieva(基于上下文的检索)
co
heraHyDE生成假设性文档GraphRAG
(图
RAG)基于相关性和冗余度进行文档压缩自查询检索器从查询中自动生成复杂RAG范式Langchain
Documents
L
amaIndex
Documents检索前处理层次节点解析器RAPTOR bge-m3数据导入文本分块分块时形成层级文档簇BM25
查询(问题)查询翻译自然语言转SQL
SQL结合PGVector父子文档索引文本块的优化回答忠实度jina-embeddings-v3分层索引text-embedding-3-sma向量数据库嵌入模型Text-to-SQL关系数据库关系数据库专用嵌入Unstructured加载器文本块元数据过滤器查询扩展图数据库主动检索
文本块图数据库JSON/XML加载器查询(问题)查询(问题)查询(问题)查询(问题)索引重排fi
e-01.
exce
fi
e-01.jsonfi
e-01.
pdffi
e-01.xm
相关性检索评估精确率PrecisionF1分数召回率Reca...
...MAPMRR
P@K生成评估ROUGEMETEOR扎实性安全性...
...•
评估数据集应该如何构建•
如何设计有针对性的评估机制D我们在此!忠实度评估BLEU真实性
(幻觉)忠实度
(上下文)扎实性
(相关性)安全性
(对齐)整体来说,这些工具用处不大检索评估•
精确率•
召回率•
F1分数•
平均倒数排名•
平均精确率•
P@K生成评估•
BLEU•
ROUGE•
METEOR检索评估精确率(Precision)F1分数召回率(Reca
)MAPMRR
P@K响应评估BLEU
ROUGEMETEOR扎实性安全性忠实度系统评估GraphRAG(图
RAG)contextuaRetrieva(基于上下文的检索)Modu
ar
RAG(模块化
RAG)Agentic
RAG(自主
RAG)Mu
ti-Moda
RAG
(多模态
RAG)父子文档索引[0.2I...]文档簇[1.3I...]文档簇输出解析Pydantic解析器JSON模式工具调用(Function/Tooca
s)压缩查询(问题)RRF、crossEncoder、co
BERTRankGPT、RankLLM排序或过滤、RAG-Fusion校正cRAG如果检索结果不相关再次检索或从新数据源(如网络)检索语义路由
提示词#1
(嵌入/索引)
提示词#2让大模型根据查询问题来自动选择提示词或嵌入/索引方式向量数据库查询(问题)Text-to-cypher自然语言转cypherGraphDB的查询语言向量存储寻找瓶颈点查询重写
,
查询分解
,
查询澄清子问题、退—步的问题多查询、退—步查询、RAG-Fusion分解或重新表述输入问题生成子问题、退—步的问题或更清晰的问题PDF加载器Directory加载器Unstructured加载器JSON/XML加载器PyPDF、
Unstructured、
PyMuPDFFLAT
、
IVFSQ、PQ、OPQHNSW、DiskANNMi
vus、Weaviate、Pinecone、Qdrant
Faiss、chroma、E
asticsearchSe
f-RAGIRRR基于回答的质量判断是否需要进行查询重写或者重新查询Fine-TuningIcOLBERT基于特定领域的
专用嵌入模型TF-IDFBM25
One-hot编码信息嵌入主动生成
co
heratext-embedding-3-sma文本分块文本块的优化语义分块优化分块可以提升检索和生成的质量查询路由逻辑路由按字符按段落按语义智能分块让大模型根据查询问题来自动选择数据源HyDE生成假设性文档节点-句子窗口递归检索器基于相关性和冗余度进行文档压缩自查询检索器从查询中自动生成复杂RAG范式Langchain
Documents
L
amaIndex
Documents检索前处理检索后处理层次节点解析器RAPTOR集成检索器多向量检索器 bge-m3选择合适的大模型数据导入查询(问题)Langchainchunks
LamaIndex
Nodesembed-
mu
ti
ingua
-v3.0查询翻译索引优化查询构建响应生成自然语言转SQL
SQL结合PGVector稀疏嵌入和密集嵌入多表示索引 [0.
1I...]回答提示工程分块时形成父子文档导入的文档jina-embeddings-v3分层索引向量数据库嵌入模型Text-to-SQL习得的稀疏嵌入关系数据库
cSV
fi
e-01.
csv关系数据库分块时形成层级专用嵌入文本块元数据过滤器查询扩展图数据库主动检索图数据库查询(问题)查询(问题)查询(问题)查询(问题)文本块密集嵌入索引重排分块回答fi
e-01.
exce
fi
e-01.jsonfi
e-01.
pdffi
e-01.xm
fi
e-01.txt相关性Foder...医院内存在多种电子病历系统与数据标准临床医生使用非标准化术语记录病情医疗数据分析需要统一术语标准以提高准确性核心挑战•专业术语多样性:同义词、缩写、俚语并存•领域知识壁垒:需要专业医学背景解读上下文•系统适应性:需应对不同科室、不同记录习惯•
实时性要求:诊疗过程中需快速响应SNOMED
CT
标准术语系统搜索术语...
Q慢性心脏衰竭42343007
慢性心力衰竭医疗记录患者症状:-慢性心脏衰竭-血糖升高
-活动时胸痛-
呼吸困难-关节炎症治疗:血液稀释剂两周后复诊标准化后的医疗记录患者症状:-42343007
慢性心力衰竭-27941000血糖水平
升高-活动时29857009
胸痛-267036007
呼吸困难-3723001关节炎血液稀释剂
372924007抗凝血剂血糖
27941000血糖水平胸痛29857009胸痛呼吸困难267036007呼吸困难关节炎症
3723001
关节炎非标术语
SNOMED
CT
标准标准化转换完全限定名称(FSN)同义词可能还有任意数量的同义词被标记为"可接受的"概念73211009SNOMEDCT标识符每个组件都有—个唯—标识符关系,SA
关系糖尿病
IS
A
代谢性疾病每种概念可以根据需要拥有任意数量的属性关系每种语言中有—个FSN被标记为"首选"每种语言有—个同义词被标记为“首选”糖尿病(疾病)每种概念至少要有—个IS_A关系糖尿病属性关系组件描述5获取—个医学概念所有的上下文(语义网络)获取—个医学概念的相关属性。查找某医学概念的所有属性关系(如“部位”
、“过程”
、“因果”
)因果关系概念和属性语义网络检索评估精确率(Precision)F1分数召回率(Reca
)MAPMRR
P@K响应评估BLEU
ROUGEMETEOR扎实性安全性输出解析Pydantic解析器JSON模式工具调用(Function/Tooca
s)复杂RAG范式GraphRAG(图
RAG)contextuaRetrieva(基于上下文的检索)压缩查询(问题)RRF、crossEncoder、co
BERTRankGPT、RankLLM排序或过滤、RAG-Fusion校正cRAG如果检索结果不相关再次检索或从新数据源(如网络)检索语义路由
提示词#1
(嵌入/索引)
提示词#2让大模型根据查询问题来自动选择提示词或嵌入/索引方式向量数据库查询(问题)Text-to-cypher自然语言转cypherGraphDB的查询语言查询构建
检索后处理
系统评估向量存储寻找突破口查询重写
,
查询分解
,
查询澄清子问题、退—步的问题多查询、退—步查询、RAG-Fusion分解或重新表述输入问题生成子问题、退—步的问题或更清晰的问题Modu
ar
RAG(模块化
RAG)Agentic
RAG(自主
RAG)PDF加载器Directory加载器Unstructured加载器JSON/XML加载器PyPDF、
Unstructured、
PyMuPDFFLAT
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高中介绍孔子的课件
- 高三复课防疫知识培训课件
- 高一物理时间轴课件
- 离婚合同财产分割补充:子女抚养费及监护权调整
- 离婚协议书范本:财产分配及子女抚养权明确协议
- 离婚后房产共有权益及管理责任补充协议
- 离婚财产分割协议书:房产、车辆、存款等明细划分
- 广告物料设计代理执行合同
- 骨髓细胞检查课件
- 构建职业教育与产业对接机制的方案
- 质量警示卡模板
- 工厂设备拆除施工方案
- DZ∕T 0219-2006 滑坡防治工程设计与施工技术规范(正式版)
- JJG 86-2011 标准玻璃浮计
- 产业园转让协议样本
- 模具师转正述职报告
- 剪式升降台的驱动机构设计
- 仪表电气专业培训课件
- 路政巡查培训课件
- 《甲状腺危象》课件
- 初二家长学堂讲座课件(怎样和青春期的孩子相处)
评论
0/150
提交评论