CN119416776A 面向知识检索的政务文档增强生成方法、电子设备和介质 (北京大学(天津滨海)新一代信息技术研究院)_第1页
已阅读1页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

地将文本按照篇章结构进行第一层级的语义切2对所述语义完整的文本块进行语义切分,得到多个中粒度文本块,5.根据权利要求1至4中任一项所述的面向6.根据权利要求1至4中任一项所述的面向知识7.根据权利要求1至4中任一项所述的面向8.根据权利要求1至4中任一项所述的面向知识其中,所述存储器(120)存储有可被所述至少一个处理器(113对所述语义完整的文本块进行语义切分,得到多个中粒度文本块,实现如权利要求1至8中任一项所述的一种面向知识检4[0002]检索增强生成(Retrieval_AugmentedGeneration,简称RAG)技术是一种结合信[0010]在一些实施方式中,任一项所述的面向知识检索的政务文档增强生成方法还包5理器执行时实现任一项所述的面向知识检索的政务文档增强[0020]图3为本发明一实施例的面向知识检索的政务文档增强生成方法的示例的原始文[0024]图7为本发明一实施例的面向知识检索的政务文档增强生成方法的文本切片得到6过长则可能在召回多个切片拼接后超出模型的上下文窗口,导致截断进而导致信息丢失,7够将上述标题切分阶段得到的所有不满足预设长度的文本块切分为最细粒度的句子。具体地,针对上述按标题切分得到的最小文本单元,如果其长度超过了设定的文本长度,如民家庭经济状况核对机制进行核查。”等单句,然后对每个相邻句之间进行语义相关的判阶段可以将上述标题切分得到较长的文本按语义分割开,并保持切割开的块内有语义关8取其中的关键信息。问题在原文中很难实际匹配到完整相关信息,但构造问题与实际问题之间信息差异更小,更容易匹配。通过对上述得到的中粒度文本块和分层总结摘要内容进行抽象问题的提问,9算机程序被处理器执行时实现任一项的面向知识检索的政本并进行多级标题的信息合并,能够有效地将文本按照篇章结构进行第一层级的语义切

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论