CN118885570B 一种检索系统的文本排序方法、装置、电子设备 (北京微步在线科技有限公司)_第1页
CN118885570B 一种检索系统的文本排序方法、装置、电子设备 (北京微步在线科技有限公司)_第2页
CN118885570B 一种检索系统的文本排序方法、装置、电子设备 (北京微步在线科技有限公司)_第3页
CN118885570B 一种检索系统的文本排序方法、装置、电子设备 (北京微步在线科技有限公司)_第4页
CN118885570B 一种检索系统的文本排序方法、装置、电子设备 (北京微步在线科技有限公司)_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

地址100082北京市海淀区知春路76号(写输入文本进行多维度特征解析,得到待检索数2所述根据预先构建的精确排序模型对所述候选数据进行精确排序,得到确定所述预估评分符合评估阈值的候选数据将所述待检索数据的主语信息与所述第二候选数据的主语过滤所述第二候选数据中主语信息与所述待检索数据的主语信息不匹配根据所述优化后的分段文本构建所述知识库文档,所述知识库3.根据权利要求2所述的检索系统的文本排序方法,其特征在于,所述对所述表格信对所述表格信息的总结性文本、所述图片信息的总结性文本和所对所述知识库文档进行查询,得到所述知识库中每个子文档的主分别将所述待检索数据的主题信息与每个所述子文档的主题信息以及每个所述子文若所述待检索数据的主题信息与每个所述子文档的主题信息以及每个所述子文档中3提取所述第一候选数据中具有不同细粒度的将所述待检索数据的语义特征与所述第一候选数据的语义特征根据细去除所述第一候选数据中,语义信息的细粒度与所述待检索数据的多维度特征解析模块,用于对所述用户输入文本粗略排序模块,用于根据预先构建的知识库文档对所述待检索精确排序模块,用于根据预先构建的精确排序模型对所确定所述预估评分符合评估阈值的候选数据将所述待检索数据的主语信息与所述第二候选数据的主语过滤所述第二候选数据中主语信息与所述待检索数据的主语信息不匹配4[0002]现有技术的生成式搜索引擎中,粗召回策略主要着眼于段落文本的局部语义特文本深层含义和上下文背景的理解不足,从而使得检索结果与用户的查询意图产生偏差。5[0025]分别将所述待检索数据的主题信息与每个所述子文档的主题信息以及每个所述[0026]若所述待检索数据的主题信息与每个所述子文档的主题信息以及每个所述子文[0031]将所述待检索数据的语义特征与所述第一候选数据的语义特征根据细粒度进行[0035]根据所述精确排序模型对所述候选数据进行评估,得到所述候选数据的预估评6[0039]在上述实现过程中,根据精确排序模型对候选数据进行评估后进而进行二次校[0043]过滤所述第二候选数据中主语信息与所述待检索数据的[0048]粗略排序模块,用于根据预先构建的知识库文档对所述待检索数据进行粗略排[0049]精确排序模块,用于根据预先构建的精确排序模型对所述候选数据进行精确排7[0064]图1是本申请实施例提供的检索系统的文本排序方法的流[0070]本申请通过引入多特征融合检索策略、知识库文档质量优化以及对cross_8[0093]分别将待检索数据的主题信息与每个子文档的主题信息以及每个子文档中的分9[0094]若待检索数据的主题信息与每个子文档的主题信息以及每个子文档中的分段文[0099]主题识别方法主要用于过滤知识库文档中与用户查询的语义特征上有关联但在[0111]在上述实现过程中,根据精确排序模型对候选数据进行评估后进而进行二次校[0118]在主语匹配过程中,对用户查询的主语信息与候选数据的主语信息进行对比分[0119]主语识别主要用于解决在精确排序过程中用户查询的主语信息与候选数据的主[0144]分别将待检索数据的主题信息与每个子文档的主题信息以及每个子文档中的分[0145]若待检索数据的主题信息与每个子文档的主题信息以及每个子文档中的分段文[0158]在上述实现过程中,根据精确排序模型对候选数据进行评估后进而进行二次校机程序,该处理器运行计算机程序以使电子设备执行实施例一的检索系统的文本排序方[0170]上述的处理器31可以是通用处理器,包括中央处理器(CentralProcessing[0173]输入输出单元用于提供给用户创建任务以及为该任务创建启动可选时段或预设算机程序被处理器执行时实现实施例一的检索[0176]本申请实施例还提供一种计算机程序产品,该计算机程序产品在计算机上运行显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、[0178]另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论