CN114020866B 搜索结果的排序方法、装置、电子设备及存储介质 (山东库睿科技有限公司)_第1页
CN114020866B 搜索结果的排序方法、装置、电子设备及存储介质 (山东库睿科技有限公司)_第2页
CN114020866B 搜索结果的排序方法、装置、电子设备及存储介质 (山东库睿科技有限公司)_第3页
CN114020866B 搜索结果的排序方法、装置、电子设备及存储介质 (山东库睿科技有限公司)_第4页
CN114020866B 搜索结果的排序方法、装置、电子设备及存储介质 (山东库睿科技有限公司)_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本申请涉及一种搜索结果的排序方法、装2根据所述多个搜索结果分别对应的领域分类,查询预设的不同从每个所述搜索结果中提取与所述各个文本特征相关的特针对每个所述搜索结果,根据与所述各个文本特征相关的特根据每个所述搜索结果与所述查询词的语义相似度,确定每个所其中,所述针对每个所述搜索结果,根据与所述各个文本特针对每个所述搜索结果,计算与所述各个文本特征相关的特征数据分根据所述第一语义相似度以及所述各个文本特征的权重参数进行相应地,所述根据每个所述搜索结果与所述查询词的相似度,确根据所述每个所述搜索结果与所述查询词的相似度,以及每个所述搜索结果的热度,根据每个所述搜索结果所属应用程序的第一排名数据,确定所述所属应用程序的热根据所述所属应用程序对应的意图以及所述查询词对应的意图,确从所述所属应用程序的文本信息中提取至少一个应用关键词,并根据用关键词与所述查询词之间的词向量相似度以及所述至少一个应用关键词的逆文本频率利用BM25算法确定所述查询词与所述所属应用程序的文本信息之间的第一相关性分根据所述第一相关性分数以及所述第二语义相似度,确定所述所根据所述所属应用程序的热度、所述查询词与每个所述搜索结3所述根据所述每个所述搜索结果与所述查询词的相似度,以及所述每个根据所述每个所述搜索结果的所属应用程序的得分、所述每个所根据所述每个所述搜索结果所属应用程序的第一排名数据,以及所述每根据所述所属频道对应的意图以及所述查询词对应的意图,确定所从所述所属频道的文本信息中提取至少一个频道关键词,并确定所述至利用所述BM25算法确定所述查询词与所述所属频道的文本信息之间的第二相关性分根据所述第二相关性分数、所述第三语义相似度以及所述所属应用程序根据所述所属频道的热度、所述查询词与每个所述搜索结果所所述根据所述每个所述搜索结果的所属应用程序的得分、所述每个所根据所述每个所述搜索结果的所属频道的得分、所述每个所根据每个所述搜索结果与所述查询词的语义相似度、所述所属参数确定模块,用于根据所述多个搜索结果分别对应的领域分类,查特征提取模块,用于从每个所述搜索结果中提取与所述各个文本特征相关的特征数语义相似度计算模块,用于针对每个所述搜索结果,根据与所4相似度确定模块,用于根据每个所述搜索结果与所述查询词得分确定模块,用于根据每个所述搜索结果与所述查询词的相似度针对每个所述搜索结果,计算与所述各个文本特征相关的特征数据分根据所述第一语义相似度以及所述各个文本特征的权重参数进行算机程序,所述计算机程序被处理器执行时实现如权利要求1-5任一项所述的搜索结果的处理器执行时实现如权利要求1-5任一项所述的搜索结果的排序方56定与各文本特征匹配的权重参数来计算语义相似度进而确定搜索结果与查询词的相似度及搜索结果的得分,实现了在对搜索结果进行排序时结合不同领域下特征的优先级的差7[0035]应当理解,本公开的方法实施方式中记载的各个步骤可相互依存关系。[0038]图1为本申请一实施例提供的搜索结果的排序方法的流程示意图,该方法可以由的对应关系,不同的领域分类下各个文本特征对应的权重参数可以通过实验或者经验确8数据与查询词之间的第一语义相似度;如果某个文本特征的特征数据是一个句子或一段料数据和搜索结果)训练得到词向量模型用来获取词汇的词向量,也可以基于大规模公开9该对应关系来确定每个搜索结果对应的各个文本特征的权重参数,进而针对每个搜索结用单一特征进行排序导致排序的准确性差的技[0065]通常,搜索结果的下载量和评分的高低也能在一定程度上反映该搜索结果的质[0076]示例性地,可以将搜索结果与查询词之间的相似度和搜个应用关键词与所述查询词之间的词向量相似度以及所述至少一个应用关键词的逆文本[0082]利用所述BM25算法确定所述查询词与所述所属应用程序的文本信息之间的第一名数据(称为第一排名数据),并根据第一排名数据确定每个搜索结果所属应用程序的热[0091]示例性地,可以通过如下公式(2)计算得到查询词与各个搜索结果的所属应用程意图的词向量与所属应用程序对应的意图的词向量之词向量相似度,并将每个应用关键词的逆文本频率指数(InverseDocumentFrequency,IDF)值作为权重值对每个应用关键词的词向量与查询词的词向量之间的词向量相似度进是常用的确定查询词与文档之间的相关性的算法,本申请对其具体的处理过程不作详述。Sim(APP,query),加权系数可以预先设定。当然,也可以采用求均值等其索结果所属应用程序的热度,P(APP|query)为通过上述公式(3)计算得到的所属应用程序[0108]根据所述每个所述搜索结果所属应用程序的第一排名数据和在所述所属应用程[0111]利用所述BM25算法确定所述查询词与所述所属频道的文本信息之间的第二相关名数据(称为第一排名数据)以及获取各个搜索结果在所属应用程序中的所属频道的排名[0119]示例性地,可以通过如下公式(5)计算得到查询词与各个搜索结果的所属频道之2意图的词向量与所属频道对应的意图的词向量之间示搜索结果所属频道的热度,P(Channel|query)为所属频道与查询词之间的相似度,P(Channelintent|qintent)为通过上述公式(5)计算得到的查询词与搜索结果所属频道之间的[0132]能够理解的是,本申请实施例中所涉及的公式中的每个部分可以设置对应的参[0135]步骤201,利用BM25算法确定每个所述搜索结果与所述查询词之间的第三相关性[0136]能够理解的是,BM25算法是比较常用的确定查询词与文[0146]特征提取模块330,用于从每个所述搜索结果中提取与所述各个文本特征相关的[0150]排序模块370,用于根据每个所述搜索结果的得分,对所述多个搜索结果进行排[0160]应用热度确定模块,用于根据每个所述搜索结果所属应[0163]根据所述至少一个应用关键词与所述查询词之间的词向量相似度以及所述至少[0165]应用相似度确定模块,用于根据所述第一相关性分数以块或者单元的特征和功能可以进一步划分为由多个模块或者单储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执其上读出的计算机程序根据需要被安装入存述计算机程序被处理器执行时实现上述实施例所述的搜索结果的排序方[0189]需要说明的是,本申请所示的计算机可读存储介质例如可以是—但不限于—电、[01

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论