CN111460311B 基于字典树的搜索处理方法、装置、设备和存储介质 (腾讯云计算(北京)有限责任公司)_第1页
CN111460311B 基于字典树的搜索处理方法、装置、设备和存储介质 (腾讯云计算(北京)有限责任公司)_第2页
CN111460311B 基于字典树的搜索处理方法、装置、设备和存储介质 (腾讯云计算(北京)有限责任公司)_第3页
CN111460311B 基于字典树的搜索处理方法、装置、设备和存储介质 (腾讯云计算(北京)有限责任公司)_第4页
CN111460311B 基于字典树的搜索处理方法、装置、设备和存储介质 (腾讯云计算(北京)有限责任公司)_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本申请涉及一种基于字典树的搜索处理方采用本方法能够有效提高业务数据的存储效率2根据所述搜索字符的字符序列在预构建的字典树中查找相应节点确定为公共前缀节点,将所述公共前缀节点的最后一个字符节点确定为直接前缀节在所述目标搜索子树中遍历所述直接前缀节点对应根据所述搜索字符和各字符串生成搜索建议词,将各字符串对根据所述权重对各搜索建议词进行排序,将排序后的搜索建议词基于各业务关键词对应的搜索热度确定各业务基于所述公共前缀词,根据各业务关键词生成包括所述公共前缀词的业务关键词集基于各业务关键词集合中的业务关键词以及对应的权重构根据所述公共前缀词确定各业务关键词相应的字符串,并确定所述基于所述公共前缀词和各业务关键词的字符序列构建字典树的至少一个公共前缀节将各业务关键词的权重存储至相应字符串对应的字若所述字符串包括字符子集,将各业务关键词对应的权重存储至若所述字符串不包括字符子集,在所述字符串的节点末端配置叶5.根据权利要求2至4任一项所述的方法,将所述各业务关键词以及对应的权重分发至各子树集群标识对应的子树集群服务器,通过各子树集群服务器基于接收的各业务关键词以及对应的权重构建3基于所述散列值和预设算法确定所述各业务关键词对应根据所述存储位置对各业务关键词分配相应的根据所述直接前缀节点确定在所述目标搜索子树中的查找路径,根据所述查找路径在所述目标搜索子树中遍历与所述直接前缀节点获取当前字符节点的权重,当所述当前字符节点的权重为空时,根据所述查找路径确定所述叶子节点对应的字符串和所述9.根据权利要求7至8中任一项所述的方法,其特征基于各字符串的权重分别确定与各字符串对应的搜索基于所述权重对各搜索建议词进行降序排序,基于排序结将获取的搜索建议词返回至所述终端,并按照所述排序结果通过根据预设频率获取历史业务数据,所述历史业务数据包括业务关键根据各业务关键词的当前搜索热度确定各业务关键基于各业务关键词以及对应的当前权重更新所若所述业务关键词中包括更新业务关键词,提取所述更新业务根据所述更新业务关键词的前缀字符确定对应的更新字符和字符序列;基于所述字符序列将所述更新字符和对应的当前权重更新所4数据搜索模块,用于根据所述搜索字符的字符序列在预构建的字数据处理模块,用于根据所述搜索字符和各字符串生成搜索建字典树构建模块,用于获取业务数据,所述业务5字典树更新模块,用于根据预设频率获取历史理器执行时实现权利要求1至12中任一项所述的方法6[0003]随着互联网技术的迅速发展,利用输入框对输入的内容进行搜索的需求日益增7业务关键词集合中的业务关键词以及对应的权重构建字符子集,将各业务关键词对应的权重存储至所述字符串的最后一个字符节点的权重空间;[0017]在其中一个实施例中,所述字典树构建模块还用于获取各业务关键词中的首字节点确定目标搜索子树;根据所述直接前缀节点确定在所述目标搜索子树中的查找路径,[0021]在其中一个实施例中,所述数据搜索模块还用于获取所8后的搜索建议词返回至终端进行展示。通过在字典树中分别配置字符和权重的存储空间,9[0049]人工智能(ArtificialIntelligence,AI)是利用数字计算机或者数字计算机控服务器104根据搜索字符在预构建的字典树中查找相应的字符节点,根据字符节点在字典服务器104可以用独立的服务器或者是多个服务器组成的服务器[0061]字典树中包括公共前缀,公共前缀可以表示多个字符串计算机设备进而在字典树中查找该字符序列对应的字符节点,并将计算机设备则可以进一步根据目标搜索建议词进行索处理方式中,计算机设备根据搜索字符在字典树中仅可以匹配出相应的多个搜索建议索热度将多个搜索建议词进行排序并返回给序后的搜索建议词返回至终端进行展示。通过在字典树中分别配置字符和权重的存储空中已插入的某个单词是否是该单词的公共前缀。若当前字符串包括其他字符串的公共前词,在字典树中则可以直接在公共前缀词的字符节点下构建多个业务匹配词相应的子节个公共前缀节点,根据各业务关键词的字符序列以及相应字符串的字符构建相应的子节设备可以根据公共前缀词以及相应字符串的顺序确定业务关键词集合中每个业务关键词业务关键词的权重存储至该字符串对应的叶的末端构建相应的叶子节点,并在叶子节点存储预设的结束字符,例如结束字符可以为等多个业务词构建的树形结构,可以为字典树中的其中一个子树。由此计算机设备能够有效地存储业务关键词对应的字符以及权重。[0116]计算机设备获取各业务关键词以及对应的权重后,获取各业务关键词中的首字符构建相应的子节点;将各业务关键词的权重存储至相应字符串对应的字符串的节点中,集群标识对应的子树集群服务器。通过各子树集群服务器对各业务关键词进行分词处理,[0125]计算机设备获取各业务关键词以及对应的权重后,获取各业务关键词中的首字[0126]具体地,计算机设备可以采用取模算法或一致性哈希算法对散列值进行计算出31^(4-2)+110*31^(4-3)+103=103*31*31*31+111*31*31+110*31+103=31查找终端输入的第一个字符,并继续根据字符序列在字典树中查找终端输入的第二个字标搜索子树中的公共前缀节点则为字符串集合对应的[0138]计算机设备进而可以利用公共前缀字符和字符串集合中的多个字符串分别生成树里没有该搜索词,计算机设备则不向终端返回搜索建议词。若根据搜索字符在字典树中在字典树中查找搜索字符对应的字符串,同时也能够快速有效地获取到字符串对应的权从目标搜索子树的搜索根节点为起点分别查找对应的多而能够有效地根据查找路径确定该条查找路径下叶子节点所对应的字符串以及字符串的[0149]计算机设备搜索字符后,获取搜索字符对应的字符串的第一个字符对应的散列典树集群中可以包括多个带权重字典树子树[0153]计算机设备根据搜索字符在字典树中查找到与搜索字符并利用多个字符串和权重生成公共前缀节点对应的字符串集合。因此生成的字符串集合中而利用搜索字符和字符串集合中的多个字符串分别生成多个搜索建议词,从而可以得到若搜索建议词的数量超过预设数量阈值,则在排序后的多个搜索建议词中提取预设数量阈值的搜索建议词,并将提取的搜索建议词按照排序结果返回至终端,并在终端的搜索界面返回相应的搜索建议词的推送结果的界面示意图。[0161]计算机设备则需要将更新业务关键词和对应的当前权重更新至字典树中。具体[0174]本申请还提供一种应用场景,该应用场景应用上述的基于字典树的搜索处理方9中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在各子树集群服务器基于接收的各业务关键词以及对应的权重发至子树集群标识对应的目标子树集群服务器,通过目标子树集群服务器基于搜索字符,从预构建的字典树中获取相应的搜索建议词和对应根据预设频率获取历史业务数据,历史业务数据包括业务关键词和对应的当前搜索热度;[0191]在一个实施例中,字典树更新模块还用于若业务关键词[0192]关于基于字典树的搜索处理装置的具体限定可以参见上文中对于基于字典树的包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论