CN111814471B 一种信息处理方法、装置、电子设备及存储介质 (腾讯科技(深圳)有限公司)_第1页
CN111814471B 一种信息处理方法、装置、电子设备及存储介质 (腾讯科技(深圳)有限公司)_第2页
CN111814471B 一种信息处理方法、装置、电子设备及存储介质 (腾讯科技(深圳)有限公司)_第3页
CN111814471B 一种信息处理方法、装置、电子设备及存储介质 (腾讯科技(深圳)有限公司)_第4页
CN111814471B 一种信息处理方法、装置、电子设备及存储介质 (腾讯科技(深圳)有限公司)_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

应的搜索词与搜索结果所构成的集合作为搜索2获取搜索引擎的日志信息,并基于所述搜索引擎的日志信息将所述搜索词集合中的不同搜索词映射至相匹配的语义空间,并对所根据所述偏离语义中心的搜索词,确定对应的搜索词与搜索结果所通过所触发的所述分词库单词词典对所述搜索引擎的日志信息进行分词确定与所述不同的词语级搜索词和语句级搜索词所分别对对所述不同的词语级搜索词和语句级搜索词进行除噪处理,形成与所确定对所述搜索词文本进行分词处理时所使用根据与所述分词库的名称,确定与所述搜索词文本相对应的词4.根据权利要求1所述的方法,其特征在于,所述根据不同点击序列中的不同搜索结将所述目标搜索词所对应的至少一个词语级的向量映射至所述语义获取第一训练样本集合,其中所述第一训练样本集合包括至少3通过信息处理模型对所述第一训练样本集合进行处理,以确定所述信响应于所述信息处理模型的初始参数,通过所根据所述信息处理模型的更新参数,通过所述第一训练样本集确定与所述信息处理模型的使用环境相匹配根据所述动态噪声阈值对所述第一训练样本集合进行去噪处理,确定与所述信息处理模型相对应的固定噪声阈值,并对所述第一训练样本集合进行负例处理,以形成与所述第一训练样本集合相9.根据权利要求6所述的方法,其特征在于,所述响应于所述信息处理模型的初始参将所述第二训练样本集合中不同语句样本,代入由所述信息处理模确定所述损失函数满足收敛条件时对应所述信息处理模型中编码器的参数和相应的对所述搜索词集合中的不同搜索词进行迭代处理,直至确定所述信息传输模块,用于获取搜索引擎的日志信息,并基于所4所述信息处理模块,用于将所述搜索词集合中的不同搜索词映射至相匹配的语义空所述信息处理模块,用于基于所述搜索词向量,确定所述搜索词所述信息处理模块,用于根据所述偏离语义中心的搜索词,确定所述信息处理模块,用于根据所述搜索引擎的日志信息所述信息处理模块,用于通过所触发的所述分词库单词词典对所所述信息处理模块,用于确定与所述不同的词语级搜索词和语句级搜所述信息处理模块,用于对所述不同的词语级搜索词和语句级搜索词进行除噪处理,理器执行时实现权利要求1至11任一项所述的信息5确定搜索词与对应的搜索结果所构成的点击[0018]所述信息处理模块,用于根据所述搜索引擎的日志信息所携带的搜索词参数信6[0037]所述信息处理模块,用于通过信息处理模型对所述第一7样本集合和所述第二训练样本集合对所述信息处理模型的编码器参数和解码器参数进行信息处理模型的编码器和解码器构成的自编型中编码器的参数和相应的解码器参数作为所述信息处理模[0055]所述信息处理模块,用于当所述搜索词集合中的不同搜索词均未超出距离阈值89softmax等算法最终输出网页类别。在训练时,模型通过交叉熵等目标函数向正确趋势逼[0094]12)双向注意力神经网络模(BERTBidirectionalEncoderRepresentations括终端10-1和终端10-2)通过网络300从相应的服务器200中获取不同的文章进行浏览或者络300从相应的服务器200中获取与检索指令A相匹配的小程序或公众号,也可以通过网络[0096]在本发明的一些实施例中,服务器200中所保存的不同类型的小程序可以是在不Program),是一种基于面向前端的语言(例如JavaScript)开发的、在超文本标记语言嵌浏览器核心的任意客户端)经由网络(如互联网)下载、并在客户端的浏览器环境中解释[0097]服务器200根据终端输入的搜索词通过网络300向终端(终端10-1和/或终端10-2)[0098]下面对本发明实施例的服务器的结构做详细说明,服务非易失性存储器两者。本发明实施例中的存储器202能够存储数据以支持终端(如10-1)的理器可以采用一个或多个应用专用集成电路(ASIC,ApplicationSpecificIntegrated(CPLD,ComplexProgrammableLogicDevice)、现场可编程门阵列(FPGA,Field-ProgrammableGateArray)或其他电子例所提供的信息处理装置可以直接体现为由处理器201执行的软件模块组合,软件模块可器件(PLD,ProgrammableLogicDevice)、复杂可编程逻辑器件(CPLD,ComplexProgrammableLogicDevice)、现场可编程门阵列(FPGA,Field-ProgrammableGateArray)或其他电子元件执行实现本发明实施例提供的信[0106]本发明实施例中的存储器202用于存储各种类型的数据以支持服务器20的操作。明实施例的从信息处理方法的程序可以包含在可[0107]在另一些实施例中,本发明实施例提供的信息处理装置图2示出了存储在存储器202中的信息处理装置2020,其可以是程序和插件等形式的软件,信息确定搜索词与对应的搜索结果所构成的[0113]继续结合图2示出的服务器20说明本发明实施例提供的信息处理方法,在执行搜备(例如前序图1所示的终端10-1和/或终端10-2)可以在各自对应搜索界面上(例如网页、点击序列可以通过服务器所保存的用户日志,通过获取用户点击行为关联query-doc[0124]继续参考图7,图7为本发明实施例提供的信息处理方法[0127]步骤703:将所述目标搜索词所对应的至少一个词语级的向量映射至所述语义空[0128]其中,信息处理模型可以为双向注意力神经网络模(BERTBidirectionalEncoderRepresentationsfromTransformers),在对其使用之前还需要进行相应的训一训练样本集合和所述第二训练样本集合对所述信息处理模型的编码器参数和解码器参型一个可选的信息处理过程示意图,其中,其中,encoder和decoder部分都包含了6个encoder和decoder。进入到第一个encoder的inputs结合embedding和positional[0132]继续参考图10,图10为本发明实施例中信息处理模型中编码器的向量拼接示意矩阵的维度就和进入下一个encoder的[0133]继续参考图11,图11为本发明实施例中信息处理模型中编码器的编码过程示意信息处理模型的使用环境相匹配的动态噪声阈值需要小于短视频客户端中搜索引擎的动[0136]在本发明的一些实施例中,还以确定与所述信息处理模型相对应的固定噪声阈息处理模型中编码器的参数和相应的解码器参数作为所述信息处理模型的更新参数。由行迭代处理,直至确定所述搜索词集合中所有偏离语义中心的搜索词。取得的query[0149]继续参考图13,图13为本发明实施例提供的信息处理方法一个可选的流程示意短视频播放界面可以是相应的短视频APP中所展现的,也可以是通过微信小程序所触发的(信息处理模型可以经过训练后封装于相应的APP或以插件形式保存于微信小程序中),随

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论