版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
本说明书实施例提供一种推送信息的生成成模型,预测出至少一个字符序列作为候选文生成模型在预测作为候选文案的词汇序列的过程中通过指针分布对词表中的词汇概率分布进2依次将各个训练样本对应的源序列作为生成模型的输从文案库中匹配出包含超过预定数量的场景相关对文案库中的各个文案提取关键词,确定各个文案对应将匹配到的相关文案分别输入预先训练的分类模型,以确定各个相关文案的文案类5.根据权利要求1所述的方法,其中,所述生成模型包括编码神经网络和解码神经网将接收的源序列及所述编码神经网络根据源序列得到的输出结果在各个时刻向所述将所述解码神经网络在各个时刻的预测词汇分别与在后面添加一个序列结束标识的将所述指针分布权重作为所述词表中词汇的词汇分布概率的权重系数,将1与所述指针分布权重的差,作为当前时刻所述编码神经网络所接收词汇的词汇分布概率的权重系3依次将各个词向量输入预先训练的生成模型,根据所述语义向量和序列开始标识,通过所述解码神经网络的神经按照各个概率选择满足以下条件之一的字符序样本生成单元,配置为对各个相关文案分别进行关键词模型训练单元,配置为依次将各个训练样本对应的源4选择单元,配置为从所述候选文案中选择出符合条件的5[0003]自然语言处理(NaturalLanguageProcessing)可以用于研究能实现人与计算机用往往体现在如何根据被推送方信息和/或推送信息进行更精准、更具有针对性的信息推[0004]本说明书一个或多个实施例描述了一种基于自然语言处理生成推送信息的方法6经网络根据源序列得到的输出结果在各个时刻向所述解码神经网络的神经元传递,同时,将前面添加一个序列开始标识后的目标序列按顺序依次在各个时刻输入所述解码神经网[0019]按照各个概率选择满足以下条件之一的字符序列,7[0023]模型训练单元,配置为依次将各个训练样本对应的源序列作输入生成模型内的源序列中的关键词出现在8[0037]图5示出根据一个实施例的在生成推送信息过程中通过指针分布对词汇概率分布[0044]其中的生成模型可以是基于自然语言处理的神经网络,编码解码网络(Encoder-[0047]在本说明书实施例中,训练样本可以基于与当前场景相关的多个相关文案每个相关文案可以具有多个关键词作为样本特征,相关文案本身可以作为对应的样本标9[0053]在另一个实施例中,可以对文案库中的各个文案提取关键词(提取过程将在下文的相同词汇数目/场景相关词汇与第一文案的关键词的数目之和。当第一文案与场景相关以称为候选词。将每一个词作为一个节点建立图模型,节点与节点之间的边由词与词之间的共现决定。词与词之间的共现由一个固定大小的窗口(以选择序列到序列(Seq2seq)的模型作为生成模型,即编码解码网络(Encoder-Decoder)。汇形成的词汇序列或各个词汇对应的词向量固定长度的语义向量。然后将该语义向量传递给神经网络302,该语义向量通过神经网络[0075]输入隐状态加权生成contextvector(语境矢量,也就是前文所说的语义向量)定词表中各个词汇的分布概率。hsxptr是生成模型的在模型训练过程中进行调成模型的输出遵循该原则,根据一个可能的设计,还可以在指针生成器(Pointer[0095]其中,min(af,cf)表示当前词汇注意力向量af和历史注意力向量总和cf的[0100]图6示出根据一个实施例的推送信息的生成方法流程图。该方法的执行主体可以例如可以是,独热表示(one-hotrepresentation)、矩阵分布表示(GloveVector)、“是”作为在第二时刻神经网络302的神经元输入,同时将神经网络301得到的语义向量保“是”作为第二时刻的神经元输入时,得到各个词汇作为Y2输出的概率分布,例如为“我”[0123]其中,在生成模型中的解码神经网络通过集束搜索的方法预测词汇序列的情况[0128]根据一个实施例,可以在步骤603中最终输出的预定数量的概率最大的词汇序列);k的概率。以LSTM神经网络为例,可以将训练样本的各个句子拆分得到的字符单元对应的字符向量,率1作为标签调整模型参数,从而对LSTM神经网络进行训练。对字符单元序列P(S)=W1,符序列,可以筛选出通过预测模型预测的概率最大的预定数量(如1个)的字符序列作为待推送目标的推送信息,也可以筛选出通过预测模型预测的概率超过[0135]根据再一个实施例,还可以先对步骤603中确定的至少一个词汇序列按照是否完[0136]根据其他实施例,还可以通过人工在步骤603得到的候选文案中筛选出符合需求[0147]将编码神经网络接收的源序列及根据源序列得到的输出结果在各个时刻向解码[0148]将解码神经网络在各个时刻的预测词汇分别与在后面添加一个序列结束标识的[0149]在进一步的实施例中,解码神经网络在第一个时刻的输出结果是预定数量的词刻的输出结果基于根据注意力机制确定的词表中当[0150]假设第一时刻的指针分布权重与当前时刻的神经元状态、当前时刻神经元输出、模型训练模块通过指针分布对词表中的词汇概[0151]将指针分布权重作为词表中词汇的词汇分布概率的权重系数,将1与指针分布权[0153]值得说明的是,图7所示的装置700是与图2示出的方法实施例相对应的装置实施[0161]按照各个概率选择满足以下条件之一的字符序列,[0162]值得说明的是,图8所示的装置800是与图6示出的方法实施例相对应的装置实施以将这些功能存储在计算
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 老年高钙营养食品研发工程师考试试卷及答案
- 2025年中鼎国际建设集团有限责任公司招聘2人笔试历年参考题库附带答案详解
- 2025年2月云南思茅产业园区企业用工193人笔试历年参考题库附带答案详解
- 2025山东省环保发展集团生态有限公司及权属企业招聘10人笔试历年参考题库附带答案详解
- 2025山东信圆金属科技有限公司招聘12人笔试历年参考题库附带答案详解
- 2025国冶西南有限公司公开招聘(16人)笔试历年参考题库附带答案详解
- 2025四川宜宾高县国盛劳务派遣有限责任公司招聘劳务派遣人员3人笔试历年参考题库附带答案详解
- 2025吉林省矿业集团有限责任公司遴选31人笔试历年参考题库附带答案详解
- 2025内蒙古鄂尔多斯市育知人才开发服务有限公司艺术类岗位招聘16人笔试历年参考题库附带答案详解
- 2025内蒙古北疆交通天然气有限公司招聘6人笔试历年参考题库附带答案详解
- 第5单元 单元教学设计 2026统编版三年级语文下册
- 《2026年》纪检监察室岗位高频面试题包含详细解答
- 公路机电安全培训课件
- 土地测量服务投标方案(技术方案)
- 2026年郑州黄河护理职业学院单招职业技能测试题库及完整答案详解1套
- 2024年全国职业院校技能大赛ZZ058 动漫制作赛项规程以及动漫制作赛题1-10套
- 车转租合同(标准版)
- 管道工程竣工验收报告范本
- 非遗宋锦课件
- 索尼摄像机HXR-MC2500说明书
- 电力施工项目部安全培训课件
评论
0/150
提交评论