CN111291182B 热点事件发现方法、装置、设备及存储介质 (平安科技(深圳)有限公司)_第1页
CN111291182B 热点事件发现方法、装置、设备及存储介质 (平安科技(深圳)有限公司)_第2页
CN111291182B 热点事件发现方法、装置、设备及存储介质 (平安科技(深圳)有限公司)_第3页
CN111291182B 热点事件发现方法、装置、设备及存储介质 (平安科技(深圳)有限公司)_第4页
CN111291182B 热点事件发现方法、装置、设备及存储介质 (平安科技(深圳)有限公司)_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

道福安社区益田路5033号平安金融中本发明公开了一种热点事件发现方法,包粗略聚类结果中依次取同一类别内的文章两两2基于爬取的文章数量,确定粗略聚类的类别数量,并使用预置聚将各文本对进行预处理后依次输入预置的文本对模型进行处理逐一对每一顶点进行分区试探划分,以将每个顶点划分到与该顶若最大模块度变化值大于0,则将对应顶点划分到最大模块度变化值对应的邻居顶点将所有在同一分区内的顶点压缩成一个新的顶点以构建新的事件图各顶点之间的边的权重设置为新顶点的环的权重以及将不同分区间的边的权重设置为各获取用于训练文本对模型的训练样本,其中,所述训练样本为文本采用预置词典或字典,对各词或字进行编码,得到各文本对中两篇文章将各文本对中两篇文章对应的字符编码向量输入嵌入层以转换为矩阵文本对中两篇文章对应的矩阵向量分别输入两个独立且同层的卷将两个卷积层各自提取到的特征分别输入池化层,以计算同一文本将各文本对中两篇文章对应特征之间的相似度以及降维后的特征输入全连接层进行3将分词处理后的词或字转换为词向量,并根据所述类别数量,采配对模块,用于从所述粗略聚类结果中依次取同一类别内的文模型处理模块,用于将各文本对进行预处理后依次输入预置的文本对模型进行处理,分区划分单元,用于逐一对每一顶点进行分区试探划分,以将点相邻的邻居顶点所在分区内,并计算各顶点划分前后对应的所述事件图的模块度变化新图构建单元,用于将所有在同一分区内的顶点压缩成一个新的顶6.如权利要求5所述的热点事件发现装置,其特征在于,所述热点事件发现装置还包4模型构建模块,用于将各文本对中两篇文章对应的字符编码向量输入程序被所述处理器执行时实现如权利要求1-4中任一项所述的热点事件发现8.一种计算机可读存储介质,其特征在于,所述计件发现程序,所述热点事件发现程序被处理器执行时实现如权利要求1-4中任一项所述的5言处理的一个重要领域,在互联网的海量文章中发现热点事件需要经过一系列的文本处负样本为取不同事件的文章之间两两配对并取抽样以及取相似事件之间的文章两两配对得到;6对应特征之间的相似度以及对提取到的特征[0018]将各文本对中两篇文章对应特征之间的相似度以及降维后的特征输入全连接层[0022]若最大模块度变化值大于0,则将对应顶点划分到最大模块度变化值对应的邻居区内各顶点之间的边的权重设置为新顶点的环的权重以及将不同分区间的边的权重设置[0025]重复执行构建新的事件图的处理流程,直到整个事件图78两个文本的重要特征并对特征进行相似度计算,从而可判断两个文本是否讲的是同一事1004可选的可以包括标准的有线接口、无线接口(如W可选的还可以是独立于前述处理器10019[0072]本领域技术人员可以理解,图1中示出的热点事件发现设备的硬件结构并不构成用户接口1003主要用于侦测确认指令和编辑指令等。而处理器1001可以用于调用存储器实施例中采用构建事件图的方式实现对多个相同事件对应的文章再次进行热点事件聚类,[0108]本实施例中优选使用PairCNN模型对文本对进行深度学习,先经过一个嵌入层[0119]步骤S1604,重复执行分区试探划分的处理流程,直至所有顶点对应分区不再变并将同一分区内各顶点之间的边的权重设置为新顶点的环的权重以及将不同分区间的边以便于后续将分词处理后的词或字转换为词向量。本实施例对于词向量的转换方式不限,的文章两两配对得到;[0153]模型构建模块100,用于将各文本对中两篇文章对应的字符编码向量输入嵌入层件发现程序被处理器执行时实现如上述任一项实施例中所述的热点事件发现方法的步骤。出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论