CN115455172B 基于深度学习的专利组合推 荐方法及系统 (合肥工业大学)_第1页
CN115455172B 基于深度学习的专利组合推 荐方法及系统 (合肥工业大学)_第2页
CN115455172B 基于深度学习的专利组合推 荐方法及系统 (合肥工业大学)_第3页
CN115455172B 基于深度学习的专利组合推 荐方法及系统 (合肥工业大学)_第4页
CN115455172B 基于深度学习的专利组合推 荐方法及系统 (合肥工业大学)_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本发明提供一种基于深度学习的专利组合请将预先获取的专利数据集划分成专利文本数这三类数据获取专利文本相似度矩阵和专利表最后利用上述真实专利组合和更新专利表征向评分和专利相似性评分为企业进行专利组合推2基于所述专利文本数据获取专利文本表征向量和专利文本相似度矩阵,基于所述专利数据集将每个企业对应的企业专利数据集按照时间顺序划分为真实专将所述专利表征向量利用专利组合表征学习模型学习后获取更新专利利用所述真实专利组合和所述专利组合表征向量每个所述专利预测评分和所述专利相似性评分进行将所述专利关系数据中的所有专利关系按照任意三种专利关系为一个三元组的方式基于所述专利节点关系图数据集训练多关系图卷积神经网络将所述专利节点关系图数据集输入训练好的所述多关系图卷积神经网络模型中获取所述基于专利结构化数据获取专利结构化表将每个所述专利结构化数据转化为一个多维结构化向量,并将所述4.如权利要求1所述的方法,其特征在于,所述专利组合表征学习模型包括Lite将所述专利预测评分和所述专利相似性评分求和得到每个专利的最预设个数个所述最终评分靠前的专利作为一个专利组合进数据获取和划分模块,用于获取专利数据集,并将所述专利3真实专利组合获取模块,用于基于所述专利数据集将每个企业对应的企企业的所有专利中时间划分依据相同的专利视为一个真实专专利组合表征学习模块,用于将所述专利表征向量专利组合推荐模块,用于利用所述真实专利组合和所述专专利相似性评分,并基于每个所述专利预测评分和所述专利相似性评分进行专利组合推将所述专利关系数据中的所有专利关系按照任意三种专利关系为一个三元组的方式基于所述专利节点关系图数据集训练多关系图卷积神经网络将所述专利节点关系图数据集输入训练好的所述多关系图卷积神经网络模型中获取所述基于专利结构化数据获取专利结构化表将每个所述专利结构化数据转化为一个多维结构化向量,并将所述9.如权利要求6所述的系统,其特征在于,所述专利组合表征学习模型包括Lite将所述专利预测评分和所述专利相似性评分求和得到每个专利的最预设个数个所述最终评分靠前的专利作为一个专利组合进4专利关系数据获取专利关系表征向量,以及基于专利结构化数据获取专利结构化表征向[0012]基于所述专利数据集将每个企业对应的企业专利数据集按照时间顺序划分为真[0013]将所述专利表征向量利用专利组合表征学习模型学习后5基于每个所述专利预测评分和所述专利相似性评分[0017]将所述专利关系数据中的所有专利关系按照任意三种专利关系为一个三元组的[0020]将所述专利节点关系图数据集输入训练好的所述多关系图卷积神经网络模型中[0023]优选的,所述专利组合表征学习模型包括LiteTransformer层,所述LiteTransformer层仅由一个TransformerEn选取预设个数个所述最终评分靠前的专利作为一个专利组合进行专[0031]专利组合推荐模块,用于利用所述真实专利组合和所述专利组合表征向量训练6[0034]将所述专利关系数据中的所有专利关系按照任意三种专利关系为一个三元组的[0037]将所述专利节点关系图数据集输入训练好的所述多关系图卷积神经网络模型中[0040]优选的,所述专利组合表征学习模型包括LiteTransformer层,所述LiteTransformer层仅由一个TransformerEn选取预设个数个所述最终评分靠前的专利作为一个专利组合进行专[0044]本发明提供了一种基于深度学习的专利组合推荐方法及7学习更新专利表征向量;最后利用上述真实专利组合和专利组合表征向量训练LSTM模型,8[0069]本实施从Patsnap智慧芽数据库中采集企业历史申请或购买的专利组成专利数据词等的文本预处理操作,然后将预处理后的所有专利文本涉及的全部单词作为一个语料[0076]计算每个单词在每篇专利文本中的TF_IDF值并将该值作为每个单词对于专利文9[0080]其中,tfi,j为第i个字词在第j篇专利文本中的tf值,idfi为第i个字词的idf值,i[0083]进一步得到全部专利文本表征向量集合A=a,eR的li=1,2…,N},N=13684为专[0084]1.3)计算专利文本表征向量集合A中每任意两个专利文本向量之间的余弦相似度,得到专利文本相似向量集合s={s,eR"li=1,2…,N},进而同步可得到一个N×N的专数据信息整理为形如包含(Patent,Belongs_to,IPC),(Patent,Invented_by,Inventor),k1+k2+5维的最终专利表征向量集合p=ip,eR*li=1,2,…,N。在本实施例中令k=k1+k2+中识别到超过1条的交易记录,则说明该专利的最后一条交易记录时间可能并不是源于真[0100]在上述获取的最终专利表征向量集合P中,将每个企业下一次申请或购买专利之从企业历史行为中学习企业申请或者购买专利的兴趣达到高性能要求时所需要的数据量,因此本实施例将Transformer改进为更适合小数据集的LiteTransformer层,该LiteTransformer层仅由一个TransformerEncoder组成。[0103]S42、基于每个企业每个专利组合中所有所述更新专利表征向量获取每个企业的得到全部企业所有历史专利组合表征集合B=tb,eR",*IU=1,2,…,u},其中,mu为企业u后的LSTM模型获取每个专利预测评分,基于所述专利文本相似度矩阵获取专利相似性评[0112]其中,是企业u第ti时刻的专利组合表量,其中,X和Y是LSTM单元中需要学习的权重参数矩阵。f(x)为激活函数,本方法选取用这topk个专利作为下一个时刻企业可能购买的专利组合为[0125]为了验证本发明实施例中一种基于深度学习的专利组合推荐方法在进行专利组专利作为推荐结果。专利文本维度k1设置为64,关系向量维度k2设置为100,Lite_Transformer的多头注意力头数设置为2。transformerencoder层数的灵敏度分析结果中,123412468与企业间的各类关系;HTW为基于专利文本的单件专利推荐方法,其主要考虑专利文本特12345[0157]专利组合推荐模块,用于利用所述真实专利组合和所述专利组合表征向量训练[0160]将所述专利关系数据中的所有专利关系按照任意三种专利关系为一个三元组的[0163]将所述专利节点关系图数据集输入训练好的所述多关系图卷积神经网络模型中[0166]可选的,所述专利组合表征学习模型包括LiteTransformer层,所述LiteTransformer层仅由一个TransformerEn选取预设个数个所述最终评分靠前的专利作为一个专利组合进行专合的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论