CN115408190B 故障诊断方法和装置(北京理工大学)_第1页
CN115408190B 故障诊断方法和装置(北京理工大学)_第2页
CN115408190B 故障诊断方法和装置(北京理工大学)_第3页
CN115408190B 故障诊断方法和装置(北京理工大学)_第4页
CN115408190B 故障诊断方法和装置(北京理工大学)_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

(19)国家知识产权局(12)发明专利(10)授权公告号CN115408190B(65)同一申请的已公布的文献号(73)专利权人北京理工大学地址100081北京市海淀区中关村南大街5号(72)发明人张旭熊辉胡哲源刘检华丁晓宇庄存波(74)专利代理机构北京银龙知识产权代理有限公司11243专利代理师刘倩兰US2022269925A1,20审查员漆丽娟故障诊断方法和装置本发明提供一种故障诊断方法和装置,涉及故障分析技术领域。该方法包括:构建故障诊断网络模型;故障诊断网络模型包括特征提取网络、特征交互网络和特征分类网络;根据工单样本数据、特征提取网络和历史故障数据库,确定用于表征文本语义的第一特征数据和用于表征文本故障主题的第二特征数据;根据第一特征数据、第二特征数据、特征交互网络和特征分类网络,确定训练好的故障诊断模型;根据故障诊断模型与历史故障数据库进行相似度计算,确定历史故障数据库中对应的工单处理信息。本发明的方案,完成对不同案例的诊断,提升了自动化故构建故障诊断网络模型;所述故障诊断网络模型包括特征提取网络、特征交互网络和特征分类网络根据工单样本数据、特征提取网络和历史故障数据库,确定用于表征文本语义的第一特征数据和用于表征文本故障主题的第二特征数据根据所述第一特征数据、所述第二特征数据、所述特征交互网络和所述特征分类网络,确定训练好的故障诊断模型根据所述第一特征数据、所述第二特征数据、所述特征交互网络和所述特征分类网络,确定训练好的故障诊断模型2构建故障诊断网络模型;所述故障诊断网络模型包括特征提取网络、特征交互网络和特征分类网络;根据工单样本数据、所述特征提取网络和历史故障数据库,确定用于表征文本语义的第一特征数据和用于表征文本故障主题的第二特征数据,包括:通过所述特征提取网络的第一预设算法,确定工单样本数据的第一特征数据;所述第一特征数据包括语义长度和嵌入向量维度;通过所述特征提取网络的第二预设算法,根据所述工单样本数据和历史故障数据库,确定工单样本数据的第二特征数据;所述第二特征数据包括主题数量、故障现象主根据所述第一特征数据、所述第二特征数据、所述特征交互网络和所述特征分类网络,确定训练好的故障诊断模型,包括:将所述第一特征数据和所述第二特征数据进行向量乘积交互,确定交互后的权重系数矩阵;根据所述特征交互网络的归一化函数和所述权重系数矩阵,确定处理后的第一权重系数;通过对所述第一权重系数和所述第一特征数据加权求和,确定第三特征数据;所述第三特征数据用于表征融合文本语义和主题的特征数据;根据所述第三特征数据和所述特征分类网络的目标损失函数,确定训练好的故障诊断模型;根据所述故障诊断模型与所述历史故障数据库进行相似度计算,确定所述历史故障数据库中对应的工单处理信息。2.根据权利要求1所述的方法,其特征在于,所述特征分类网络的目标损失函数通过如下方式确定:确定第二特征数据经过所述特征分类网络的第一损失函数、第三特征数据经过所述特征分类网络的第二损失函数和模型参数正则化损失的第三损失函数;根据所述第一损失函数、所述第二损失函数和所述第三损失函数加权求和,确定所述目标损失函数。3.根据权利要求2所述的方法,其特征在于,所述第一损失函数根据预设的第一交叉熵函数以及训练样本的数量确定;所述第二损失函数根据预设的第二交叉熵函数以及训练样本的数量确定;其中,所述第一交叉熵函数和所述第二交叉熵函数均包括:样本的类别标签和样本分类的预测值。4.根据权利要求1所述的方法,其特征在于,将所述第一特征数据和所述第二特征数据将所述第一特征数据和所述第二特征数据进行向量乘积交互,确定语义特征交互矩将所述语义特征交互矩阵进行一层卷积网络处理,确定所述权重系数矩阵。5.根据权利要求1所述的方法,其特征在于,根据所述第三特征数据和所述特征分类网根据所述第三特征数据和所述目标损失函数,确定目标故障分类损失值;若所述目标故障分类损失值低于阈值时,则根据预设函数优化所述特征提取网络、所述特征交互网络和所述特征分类网络,直至所述目标故障分类损失值大于或等于所述阈值时,确定训练好的故障诊断模型。36.根据权利要求1所述的方法,其特征在于,所述方法还包括:基于所述故障特征数据,构建所述历史故障数据库;所述故障数据库包括N个历史故障工单和N个第三特征数据之间的对应关系;第三特征数据以向量形式存储于所述历史故障数据库中;进措施和使用补偿措施中的一项或多项;所述预处理包括噪声信息剔除、重复数据删除和敏感词过滤中的一项或多项。构建模块,用于构建故障诊断网络模型;所述故障诊断网络模型包括特征提取网络、特征交互网络和特征分类网络;第一确定模块,用于根据工单样本数据、所述特征提取网络和历史故障数据库,确定用于表征文本语义的第一特征数据和用于表征文本故障主题的第二特征数据;所述第一确定模块,包括:第五确定单元,用于通过所述特征提取网络的第一预设算法,确定工单样本数据的第一特征数据;所述第一特征数据包括语义长度和嵌入向量维度;第六确定单元,用于通过所述特征提取网络的第二预设算法,根据所述工单样本数据和历史故障数据库,确定工单样本数据的第二特征数据;所述第二特征数据包括主题数量、故障现象主题、故障原因第二确定模块,用于根据所述第一特征数据、所述第二特征数据、所述特征交互网络和所述特征分类网络,确定训练好的故障诊断模型;所述第二确定模块,包括:第一确定子模块,用于将所述第一特征数据和所述第二特征数据进行向量乘积交互,确定交互后的权重系数矩阵;第二确定子模块,用于根据所述特征交互网络的归一化函数和所述权重系数矩阵,确定处理后的第一权重系数;第三确定子模块,用于通过对所述第一权重系数和所述第一特征数据加权求和,确定第三特征数据;所述第三特征数据用于表征融合文本语义和主题的特征数据;第四确定子模块,用于根据所述第三特征数据和所述特征分类网络的目标损失函数,确定训练好的故障诊断模型;第三确定模块,用于根据所述故障诊断模型与所述历史故障数据库进行相似度计算,确定所述历史故障数据库中对应的工单处理信息。8.一种可读存储介质,其上存储有程序或指令,其特征在于,所述程序或指令被处理器执行时实现如权利要求1-6任一项所述的故障诊断方法中的步骤。4故障诊断方法和装置技术领域[0001]本发明涉及故障分析技术领域,特别是指一种故障诊断方法和装置。背景技术[0002]制造行业如航空航天,汽车,加工工业储存的海量故障记录激发了数据挖掘和文本挖掘在历史数据驱动的故障诊断技术中的应用。故障记录包含了产品失效的机制,涉及的零件和故障的现象,可以帮助开展产品分析并指导工作者完成对故障的修复。工业故障记录分为结构化的数据(例如零件的型号序号,运行信号,以及常见的电压电流观测值等可以直接使用计算机来诊断的信息),和非结构化的信息(通常嵌入在文本形式中)。结构化的数值数据可以直接被计算机利用,然而对非结构化的故障记录进行信息检索和诊断通常依赖专业的技术人员的经验,耗时且效率不足。对这类文本记录进行挖掘和分析可以帮助维修工作者完成故障类型的判断,故障原因的分析并检索对应的维修方案。复杂产品的故障往往会涉及不同的零部件,各个零件在不同的故障原因下也会产生不同的故障现象,对应着不同的故障主题类别和解决办法。另外,由于专业词语,多义词,语气词等常见的文本描述问题的存在,都可能造成计算机对于文本的翻译与特征识别产生偏差。不同的厂商及维修人员记录文本的习惯方式的差别也影响着故障特征的提取效果,特征的提取结果作为分类器和相似案例检索的输入直接决定着模型的故障诊断表现。因此,针对不同产品的案例记录,亟需一种能准确提取故障特征,开展智能故障诊断的通用化方法。发明内容[0003]本发明的目的是提供一种故障诊断方法和装置,以解决现有技术方案中故障文本特征提取技术效率不足,特征不细,导致故障诊[0004]为达到上述目的,本发明的实施例提供一种故障诊断方法,包括:[0005]构建故障诊断网络模型;所述故障诊断网络模型包括特征提取网络、特征交互网络和特征分类网络;[0006]根据工单样本数据、所述特征提取网络和历史故障数据库,确定用于表征文本语义的第一特征数据和用于表征文本故障主题的第二特征数据;[0007]根据所述第一特征数据、所述第二特征数据、所述特征交互网络和所述特征分类[0008]根据所述故障诊断模型与所述历史故障数据库进行相似度计算,确定所述历史故障数据库中对应的工单处理信息。[0009]可选地,根据所述第一特征数据、所述第二特征数据、所述特征交互网络和所述特[0010]将所述第一特征数据和所述第二特征数据进行向量乘积交互,确定交互后的权重系数矩阵;[0011]根据所述特征交互网络的归一化函数和所述权重系数矩阵,确定处理后的第一权5重系数;[0012]通过对所述第一权重系数和所述第一特征数据加权求和,确定第三特征数据;所述第三特征数据用于表征融合文本语义和主题的特征数据;[0013]根据所述第三特征数据和所述特征分类网络的目标损失函数,确定训练好的故障诊断模型。[0014]可选地,所述特征分类网络的目标损失函数通过如下方式确定:[0015]确定第二特征数据经过所述特征分类网络的第一损失函数、第三特征数据经过所述特征分类网络的第二损失函数和模型参数正则化损失的第三损失函数;[0016]根据所述第一损失函数、所述第二损失函数和所述第三损失函数加权求和,确定所述目标损失函数。[0017]可选地,所述第一损失函数根据预设的第一交叉熵函数以及训练样本的数量确[0018]所述第二损失函数根据预设的第二交叉熵函数以及训练样本的数量确定;[0019]其中,所述第一交叉熵函数和所述第二交叉熵函数均包括:样本的类别标签和样本分类的预测值。[0020]可选地,将所述第一特征数据和所述第二特征数据进行向量乘积交互,确定交互[0021]将所述第一特征数据和所述第二特征数据进行向量乘积交互,确定语义特征交互[0022]将所述语义特征交互矩阵进行一层卷积网络处理,确定所述权重系数矩阵。[0023]可选地,根据工单样本数据、所述特征提取网络和历史故障数据库,确定用于表征文本语义的第一特征数据和用于表征文本故障主题的第二特征数据,包括:[0024]通过所述特征提取网络的第一预设算法,确定工单样本数据的第一特征数据;所述第一特征数据包括语义长度和嵌入向量维度;[0025]通过所述特征提取网络的第二预设算法,根据所述工单样本数据和历史故障数据库,确定工单样本数据的第二特征数据;所述第二特征数据包括主题数量、故障现象主题、[0026]可选地,根据所述第三特征数据和所述特征分类网络的目标损失函数,确定训练[0027]根据所述第三特征数据和所述目标损失函数,确定目标故障分类损失值;[0028]若所述目标故障分类损失值低于阈值时,则根据预设函数优化所述特征提取网络、所述特征交互网络和所述特征分类网络,直至所述目标故障分类损失值大于或等于所述阈值时,确定训练好的故障诊断模型。[0031]基于所述故障特征数据,构建所述历史故障数据库;所述故障数据库包括N个历史故障工单和N个第三特征数据之间的对应关系;第三特征数据以向量形式存储于所述历史故障数据库中;6计改进措施和使用补偿措施中的一项或多项;[0033]所述预处理包括噪声信息剔除、重复数据删除和敏感词过滤中的一项或多项。[0035]构建模块,用于构建故障诊断网络模型;所述故障诊断网络模型包括特征提取网[0036]第一确定模块,用于根据工单样本数据、所述特征提取网络和历史故障数据库,确定用于表征文本语义的第一特征数据和用于表征文本故障主题的第二特征数据;[0037]第二确定模块,用于根据所述第一特征数据、所述第二特征数据、所述特征交互网络和所述特征分类网络,确定训练好的故障诊断模型;[0038]第三确定模块,用于根据所述故障诊断模型与历史故障数据库进行相似度计算,确定所述历史故障数据库中对应的工单处理信息。[0039]为达到上述目的,本发明的实施例还提供一种可读存储介质,其上存储有程序或指令,所述程序或指令被处理器执行时实现如上任一项所述的故障诊断方法中的步骤。[0040]本发明的上述技术方案的有益效果如下:[0041]上述的技术方案通过提取用于表征文本语义的第一特征数据和用于表征文本故障主题的第二特征数据,并通过特征交互网络将第一特征数据和第二特征数据结合,再通过特征分类网络确定训练好的故障诊断模型,根据所述故障诊断模型与历史故障数据库进行相似度计算,确定所述历史故障数据库中对应的工单处理信息,提升了自动化故障诊断的准确率,增强了模型特征学习的可解释性和对不同故障主题的诊断适应能力。附图说明[0042]图1为本发明实施例提供的故障诊断方法的流程图之一;[0043]图2为本发明实施例提供的故障诊断网络模型的结构图;[0044]图3为本发明实施例提供的特征交互网络的结构图;[0045]图4为本发明实施例提供的故障诊断方法的流程图之二;[0046]图5为本发明实施例提供的故障诊断装置的结构图。具体实施方式[0047]为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。特定特征、结构或特性包括在本发明的至少一个实施例中。因此,在整个说明书各处出现的构或特性可以任意适合的方式结合在一个或多个实施例中。[0049]在本发明的各种实施例中,应理解,下述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。7确定B。但还应理解,根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其它信息确定B。[0053]步骤101、构建故障诊断网络模型;所述故障诊断网络模型包括特征提取网络、特征交互网络和特征分类网络。[0054]本发明中构建的基于文本挖掘的特征提取交互的故障诊断网络模型,称为主题-语义交互特征模型(Topic-contextInteractionModel,TCIM)。如图2所示,按构的具体功能,可将TCIM模型划分为特征提取网络(Gg)、特征交互网络(Gf)和特征分类网络(Gd)三部分,这里,图2的网络结构可以用于下述任意的步骤中,图2中的箭头代表故障原始数据在模型训练时的流动过程。[0055]步骤102、根据工单样本数据、所述特征提取网络和历史故障数据库,确定用于表征文本语义的第一特征数据和用于表征文本故障主题的第二特征数据。其中,工单样本数据为故障案例文本数据,如维修日志和手册等文本形式的记录数据。[0056]该实施例中,第一特征数据可以表示从字或词的角度,挖掘出文本的全局信息,还可以表示为通过注意力机制确定的局部语义特征;第二特征数据是文本故障主题的特征数据,代表了文本中的关键信息,若主题词与候选关键词匹配,则代表候选内容充分代表文本主旨。利用隐含狄利克雷分布(LatentDirichletAllocation,LDA)主题模型构建主题关键词,主题特征评分的依据是候选关键词是否出现在主题特征词里,如果出现,则权重加[0057]步骤103、根据所述第一特征数据、所述第二特征数据、所述特征交互网络和所述特征分类网络,确定训练好的故障诊断模型;[0058]该实施例中,将第一特征数据和第二特征数据通过特征交互网络交互,再通过特征分类网络进一步确定训练好的故障诊断模型。[0059]步骤104、根据所述故障诊断模型与历史故障数据库进行相似度计算,确定所述历史故障数据库中对应的工单处理信息。[0060]本发明实施例中,在确定故障诊断模型后,将待处理的工单数据输入至故障诊断模型中,故障诊断模型可以对待处理的工单数据进行分类,确定分类后的数据或者确定待处理的工单数据的关键信息,根据分类后的数据或者待处理的工单数据的关键信息,与历史故障数据库进行相似度计算,从而发现相近的工单,并返回该工单的处理意见。[0061]需要说明的是,相似度的过程是:经过特征交互网络将第一特征数据、第二特征数据生成包含前两个特征信息的第三特征数据,与历史故障数据库中储存的第三特征数据集进行相似度计算,来找到相似的故障案例从而帮助解决当前问题,故障诊断模型用来帮助完成故障的分类智能诊断。[0062]可选地,相似度计算的计算方法采用余弦相似度的确定方式,通过余弦度量判断两文本的相关程度,如果余弦相似度越大,说明两变量夹角越小,两文本的相似程度就越高,如果余弦相似度越小,说明两变量夹角越大,两文本的相似程度就越低,最终与历史故障数据库对比后,确定所述历史故障数据库中相似度最高的工单处理信息。[0063]本发明的方案可以完成对不同案例的诊断和检索任务,提升了自动化故障诊断的准确率,增强了模型特征学习的可解释性和对不同故障主题的诊断适应能力。8[0065]步骤104、通过所述特征提取网络的第一预设算法,确定工单样本数据的第一特征数据;所述第一特征数据包括语义长度和嵌入向量维度;[0066]步骤105、通过所述特征提取网络的第二预设算法,根据所述工单样本数据和历史故障数据库,确定工单样本数据的第二特征数据;所述第二特征数据包括主题数量、故障现[0067]需要说明的是,主题数量,主题的先验分布为事先确定好的参数(预计研究领域分成几个主题),事先确定可以通过人为确定,或者机器算法确定。这里,第二特征数据的主题是指所有历史故障数据库中包含的故障主题,比如针对汽车领域包含:发动机气缸进排气故障、机械传动故障、电源电池故障类型等。特征提取网络的主题特征模块学习后,将所有历史数据分为对应主题数目的几类,且会为每个主题下对应有相应的词语(即文章-主题和主题-词语概率分布),对每个主题下前几个高频词语对应的嵌入向量加权求平均可以得到最终的第二特征信息,它代表了每个主题下主要的故障现象和原因。[0068]本发明实施例中,特征提取网络(Gg)用于从原始故障数据文本(工单样本数据)中提取有效的故障特征,分为语义特征提取模块(如图2所示)和主题特征提取模块(如图2所示)。语义特征提取模块基于学习到的词向量,利用卷积神经网络提取文本的语义信息,经过归一化,线性整流函数(ReLU函数)以及池化层可以得到需要的文本语义特征向量,即第一特征数据。主题特征提取模块基于文本挖掘中广泛应用的潜在狄利克雷(LDA)主题模型,对案例数据库中的记录进行主题挖掘,得到能够人为观测的故障主题分布及每个主题下的高频词语,对每个主题下的高频词语向量进行加权求和,即得到每个故障主题下的主题特[0069]在一可选实施例中,通过特征提取网络(Gg)进行语义特征和主题类别特征的提取,其中语义特征(第一特征数据)为每个案例文本经过Word2vec(wordtovector)模型和卷积层后输出的语义特征嵌入向量D={d₁,d2,…,d}∈R×°,s为文档的长度,e为设置的嵌入向量维度。主题类别特征(第二特征数据)为根据主题模型的输出(主题-词语概率分布),对每个主题下概率前五名词语的嵌入向量加和求取平均值得到的主题特征向量T={t₁,个分量,每个分量是e维的向量。[0071]步骤104、将所述第一特征数据和所述第二特征数据进行向量乘积交互,确定交互后的权重系数矩阵;[0072]步骤105、根据所述特征交互网络的归一化函数和所述权重系数矩阵,确定处理后的第一权重系数;[0073]步骤106、通过对所述第一权重系数和所述第一特征数据加权求和,确定第三特征数据;所述第三特征数据用于表征融合文本语义和主题的特征数据;[0074]步骤107、根据所述第三特征数据和所述特征分类网络的目标损失函数,确定训练好的故障诊断模型。[0075]该实施例中,在特征交互网络(Gf)中,对提取的主题特征和语义特征进行向量乘积,得到主题-语义关系,即将所述第一特征数据和所述第二特征数据进行向量乘积交互,9分类网络(Gd)的目标损失函数,输出为所有故障类别对应[0083]具体地,所述第一损失函数根据预设的第一交叉熵函数以及训练样本的数量确[0087],公式二;[0092]其中y(①)是第i个样本的类别标签,即样本的真实值;(①)为模型对第i个样本分类的预测值。[0093]综上所述,目标损失函数Lc表示等同如下:[0096]步骤110、将所述第一特征数据和所述第二特征数据进行向量乘积交互,确定语义特征交互矩阵。[0097]该实施例中,将工单样本数据提取后的第一特征数据和所述第二特征数据进行向量乘积交互,即将第一特征数据和所述第二特征数据输入给特征交互网络,特征交互网络的具体网络结构如图3所示。首先,进行向量乘积完成交互计算,得到类别语义特征交互矩阵G=DTT={g₁,g₂,…,g}∈R×k,语义特征交互矩阵G使模型为后面的任务提供了更多的特征信息且保留了模型的可解释性,通过引入主题先验知识,帮助文本的重新表达。[0098]步骤111、将所述语义特征交互矩阵进行一层卷积网络处理,确定所述权重系数矩[0099]为了获得主题-单词对的关联,进一步用一层卷积网络处理语义特征交互矩阵G来捕捉相邻词语的非线性关系。[0100]对于中心为d,从d-n到d+n的每个G向量进行卷积核大小为n的卷积,采用relu激活函数得到卷积后的向量U={u₁,u₂,…,u.}∈R×k,对于第d个卷积向量ua,该卷积过程的公式五如下:[0101]ua=Relu(wGa-n:d+n+b),公式五;得到最终的权重注意力向量V={v₁,V₂,…,vs}∈R×1。V是存储了当前文本中每个单词与主题之间注意力得分的长度为s的向量,用Softmax函数可以将得分转化为主题-单词权重系[0103]其中,第d个主题-单词权重系数计算为:[0105]计算得到权重系数向量β后,和原始的文本语义特征每个单词分量对应加权可以生成新的交互特征H={h₁,h₂,…,hg}∈R×B,该特征就是最终生成的带有主题-单词特征交互关系的新特征,即第三特征数据,它包含了每个案例的文本信息以及类别信[0108]步骤112、根据所述第三特征数据和所述目标损失函数,确定目标故障分类损失[0109]步骤113、若所述目标故障分类损失值低于阈值时,则根据预设函数优化所述特征提取网络、所述特征交互网络和所述特征分类网络,直至所述目标故障分类损失值大于或等于所述阈值时,确定训练好的故障诊断模型。11[0110]本发明实施例中,确定训练好的故障诊断模型中还可以优化语义特征提取网络,特征交互网络和特征分类网络。固定训练好的主题特征提取模块,利用原始数据提取语义特征,完成特征交互和分类预测,得到一轮训练后的目标故障分类损失值;若所述目标故障分类损失值低于阈值时,则根据预设函数优化所述特征提取网络、所述特征交互网络和所述特征分类网络,也就是针对当前损失反向梯度传播,反复优化,重复步骤112,直至所述目标故障分类损失值大于或等于所述阈值时,模型损失收敛结束,确定训练好的故障诊断模型需要最小化L₂损失来约束提取出的主题特征加权后能够尽量贴合分类类别,另一方面,在加入语义特征后,模型需要最小化L₁损失来约束生成的特征能够代表案例完整信息,使得特征分类网络能够辨别故障的类型,使生成的细粒度特征具有故障诊断的能力。训练过程中,模型通过计算特征分类网络中的目标故障分类损失值,并反向传播依次迭代优化特征提取模型和特征交互模型的参数来实现上述优化目标。[0112]还需要说明的是,在上述步骤103之前,首先需要模型初始化。对特征提取网络(Gg)、特征交互网络(Gf)和特征分类网络(Gd)的权值参数进行初始化;其次,试验并确定特征提取网络(Gg)中主题特征提取模块参数;利用原始数据提取主题特征,利用高频词及主题可视化分布方法进行试验确定合适的主题模型参数,充分利用相关技术人员的经验,使得主题特征分布尽量贴近真实的故障特征分布。[0115]步骤115、基于所述故障特征数据,构建所述历史故障数据库;所述故障数据库包括N个历史故障工单和N个第三特征数据之间的对应关系;第三特征数据以向量形式存储于所述历史故障数据库中;计改进措施和使用补偿措施中的一项或多项;[0117]所述预处理包括噪声信息剔除、重复数据删除和敏感词过滤中的一项或多项。[0118]需要说明的是,构建的历史故障数据库中存储的是历史故障案例(历史故障工单)及其对应的第三特征(训练的时候就已经生成,包含了第一、第二特征数据),第三特征数据是向量的形式存储,所以对比传统文本存储和相似文本检索,该方法更加便于储存并且更方便完成案例之间的相似度计算。括人工诊断结果、系统诊断结果,所述系统诊断结果是基于预存的故障诊断系统处理故障特征数据而得到的,N个历史故障工单中包括M个人工诊断结果,所述M为小于或等于N的正整数,所述N为正整数;其中,所述故障特征数据是处理所述历史故障工单的故障详单数据而得到的,所述故障详单数据包括与所述历史故障工单中的故障的发生时间关联的预设时段内的数据。所述故障特征数据包括故产品信息(产品名称、产品型使用补偿措施等)[0120]在一可选实施方式中:建立历史故障数据库,包括产品族/产品平台、产品详细信品族、产品树的形式,将实现相似功能的有同样内部接口的产品组织起来,然后在产品平台上添加不同的个性模块形成产品实例。所有的故障知识都属于某一个产品实例或平台。数据库包括关系层表和应用层表两个数据库表。关系层表中存储着已知的对象关系,应用层表中存储着产品功能和故障之间数据关系,构成了历史故障数据库。[0122]步骤1:从数据库中提取历史故障案例数据(历史故障工单),进行文本预处理,包括专业词的识别并去除停用词,得到故障案例语料库(历史故障数据库)。[0123]步骤2:按照特征提取网络分两阶段提取每一个故障案例的文本语义特征和案例库的整体故障主题类别特征,选择合适的网络层结构参数通过特征交互网络进行特征的生成,并通过特征分类网络中分类器最小化整体损失函数训练模型。[0124]步骤3:针对新的故障案例,对案例测试样本进行预处理后直接输入训练好的模[0125]步骤4:对该案例表征特征可以进行分类预测诊断,并和历史故障数据库中的案例特征进行相似度的计算,找到相似案例,完成对新故障案例的诊断和解决方案检索。[0126]步骤5:将该案例分析检查后加入历史故障数据库进行数据库的不断更新。[0127]综上所述,本发明的方案,通过两阶段提取语义和主题特征并进行交互,得到了考虑故障主题-语义关系下的细粒度案例特征,完成对不同案例的诊断和检索任务,提升了自动化故障诊断的准确率,增强了模型特征学习的可解释性和对不同故障主题的诊断适应能[0129]构建模块501,用于构建故障诊断网络模型;所述故障诊断网络模型包括特征提取[0130]第一确定模块502,用于根据工单样本数据、所述特征提取网络和历史故障数据库,确定用于表征文本语义的第一特征数据和用于表征文本故障主题的第二特征数据;[0131]第二确定模块503,用于根据所述第一特征数据、所述第二特征数据、所述特征交互网络和所述特征分类网络,确定训练好的故障诊断模型;[0132]第三确定模块504,用于根据所述故障诊断模型与历史故障数据库进行相似度计算,确定所述历史故障数据库中对应的工单处理信息。[0134]第一确定子模块,用于将所述第一特征数据和所述第二特征数据进行向量乘积交[0135]第二确定子模块,用于根据所述特征交互网络的归一化函数和所述权重系数矩阵,确定处理后的第一权重系数;[0136]第三确定子模块,用于通过对所述第一权重系数和所述第一特征数据加权求和,确定第三特征数据;所述第三特征数据用于表征融合文本语义和主题的特征数据;[0137]第四确定子模块,用于根据所述第三特征数据和所述特征分类网络的目标损失函[0138]可选地,所述构建模块501中,特征分类网络的目标损失函数通过如下方式确定:[0139]第一确定单元,用于确定第二特征数据经过所述特征分类网络的第一损失函数、第三特征数据经过所述特征分类网络的第二损失函数和模型参数正则化损失的第三损失[0140]第二确定单元,用于根据所述第一损失函数、所述第二损失函数和所述第三损失函数加权求和,确定所述目标损失函数。[0141]具体的,第一确定单元具体用于,所述第一损失函数根据预设的第一交叉熵函数以及训练样本的数量确定;[0142]第二确定单元具体用于,所述第二损失函数根据预设的第二交叉熵函数以及训练样本的数量确定;[0143]其中,所述第一交叉熵函数和所述第二交叉熵函数均包括:样本的类别标签和样本分类的预测值。[0145]第三确定单元,用于将所述第一特征数据和所述第二特征数据进行向量乘积交[0146]第四确定单元,用于将所述语义特征交互矩阵进行一层卷积网络处理,确定所述权重系数矩阵。[0148]第五确定单元,用于通过所述特征提取网络的第一预设算法,确定工单样本数据的第一特征数据;所述第一特征数据包括语义长度和嵌入向量维度;[0149]第六确定单元,用于通过所述特征提取网络的第二预设算法,根据所述工单样本数据和历史故障数据库,确定工单样本数据的第二特征数据;所述第二特征数据包括主题[0151]第七确定单元,用于根据所述第三特征数据和所述目标损失函数,确定目标故障分类损失值;[0152]第八确定单元,用于若所述目标故障分类损失值低于阈值时,则根据预设函数优化所述特征提取网络、所述特征交互网络和所述特征分类网络,直至所述目标故障分类损失值大于或等于所述阈值时,确定训练好的故障诊断模型。[0154]获取模块,用于获取N个历史故障工单,并进行预处理,确定故障特征数据;N为正[0155]第二构建模块,用于基于所述故障特征数据,构建所述历史故障数据库;所述故障数据库包括N个历史故障工单和N个第三特征数据之间的对应关系;第三特征数据以向量形式存储于所述历史故障数据库中;计改进措施和使用补偿措施中的一项或多项;[0157]所述预处理包括噪声信息剔除、重复数据删除和敏感词过滤中的一项或多项。[0158]其中,上述故障诊断方法的所述实现实施例均适用于该故障诊断装置的实施例[0159]本发明实施例的一种可读存储介质,其上存储

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论