【《基于核主成分分析的电弧故障识别方法分析概述》8200字】_第1页
【《基于核主成分分析的电弧故障识别方法分析概述》8200字】_第2页
【《基于核主成分分析的电弧故障识别方法分析概述》8200字】_第3页
【《基于核主成分分析的电弧故障识别方法分析概述》8200字】_第4页
【《基于核主成分分析的电弧故障识别方法分析概述》8200字】_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于核主成分分析的电弧故障识别方法分析概述目录TOC\o"1-3"\h\u20855基于核主成分分析的电弧故障识别方法分析概述 170871.1电弧故障特征提取方法 1214431.1.1核主成分分析算法理论 1290551.1.2提取电弧故障特征向量 4265751.2电弧故障识别方法 10291901.2.1支持向量机理论 10145571.2.2故障识别模型参数优化 13279231.3电弧故障识别结果分析 16本章提出一种基于核主成分分析(KPCA)和萤火虫算法优化支持向量机(FA-SVM)的串联电弧故障识别方法。首先,通过KPCA算法对电源电压信号、故障相电流信号和正常相电流信号进行处理,来分离电源谐波干扰、非线性负载噪声干扰和串联电弧故障干扰。其次,分析由KPCA计算所得的主元,寻找电弧故障特征,计算故障特征向量。最后,通过FA-SVM建立电弧故障识别模型,实现串联电弧故障的识别。该串联电弧故障识别方法的流程图见图1.1。图1.1串联电弧故障识别方法流程图Figure1.1Flowchartofseriesarcfaultrecognitionmethod1.1电弧故障特征提取方法1.1.1核主成分分析算法理论KPCA算法是在主成分分析(PCA)的基础上,提出的一种改进算法,可以更好的提取非线性、非平稳信号的特征,因此KPCA经常用于线性不可分数据的降维和特征提取[61]。通过计算核矩阵的特征向量就可以分离原始数据中的非相关分量,但是原始数据的信号源数量需要大于或等于非相关分量的数量[62]。因此,本章将电源电压信号、A相电流信号和B相电流信号作为原始数据来分离电源谐波、变频器噪声和电弧故障干扰。主成分分析算法PCA算法可以去除原始变量中的冗余信息,经常用于数据降维、数据压缩和数据噪音消除等领域。PCA算法是一种线性的降维方法,通过线性变换将原始数据转换为一组线性不相关的变量,转换后的变量为主成分。通过比较主成分的方差可以来度量每个主成分保留的信息量,主成分分量的方差越大,表明其保留的信息越多。PCA算法的原理:假设样本集X=(x1,x2,…,xn),其中,,i=1,2,…n。计算样本的协方差矩阵样本的协方差矩阵为:(1.1)(1.2)其中,i,j=1,2,…,n。为的平均值。计算主成分及其方差贡献率计算协方差矩阵的特征值,前p个特征值由大至小排列为,对应的正交化单位特征向量为u1,u2,…uP,。其中,特征值为前p个主成分对应的方差,特征向量为主成分关于原变量的系数。第k个主成分为:(1.3)主成分的方差贡献率可以度量包含的信息量,为:(1.4)确定主成分的个数,计算综合评价值通过计算主成分累积贡献率,确定主成分的个数k。一般认为累积贡献率大于85%时,即可反映原变量的信息,即原变量可由主成分F1,F2,…Fk代替。主成分累积贡献率为:(1.5)主成分得分为(1.6)其中,为第i个主成分的方差贡献率,根据综合得分值可进行评价。在使用PCA算法进行数据处理时,为消除数据量纲的影响,可以先将原始数据标准化。原始数据标准化如下:(1.7)其中和为第j个数据样本的均值和标准差。(1.8)(1.9)核主成分分析算法KPCA通过映射函数𝛷将样本映射到高维特征空间F,并进行PCA分析。通过将数据映射到高维空间,可以使数据在该空间具有更好的可分性。KPCA算法原理:假设数据集为m行n列矩阵X。数据集映射到高维空间为,在高维空间中进行PCA降维,可得:(1.10)其中为高维空间中的特征向量,为对应的特征值。对于任意第个特征向量,是对应的特征值,可得:(1.11)化简式(1.11)可得:(1.12)通过式(1.13)化简式(1.12),则特征向量可以用样本集合线性表示:(1.13)(1.14)把式(1.14)代入式(1.11),化简可得:(1.15)将核矩阵K表示为:(1.16)则式(1.15)可表示为:(1.17)至此对数据集X的降维转换为对核矩阵K的降维。KPCA算法运算步骤如下:选择核函数类型与参数,计算核矩阵K。对核矩阵K中心化。计算核矩阵K的特征值与特征向量,其中特征值按降序排列。对特征向量进行单位化和正交化。给定低维空间数𝑥,计算𝑥个主元。1.1.2提取电弧故障特征向量TC"5.1Modelselection"\l2使用KPCA算法处理电源电压、A相电流、B相电流数据,并提取故障特征向量。选择径向基核函数为KPCA算法的核函数,给定低维空间数为6,计算6个主元。由于本文主要研究在电源谐波影响下的电弧故障检测,所以首先分析了实验电源为U4的实验数据。通过KPCA算法对采样频率为40kHz和实验电源为U4的实验数据进行了计算,部分实验数据的主元图见图1.2和图1.3。图中每个主元只选取了两个周期进行显示,以便更好的观察故障特征。对比图1.2和图1.3,发现图1.2(e)与图1.3(e)、图1.2(f)与图1.3(f)在发生电弧故障前后的曲线形状差别较大。图1.2(e)中曲线近似以高、低尖峰交替循环,并在纵坐标正、负半轴波动的幅值相近。图1.3(e)近似以一个高尖峰循环,且在纵坐标一个半轴波动的幅值较大;图1.2(f)中曲线近似以尖峰交替循环,且在纵坐标一个半轴波动的幅值较大;图1.3(f)近似于正弦曲线的上下循环波动。(a)第一主元图(b)第二主元图(c)第三主元图(d)第四主元图(e)第五主元图(f)第六主元图图1.2U4电源条件下,线路正常状态主元图Figure1.2UnderU4,Principalcomponentdiagramoflineinnormalstate(a)第一主元图(b)第二主元图(c)第三主元图(d)第四主元图(e)第五主元图(f)第六主元图图1.3U4电源条件下,线路故障状态主元图Figure1.3UnderU4,Principalcomponentdiagramoflineinfaultstate在采样频率为40kHz以及实验电源为U1、U2、U3、U5、U6的实验条件下,部分实验数据的第五和第六主元图,见图1.4、图1.5、图1.6、图1.7、图1.8。分析图1.4中的第五主元图和第六主元图可知,图1.4(a)与图1.2(e)曲线走势相同,图1.4(c)与图1.3(e)曲线走势相同。即,第五主元图的曲线在电弧故障发生前为一种曲线走势,在故障发生后为另一种曲线走势,图1.3中的第六主元图也是同样结果。图1.5、图1.6、图1.7和图1.8中的第五、第六主元图也是同样结果。本章使用KPCA算法对10kHz的实验数据进行了计算,得到了与上述一致的分析结果。因此,本章根据第五主元、第六主元在线路正常和电弧故障状态下不同的曲线走势,判断实验线路中是否发生串联电弧故障。(a)线路正常,第五主元图(b)线路正常,第六主元图(c)线路故障,第五主元图(d)线路故障,第六主元图图1.4U1电源条件下,线路正常、故障状态下的主元图Figure1.4UnderU1,Principalcomponentdiagramoflineinnormalandfaultstate(a)线路正常,第五主元图(b)线路正常,第六主元图(c)线路故障,第五主元图(d)线路故障,第六主元图图1.5U2电源条件下,线路正常、故障状态下的主元图Figure1.5UnderU2,Principalcomponentdiagramoflineinnormalandfaultstate(a)线路正常,第五主元图(b)线路正常,第六主元图(c)线路故障,第五主元图(d)线路故障,第六主元图图1.6U3电源条件下,线路正常、故障状态下的主元图Figure1.6UnderU3,Principalcomponentdiagramoflineinnormalandfaultstate(a)线路正常,第五主元图(b)线路正常,第六主元图(c)线路故障,第五主元图(d)线路故障,第六主元图图1.7U5电源条件下,线路正常、故障状态下的主元图Figure1.7UnderU5,Principalcomponentdiagramoflineinnormalandfaultstate(a)线路正常,第五主元图(b)线路正常,第六主元图(c)线路故障,第五主元图(d)线路故障,第六主元图图1.8U6电源条件下,线路正常、故障状态下的主元图Figure1.8UnderU6,Principalcomponentdiagramoflineinnormalandfaultstate经过分析,峭度和偏度可以作为区分上述曲线走势的一个标准。峭度和偏度是衡量数据分布的两个无量纲的指标,可以作为故障特征检测电弧故障。因此,本章分别计算第五主元和第六主元的峭度、偏度,以之作为故障特征向量。设定一组数据为,峭度与偏度的计算公式如下:(1.18)(1.19)其中,Kurt表示峭度,Skew为偏度,为数据平均值。根据采样频率,将第2.2节采集1~12组实验数据划分为一类,13~24组实验数据划分为另一类。第一类实验数据根据1个电流和电压周期进行分段,其中每组实验数据取100个样本,共1200个样本。对每个样本进行核主成分分析,分别计算第五主元和第六主元的峭度、偏度,作为一组故障特征向量。对上述计算结果进行编号和分类,1~600组和601~1200组分别为线路正常和故障状态下的故障特征向量,记为第一类分类样本。第一类实验数据根据2个或以上数据周期进行分段时,计算故障特征向量的计算量过大。因此,并未将其作为对比分类样本。第二类实验数据分别根据1个、2个和3个数据周期进行分段,按照上述方法计算故障特征向量。对计算结果分类,对应记为第二类、第三类和第四类分类样本。四类分类样本的分组见表1.1。采样频率为40kHz时,每个数据周期的数据点个数为800点。采样频率为10kHz时,数据点个数为200点。通过四类分类样本的对比,验证采样频率和计算故障特征向量的数据周期个数对电弧故障识别率的影响。表1.1四类分类样本Table1.1Fourtypesofclassificationsamples分类样本编号采样频率数据周期处理数据点数分组编号第一类40kHz1个2400点1~1200第二类10kHz1个600点1201~2400第三类10kHz2个1200点2401~3600第四类10kHz3个1800点3601~4800第一类分类样本的部分样本见表1.2,正常1#、正常2#和正常3#为正常分类样本,故障1#、故障2#和故障3#为故障分类样本。分类样本的维度为4,通过设立阈值识别电弧故障比较困难。本章拟通过支持向量机建立电弧故障识别模型,实现电弧故障的识别。表1.2第一类分类样本的部分样本Table1.2Partofthesamplesofthefirstcategory故障特征向量正常1#正常2#正常3#故障1#故障2#故障3#第五主元峭度1.45470.94811.10640.16610.33861.8473第六主元峭度1.67622.96591.02061.72982.06738.8548第五主元偏度0.38300.12941.22332.98821.42962.2932第六主元偏度4.95581.88534.506611.12544.57687.55451.2电弧故障识别方法1.2.1支持向量机理论支持向量机(SVM)是一类按监督学习对数据进行二元分类的广义线性分类器,具有很好的鲁棒性、通用性和有效性。SVM的原理是结构风险最小化理论,适用于非线性系统的灰箱或黑箱建模[63]。通过SVM进行线性分类的基本原理为通过建立最优决策超平面,实现不同种类样本之间距离的最大化。图1.9为SVM的二分类示意图,图中方块和圆圈表示两类不同的样本数据。H为最优的分类线,H1和H2为经过样本数据与H平行且最近的直线,H1和H2之间的间隔称为分类间隔。当上述分类问题在高维空间实现时,最优分类线就会转化为最优决策超平面。图1.9SVM的二分类示意图Figure1.9SchematicdiagramofSVMdichotomy设定一组训练样本,,。分类平面为:(1.20)分类间隔为:(1.21)将上述问题转化为带有约束条件的最小值问题:(1.22)当上述样本数据无法进行线性分类时,即无论怎样构建分类线或超平面,都存在错误分类。此时式(1.22)的约束条件不再适用,需要引入松弛变量,错误分类上限为。(1.23)其中,C为惩罚因子,反映对错误分类样本的惩罚程度。C值越大,表示惩罚越严重。当SVM对非线性不可分样本进行分类时,可以通过核函数将原数据转换为。通过将低维空间的点映射待高维空间,把非线性不可分的问题变换为线性可分的问题。此时式(1.23)可转换为:(1.24)引入拉格朗日算法,为拉格朗日乘子,且与样本对应。若非零,即为支持向量,可表示为。此时将优化问题变换为对偶形式为:(1.25)(1.26)由上述推倒可得,优化问题的计算量和高维空间的内积计算相关[64]。通过核函数将数据从低维空间映射到高维空间,解决了非线性不可分的问题。目前常用的四种核函数见表1.3。表1.3常用的四种核函数Table1.3Fourcommonlyusedkernelfunctions核函数表达式参数线性核函数—多项式核函数径向基核函数Sigmoid核函数线性核函数主要用于处理线性可分的问题,具有设置参数少和核运算速度快的优点。多项式核函数属于全局核函数,需要设置3个参数。当多项式的阶次d设置较高时,会增加学习的复杂度,且容易出现过拟合的问题。Sigmoid核函数源自于神经网络,广泛用于机器学习以及深度学习中,运算时需要设置2个参数。径向基核函数属于局部核函数,样本分类型性能较好,应用广泛。径向基核函数只需设置1个参数,函数比较简单,可以通过改变值灵活的调整核函数。与其他核函数相比,径向基核函数更适用解决非线性逼近和函数拟合等问题。因此,本文选择径向基核函数作为SVM核函数,并且使用优化算法优化SVM参数时,需要优化的参数较少。SVM适用于串联电弧故障的识别,将径向基核函数带入式(1.25),优化问题转变为:(1.27)其中,C为惩罚参数,g为核函数参数gamma。通过式(1.27)可知,SVM的分类精度与惩罚参数C和核函数参数g有关。惩罚参数C值过大会造成过拟合,而C值过小会导致样本不能充分训练,造成欠学习和分类准确率降低的问题。以第二类分类样本为例,随机选择参数C和g,使用SVM识别电弧故障。从600组正常样本和600组故障样本中,分别随机选出300组样本作为训练样本,剩余的600组样本作为测试样本。根据参考文献[27],设置参数C的范围为[0.01,100],设置参数g的范围为[0.01,1000]。在参数范围内随机选取4组参数C和g,SVM的识别结果见表1.4。结果表明参数C和g会影响识别结果,并且随机选择的参数难以保证测试样本的识别率达到最高。因此,需要选择最优化算法来计算出最优惩罚参数C和核函数参数g。表1.4SVM随机选择参数的识别结果Table1.4SVMrecognitionresultsofrandomlyselectedparameters运行次数随机C值随机g值识别率117.3184.8892.50%268.9750.4691.33%371.93419.2297.00%478.60716.4895.50%1.2.2故障识别模型参数优化最优化算法是一种搜索过程或规则,通过基于某种机制,以一定的途径或规则得到满足问题的解。最优化算法可以分为精确算法和启发式算法两类。精确算法包括分支定界算法、背景分割算法和动态规划等运筹学中的传统算法,通常用于小规模问题求解。启发类算法包括基于个体和基于群体的两类算法。个体启发算法包括爬山法、模拟退火、禁忌搜索等,特点为收敛速度快,但全局开发能力弱,只能搜索到局部最优解,并且搜索结果完全依赖于初始解和邻域的映射关系。群体启发算法又可分为进化算法和群体智能算法两类,进化算法包括遗传算法、遗传规划、进化策略等,群体智能包括粒子群算法、蚁群算法、萤火虫算法等。群体启发算法可以全局寻优,但计算时间较长。从启发类算法的分支中,选择模拟退火算法(SA)、遗传算法(GA)、粒子群算法(PSO)、萤火虫算法(FA)分别优化惩罚参数C和核函数参数g,通过识别结果选择最优的优化算法。SA为个体启发式优化算法,GA为进化优化算法,PSO和FA为群体智能优化算法。SA理论SA源于固体退火和冷却过程,属于全局优化算法[66]。将固体加温再冷却,固体原子能否排列为晶体结构,在算法中对应全局最优解和局部最优解。SA具有很好的鲁棒性,初始解与最终解均是随机选取。SA具有渐进收敛性,可以跳出局部最优,而以一定的概率收敛于全局最优解。SA会受温度冷却速率的影响,冷却速率缓慢会造成搜索时间长,但可以得到更好的解。若冷却速率快速,搜索时间则较短,但有可能会跳过最优解。SA的运算效率低,对参数依赖性较强,进化速度缓慢。SA基本运算步骤:1)初始化各个参数,随机选择初始解。使当前解,迭代次数,退火温度,并且计算目标函数。2)从当前解的邻域中选择一个新解,并且计算目标函数。3)计算。若,则接受新解。否则根据Metropolis接受准则确定是否接受新解。4)判断是否满足迭代次数。若不满足,返回步骤2)。若满足,则判断是否满足设置的收敛条件。若满足,输出最优解。否则,通过退火速度函数缓慢降低退火温度并更新迭代次数后,返回步骤2)。Metropolis接受准则:若式(1.29)计算的概率值大于区间的随机数,则接受新解,否则保留当前解。(1.28)GA理论GA将问题模拟成一个生物进化过程,通过遗传、交叉、变异、自然选择等操作产生下一代的解,并逐步淘汰适应度函数值低的解,增加适应度函数高的解。GA为一种全局寻优算法,具有快速随机的搜索能力,并且搜索从群体出发,可以多个个体同时进行比较。GA通过概率机制迭代,使用评价函数启发,过程简单且具有随机性。但是GA的搜索速度较慢,若需要得到更精确的解,则需要更多的训练时间。GA中的参数如交叉率和变异率会影响解的选择,而目前这些参数需要人为根据经验设置。GA基本运算步骤:初始化各个参数,并生成初始种群。计算种群中每个个体的适应度值。根据遗传策略,对群体进行选择、交叉和变异操作,生成新一代群体。判断是否满足迭代次数。若满足,输出最优解。否则,返回步骤2)。PSO理论PSO源于鸟群捕食行为特性,将待优化问题看成鸟群,把问题的最优解看作是食物,鸟群在寻找食物的过程中共享信息,最后趋于一个最终的食物,即为最优解。PSO算法通过粒子快速完成搜索,迭代过程中只有最优粒子进行信息传递,搜索速度较快。PSO需要设置的参数较少,结构比较简单,易于实现。PSO容易陷入局部最优,存在收敛精度低以及不易收敛的问题。PSO基本运算步骤:初始化各个参数计算各个粒子的适应度值,并寻找个体和群体的最优解。更新各个粒子的速度与位置。判断是否满足迭代次数。若满足,输出最优解。否则,返回步骤2)。FA理论FA源于萤火虫的活动特性,亮度较强的萤火虫吸引亮度较弱的萤火虫。其中,吸引力与亮度成正比,亮度最高的萤火虫的位置为最优解[65]。FA算法涉及两个因素,萤火虫的发光亮度和相对吸引度:(1.29)(1.30)为萤火虫的最大发光亮度,即处的亮度;为最大吸引度,即处的吸引度;为光强吸收系数;为萤火虫和之间的欧式距离。(1.31),为亮度最高的萤火虫的新位置和旧位置;,为萤火虫和所处的位置;为步长因子;为[0,1]上服从均匀分布的随机因子。FA基本运算步骤:初始化各个参数。随机初始化萤火虫位置,计算目标函数值作为最大发光亮度。计算萤火虫的发光亮度和相对吸引度,确定萤火虫移动方向。更新萤火虫位置,并计算萤火虫亮度。判断是否满足迭代次数。若满足,输出最优解。否则,返回步骤3)。不同优化算法识别结果对比通过SA优化SVM(SA-SVM)、GA优化SVM(GA-SVM)、PSO优化SVM(PSO-SVM)、FA优化SVM(FA-SVM)进行横向对比。算法程序分别设置GA-SVM、PSO-SVM和FA-SVM的最大迭代次数为50次;SA的马可夫链长度为50;GA的交叉率设为10,变异率设为0.9;GA-SVM和FA-SVM的种群规模为10。用于数据处理的硬件设施的处理器为英特尔Corei5-8300H,显卡为NvidiaGeForceGTX1060,内存为8GB。不同配置的硬件设施,计算故障特征向量和进行样本识别的时间略有不同。使用优化后的SVM对第二类分类样本进行分类,从600组正常样本和600组故障样本中,分别随机选出300组样本作为训练样本,剩余的600组样本作为测试样本。识别结果见表1.5,FA-SVM的识别率为98.83%,高于SA-SVM、GA-SVM和PSO-SVM的识别率。FA-SVM在高识别率的情况下,平均识别时间最短。因此,FA-SVM的分类效果最好。表1.5不同类型的SVM识别结果Table1.5DifferenttypesofSVMrecognitionresults优化算法优化C值随机g值识别率平均识别时间SA-SVM11.15178.9698.00%10.66usGA-SVM82.024.1191.17%2.92usPSO-SVM8.4681.7192.83%12.96usFA-SVM45.9839.9798.83%1.86us1.3电弧故障识别结果分析由于训练样本数量、数据采样频率、数据处理周期以及不同故障特征组合会影响电弧故障的识别率,因此有必要对上述影响因素进行分析,使提出的电弧故障识别方法的识别效果达到最佳。TC"5.2Theestablishmentofthepantographarcmodel"\l2选用不同训练样本数量进行电弧故障识别以第一类分类样本为例,选择不同的训练样本数量,使用FA-SVM进行分类,识别结果见表1.6。其中,表中的平均识别时间为单个测试样本的平均识别时间。识别结果表明随着训练样本数量的增加,会提高FA-SVM的识别率。当训练样本个数在400以上时,电弧故障识别率基本不再变化,并且标签错误识别个数在2个之内。设置训练样本个数为400,可以保证电

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论