【《基于k-means聚类的局部放电诊断方法分析案例》5000字】_第1页
【《基于k-means聚类的局部放电诊断方法分析案例》5000字】_第2页
【《基于k-means聚类的局部放电诊断方法分析案例》5000字】_第3页
【《基于k-means聚类的局部放电诊断方法分析案例》5000字】_第4页
【《基于k-means聚类的局部放电诊断方法分析案例》5000字】_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGE2基于k-means聚类的局部放电诊断方法分析案例目录TOC\o"1-3"\h\u45031.1k-means聚类算法 194361.2基于k-means的局部放电诊断模型 5244161.3结果与分析 111.1k-means聚类算法k-means聚类算法是常用的聚类算法之一,指的是利用数据集中样本的相似性等规律,根据样本之间的欧式距离的不同将其归类为多个不相交的子集来达到分类的目的,通常这些子集称作簇(Clusters)。其中“k”指的是算法最终将实现聚类的簇数,“means”指的是每个簇的聚类中心由该组数据的均值决定。k-means算法流程如如下:1)自定义聚类的类别数量k,并随机在数据中选取k个点作为聚类簇的初始中心点;2)根据计算数据集中每个点到各聚类中心的欧式距离,将每个点按照“就近原则”分别划分到距离最近的簇中心,形成k个簇;3)分别计算这k个簇中所有点的均值作为新的簇中心;4)不断重复2)和3)部分,直到选定的簇中心不再变化为止,此时的k个簇为根据数据集的相似性得出的最终聚类结果。k-means聚类算法的关键在于如何将数据集中的点划分到距离最近的聚类中心所在的簇中,其中相似性度量函数的选取很大程度的影响了k-means的聚类效果。以两个k维向量和为例,常见的相似性度量函数如表4-1所示。表STYLEREF1\s4SEQ表\*ARABIC\s11常见的相似性度量函数及其表达式相似性度量函数表达式欧氏距离马氏距离曼哈顿距离兰氏距离图STYLEREF1\s4SEQ图\*ARABIC\s11k-means算法流程图根据所提取的多光谱局部放电特征量的数据集特性,本文选用欧氏距离作为相似性度量函数,对k-means聚类算法中相关参数描述如下:数据集,其中,是一个n维向量,指的是第i个数据的n种特征量,m是数据集中样本的个数。每个簇的中心,其中,第j个簇的中心为,每个簇中心也包含n个特征量,k表示簇数。点与簇中心间的距离可由式(4-1)计算:(4-1)每个簇的聚类中心可由式(4-2)计算:(4-2)式中:——同一簇中点的个数。典型的k-means聚类过程如图4-2所示,为了将如图4-2(a)所示的原始数据通过k-means分为四类,首先应在数据集中随机选取四个点作为初始的中心,经过两次迭代计算并更新聚类中心后得出的最终结果如图4-2(e)所示。(a)原始数据(b)随机选择初始聚类中心(c)第一次迭代(d)第二次迭代(e)聚类结果图STYLEREF1\s4SEQ图\*ARABIC\s12k-means聚类过程示意图对于本局部放电诊断模型而言,待聚类的数据集为7个光谱波段下的放电脉冲数占比、脉冲最大幅值占比和脉冲平均幅值占比,是一个高维数组。为了使k-means聚类运行更高效并且能更直观的看到聚类结果,首先应对数据集进行降维。目前常用的降维方法有:主成分分析法(PrincipalComponetAnalysis,PCA)、独立分量分析(IndependentComponentAnalysis,ICA)、局部线性嵌入(LocallyLinearEmbedding,LLE)、连续投影(SuccessiveProjectionsAlgorithm,SPA)等,本文采用PCA对数据集进行预处理。PCA降维的目的是寻找一个合适的低维空间,通过线性变换对原始数据在此空间上进行投影并使得投射平均均方误差最小,从而实现在尽可能多的保留原始数据信息的同时降低维度。实现步骤如下:1)计算协方差矩阵将数据集表示为一个的矩阵,原始数据集中样本的个数为n,每个样本的维数为m。其协方差矩阵可由式(4-3)和(4-4)计算:(4-3)(4-4)2)计算协方差矩阵的特征向量和特征值求出协方差矩阵V后,将矩阵对角化求出它的特征值及相应的特征向量。然后按照特征值大小,以从大到小的顺序,将其对应的特征向量依次从上到下重新排列,得到矩阵,将原始的特征矩阵A与相乘即可得到映射变换后新的特征参数矩阵B,如式(4-5所示)(4-5)3)提取主成分在PCA计算中,特征值越大表示U中相应的新特征参量贡献率越大,贡献率的计算式如式(4-6)所示(4-6)矩阵U中的前k行向量即为要求的前k个主成分,也就是将原始数据集A降维至k维后的数据。1.2基于k-means的局部放电诊断模型对于局部放电的精细化诊断包括局部放电类型识别和局部放电的严重程度划分两个方面,根据第三章局部放电多光谱特征参数的初步分析可知对于不同放电缺陷,各波段下放电脉冲数、最大放电脉冲幅值和平均放电脉冲幅值特性不同,因此可以利用这些特征量对局部放电类型进行分类。另外,对于同一个放电缺陷,同一电压时的各光谱波段下放电脉冲幅值分量的占比较为稳定,几乎不随相位的变化而变化,只有当放电严重程度变化时其各波段下的脉冲幅值占比才会相应的出现变化,因此可以以此为依据对放电严重程度进行划分。本节分别将不同的放电多光谱特征量作为数据集,结合k-means聚类算法,先后建立了用于局部放电类型识别和放电严重程度划分的局部放电诊断模型。值得注意的是,本文同时采用7个波段下的局部放电特征参量进行局部放电诊断,对于能否对波段数量进行简化,在保证正确率的情况下选择尽量少的波段进行放电诊断有待研究。因此在进行局部放电诊断前,首先应对多光谱数据进行预处理,优选出用于诊断的最佳波段组合。1)光谱波段选择PCA作为一种数据降维的方法,是通过保留高维数据中的重要特征,去掉不重要的部分,从而实现数据集从高维向低维度的转化,最佳光谱波段的选择则可利用PCA的这一特性实现。首先分别计算各多光谱特征量的协方差矩阵及其特征向量和特征值,然后将特征值由大到小排序,得到相应波段重要程度的顺序,计算结果如表4-2所示。表STYLEREF1\s4SEQ表\*ARABIC\s12不同多光谱特征参量下波段的重要程度排序多光谱特征参量波段重要程度排序放电脉冲数450nm>350nm>650nm>550nm>400nm>600nm>500nm平均脉冲幅值450nm>600nm>400nm>350nm>550nm>650nm>500nm最大脉冲幅值450nm>650nm>400nm>350nm>600nm>550nm>500nm开窗后脉冲幅值(沿面放电)450nm>400nm>650nm>350nm>600nm>550nm>500nm开窗后脉冲幅值(悬浮放电)450nm>400nm>550nm>650nm>350nm>500nm>600nm开窗后脉冲幅值(尖端放电)450nm>400nm>650nm>550nm>600nm>350nm>500nm可以看出,对于多光谱放电脉冲数、平均脉冲幅值和最大脉冲幅值而言,最重要特征波段为450nm,其次是350nm、400nm、550nm、600nm和650nm,500nm波段的重要程度最低;对于开窗后的多光谱脉冲幅值而言,沿面放电、悬浮放电和尖端放电下的最重要特征波段均为450nm,其次为400nm。通过上表得出了不同光谱波段下特征量重要程度的顺序,但对于挑选哪几个波段下的特征量进行局部放电诊断,能在简化数据集的同时保证较高的诊断正确率有待进一步研究。根据光谱波段的重要程度,本文依次选取前2个、3个……7个波段下的特征量进行局部放电诊断,并比较各种情况下诊断正确率的差异。2)放电类型识别基于k-means聚类的特性,本节将多个光谱波段组合下的放电脉冲数、平均脉冲幅值和最大脉冲幅值作为三组数据集,分别进行放电类型识别,比较不同放电特征量的识别效果。以放电脉冲数为例,放电类型识别的具体流程如下:=1\*GB3①以多光谱放电脉冲数占比为特征量进行聚类,其数据集表示为式(4-7);(4-7)式中:n——所挑选光谱波段个数,;m——三种缺陷下获取单个波段内放电脉冲数的总数据量,;=2\*GB3②根据式(4-3)和(4-4)计算X的协方差矩阵及其特征向量和特征值;=3\*GB3③提取最大的两个特征值所对应的特征向量,分别左乘X,即可得到原数据集降维后的第一主成分和第二主成分(波段数为2时可省略);=4\*GB3④根据试验情况,放电类型为沿面放电、悬浮放电和尖端放电三类,因此确定k-means聚类中簇数k为3,并随机选取3个初始簇中心;=5\*GB3⑤计算各点到簇中心的欧氏距离,将各点划分到距离最近的簇中,然后更新每个簇的簇中心;=6\*GB3⑥重复=5\*GB3⑤直至簇中心不再变化,即得到最终聚类结果。利用平均脉冲幅值和最大脉冲幅值进行k-means聚类实现放电类型识别的流程与放电脉冲数类似,不同光谱组合下放电类型识别结果如表4-3所示。表STYLEREF1\s4SEQ表\*ARABIC\s13不同光谱组合下放电类型识别正确率组合波段数放电脉冲数平均脉冲幅值最大脉冲幅值290.368%97.346%91.704%390.168%95.355%90.831%489.726%95.004%90.445%590.284%96.220%91.915%691.765%97.915%93.256%791.765%98.189%93.788%可以看出,以上述三种多光谱特征量进行局部放电类型识别时,2和波段时识别正确率已到达较高值,随着所选波段数增多,识别正确率先减小后增大。而以放电脉冲数为特征量进行识别时,当所选波段加入500nm和600nm时,正确率不变。这可能是由于尖端放电时,450nm波段下的放电脉冲数占比远大于其他波段,导致重要程度最小的两个波段下的分量占比在聚类中被忽略。总的来说,对于各放电特征而言,不同光谱组合下放电类型识别正确率差异均在10%以内,尤其当波段数为5时,其正确率与7个波段时的正确率差异小于2%。因此在后续局部放电类型识别的应用时,条件允许的情况下采集7个波段下的特征参量进行放电类型识别效果最好。若无法同时采集7个波段下的数据,依据放电特征量可适当减少光谱波段。以平均脉冲幅值为例,可以450nm和600nm波段下的分量占比进行放电类型识别,正确率同样高达97.346%。图4-3为以7个波段下的多光谱局部放电特征量进行放电类型识别的结果。(a-i)放电脉冲数降维数据(a-ii)放电脉冲数聚类结果(b-i)平均幅值降维数据(b-ii)平均幅值聚类结果(c-i)最大幅值降维数据(c-ii)最大幅值聚类结果图STYLEREF1\s4SEQ图\*ARABIC\s13放电脉冲数、平均幅值和最大幅值的放电类型识别(k-means)其中,(a-i),(b-i)和(c-i)分别为7个波段下放电脉冲数、平均脉冲幅值和最大脉冲幅值降维后的数据,并根据实际试验情况将数据按放电类型进行标记。(a-ii),(b-ii)和(c-ii)分别是相应多光谱局部放电特征量的聚类结果,可以看出三种多光谱放电参量都可以很好的实现放电类型识别,正确率均为90%以上,其中以7个光谱下的平均脉冲幅值作为数据集进行识别的正确率最高,高达98.189%。3)放电严重程度划分本节基于k-means聚类分别对沿面放电、悬浮放电和尖端放电下的放电严重程度进行划分。根据第三章的分析,依据开窗处理后多个光谱波段组合下的放电脉冲幅值进行判断。以沿面放电的严重程度划分为例,其具体流程如下:=1\*GB3①沿面放电下开窗处理后的多光谱放电脉冲以矩阵的形式写作(4-8);(4-8)式中:n——光谱波段个数,;m——沿面放电下获取的开窗后的单个波段内放电脉冲幅值的总数据量,;=2\*GB3②根据式(4-3)和(4-4)计算X的协方差矩阵及其特征向量和特征值;=3\*GB3③提取最大的两个特征值所对应的特征向量,分别左乘X,即可得到原数据集降维后的第一主成分和第二主成分(波段数为2时可省略);=4\*GB3④根据试验情况,放电严重程度可分为轻微放电、中度放电和剧烈放电三类,因此确定k-means聚类中簇数k为3,并随机选取3个初始簇中心;=5\*GB3⑤计算各点到聚类中心的欧氏距离,将各点划分到距离最近的簇中,然后更新每个簇的簇中心;=6\*GB3⑥重复=5\*GB3⑤直至聚类中心不再变化,得到最终聚类结果。悬浮放电和尖端放电下通过k-means的放电严重程度划分流程与沿面放电类似,不同光谱组合下放电类型识别结果如表4-4所示。表STYLEREF1\s4SEQ表\*ARABIC\s14不同光谱组合下放电严重程度划分正确率组合波段数沿面放电悬浮放电尖端放电295.524%95.112%91.063%394.753%94.860%90.687%495.037%96.468%90.703%596.103%96.931%91.186%696.316%97.247%91.259%796.484%97.419%91.259%由表可知,三种放电缺陷下,2个波段时评估已达到较好效果,随着光谱波段数量的增加,放电严重程度评估的正确率先略有减小后增加,但总体而言正确率变化差异低于5%。因此当试验无法满足7个波段下同步检测局部放电多光谱脉冲信号时,可由400nm和450nm这两个波段下的放电脉冲信号代替,进行放电严重程度评估。图4-4为三种放电缺陷下,以7个波段下开窗后的多光谱放电脉冲幅值占比为特征量进行严重程度划分的结果。其中,(a-i),(b-i),(c-i)分别为沿面放电、悬浮放电和尖端放电下7个波段内经过开窗处理后放电脉冲幅值的降维结果,并根据实际试验情况将数据按放电阶段进行标记,(a-ii),(b-ii)和(c-ii)分别是聚类后的严重程度划分结果。(a-i)沿面放电降维数据(a-ii)沿面放电聚类结果(b-i)悬浮放电降维数据(b-ii)悬浮放电聚类结果(c-i)尖端放电降维数据(c-ii)尖端放电聚类结果图STYLEREF1\s4SEQ图\*ARABIC\s14沿面放电、悬浮放电和尖端放电的严重程度划分(k-means)从图中可以看出,利用多光谱放电脉冲这一特征参量可对严重程度划分,且正确率较高,均在90%以上,其中尖端放电的严重程度判别的正确率为91%,低于沿面放电和悬浮放电。从图(c-i)可看出,尖端放电下轻度放电和中度放电阶段下的多光谱放电脉冲特性区别不大,可能是由于尖端放电下放电初始阶段到放电发展阶段放电特征相对稳定,或根据全波段下的放电阶段划分不够精确导致。1.3结果与分析从基于k-means的局部

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论