聚类算法的分析与比较_第1页
聚类算法的分析与比较_第2页
聚类算法的分析与比较_第3页
聚类算法的分析与比较_第4页
聚类算法的分析与比较_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1前言1.1研究背景及意义在发电厂或电力系统中,任意时刻所承担的所有耗电设备消耗的电功率之和,称作电力负荷,单位:“KW”。虽然电力负荷的标准单位是“KW”,但于实际运行工作中我们经常用来表征负荷的方式为电流。电力系统的负荷分类研究就是研究电力负荷的组成,从而划出某一区域(或一个单位等)内各类负荷组成的种类、占比及其相互之间的关系[1]。对电力负荷进行分类,它的实质就是数据挖掘中聚类分析在电力系统中的应用。其结构日益复杂化、规模日益庞大化等特点在我国电力系统的发展下逐渐显露出来,此外,需求侧负荷特征的多样化及其管理技术(DemandSideManagement,DSM)在系统中的广泛应用,也令电力负荷分类成为电力系统中重点且基础的工作。一种好的负荷分类方法作为电力系统规划、分时电价、错峰管理、负荷预测的基础,能给电力系统提供合理、准确的依据和引导,不仅对电力系统有利,而且对用户有利[2]。根据电力负荷的不同标准存在多种分类类型,我国目前施行的分类标准是依据用户用电所属的行业和用户的经济活动特点进行的,它将用电负荷划分为工业负荷、农业负荷、商业负荷和城乡居民及其他负荷四大类。但是在实际应用中,该方法存在着如下问题:用户负荷特性的多样性在相同行业中不能被充分地体现。往年直接根据用户所属行业进行分类的方式显然是不合理的,随着现代工业生产模式转变、农业工业化的发展和居民用电习惯改变等因素,同时各地负荷构成复杂,地区负荷可能存在某些用户负荷虽然属于同一行业,但由于其自身的用电的特性导致负荷不一致的情况,其负荷曲线也存在着较大的差异。无法展现不同电网的变化及差别。随着我国经济社会的发展、人民生活的复杂化及多样化,电网中随即出现了一些新兴负荷类型的用户,这些新类型用户的负荷呈现出与传统负荷差异较大的负荷特性,如果将此类新类型的用户直接规类到已被定义的类型中,会导致分类的不准确,无法准确得知负荷状况,因而有必要重新划分与定义负f类型。另外,不同地域电网间的负荷组成也存在一定的差别,也可能只包含上述负荷类型中的一部分,如某一地域大多数用户的负荷特征呈现同种类型的可能性,所以需要根据实际情况对负荷类型进行划分,不应该盲目的确定负荷类型。不准确的负荷分类结果,会导致阻碍其下一步运用。负荷分类本应是一类无监督分类问题,只是传统的负荷分类方式,并没有考虑用户负荷的实际变化规律、特性和负荷构成情况,只凭以往的结果来进行引导分类,确认负荷类型,理论依据严重缺失,人为因素对分类结果的影响巨大,主观意识严重影响分类结果。因此负荷分类结果是否精准、合理无法保证,且直接影响上述基础的模块进一步运用,比如会导致负荷预测时的准确度降低,供电公司依据不同负荷类型所拟定的电价不合理等等。电力负荷数据日益海量、复杂,分类困难。目前我国电力系统的自动化水准不断提升,并广泛运用到各种负荷检测装置之中,经已配置的数据检测系统,各级电网调度中心和变电站皆获得了大批相关用户的负荷数据。随着电力系统发展,相关电力负荷的数据量逐年上涨,并跟随着不断增加新的负荷标准,在让提高负荷分析的精确性变为可能的同时,也让分析过程变为更加复杂的工作,庞大的数据量成为负荷分类研究问题上巨大的麻烦。综上所述,目前分类方法已难以适应负荷分类的各种需求,鉴于负荷分类于系统的重要性以及当前负荷分类时所出现的问题,亟待对更合理的负荷分类方法进行研究,以期发现一种更适合当前负荷分类要求的负荷分类方法[3]。为解决上述出现的问题,迫切需要一种可以迅速、精确处理海量数据的技术方法进行负荷分类,并实现根据负荷数据特性来自动获取负荷类型个数的电力用户负荷分类方法,从而降低人为因素对分类结果的影响,为有关电力部门提供精确的负荷分类方法和结果,并成为有关电力部门进一步运用的基础。随着我国电力系统的改革和市场化的推进,供电公司期望分别针对每个客户的特点来提供个性化服务,那么对用户进行精确分类且通识各类负荷的特点变得十分重要。在此背景下,本文对数据挖掘中的几种聚类方法进行分析研究,最终选择K-means聚类算法对电力负荷数据进行分类,并在MATLAB平台上进行仿真实现。1.2电力用户负荷分类电力系统中含有各种类型的电力负荷,通常称各种不同性质的负荷总和为系统总负荷[4]。为方便进行负荷管理,有必要对各类电力系统中各类型的负荷进行精确、合理的分类,令不同类型负荷间展现差异较大的特征,同一类负荷具有相似甚至相同的特征。当前在负荷分类方法中,根据不同的分类标准,一般可以对负荷做出下列不同的划分,如下图1.1所示。虽然能够按照如图标准对电力系统的负荷类型进行分类,但有时分类结果并不准确。在实际分类时,可能会出现某些特殊负荷的归类无法确定等问题。为解决这些问题,一般由供电公司主观进行决定其归属,所以在进行电力负荷分类时,某些供电公司可能存在更加精细标准的分类准则。图1.1电力负荷分类负荷分类的根本意义是,作为电力市场分析、规划等应用的基础分析和参考,随着分类方法的研究逐渐完善,分类方法的应用也随之深入,它的应用研究主要表现在下列四个方面:(1)订制电价现如今,有关我们国家电力体制改革的呼声日益强烈,今后电力市场的发展需求将会逐渐的展露出目前施行的电价体制里电价分类不完全合理的不足。目前,大多以用户用电行业和用途划分为标准将电价归类,定制电价时政策将起决定性作用,忽略掉用户的用电负荷特性,以致企业的生产成本难以通过电价展现出来,并且电价难以应对市场经济的需求,致使电力资源很难合理地实现优化配置。但随着电力改革的深入,今后电力用户将能够自由地挑选售电商进行消费,如此会迫使各售电商依照各类用户的用电行为、习惯等不同特征进行市场划分,拟定不同的营销手段及更加公平合理的电价,来竞争更广泛的消费人群。有专家提出了一种电价决策方案,这种决策方案在保证负荷分类结果的前提下,又考虑了用电特性,这样能够为有关供电部门制定电价的时候提供依据;另有学者提出了完善峰谷电价的一种方式,这种方式先是把用户负荷特性分类处理,然后对各种用户建立起在不同时段的成本分摊模型,剖释了不同用户在峰谷电价问题上的响应程度。(2)负荷预测直接根据总负荷的现有数据做出预测,亦或是首先分别对每一类负荷做出预测,然后汇总为总负荷预测,以上为预测总负荷比较常见的两种方式。直接对总负荷进行预测不仅较为容易实现,而且可以使负荷的变化趋势可视化;而在进行分类负荷预测的时候,可以看到某种负荷可能出现的异常变化趋势,而且基于对各类负荷进行单独预测的结果,综合得出的负荷预测结果相较于直接预测的结果更为精确。现在,进行分类预测的方法如下:先是将预测系统范围内的用户进行负荷分类,然后做出预测,把得出的各类用户的负荷预测曲线进行加权累加,就能够得出系统总的日负荷预测曲线。(3)系统规划与负荷管理负荷分类对电力系统的合理规划问题进行了技术指导,用户电力负荷的组成情况是系统总负荷需求的决定性因素。根据规划地域各种类型的用户用电习惯和他的增长方式而组建的负荷预测模型更为准确,此模型的优点十分显著,比如使区域之间联络线的传输功率以及地区装机容量与负荷之间可能出现的的不匹配的情况大大降低[5]。如今,由于电力需求侧管理(DSM)的广泛推进,电力用户已经具备参与市场的条件,急需用户和电力部门建立较为融洽的合作关系,共同致力于实现电力系统的利益最大化,合理的负荷分类是制定相关政策的基础依据。DSM经过分析系统的负荷构成,从而引导用户在用电高峰时段减少用电设备的电力消耗,相对在低谷时段可根据需求选用合适的用电设备,从而对峰谷时段进行平衡,此手段具有降低负荷的峰谷差、提高用电负荷率、降低发电成本、优化电力系统、提高经济效益等益处;除此之外,降低最大负荷值,减小装机容量需求,节约了我们国家电力工业的建设投资。(4)综合建模在综合负荷具备随机性、分散性、多样性等特点的大环境下,负荷建模研究被大众所关注的核心内容。构建一个结构合理、参数精确的综合负荷模型是电力系统仿真的可靠性和准确性的保障。每种类型负荷所展现出其单独具备的特点,致使出现多种负荷模型。负荷分类把电网中负荷特性相近的负荷归为同类,并依照它的特征组建一类模型用以表述这类负荷,让得出的模型能够最大化地表现出相同类型负荷所具备的共同特征,令该模型更加广泛地应用到负荷建模研究中。负荷分类于电力系统中一般包含上述几点应用,它会直接表现出对电力系统和用户的益处[6]。精确的负荷分类方式能够减少电力系统的建设投资、运行成本,完善和运营电力市场,对电网安全、经济、优质的运行起保障作用;广大用户可以真切地感受到电力系统的益处,在降低系统运行成本和引导用户减小负荷峰谷差两条件下,降低用户的电力负荷消耗,与此同时将会引导某些高能耗企业进行低谷时段生产和改变员工作息,从而让交通、供水等基础供应行业进行错峰,令社会资源得到均衡分配。1.3负荷分类方法的国内外研究现状现如今,负荷分类方法都是以聚类数目确定、初始类中心确定、合适聚类方法的选择等方面进行研究的[7]。随着电力体制改革的深入和智能电网构建的推进,负荷分类方法的探究逐渐深化,近期分类方法的主要研究成果有下列几点。将基于模糊C均值算法等模糊聚类算法用于负荷分类研究中,此类算法通过建立样本描述类别的不确定性,来量化类别与表征样本间的隶属关系,那么得出的聚类结果就会变得更为客观,并且由于该算法可以精确地识别出孤立点,从而可以迅速确定出一些具备特殊特征的样本;不过此类算法也存在易被发现的不足,像是它存在对初始聚类中心比较敏感、不容易确定聚类个数和常常陷入局部最优等缺点,直接利用FCM算法进行负荷分类会致使分类结果不精确,合理性不足,并且此类算法在所处理的数据呈现稀疏分布时展现出不稳定的缺点;因此,许多文献对此类算法进行完善,像某组学者提出一种综合C-均值聚类算法与SOM神经网络两种算法所综合的负荷分类方法,先是通过SOM神经网络算法计算出聚类的个数和每类电力负荷的中心点,然后把它的结果当成C-均值聚类算法的初始输入数据,这种综合算法汇集了两种基础算法的优势,这将会提高C-均值聚类算法的收敛速度和精度[8]。另一组学者提出了一种基于自适应模糊C均值算法,这种算法将模糊C-均值聚类算法需要提前确定聚类个数的缺点进行完善,通过于传统算法中引入聚类有效性函数的方式,令算法可以根据数据特性自动确定聚类个数[9]。神经网络理论同时被大量应用到电力负荷分类的研究中,如有文献阐述了某种利用神经网络来做出负荷分类的方案;有文献研究了SOM算法的相关理论;有文献而是为了获取总负荷曲线,先是利用神经网络算法将负荷数据进行分类从而获取不同类型的典型负荷曲线,最后将不用种类曲线进行叠加。但是该算法存在不足:它的收敛速度很慢、样本训练过程复杂且不灵活、训练样本病态对结果影响很大等。另外,有国外专家提出在负荷分类中使用两阶段聚类法,这种算法在第一阶段使用某种聚类方法获取每类用户的典型负荷曲线,第二阶段利用已获取的典型负荷曲线将全部用户做出分类,追其根源是追求所选取的样本质量;一种源于图的谱分割的谱聚类算法同样被负荷分类研究所利用,这种算法不用预先确定分类的最优个数,不过不容易选择它的相似度函数;另存在基于免疫网络理论等负荷分类方法,相关研究依旧处于理论探究阶段。如今,有关对分类方法的研究都是以怎样自动获取最佳聚类数、确定初始聚类中心点、根据需求选择的合适聚类方法等方面为中心而进行的。K-means算法作为聚类分析里一种普遍的、原始的分类方法,依靠着它理论可靠、具备有效处理大数据集、收敛速度快、实现简单等优势被研究者大量使用。本文将针对几种常见的聚类算法进行分析研究,根据提供的电力负荷数据的特点,选出最适合电力负荷分类的方法。1.4本文的主要工作本文总共分为四章,其中分别介绍电力负荷分类和几种常用的聚类分类的理论思想,并最终选择K-means聚类算法对电力负荷数据进行仿真模拟。其中,第一章主要介绍电力用户负荷分类和电力负荷分类方法在国内外的研究现状。第二章解释了聚类的定义并举出了多种聚类算法并分别从理论上介绍,而后了解各种聚类算法的思想流程并对其优缺点进行了分析和比较。第三章选取K-means聚类算法进行重点分析,对其思想流程做出详细介绍,分析其优缺点并进行现有改进。第四章结合电力负荷数据,利用MATLAB对K-means聚类算法进行仿真。2聚类算法的分析与比较2.1聚类的定义聚类的定义是通过某种或某几种聚类算法将数据库中的数据对象的集合划分成为一系列有意义的子集。通过聚类算法进行偏差分析和概念描述,使得人们对客观现实的认知形式作出了进一步了解和改观。聚类是基于传统的模式识别方法和现代的数学分析学两种技术来进行的分类方法。聚类就是依照一些特定标准将某个数据集切割成不同的类,这样令相同分类中的数据对象尽可能大概率相似,与此同时令不同分类中的数据对象也尽可能地大概率相异。也就是聚类后相同分类的数据尽可能地聚集在一起,不同分类的数据尽可能地分离。聚类是基于“物以类聚,人以群分”古老的朴素思想而产生的,它的目的是将数据库中大量的数据依照相应的原则分配为不同的种类,通过聚类的分类原理,使同一类别的数据对象之间具有较高的相似度,不同类别的数据对象之间具有较低的相似度。截至日前,国内外大量聚类算法[10]已经被国内外的研究人员汇编成型,纵使目前存在大量成型的聚类算法,但是不存在任意一种聚类算法技术能够做到兼顾各种多维数据所呈现出来的各类不同的结构,它们都或多地存在着一些不足和缺陷。目前国内外专家和学者们仍然将聚类算法的改进和探讨作为研究的热门话题。2.2主要聚类算法分类聚类算法有很多种,按照不同的划分原则也将被分成许多种类。不同的聚类算法适用的场合也不尽相同,在选取具体的算法之前要考虑数据的属性、聚类的目标和应用背景等因素。本章将会挑选四种比较常用的算法进行分析和比较,包括基于密度的聚类(DBSCAN)、K-NN聚类、基于神经网络的聚类和K-means聚类这四种算法进行原理分析和比较。我们选择K-means聚类算法,并将它的原理在第三章中着重介绍。2.3基于密度的聚类算法(DBSCAN)基于密度的聚类算法是假设聚类结构可以由样本分部的紧密程度而确定的一种算法。通常情况下,密度聚类算法根据样本密度的关系来观测样本间的可连接性,同时在可连接样本进一步扩展聚类簇的条件下最终获取聚类结果[11]。这种聚类方法把簇定义成密度相连的点的最大集合,可以将具备足够高密度的区域划分成簇,同时能够在噪声的空间数据库内找到任意形状的聚类。DBSCAN是密度聚类算法中最常用的一种算法,这种算法以一组“邻域”参数为条件去刻画样本分布的紧密程度[12]。图2.1给了几个概念的直观显示。图2.1DBSCAN定义的基本概念:虚线显示出邻域,是核心对象,密度直达,密度可达,密度相连。基于密度的聚类算法流程图如下图2.2所示。图2.2基于密度的聚类算法流程图2.4K-NN聚类K-NN算法的核心思想为假设一个样本于特征空间内的K个最相邻的样本中的大多数样本同属某一个类型,那么这个样本同样隶属于此类型,而且具备此类型中样本的特性[13]。这种方法于确定分类决策中仅仅依据最邻近的一个或者几个样本的类型来决定未分类样本所隶属的类型。K-NN聚类算法在类别决策的时候,仅以极少量的相邻样本为基础[14]。因为K-NN聚类算法主要依靠周围有限的邻近的样本,而非依靠判别类域的方式确定所属类别,所以对于类域的交叉或重叠较多的未分类样本集而言,K-NN聚类算法是比其他聚类算法更优的方法。K-NN聚类一般采用欧氏距离(EuclideanDistance)当成它进行分类的模型,欧氏距离的数学模型概念在下面给出:设在n维空间中有两个点和,这两个点的欧氏距离计算公式如下所示:(2-1)其中,是维数,和分别是和的第个属性值。2.5基于神经网络的聚类(SOM)2.5.1基于神经网络的聚类算法的思想及流程1981年,赫尔辛基大学的TeuvoKohonen根据大脑处理外界信号的方法特点,提出了一种自组织神经网络的模型,即基于神经网络的聚类,又被称作自组织特征映射的神经网络(SOM)[15]。这种神经网络算法思想的本质为:解决人脑中的自组织如何处理来自外界的信息并形成概念的问题。和其他的聚类算法大体一致,基于神经网络聚类算法同样是依靠迭代算法来优化目标函数,进而达成最佳的聚类目的[16]。基于神经网络的聚类层次结构图如下图2.3所示。图2.3基于神经网络的聚类层次结构图基于神经网络的聚类算法的流程图如下图2.4所示。图2.4基于神经网络的聚类流程图2.5.2基于神经网络的聚类算法的优缺点分析基于神经网络的聚类算法的优点是,它具有很强的容错能力,即为出于某种原因,导致数据或者文件出现冗余的、不完整的,或者数据本身就带有较多的噪声数据和矛盾的数据,基于神经网络的聚类也能在此基础上进行问题的求解[17]。并且作为数据挖掘中聚类环节的算法之一,它具备对非线性的数据进行快速建模的能力[18]。然而,基于神经网络的聚类的缺陷也十分明显,在一般情况下,因为基于神经网络的聚类算法复杂程度较高,所以将导致它的聚类速度很慢、算法执行时间很长,且需要输入足够多的数据对象,才能使神经网络收敛于某一稳定状态[19]。所以当面对海量的数据信息的时候,使用基于神经网络的聚类算法进行目标预测时,会有效率低下、训练时间长等缺点。2.6本章小结本章首先介绍了聚类的定义,选取了几种常用的聚类算法做出介绍,包括基于密度的聚类算法(DBSCAN),K-NN算法,和基于神经网络的聚类算法(SOM),详细阐述了以上几种算法的基本思想及算法流程。本文将在第三章对K-means聚类算法进行详细介绍。3K-means聚类算法研究与分析3.1K-means聚类算法的思想及流程MacQue提出的K-means聚类算法是一种经典的划分聚类算法,在这之中,K值表示数据集最终被聚成的聚类数目,means为平均值,代表着每类数据的算数平均值,即为聚类中心[20]。因此,K-means聚类算法也称作K-均值聚类算法。K-means聚类算法的基本思想:K-means聚类算法是一种动态聚类算法,也叫作逐步聚类法,在聚类算法迭代之前,该算法首先从数据集中随机依次选取K个数据对象作为K个初始聚类中心,而后根据所分类内对象的均值,即聚类中心,依次将其他的数据对象划分到与其最近的聚类中心所在的类中,数据对象分类完毕后,计算每个聚类中心的均值,更新该均值作为新的聚类中心点,迭代上述聚类过程。直到聚类中心不再产生变化,即聚类中心均值数值收敛或是聚类准则函数连续值相差小于给定阀值为止。一般采用的目标函数即聚类准则函数是误差平方和准则函数[21]。在每次迭代中均要考察样本分类的准确性是K均值聚类算法的一个的特点。K-means聚类算法是最经典的聚类算法之一。该算法是一种基于距离的聚类算法,基于距离的聚类算法主要指把距离函数当成相似性度量的评价标准的聚类算法,距离函数主要有以下几种:1.欧氏距离:欧氏距离的计算公式如下式:(3-1)2.明氏距离:明氏距离的计算公式如下式:(3-2)

其中,t为一个正整数。可以明确地看出,在式(3-2)中当t=2时,会得到欧式距离,所以欧氏距离可以看作明氏距离的一个特例。欧氏距离是聚类算法中用以度量数据对象间相异性最常用的方法之一。与其相近的相似度度量方法还有曼哈顿距离、马氏距离等,不过诸类相似度度量方法并不常用,他们分别定义如下:3.曼哈顿距离:

(3-3)4.马氏距离:

(3-4)在式中,表示样本协方差阵的逆矩阵,T表示矩阵的转置。基于K-means聚类算法快速且高效的特点,该算法被广泛地应用到大规模的数据聚类中,它是一种颇具影响力的聚类算法。在一般情况下,K-means聚类算法容易得到指定类别数的聚类结果,而K值确定是实践经验积累的结果[22]。图3.1为K-means聚类算法流程图:图3.1K-means聚类算法流程图为了方便算法描述,定义已知一个含有个数据的样本集合为,即(3-5)其中,是一个维向量,表示第个的数据的个不同属性,是样本容量。聚类中心为:(3-6)其中,是第个类的中心点,每个中心点都含有个不同的属性,是聚类个数。定义1:两个数据和之间的欧几里得距离为,其表示如下:(3-7)其中,,,是簇类个数。定义2:同一簇类的中心点为表示如下:(3-8)其中,是同一簇类中数据的个数,。定义3:把类内误差平方和作为准则函数,如下式:(3-9)其中,,,是簇类个数。3.2K-means聚类算法的优缺点分析K均值聚类算法具备算法简单、理论可靠、收敛速度快、能有效地处理大数据集等优点,因此在科学和工程等高新技术产业领域内被大量应用。而且K-means聚类算法可以有效地减少聚类计算的迭代次数,提高分类的准确性,同时可以根据负荷的数据特点实现自动化的科学分类,在电力负荷分类问题中K-means聚类算法的分类结果明显优于其他聚类方法。但是传统的K-means算法也存在着在处理大量多维数据时选取聚类中心的问题。3.3K-means聚类算法的现有改进现如今有关K-means聚类算法的改进出现了多种方式,K-means聚类算法在国内外的研究成果主要包括:有学者提出把决策树算法综合到K-means聚类算法的改进中[24],这样的改进方式虽增强了算法的抗噪性,但算法的计算量较之前大大提升;还有学者把遗传算法综合到K-means聚类算法中,这种改进方式完善了算法的聚类效果[25];另有研究者提出了一种模糊K-means聚类算法,这种新型算法引入处罚项到目标函数中,会令算法对初始聚类中心的敏感度降低,提高了算法聚类结果的准确性。可以看出,如何选择K-means聚类算法的初始聚类中心将会是今后如何优化K-means聚类算法的重点研究方向。3.4本章小结本章重点对K-means聚类进行介绍,首先介绍了K-means聚类算法的基本思想和算法流程,然后对K-means算法的优缺点进行介绍,最后介绍了一下该算法的现有改进。鉴于K-means聚类算法的应用广泛性及其分类准确性和科学性,本文将采用K-means聚类算法进行电力负荷分类的仿真,并在第四章中展示通过K-means聚类算法于Matlab上仿真得到的电力负荷分类结果。4K-means聚类算法在电力负荷分类的仿真设计4.1电力负荷数据来源进行算例仿真的电力负荷来源于文献[29],该负荷数据是由某供电公司提供,该数据体现了三十一个不同用户在一天内(从0时到23时)的用电量。利用MATLAB进行绘图,得到此三十一个用户的日负荷曲线图,如下图4.1所示。表3.2用户的日负荷T0123456789101110.10.360.430.480.420.420.010.010.010.010.010.0120.150.320.310.30.310.320.320.170.170.090.10.11…………………310.2350.2350.2350.220.230.230.2150.230.250.2450.220.2T12131415161718192021222310.010.010.010.010.010.010.010.010.010.010.060.0120.120.160.120.160.130.140.140.160.1550.150.180.022…………………310.1950.1950.210.220.220.220.1850.190.180.1650.1650.16图4.1用户日负荷曲线图根据上图不同用户的日负荷曲线图我们可以先进行粗略的分析,首先,我们可以把一天中的24个小时分为以下几个阶段:(1)0时-7时,这个时段属于低峰时段,一般用户在此时段属于休眠状态,用电量会比较低,但有些用户为了避开用电高峰期会选择在这个时段进行电力消耗。(2)7时-11时,这个时段处于高峰时段,无论是通勤路上的交通运输还是进行日常的生产生活消耗,都无疑是较大的消耗。(3)11时-13时,这个时段是一个较短的低峰时段,主要原因是午饭、午休。但不排除餐饮、服务行业在这个时段进入他们的用电高峰期。(4)13时-20时,这个时段是一个用电的高峰时段,结束午饭和午休后迎来了正常的工作和生产,之后过度到下班的通勤交通消耗和晚饭、娱乐活动等消耗。(5)20时-24时,这个时段也属于低峰时段,原因与0时-7时时段基本相同,多数用户结束了一天的生产和生活工作后需要进行休息,但有些用户为了避开用电高峰期会选择在这个时段进行电力消耗。所以我们可以将不同用户的日电力负荷消耗粗略的分为如下几类:第一类用户的用电高峰期在17时到23时,其余时间用电平缓,此类用户可以看作白天工作,夜晚回家以后导致用电量增加的上班族。第二类用户在夜间和中午时段负荷较小,而在上午和下午常规的工作时间负荷较大,应属于常规工作用户,一般这类用户大多是学校以及正常工作制的公司企业等正常作息的单位。第三类用户在0到5时和20到23时(夜间)负荷较大,而在6到19时(白天)负荷较小,显然属于避峰用户。第四类用户负荷曲线较为平缓,但是夜间用电量比白天稍大,但是波动较小,可以看作不同于第二类的常规工作用户。所以我们认为K=3,4或5都可能是最优的电力负荷分类结果。下面我们开始进行仿真实验,从而验证我们的初步判断结果,得出最终的结论。4.2不同K值下的k-means仿真结果4.2.1K=2时的仿真结果在上文中提到,K-means聚类算法的K值是需要自己设定的。我们则分别赋予K不同的值,然后对聚类仿真结果进行分析,从而选择最佳聚类分类方法时的K值。首先选择K=2来开始仿真实验。K=2时的仿真结果如下图4.2所示。图4.2K=2时分类结果由上图可以看出,经过K-means(K=2)聚类以后将31个用户的日负荷曲线分为两类,第一类用户在0到5时和20到23时(夜间)负荷较大,而在6到19时(白天)负荷较小,显然属于避峰用户。第二类用户的曲线较为复杂,特征也不是十分明显,显然可以再进行更细致的分类,说明当K=2时,k-means的分类结果不是特别理想。还需进行K=3时的仿真。4.2.2K=3时的仿真结果K=3时的仿真结果如下图4.3所示。图4.3K=3时分类结果由上图4.3可以看出,经过K-means(K=3)聚类以后将31个用户的日负荷曲线分为3类。第一类用户在0到5时和20到23时(夜间)负荷较大,而在6到19时(白天)负荷较小,显然属于避峰用户。第二类用户在夜间和中午时段负荷较小,而在上午和下午常规的工作时间负荷较大,应属于常规工作用户,一般这类用户大多是学校以及正常工作制的公司企业等正常作息的单位。第三类用户的用电高峰期在17时到23时,其余时间用电平缓,此类用户可以看做白天外出工作,夜晚回家后导致用电量增加的上班族。此时的分类情况相比于K=2时,分类效果明显好了一些,但是第二类和第三类的负荷曲线还是可以看出明显的不同,还需要更为细致的划分。所以需要继续进行K=4时的仿真。4.2.3K=4时的仿真结果K=4时的仿真结果如下图4.4所示。图4.4K=4时分类结果由上图4.4可以看出,经过K-means(K=4)聚类以后将31个用户的日负荷曲线分为4类。第一类用户的用电高峰期在17时到23时,其余时间用电平缓,此类用户可以看作白天工作,夜晚回家以后导致用电量增加的上班族。(同分3类情况下的第三类用户为同一特征用户)。第二类用户在夜间和中午时段负荷较小,而在上午和下午常规的工作时间负荷较大,应属于常规工作用户,一般这类用户大多是学校以及正常工作制的公司企业等正常作息的单位。(同分3类情况下的第二类用户为同一特征用户)[30]。第三类用户在0到5时和20到23时(夜间)负荷较大,而在6到19时(白天)负荷较小,显然属于避峰用户。(同分3类情况下的第三类用户为同一特征用户)。第四类用户负荷曲线较为平缓,但是夜间用电量比白天稍大,但是波动较小,可以看作不同于第二类的常规工作用户。由图可以看出K=4时的分类比K=3时效果更好。但在K=3结果下,我们得到的结论两个分类结果组还需细致分类,在K=4时只把其中的一类继续区分,而第一类用户没有得到更细致的分类。所以我们还需进行K=5时的仿真。4.2.4K=5时的仿真结果K=5时的仿真结果如下图4.5所示。图4.5K=5时分类结果由上图4.5可以看出,经过K-means(K=5)聚类以后将31个用户的日负荷曲线分为5类。第一类用户的负荷曲线平缓,7到22时用电量较夜间小一些,此类用户可看作正常上班族用户。第二类用户的用电高峰期在17时到23时,其余时间用电平缓,此类用户可以看作为白天工作,夜晚回家以后导致用电量增加的上班族。第三类用户在0到5时和20到23时(夜间)负荷较大,而在6到19时(白天)负荷较小,显

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论