(电力系统及其自动化专业论文)电力系统负荷分类研究.pdf_第1页
(电力系统及其自动化专业论文)电力系统负荷分类研究.pdf_第2页
(电力系统及其自动化专业论文)电力系统负荷分类研究.pdf_第3页
(电力系统及其自动化专业论文)电力系统负荷分类研究.pdf_第4页
(电力系统及其自动化专业论文)电力系统负荷分类研究.pdf_第5页
已阅读5页,还剩67页未读 继续免费阅读

(电力系统及其自动化专业论文)电力系统负荷分类研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

a b s t r a c t l o a dc l a s s i f i c a t i o ni sa ne s s e n t i a lt a s ki ne c o n o m i ca n a l y s i s ,o p e r a t i o na n d p l a n n i n go fd i s t r i b u t i o ns y s t e m s ,e s p e c i a l l yf o rt h er a p i dd e v e l o p m e n to fp o w e r d e r e g u l a t i o na n dd e m a n ds i d em a n a g e m e n t ( d s m ) n o w a d a y s ,t h el o a dc l a s s i f i c a t i o n h a sb e c o m et h eb a s eo fp r i c es e t t i n g ,l o a df o r e c a s t i n g ,s y s t e mp l a n n i n g ,l o a d m o d e l i n g ,e t c t r a d i t i o n a ll o a dc l a s s i f i c a t i o nu s e d i nt h ep o w e ru t i l i t yi su s u a l l y a c c o m p l i s h e db a s e do nt h ee c o n o m i ca c t i v i t i e so fc u s t o m e r s h o w e v e r , c h a r a c t e r i s t i c s o ft h el o a dc u r v e sw i t hs i m i l a re c o n o m i ca c t i v i t i e sm a yb ea b s o l u t e l yd i f f e r e n t s oi t i sv e r yi m p o r t a n tt of i n dm o r ee f f e c t i v ea n dp r e c i s el o a dc l a s s i f i c a t i o nm e t h o dn o t o n l yf o rt h et h e o r e t i c a ls t u d yb u tf o rt h ep o w e rs y s t e ma p p l i c a t i o n i n t h i st h e s i s ,d a t am i n i n ga n df u z z yc l u s t e r i n ga n a l y s i sa r eu s e dt of i n dm o r e e f f e c t i v el o a dc l a s s i f i c a t i o nm e t h o d l o a df o r e c a s t i n gb a s e do nl o a dc l a s s i f i c a t i o ni s f u r t h e rd i s c u s s e d w o r ko f t h i st h e s i si sa sf o l l o w i n g : 1 l o a dc l a s s i f i c a t i o nm e t h o db a s e do nt h ec l u s t e r i n ga n a l y s i si sd e e p l ys t u d i e d f i r s t l y , c o m p a r i s o ni sp e r f o r m e db e t w e e ns e v e r a lc l u s t e r i n gv a l i d i t yf u n c t i o n st of i n d t h eo p t i m a lo n e t h e n ,f u z z yc l u s t e r i n ga n a l y s i sa n df u z z yw e i g h t e dc l u s t e r i n g m e t h o d sa r eu s e dt oc l a s s i f yt h em e a s u r e dl o a dp r o f i l e s t h el o a d si nt h es a m eg r o u p a leg u a r a n t e e dt ob eh o m o g e n o u s 2 t w op a t t e mr e c o g n i t i o nm e t h o d s ,i e m a x i m u md e g r e eo fm e m b e r s h i pa n d m e a ns q u a r ed e v i a t i o no fs e r i e s ,a led e e p l ys t u d i e dt or e c o g n i z et h ep a t t e r no fl o a d c u s t o m e r s 3 f i n a l l y , l o a df o r e c a s t i n gm e t h o db a s e d o nl o a dc l a s s i f i c a t i o ni sd i s c u s s e d t w o f o r e c a s t i n gm e t h o d s ,t y p i c a ll o a dc u r v es u p e r p o s i t i o nm e t h o d a n ds u p p o r tv e c t o r r e g r e s s i o nm e t h o d ,a l ei n t r o d u c e d t h e i re f f e c t i v e n e s si st h e nv a l i d a t e db yt h e n u m e r i c a ir e s u l t s s t u d i e si n t h i st h e s i sa leh e l p f u lt of i n dm o r es c i e n t i f i ca n de f f e c t i v el o a d c l a s s i f i c a t i o na n df o r e c a s t i n gm e t h o d k e yw o r d s :l o a dc l a s s i f i c a t i o n ,c l u s t e r i n ga n a l y s i s ,p a t t e r nr e c o g n i t i o n , l o a df o r e c a s t i n g ,p o w e rs y s t e m 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的 研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他入已经发表 或撰写过的研究成果,也不包含为获得丕鲞盘堂或其他教育机构的学位或证 书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中 作了明确的说明并表示了谢意。 学位论文作者签名:毒岳当擎 签字日期: 矽圹年,月,口日 学位论文版权使用授权书 本学位论文作者完全了解 苤生盘堂有关保留、使用学位论文的规定。 特授权叁盗叁堂可以将学位论文的全部或部分内容编入有关数据库进行检 索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校 向国家有关部门或机构送交论文的复印件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 学位论文作者签名:貉建垆 签字r 期:泗7 年月,。日 导师签名: 签字r 期: 杰引黝椰诡硼 第一章绪论 第一章绪论 随着电力市场的深入发展,以及电力需求侧管理( d s m ) 技术的广泛应用,电 力系统负荷分类已经成为一项十分重要的基础性工作,负荷定价、负荷预测、系 统规划、负荷建模等工作都需要对负荷类型有一个科学准确的分类,因此,深入 研究电力系统负荷分类的方法及应用,有利于及时掌握用电负荷的变化规律和发 展趋势,有利于用电负荷的科学管理,有利于计划用电工作的开展。因此具有重 要的理论意义和现实意义i l 刮。 1 1 电力系统的负荷与负荷分类 电力系统的基本任务是为广大用户不间断地提供优质电能,满足各类负荷的 需求。通常负荷是指变电站或某一电网在某一瞬间所承担的工作负荷。而对于用 户来说,用电负荷是指连接在电网中的用户所有设备在某一瞬间所消耗的功率之 和。 电力系统负荷特性,无论是对于系统规划设计,还是安全优化运行,都是极 为重要的。所以,针对负荷特性的研究,是电力系统的一项重要工作。负荷预测、 负荷分类、负荷定价、负荷需求侧管理以及负荷建模等方面的研究,在现代电力 市场环境下已经成为占有重要地位的研究领域,同时也是电力系统自动化研究领 域中的一项重要内容。 实际电力系统具有各式各样的负荷,系统总负荷由各种不同性质的负荷总加 而成。因此,对于实际的电力系统,各种类型的负荷应当有一个正规准确的分类, 使得同一类型的负荷具有相同或相似的特性,从而简化或降低负荷管理的难度和 复杂性。 一般来讲,负荷可以分为城市民用负荷、商业负荷、农村负荷、工业负荷以 及其它负荷。城市民用负荷主要是指城市居民的家用负荷,商业负荷与工业负荷 是各自为商业和工业服务的负荷,在我国,农村负荷是指广大农村所有的负荷( 包 括农村民用负荷、生产与排灌用电以及商业用电等) ,而其他负荷则包括了市政 用电( 如街道照明) 、公用事业、政府办公、铁路与电车、军用以及其它等。依 据不同的标准,可以对负荷类型做出不同的划分。 1 按物理性能划分 负荷按物理性能可分为有功负荷和无功负荷。 第一章绪论 ( 1 ) 有功负荷:是把电能转换为其他形式的能量,并在用电设备中真实消耗 的能量,计算单位为k w ( 千瓦) 。 ( 2 ) 无功负荷:在电能输送和转换过程中,需要建立磁场( 如变压器、电动 机等) 和电场( 如电容场能) 而消耗的功率。它仅完成电磁能量的相互转换, 并不做功,在这个意义上称为“无功 ,计算单位是l ( 、,a r ( 千乏) 。 2 按电能划分 负荷按电能的产、供、销生产过程可分为发电负荷、供电负荷和用电负荷。 ( 1 ) 发电负荷:是指发电厂以电网担负的供电负荷,加上同一时刻发电厂的 厂用电负荷,单位为k w 。 ( 2 ) 供电负荷:是指供电地区内各发电厂发电负荷之和,减去发电厂的厂用 电负荷,加上从供电地区外输入的负荷,再减去向供电地区外输出的负荷,单位 为k w 。 ( 3 ) 用电负荷:是指地区供电负荷减去线路和变压器中的损耗后的负荷,计 算单位为k w 。 3 按时间划分 负荷按时间可以分为年、月、日、时、分的负荷。 4 按对供电可靠性的要求划分 根据用电负荷的性质及对供电可靠性要求的不同,负荷可分为一类负荷、二 类负荷和三类负荷。 ( 1 ) 一类负荷:中断停电时将造成人身伤亡或政治、军事、经济上的重大损 失的负荷,如发生危及人身安全的事故、使工业生产中的关键设备遭受难以修复 的损坏、生产秩序混乱,造成国民经济的重大损失等。重要的军事设施、医院、 机场等地的负荷一般属于一类负荷。 ( 2 ) 二类负荷:中断停电时将造成严重减产、停工、局部地区交通阻塞,使 城市中大量居民的正常活动受到影响等,在我国,大中城市的居民和工厂负荷, 一般归入二类负荷。 ( 3 ) 三类负荷:除一、二类负荷之外的一般负荷,这类负荷中断停电时造成 的损失不大。如工厂的附属车间、小城镇和农村的公共负荷等常归入此类负荷。 5 按国际上用电负荷的通用分类 根据国际上对用电负荷的通用分类,可以对用电负荷进行如下划分: ( 1 ) 农、林、牧、渔、水利业。包括农村排灌、农副业、农业、林业、畜牧、 渔业、水利业等各种用电。 ( 2 ) 工业。包括各种采掘业、制造业等用电。 第一章绪论 ( 3 ) 地质普查和勘探业。 ( 4 ) 建筑业。 ( 5 ) 交通运输、邮电通信业。公路、铁路车站用电、码头、机场用电、管道 运输、电气化铁路用电及邮电通信用电等。 ( 6 ) 商业、公共饮食业、物资供应和仓储业、各种商店、饮食业、物资供应 单位及仓库用电等。 ( 7 ) 其他事业单位。包括市内公共交通用电,路灯照明用电,文艺、体育单 位、国家党政机关、各种社会团体、福利事业、科研等单位用电。 ( 8 ) 城乡居民生活用电。包括城市和乡村居民生活用电。 虽然电力系统的负荷类型可以按照上述标准进行划分,但是这样的分类并不 严格和准确。在实际分类时,可能会发生把某些实际负荷归算到哪一类的争执。 在这种情况下,一般都是由供电部门自己主观进行决定。因此,在一些供电部门 中,可能各自有其更具体和详细的负荷分类目录,以备负荷分类之用。然而,上 述供电部门所采取的负荷分类方法在实际应用中还存在着一些问题: ( 1 ) 同一行业内的用户可能具有不同的负荷特性。目前,供电部门对电力系 统用户负荷进行分类,大多数依据的是用户负荷所属的行业以及用户的经济活动 特点。然而,随着用户负荷设备的构成越来越复杂以及人们生产、生活方式的变 化,同一行业内的用户负荷特性也并不完全一致,其负荷曲线可能存在着较大的 差异。 ( 2 ) 不能反映出电网的变化和差异。随着经济和社会的发展,电网中会不断 出现一些新的类型的用户负荷,而这些类型的用户负荷可能会与已经定义的用户 负荷类型之间存在着较大的差异,因此需要重新考虑对其类型的划分与定义。并 且不同地区电网之间的负荷构成也存在一定的差别,应当针对实际情况对电网的 负荷类型进行划分。 ( 3 ) 分类结果不准确,影响了在此基础上的进一步应用。传统的负荷分类方 法,没有充分考虑用户负荷的实际特性和变化规律,缺乏理论依据,存在着较大 的人为因素,降低了分类结果的准确性和合理性,使得在此基础的一些应用受到 影响,例如降低了分类负荷预测的准确性,电价制定的不尽合理等等。 因此,为解决上述存在的问题,需要研究一种科学准确的负荷分类方法,为 供电部门进行负荷分类以及在此基础上的应用提供有力的参考和依据。本文应用 数据挖掘技术和聚类分析理论,选取用户负荷特性作为分类依据,使得划分到同 一类型中的用户负荷具有相同或相近的负荷特性。 第一章绪论 1 2 电力系统的负荷特性与负荷特性指标 1 2 1 负荷特性与负荷特性指标 电力系统的负荷随时间在不断发生变化,受到多种因素的影响,具有连续性 和周期性的特点。掌握用电负荷的特性和变化规律,对于电力系统来讲可以有利 于系统安全、稳定地运行,对于供电部门来讲可以获得最佳的经济效益,而对于 用户来讲可以充分发挥每一度电能的效益。电力系统负荷特性就是指用电负荷的 特点和性质,不同类型的用户负荷表现出不同的负荷特性【3 】。 例如,在前面所述的各类负荷中,城市居民负荷具有经常的年增长以及明显 的季节性波动特点,而居民负荷的季节性变化在很多情况下,直接影响系统峰值 负荷的季节性变化,但其影响程度则取决于居民负荷在系统总负荷中所占的比 例。尤其是随着电热器、空调装置、电风扇、电冰箱之类的敏感于气候的家用电 器日益广泛地采用,使得居民负荷变化对系统峰值负荷变化的影响越来越大。 商业负荷也同样具有季节性变动的特性,而这种变化主要也是由于商业部门 越来越广泛地采用空调、电风扇、制冷设备之类的敏感于气候的电器所致,并且 这种趋势正在增长。 相对来说,工业负荷一般都是受气候影响较小的基础负荷。当然,这并不是 说它一点儿也不受影响。然而,由于工业负荷本身基础很大,另一方面尤其是由 于三班连续生产,因此这类负荷变动较小。 而其他各类负荷,根据他们的不同特点,也可能具有季节性等特点。 要描述和区分各种不同类型用户负荷的特性,就需要使用负荷的特性指标。 科学、规范的负荷特性指标体系是负荷特性研究的基础。我国于1 9 8 9 年由原电 力部颁发了电力工业生产统计指标解释,其中涉及负荷特性的指标有最高负 荷、最低负荷、平均负荷、负荷曲线、负荷率、平均日负荷率、最小负荷率、月 生产均衡率、年生产均衡率、最高负荷利用小时、同时率、不同时率、尖峰负荷 率等1 4 个。2 0 0 1 年初原国家电力公司对原解释进行了补充修改,其中增加 了峰谷差率指标。这些指标都是电力系统规划和运行中常用和规范的负荷特性指 标,并且都有明确的定义与计算方法。 负荷特性的指标数量多,而且涉及日、月、季、年等不同时段,有的是数值 类,有的是曲线类;有的反映负荷特性总体状况,有的反映负荷的变化趋势。到 目前为止还没有一个统一的分类方式和规范的指标体系,文献【3 】在充分调研分 析的基础上,结合实际工作,考虑实用性,提出以下负荷及负荷特性指标体系分 类方法: 4 第一章绪论 ( 1 ) 描述类( 绝对量) 。如日最大( 小) 负荷,日平均负荷,峰谷差等等。 ( 2 ) 比较类( 相对量) 。如日负荷率、日最小负荷率、日峰谷差率等等。 ( 3 ) 曲线类。如日负荷曲线、月负荷曲线、年负荷曲线等等。 1 2 2 本文所选用的负荷特性指标 对系统内的用户负荷进行分类,所依据的就是不同用户的负荷特性。选取不 同的负荷特性指标对于分类的结果将有很大影响。本文在分类时所选用的用户负 荷特性指标为用户的日负荷曲线,原因如下: ( 1 ) 负荷曲线是反映负荷随时间变化规律的曲线,通过负荷曲线可以直观地 反映出用户负荷的大小和变化趋势,反映出用户用电行为的特征和偏好,并且利 用负荷曲线可以很快计算出如日负荷率、日最小负荷率等其它一些特性指标,能 够比较全面地反映不同用户所具有的负荷特性。 ( 2 ) 日负荷曲线特别是典型日负荷曲线更是期货、合约交易中分配电量、审 核调峰能力及分析互联系统错峰效益的基础。因此,选取日负荷曲线作为系统负 荷分类的依据,对于在此基础上的进一步应用有重要的意义。 ( 3 ) 随着电力系统自动化水平的不断提高和各种负荷量测装置的广泛应用, 各级电网调度中心和变电站,能够通过数据量测系统( s c a d a ) ,获取大量有关用 户的负荷数据,通过对这些数据的分析与处理,可以得到各种不同类型用户的用 电负荷曲线,分析用户结构变化对用电负荷的影响,从而充分掌握负荷的变化情 况,及时调整电力负荷管理与营销策略。 1 3 电力系统负荷分类的应用 电力系统负荷分类的研究就是对电力系统用户负荷构成的研究,即对一定范 围( 一个地区、一个部门、一个企业) 内用户负荷组成的种类、比重及其相互之间 关系的总体表述。 随着电力市场的深入发展和负荷管理技术的不断提高,电力系统负荷分类的 应用也越来越广泛,主要体现在以下几个方面: ( 1 ) 定制电价1 9 , 1 0 l 随着电力体制的改革和电力市场的发展,现行的电价体制逐渐暴露出新的问 题,其中之一就是电价的分类不尽合理。现行的电价分类基本上按照用户用电行 业和用途划分【】,这种分类方法没有考虑用户的用电负荷特性,定价过程中的政 策因素多于效率因素,使电价水平既不能反映企业的生产成本,也不能适应市场 第一章绪论 经济的需要,严重阻碍了市场经济条件下电力资源的优化配置。随着电力市场改 革的不断深入,终端用户将拥有选择售电商的权利,这就要求售电商必须通过制 定公平合理的消费价格和相应的营销策略来挖掘和占领更多的市场j 。因此,售 电商需要根据消费者的电力需求特点、用电行为和习惯等不同特征进行市场划 分,制定相应的营销策略。文献【9 】中提出了一种考虑负荷分类和用电特性的电 价决策方法,特别计及了不同用户的负荷率、电压等级、负荷形状、可靠性要求 等因素,通过实际算例验证了该决策方法的有效性,可以作为有关部门在制定电 价时的参考。 ( 2 ) 负荷预测 总的负荷预测原则上有两种办法:一种是根据总负荷的过去历史资料进行预 测,另一种办法就是将各类负荷分别预测,然后再综合成总的负荷预测。分类负 荷指不同类型的负荷,也可能指不同地区的负荷。直接预测总负荷一般来说较容 易操作,而且也较平滑,能够表明负荷增长的趋势。而分类负荷预测的优点在于, 在某一类负荷中,其增长趋势的不正常情况有可能被发现,并且由于各类负荷都 得到预测,因此,总的负荷预测结果是比较明确的。目前常用的方法是将各类用 电负荷的典型负荷曲线进行加权累加的方法,即将预测系统范围内的用电负荷分 类后,分别选择典型负荷曲线,分类进行预测,再将分类预测曲线按一定的规则 叠加后即可得到待预测的日负荷曲线。文献 1 2 】以该地区各典型行业的日负荷曲 线为依据,运用典型负荷曲线叠加法编制了该地区实际的日负荷曲线,算例结果 表明运用该方法编制的地区日负荷曲线可以为该地区错峰用电方案、年度运行方 式的制定等提供可靠的参考依据。 ( 3 ) 系统规划与负荷管理1 1 3 i 在电力系统规划过程中,在指定季节、日类型等典型情况下,系统总的负荷 需求主要取决于用户负荷的构成情况。通过考虑规划地区不同类型用户负荷的增 长方式和用电习惯,可以获得更为精确的负荷预测模型,降低规划地区发电容量 和负荷需求之间的不匹配程度,减少地区之间通过联络线上的功率传输等。 目前,电力需求侧管理( d s m ) 作为一项新的负荷管理技术,在逐步推行电力 市场的条件下,已经引起人们越来越多的关注。它与传统意义上的用电管理有着 本质的不同,是一种需要由客户参与、并且能够充分挖掘电能资源的负荷管理方 法和技术。由于电力需求侧管理强调客户的参与,因此要求电力公司和客户之间 建立良好的伙伴关系,相互了解,共享信息,共同承担风险,共同争取利益。电 力需求侧管理通过掌握和分析系统的负荷构成,可以引导电力用户选择合理的用 电时间,或采用合理的蓄能方式,达到移峰填谷的作用。从而减少用电峰谷差, 6 第一章绪论 降低电力最大需求,提高用电负荷率,减少发电成本,提高电网运行的安全性和 经济性。 ( 4 ) 综合建模 现代电力系统中,负荷模型是决定仿真研究结果可信赖程度的关键因素之 一。由于综合负荷自身的随机时变性、地域分散性、成分多样性、严重非线性等 特点,负荷建模研究引起了电力工程与学术界的广泛关注。负荷建模的根本目的 是为电力系统仿真计算提供结构合理、参数准确的综合负荷模型。为了准确地反 映用户负荷特性,对不同负荷点的不同时刻应当有不同的负荷模型,或即使建立 同样的模型类,其模型参数也将具有很大的分散性。然而从工程实用的角度讲, 同一电网所采用的综合负荷模型应尽可能地简单,否则使用时就会无所适从。这 就是精确的负荷建模与工程应用要求的突出矛盾。解决这一矛盾的有效途径就是 负荷特性的分类与综合。所谓负荷特性分类就是将同一电网不同负荷点以及不同 时间段中负荷特性接近或相似的综合负荷归并为一类并用同一模型描述该分类 的特性,而负荷特性综合就是分别建立每一种分类的综合负荷模型,使得综合以 后的模型能够最大程度地提取同类负荷中的共同本质特征,从而提高模型的通用 性和适应性。文献【1 4 】中采用模糊聚类的方法,根据各变电站的负荷特征,将东 北电网2 3 4 个变电站划分为7 类,分别建立负荷模型,从而解决了电网中负荷节 点数目巨大、难以逐一测辩的难题。 1 4 本文的主要工作 针对目前电力系统负荷分类研究工作已经取得的成果和存在的问题,本文引 入数据挖掘技术和模糊聚类分析方法研究电力系统负荷的分类,并在此基础上对 基于分类结果的负荷预测等进行了讨论,具体工作如下: 1 选取日负荷曲线( 2 4 点) 作为电力系统用户的负荷特征向量,采用模糊c 均值聚类算法对系统中的用户负荷进行聚类分析。 2 引入聚类有效性函数作为判断最佳聚类结果的依据,通过对几组标准数 据分类结果的比较,确定了一种最佳的聚类有效性函数指标。 3 考虑不同时段负荷的电价、关注程度等影响因素,采用加权欧式距离聚 类分析方法对用户负荷进行精确分类。 4 研究了两种用户负荷类型的识别方法一最大隶属度方法和序列方差识 别方法。 5 在负荷分类的基础上,研究了两种基于负荷构成的电网负荷预测模型一 一典型负荷曲线叠加法和支持向量机回归方法。 第二章电力系统负荷分类的方法 2 1 引言 第二章电力系统负荷分类的方法 研究电力系统负荷的构成情况,实际上就是要研究一种有效的负荷分类方 法,即如何根据用户的负荷特性进行准确、科学的分类,使得划分到同一类中的 用户具有相同或相似的负荷特性,以及合理地确定每一类用户的典型负荷曲线, 从而有利于在此基础上的进一步应用,如提高负荷预测精度、降低负荷管理的 难度等。分类的结果要满足类内具有较高的紧密性,类间具有较高的分离性,体 现出不同类型用户之间的负荷特性差异。 在通常情况下,对系统中的用户负荷进行分类分析之前,无法准确地了解系 统负荷的构成情况,不能根据以往的经验或数据来进行指导分类,因此负荷分类 问题是一类无监督分类问题。 聚类分析又称群分析、点群分析,是一种无监督分类方法,是定量研究样品 或指标分类问题的一种多元统计方法。它是将分类对象置于一个多维空间中,按 照它们空间关系的亲疏程度进行分类。通俗的讲,聚类分析就是根据事物彼此不 同的属性进行辨认,将具有相似属性的事物聚为一类,使得同一类的事物具有高 度的相似性。 聚类分析具有以下的优点: 通过聚类分析,可以获得所研究样本的有用的概括和解释。 通过聚类分析,可以为一个指导学习的统计分类提供判断依据。 2 2 聚类分析的方法 与判别分析不同,聚类分析输入的是一组未分类记录,并且这些记录应分成 几类事先也不知道。聚类分析就是通过分析所给数据记录,根据一定的分类规则, 合理地划分记录集合,确定每个记录所在类别。它所采用的分类规则是由聚类分 析工具决定的。聚类是将数据点集合分成若干类或簇( c l u s t e r ) ,使得每个簇中的 数据点之间最大程度地相似,而不同簇中的数据点最大程度地不同;从而发现数 据集中有效的、新颖的、有用的信息并且可以分析出当前数据的分布情况。 聚类分析在数据挖掘中的应用主要有以下几个方面: 第二章电力系统负荷分类的方法 1 ) 聚类分析可以作为其他算法的预处理步骤,这些算法在生成的簇上进行 处理,如可作为特征提取和分类算法的预处理步骤,也可将聚类结果用于进一 步关联分析。 2 ) 可以作为一个独立的工具来获得数据的分布情况,观察每个簇的特点, 集中对特定的某些簇作进一步分析。可以用在市场细分、目标顾客定位、业绩估 评、生物种群划分等方面。如在商务上,聚类分析可以帮助市场分析人员从客户 基本库当中发现不同的客户群,并且用购买模式来刻画不同的客户群的特征。 3 ) 聚类分析可以完成孤立点挖掘。许多数据挖掘算法试图使孤立点影响最 小化,或者排除他们。然而孤立点本身可能是非常有用的。如在欺诈探测中,孤 立点可能预示着欺诈行为的存在。 2 2 1 聚类分析中的距离 无论采用何种聚类分析的方法,必须要对样本或变量之间的相似性进行度 量,而距离常用来度量样本间的相似性。 。 设( 扛1 , 2 ,n ;j = 1 ,2 ,p ) 为第f 个样本的第,个指标的观测数据。定义 办为样本舻l ,x 1 2 ,x 和) 7 与驴嘶1 ,砌,勃) 7 1 的距离。常用的距离定义有: ( 1 ) 明氏距离( m i n k o w s k i ) d v ( q ) :( pl 一b ) 枷 q = l 时,乃( 1 ) :pi 一x 业i 称为绝对距离。 q = 2i 对,吒( 2 ) = ( 圭j 靠- - x # 2 ) v 2 称为欧式距离。 当旷o o 时,d v ( o o ) = m 塔。a :x 。x a 一靠l 称为切比雪夫距离。 ( 2 ) 马氏距离( m a h a l a n o b i s ) 刃( m ) = ( z 一一) 叫( 置一x ,) 其中,为协方差矩阵。 ( 3 ) 兰氏距离( c a n b e r r a ) 舭,= 古喜剿 c 矿。, ( 4 ) 斜交空间距离 吒= 古喜喜c 一,c 勤一勤儿 j ( 2 - 1 a ) ( 2 - i b ) ( 2 i c ) ( 2 - i d ) ( 2 - 2 ) ( 2 - 3 ) ( 2 _ 4 ) 第二章电力系统负荷分类的方法 其中是变量以与变量而间的相关系数。 在众多的距离中,用的最多的是明氏距离中的欧式距离,有的软件如s p s s 和一些书籍中采用的是欧式平方距离,即将欧式距离加以平方。在本质上,欧式 平方距离和欧式距离没有什么不同,只是随着特征向量之间分离的越来越远,欧 式平方距离的增长速度要快一些。 在量纲取定的条件下,两个样本越相似,它们之间的距离就越小,反之亦然, 值得注意的是量纲选取的不同会改变某些特征的判断依据。因此当样本不同特征 值的量纲差别很大时,会对聚类结果造成很大的影响。这就需要将各种特征值进 行标准化。标准化的方法有很多种【1 6 】,它们可以保证比例的不变性或至少可以试 图使距离度量方法在各种特征下的贡献达到一个最佳的平衡。本文后面的实际算 例中,在对数据的预处理过程中,将对样本数据进行了峰值归一化。 2 2 2 几种常用的聚类分析方法 传统的聚类方法有层次聚类分析法,动态聚类分析法,由于新的理论不断提 出和发展,现在又有了模糊聚类分析法等。下面将对这些方法进行简单介绍。 1 ) 层次聚类分析法( h i e r a r c h i c a lc l u s t e r i n gm e t h o d ) 层次聚类法,又称等级聚类法。根据聚类过程方向的不同,可以分为分解法 ( d i v i s i v e l y ) 和聚合法( a g g l o m e r a t i v e l y ) 两类。分解法把整个集合看作一个整体 ( 类) ,再逐步划分为更小的部分( 小类) 。聚合法刚好相反,是把每一个个体都看 成一个单独的类,尔后从样本相似度入手,通过粘连操作聚集相似度足够大的样 本,逐步聚成更大的组( 类) 。层次聚类法是目前使用最多、研究最为充分的算法。 条件与约定 设待分类样本的特征向量集为讧。,x 2 ,x ,q ”表示第k 次合并时的第 f 类。 基本思想 首先,视个样本各自成为一类,然后计算类与类之间的距离,选择距离 最小的一对合并成一个新类,计算在新的类别划分下各类之间的距离,再将距离 最近的两类合并,直至所有样本聚成一类为止。将所有样本聚成一类结果是没有 意义的,还要根据一定的原则确定最终的种类个数。 算法步骤 初始分类,令k = - o ,每个样本自成一类,即q = z ) ( f = 1 , 2 ,忉; 计算各类间的距离d , y ,由此生成一个对称的距离矩阵d 似= ( 玻) 。,其 中m 为类的个数( 初始时,聊踟; 1 0 第二章电力系统负荷分类的方法 找出前一步求得的矩阵d 似中最小元素,设它是科”和g ,间的距离, 将q ”和g ,两类合并成一类,于是产生新的聚类q h ,g ,n ,令c = k + 1 , r e = m - 1 ; 检查聚类后的个数,如果类数聊大于2 ,转至,否则,停止。 算法评价 层次聚类算法的突出优点是它能够生成比较规整的类集合,聚类结果不依赖 样本的初始排列或输入次序,与聚类过程的先后次序无关,聚类结果比较稳定, 不易导致类的重构。它的不足之处主要为:全部聚类过程需要- 1 次循环,计算 开销较大;对异常数据识别比较脆弱等。 2 ) 动态聚类分析法( d y n a m i cc l u s t e r i n gm e t h o d ) 动态聚类法,又称划分聚类法、逐步聚类法,其基本思想是,在一个平面层 次上对所有的样本点先做出某种较为粗略的划分,然后按照某种最优的准则进行 修正,通过算法的迭代执行,得到一个较为合理的聚类结果。其中最为典型的就 是k 均值聚类算法。 条件与约定 设待分类样本的特征向量集为“,五,x ) ,类的数目k 是事先取定的。 基本思想 该方法取定k 类和选取k 个初始聚类中心,按照最小距离原则将各样本分 配到k 类中的某一类,之后不断计算类中心和调整各样本的类别,最终使各样 本到其所属类别中心的距离平方之和最小。 算法步骤 任选k 个样本特征向量作为初始聚类中心,墨,z 黔,z ? ,令k = - o : 将待分类样本特征向量集 置) 中的样本逐个按最小距离原则划分给某一 类,即如果d r ( k = m i n 秽】l l ,2 省,f = 1 , 2 ,n ,则判x 彤似+ 1 。 式中d 表示x ,和j ”的中心z :”的距离,上角标表示迭代次数,于是产生 新的聚类矽j “”( ,= 1 , 2 ,k ) 。 计算重新分类后的各类心: 才”= 南z ,= l ,2 ,k ( 2 - 5 ) ”j x l e w r 、 式中玎,+ 1 为形j “”类中所含样本的个数。因为这一步采取平均的方法计算调 整后的各类中心,且定为k 类,故称之为k 均值聚类算法。 如果z y = z ( k ) ( = 1 , 2 ,k ) 则算法结束,否则k = - k + l 转至。 算法评价 k 均值聚类算法是以确定的类数及选定的初始聚类中心为前提,使各样本到 第二章电力系统负荷分类的方法 其所属类别中心距离平方之和最小的最佳聚类。初值的选定对结果影响很大,不 同初值可能会导致不同的结果。该算法对于噪声和孤立点敏感,容易受例外情况 的影响。 3 ) 模糊聚类分析法( f u z z yc l u s t e r i n gm e t h o d ) 模糊c 均值聚类( f u z z yc m e a n s ,f c m ) 算法,是一种基于划分的聚类算 法,其思想是使被划分到同一类的对象之间的相似度最大,不同类之间的相似度 最小。f c m 是一种柔性的模糊划分,依据每个样本相对于各个聚类中心的隶属 度大小进行分类。 条件与约定 隶属度函数是表示一个对象x 隶属于集合a 的程度的函数,通常记作甜( x ) , 0 甜一( x ) s 1 。甜一( x ) = 1 表示x 完全隶属于集合a ,即相当于传统集合概念中的 x a 。 基本思想 在对样本数据的分类应用中,f c m 算法将疗个样本的特征向量 墨( 活1 , 2 ,刀) 分为刀。个类,然后求每类的聚类中心,使得用隶属度函数和距离 定义的聚类目标函数,达到最小。f c m 用模糊方法划分,对于每个给定的样本 用区间( 0 ,1 ) 中的隶属度值来确定其相似于各类的程度。为了能够应用模糊划分 方法,隶属矩阵列中的元素取值应在区间( 0 ,1 ) 上,加上归一化的规定,要求一 个样本对各类的隶属度之和为l ,即 = 1 ,v j = l ,2 ,n ( 2 - 6 ) t = l 因此,引入欧式距离概念定义的目标函数为 j ( u ,x c l “,如) = 以= m 口 ,2 ( 2 - 7 ) ,= , i = l 2 l 式中,u 为隶属度矩阵,( o ,1 ) 表示第- ,个样本对于第i 类的隶属度;以 表示类别f 的聚类中心;略= 0 k 一一0 为聚类中心k 与样本之间的欧式距离: m 表示加权指数,本文取m 的值为2 。 综合式( 2 - 6 ) 和式( 2 7 ) 再利用拉个朗日变换即可得到使得式( 2 7 ) 达到最小值 的必要条件: m x 以= 型-( 2 - 8 ) “孑 1 2 第二章电力系统负荷分类的方法 = i 二- 丁 ( 2 - 9 ) 艺( 嘭如) 丙 k - i 算法步骤 在设定聚类数目刀。后,就可以用迭代的方法求解式( 2 8 ) 和式( 2 - 9 ) ,得到各类 别的聚类中心置,和隶属度矩阵u ,具体步骤为: 初始化隶属度矩阵u ,使其满足式( 2 6 ) 的约束条件 依据式( 2 8 ) ,计算的聚类中心x c j ,i = 1 , 2 ,t z e 。 依据式( 2 7 ) 计算目标函数值,如果它小于某个确定的阀值或者达到设定 的迭代次数,则停止计算。 否则,利用式( 2 9 ) 计算新的隶属度矩阵u ,返回第步。 算法评价 f c m 聚类算法的优点在于对给定的刀,值,可以得出合理的结果,并且该算 法对孤立点比较敏感,能够识别出具有特殊特性的样本。本文在对用户负荷进行 分类时采用了这种聚类分析方法,并用程序加以实现。 2 2 3 加权欧式距离聚类分析 在如上所述各种聚类算法中,都隐含假定待分析样本矢量的各维特征对分类 的贡献均匀,不考虑各个特征对分类的不同影响。而在实际应用中,由于构成样 本特征矢量的各维特征代表不同的物理含义,存在量纲差异和精度及可靠性的不 同,使得所选择的特征集未必适合于实际模式分类的需要。因此,以上算法在实 际应用中都有一定的局限。 为了考虑特征矢量中各维特征对模式分类的不同贡献,以及实际应用的需 要,我们引入一种基于加权欧式距离的模糊聚类算法,应用于电力系统负荷分类 的研究中。 1 ) 欧式距离与加权欧式距离i ”i 要对数据对象进行聚类,一般要计算各个数据对象之间的距离( 相似度) 。欧 式距离是一种最常用的距离度量方法,其定义如下: ( 2 1 0 ) 其中五= ( 墨。,墨:,如) 7 和x j = ( 。,:,x 护) 7 1 是两个p 维的数据样本。 若对每个变量根据其重要性赋予一个权重,那么加权的欧式距离可以表示为 西= 瓜i 可习i 习i i 丽,( 2 - 1 1 ) 其中,= ( 劬,( 0 2 ,吃) 为各维特征的权重。 第二章电力系统负荷分类的方法 2 ) 加权欧式距离的性质 以三维空间中的点为例,假设两点坐标分别为( 薯,毛:,x ,) 7 ,( x x :,_ ,) 7 , 国= ( 劬,鲍,鸭) 7 为权重。 性质1设工m 三点的坐标分别为( _ l ,而2 ,薯3 ) 7 ( l ,2 ,x 。3 ) 7 = ( 一1 + ,薯2 ,毛3 ) 7 ,则 ( 吒) 2 一( ) 2 = 2 州矿_ - + 三) , ( 工,l ,x ,2 ,x 3 ) 7 。, 证明:由假设及( 2 一1 1 ) 式,有 ( ) 2 = 缈l ( x l x 一) 2 + 功2 ( 薯2 一x z ) 2 + ( - 0 3 ( x f 3 一x j 3 ) 2 ( 吒) 2 = 缈l ( 薯l z ,l + ,) 2 - 1 - ( 0 2 ( x i 2 一x j 2 ) 2 - - ( 1 ) 3 ( x 1 3 一_ 3 ) 2 于是 ( 矽:! ,) 2 一( ) 2 = q 【( 而。一一l + ,) 2 一( 五。一工,。) 2 】 = 颤a f ( 2 x j l 一2 x ,l + ,) = 2 t o u r ( x , 1 一x ,l + j ) r ( 2 1 2 ) ( 2 1 3 ) ( 2 1 4 ) ( 2 1 5 ) 性质2 设f j _ 两点坐标分别为( 葺l ,薯2 ,薯3 ) 7 ,( x 门,2 ,x 3 ) 7 ,m l ,m 2 ,m 3 点的 坐标依次为( + ,x f 2 ,x ,3 ) 7 ,( x l ,薯2 + ,x i 3 ) 7 ,( 一l ,2 ,薯3 + ,) 7 ,则 ( 以。,) 2 一( 西) 2 】: 【( 吒,) 2 一( ) 2 】:【( 以,) 2 一( ) 2 】= 劬( 。一_ - + 百r ) :v 0 2 ( x ,z 一_ :+ 了r ) : 鳓( 薯3 一x ,+ 互r ) 证明:由性质1 得 ( 一( ) 2 = 2 劬,( 薯。一。+ i r ) ( 2 - 1 6 ) ( :一( ) 2 = 2 ( a 2 r ( x , :一一:+ i f ) ( 2 - 1 7 ) ( 屯,一( ) 2 = 2 颤a 3 r ( x , ,一一,+ i r ) ( 2 - 1 8 ) 于是有: 【( 无。一( ) 2 】:【( 一( 吒) 2 】:【( 以,一( ) 2 】 = 2 a r ( x , l 一l + 与) :2 吐,( 2 一2 + 每) :2 t a a r ( x f 3 一x j 3 + 号i t ) , = 劬( _ 。一_ l + 丐r ) :呸( 薯2 一_ 2 + 了r ) :呜( 薯,一_ 3 + 导) ( 2 - 1 9 ) 由性质1 及性质2 可知,在计算距离时,权值系数所起的作用与其本身的大 d , 截j j 相关,因此利用加权欧式距离进行聚类分析是合理的,同时也说明在实际 应用时,要根据具体情况先决定权值系数,再计算欧式距离。 3 ) 加权欧式距离聚类 欧式距离的特点之一就是各特征分量对距离的贡献相等,但“贡献均等 并 1 4 第二章电力系统负荷分类的方法 不能完全反映客观世界中事物间的相互关系。因此根据每个样本的各个特征分量 所起作用的不同进行加权处理是必要的( 即使各特征是经过压缩或选择而得到 的) 。 以f c m 聚类为例,其目标函数的定义为: j ( u ,以l ,一,l ) = 以= m 口2 ( 2 - 2 0 ) j = ,j = l1 1 1 其中,距离办= 0 扎- x j0 即为传统的欧式距离,各特征分量的贡献相等, 在引入加权欧式距离后,可以使用来代替d 重新定义其目标函数为: n ,n ,n j ( u ,x c l ,l ) = 以= “孑吒2 ( 2 - 2 1 ) j 互f,= lj 暑l 上式即为f c m 加权欧式距离聚类的目标函数,采用与f c m 相同的迭代求解 算法和步骤,就可以对样本进行加权欧式距离聚类。本文采用该方法,并且根据 实际

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论