




已阅读5页,还剩56页未读, 继续免费阅读
(电力系统及其自动化专业论文)对地区电网电压无功控制方案的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
声明 本人郑重声明:此处所提交的硕士学位论文对地区电网电压无功控制方案的研 究,是本人在华北电力大学攻读硕士学位期间,在导师指导下进行的研究工作和取得 的研究成果。据本人所知,除了文中特别加以标注和致谢之处外,论文中不包含其他人 已经发表或撰写过的研究成果,也不包含为获得华北电力大学或其他教育机构的学位或 证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均己在论文中作了 明确的说明并表示了谢意。 学位论文作者签名:2 乞舡日 期:兰蔓业 关于学位论文使用授权的说明 本人完全了解华北电力大学有关保留、使用学位论文的规定,即:学校有权保管、 并向有关部门送交学位论文的原件与复印件;学校可以采用影印、缩印或其它复制手 段复制并保存学位论文;学校可允许学位论文被查阅或借阅;学校可以学术交流为 目的,复制赠送和交换学位论文;同意学校可以用不同方式在不同媒体上发表、传播学 位论文的全部或部分内容。 ( 涉密的学位论文在解密后遵守此规定) 作者签名:至眸 日期:迦2 :耋丛: 导师签名: 日 期: 华北电力大学硕士学位论文 1 1 概述 第一章引言 电力系统电压是衡量电能质量的重要指标。电压质量对电力系统的安全与经济 运行,对保证用户安全生产和产品质量以及电气设备的安全与寿命,有重要的影响。 电力系统的无功补偿与无功平衡,是保证电压质量的基本条件。有效的电压控制和 合理的无功补偿,可以指导调度人员安排运行方式和计划部门进行电网无功规划, 不仅能保证电压质量,而且能提高电力系统运行的稳定性和安全性,充分发挥其经 济效益。 电力系统的运行电压水平取决于系统无功功率的平衡。一方面,无功不足将导 致系统电压降低,用电设备不能充分利用,甚至会引发电压崩溃等一系列事故:如 1 9 7 0 年美国纽约大停电和1 9 8 7 年东京大停电都是由于高峰负荷时无功不足而造成 电压崩溃,进而导致系统瓦解的。另一方面,无功过剩也会造成系统电压的恶化, 从而危害系统和设备的安全运行,而且过多的无功备用又会浪费不必要的投资。另 外,系统无功功率的分布是否合理还直接关系到电力企业自身的经济效益。如果大 量的无功功率在电网中流动,不仅要消耗有功功率,占用输电线路和设备的容量, 而且会使线路电压降增大、线路损耗增加、供电的经济性降低。总而言之,维持电 网正常运行情况下无功功率的平衡与合理分布不仅是改善和提高电压质量的基本 条件,同时也是保证电力系统安全、可靠、经济运行的重要措施。 在现代大电网中,随着电力系统联网容量的增大和输电电压的提高,输电功率 变化和高压线路的投切都将引起很大的无功功率变化,系统对无功功率和电压的调 节和控制能力的要求越来越高。另一方面,由于受电力市场化变革的影响以及来自 环境、经济和技术方面的制约,为了充分利用系统资源,现代电网越来越接近于其 极限运行状态,这使得电网缺乏灵活的调节能力,特别是在某些紧急运行情况下, 电网更加脆弱。通过无功电压优化控制,不仅能改善电压质量,提高系统稳定性, 还能降低有功网损,节约能源。 电力系统电压无功控制是指在保证满足运行约束的同时,用尽量少的无功投入 ( 或尽量少的无功补偿设备投资) 最大限度地改善电压质量、降低网损【卜3 1 。电力系统 电压无功控制包括规划配置和运行控制两个方面的问题。规划问题计算无功补偿设 备的最优安装位置、类型和容量,以达到节省投资费用的目的。运行优化与控制问 题认为无功补偿设备的配置已定,需要根据实际负荷的变化,确定无功补偿设备的 投切方案和变压器分接头位置等,以达到在满足电压质量要求的情况下,网损最小, 华北电力大学硕士学位论文 或能耗最小,或运行费用最小的目的。地区电网电压无功控制主要是通过调整发电 机的端电压、变压器分接头位置,无功补偿设备等手段来实现的。 随着地区电网的不断发展,电网结构日趋复杂,无功调节手段的数目日益增多, 用户对电能质量的要求也日益提高,这些因素导致地区电网电压无功控制问题的规 模越来越大对其求解的要求也越来越高传统的电压无功控制方法己不能满足电 力系统实际运行的需求。因此,寻求一种新的控制原理和控制方法来解决地区电网 电压无功协调控制问题具有重大的理论意义和工程实际意义。 1 2 电压无功控制的研究动态 从七十年代末以来,世界范围内发生了多起电压失稳及电压崩溃事故,这些事 故的停电时闻长,波及范围广,造成了巨大的经济损失和严重的社会影响。如何有 效地防止电压崩溃事故的发生以及如何更好地进行电压无功控制引起了许多国家 电力部门的重视。近几十年来,国内外的众多电力工作者和科研人员在电压无功控 制领域开展了大量的研究工作,取得了很多成果。 1 2 1 基于变电站v 口c 的分散控制方法 分散控制是指在各个变电站或发电厂中,自动调节站内有载调压变压器的分接 头位置或其他电压调节器,控制无功功率补偿设备( 包括电容器、电抗器、调相机、 静止无功功率补偿设备等) 的工作状态,使得当负荷变化时,该变电站或发电厂的母 线电压和无功功率保持在规定的范围内m 。分散控制的特点是见效快,可有效避免 无功功率经过长距离的输送流经各级输变电设备所造成的有功功率损耗和电压降 落。它对实现局部地区的优化,提高受控站供电范围内的电压质量和降低局部网络 变压器的电能损耗,减轻值班员的操作压力是很有价值的。分散控制是我国目前普 遍采用的一种电压无功控制方式。 近年来,随着电网运行管理水平的大幅提高和微机应用技术的迅速发展,已经 有许多变电站采用了综合自动化技术,并向建立无人值班变电站的趋势发展。作为 变电站综合自动化的重要组成部分,电压无功综合自动控制装置( v o c ) 的研究和 应用得到了广泛的发展,它为分散控制方法的实现提供了技术基础f5 1 7 】。v o c 装置 一般以微机为中心,具有较强的分析判断能力,智能化程度高,灵活可靠。它能根 据采集到的变电站内部的信息,分析判断该站当前的运行状态,并依据制定的控制 策略自动调节变电站内部的有载调压变压器分接头和无功补偿设备,以控制变电站 的母线电压和无功功率在舰定的范围内。 按照其实现方式,v o c 装置l5 _ 1 6 1 分为以下三种类型: 华北电力大学硕士学位论文 ( 1 ) 自带输入输出系统的独立v q c v q c 装置集输入输出系统与分析判断功能于一体,其测量值由本身自带输入, 输出单元采集,有关闭锁信号由相应装置的硬接点接入优点是调节速度快、可靠 性高。缺点是铺设电缆多、安装调试麻烦、变电站运行方式改变时不易扩充。 ( 2 ) 变电站自动化系统网络v o c v q c 装置本身不带输入输出系统,利用变电站自动化系统的网络与i ,0 单元实 现数据的采集与控制。优点在于参数设置简单,人机界面友好,无需单独铺设电缆, 调试方便,调节与闭锁速度快。缺点是v q c 的可靠性取决于网络通信、i o 单元和 独立工控机v q c 装置的运行情况,并且它还要求提供专用的滑档闭锁通道。 ( 3 ) 变电站后台监控计算机软件v q c v q c 软件是后台监控系统的一个子模块,没有专用的i ,o 单元,借助于变电站 自动化系统进行数据采集与控制。优点在于参数设置简单,人机界面友好,调试方 便,省去了专用的硬件设备,降低了成本。缺点是由于数据采集与控制经过了多个 环节,v q c 的可靠性取决于网络通信、i ,o 单元和后台监控计算机的运行状况,因 此对后台监控计算机的可靠性要求特别高。它同样也要求提供专用的滑档闭锁通 道。 按照v q c 装置采用的控制策略,v q c 可分为: ( 1 ) 单一的控制策略 它又可分为按照功率因数大小控制、按母线电压曲线控制、按无功功率变化控 制、按昼夜时间段控制、按负载电流大小控制、按电压电流相位差控制等。 ( 2 ) 综合功能的控制策略 这类控制包括按电压、功率因数复合控制,按电压、时间复合控制,按电压无 功综合控制等等。 以上控制策略中,应用最广泛的是按电压无功综合控制【7 以1 1 的控制策略。它的 基本思想是以主变低压侧电压为主要控制目标,以无功功率为参考条件,通过界定 电压和无功功率的上下限,将平面分为九个区,每个区域都有其相应的控制规则。 在实际运行时,根据采集到的数据判定当前的运行状态属于其中的哪一个区域,然 后依据该区域的控制策略,或投切并联补偿电容器,或升降有载调压变压器的档位, 或联合控制两种手段,把运行于非理想区域的状态调节到正常理想的区域内。 基于变电站v q c 装置的分散控制方法原理简单,动作迅速可靠,可以满足电 力系统实时性及可靠性的要求。但是,随着电力系统规模的不断扩大及计算机、通 信技术的迅速发展,这种各自为阵的变电站分散控制方法的缺陷越来越明显。其最 大的缺陷在于:受到变电站综合自动化水平的限制,v q c 装置仅采集该变电站内部 的电压无功运行参数,而不可能同时得到同电压等级的相关变电站和上一电压等级 变电站的实时运行信息,因此无法从全网的角度考虑选择较优的电压无功调节手 3 华北电力大学硕士学位论文 段,也不可能对本站的控制措施对全网产生的影响进行评估,这注定了v o c 装置 仅能实现变电站局部的最优控制,无法考虑到对其他变电站的影响,更无法从整个 地区电网的电压合格率最高或全网有功网损最小的角度出发寻求一种优化的控制 手段【临1 7 】。这样,从变电站局部来看,v q c 装置的调节作用提高了站内母线的电压 质量,降低了本站的损耗,但是从整个电网来看,这种控制措施不一定是有利的, 有时可能还会影响全网的电压质量及有功网损增加,甚至可能导致相关站点的调节 装置连锁动作,造成全网的连锁反应。 1 2 2 基于优化算法的集中控制方法 目前,某些地区电网通过在其能量管理系统( e m s ) 中装设电压无功优化计算高 级应用软件来对地区电网中的各种调压资源进行控制,实现电压无功集中优化控 制。 集中控制是指调度中心通过调度s c a d a ( 数据采集及监控) 系统,采集电网中各 个发电厂和变电站的中枢点电压,发电机的无功出力、联络线无功,变压器分接头 位置,无功补偿设备的状态等模拟量和开关量,经数据处理程序建立系统实时数据 库。然后,在相应系统硬件和软件支持下,定时启动电压无功优化计算程序,通过 调整地区电网中各种可用的无功电源发出的无功功率或无功补偿设备的投切状态, 可以在较短的时间内实现系统中枢点电压的调整,减少偏离值。整个控制过程是闭 环的,即给出优化控制方案后直接下达s c a d a 执行,可以不需要调度人员进行干 涉。 电压无功控制问题是一个多变量、多约束、多目标的混合非线性问题,它具有 控制变量不连续、不确定性、动态性等特点。针对无功优化问题各方面考虑的程度 和处理的方法的不同,就有不同类型的无功优化数学模型和处理方法。但总体而言, 各类电压无功优化控制算法的基本思路【1 8 】都是:在电力系统有功负荷、有功电源及 有功潮流分布已经给定的情况下,以发电机端电压幅值、无功补偿设备和可调变压 器分接头的位置作为控制变量,而以发电机的无功出力、负荷节点电压幅值和支路 传送功率作为状态变量,建立电力系统无功优化问题的数学模型,应用优化技术和 人工智能技术,在满足电力系统无功负荷需求的前提下,谋求合理的无功补偿点和 最佳补偿容量,使电力系统安全、经济地向用户供电。 目前,在电压无功优化控制中常用的优化算法主要包括以下几种:线性规划法、 非线性规划法、动态规划法、人工智能方法。这些方法各有优缺点,下文将对这些 方法分别进行阐述。 ( 1 ) 线性规划法 线性规划法理论完整,方法成熟,因此被广泛应用到电力系统无功优化领域中 华北电力大学硕士学位论文 【协2 2 1 。它的基本思想就是利用逐次线性规划法求解非线性规划问题。其中,灵敏度 分析法【2 卜2 2 1 就是最典型的,也是应用最广泛的线性规划法。灵敏度分析法的指导思 想是:将非线性优化转化为线性优化,求出控制变量对无功注入的灵敏度、无功注 入对节点电压的灵敏度、以及有功网损对节点电压的灵敏度,在某一初始运行状态 附近,根据目标函数以及控制变量与状态变量之间的灵敏度关系来选择对象并计算 调整量。线性规划法的优点在于计算速度快,易于处理各种约束条件,但由于它对 非线性函数作线性化处理,故模型精度不能令人满意,且收敛难度较大。 ( 2 ) 非线性规划法 由于电压无功优化问题是一个典型的非线性数学规划问题,所以非线性规划法 是处理无功优化的最直接的方法1 1 8 ,2 3 。2 6 1 。常用的非线性规划方法包括牛顿法1 2 3 之4 1 、 广义简约梯度法【2 卸和二次规划法【2 6 1 等。总体而言,非线性规划法的数学模型建立比 较直观,物理概念清晰,计算精度高。但到目前为止还没有一个成熟的基于非线性 规划的无功优化算法。现有的算法或多或少都存在计算量大,内存需求量大,收敛 性差,稳定性不好,对不等式的处理存在一定的困难等问题,所以它的应用受到了 一定的限制。非线性规划法尤其不适舍于大型电力系统的实时无功控制和优化。 ( 3 ) 动态规划法 动态规划法【1 8 ,2 m 9 1 以贝尔曼的最优化原理为依据,其原理是:把电压无功优化 决策问题分成若干个相互联系的阶段以后,把每一个阶段作为一个静态的问题来分 析。无论初始状态和初始决策如何,对于前面决策所形成的某一状态而言,其后各 阶段的决策序列必须构成最优决策。动态规划法是一种分阶段优化的方法,可用来 求解约束条件下的电力系统无功优化问题,并可提高问题的求解速度。但是,动态 规划法只是给出一种解题思想,没有给出标准算法,必须根据具体问题确定求解方 法。由于动态规划问题本身的复杂性,当阶段数目、状态变量及控制交量数目较多 时,计算量将显著增加,以致许多实际规划问题能用动态规划描述,却难于以合理 的代价求解。 ( 4 ) 人工智能法 随着计算机技术的发展和人工智能技术的不断完善和改进,越来越多的人工智 能技术8 3 0 。3 6 】已经应用于电压无功控制。一些模拟进化类方法,如遗传算法1 3 4 ,3 7 】 ( g e n e t i ca l g o r i t h m ) 、进化规划算法i ”1 ( e v 0 1 u t i o np r o g r 锄) 、模拟退火算法 【3 6 】( s i m u l a t e da n n e a l i n g ) 等具有较高的鲁棒性和广泛的适应性,对于求解问题几乎 没有任何限制,可以方便的处理混合整数离散性问题,同时使用多目标函数,也不 涉及常规优化问题求解的复杂数学过程,从多初值点开始,沿多路径搜索获得最优 解集。但是这些方法普遍都存在容易收敛于局部最优解、搜索时间过长、实时性较 差等问题。 总体而言,基于优化算法的电压无功集中控制方法需要建立全系统的模型,控 5 华北电力大学硕士学位论文 制过程需经过大量的数学计算或复杂推理,实时性不强,不能很快地对系统发生的 清况作出反应。当系统规模较大时,直接应用控制理论进行大系统的分析和设计, 还将遇到“维数灾”的困难。此外,由于地区电网中存在的一些尚未解决的实际技 术问题,它们在很大程度上限制了基于优化算法的集中控制方法的应用。这些问题 包括: ( 1 ) 当地区电网采集的数据不全或出现局部坏数据时,会导致数值计算方法 失败,系统的优化控制无法执行。 ( 2 ) 当地区电网采集的遥测数据出现时间的异步性时,数值计算方法会出现 较大的偏差,影响控制的准确度。 ( 3 ) 实际中,无功功率配置任务同时要满足电力系统正常运行和事故危机状 态,采用纯优化算法不适合处理这种多重并行问题。并且,数值算法不能体现电力 网长期运行积累的十分有价值的经验。 ( 4 ) 地区电网中的无功调节设备的响应速度存在差异,有快速调节的,也有 慢速调节的。这些不同的状态决定了使用这些调节设备的优先级也不同,而基于数 值计算的控制技术体现不出以上差别。 1 2 3 分级电压无功控制方法 为了更好的对大规模电力系统进行实时电压无功优化控制,改善电压稳定性, 目前提出了对电力系统采取分级电压控制的思想。这种方法将电力系统的无功功率 和电压自动控制按空间和时间从功能上分成三个不同的层次,即一级、二级和三级, 有的文献也称为局部的、区域的和系统的p s 4 1 l 。 ( 1 ) 一级电压控制:是一种分散、自动的控制。当节点电压发生快速、幅度 较大的变化时,自动启动电压无功调节装置,包括发电机自动电压调节器( a v r ) , 静止无功补偿器( s v c ) ,静止无功发生器( s t a t c o m ) 、有载调压变压器( o l t c ) 以 及并联补偿电容器等,它们通过维持电压或无功为设定值进行无功电压瞬时快速调 控。 ( 2 ) 二级电压控制:是一种分区控制,整个电力系统分成若干个二级电压控制区 域,每个区域的二级电压控制器按照一定的协调控制规律,闭环设定控制区域内各 一级电压控制器的整定值,维持预先设定的主导节点的电压水平,从而平衡较慢的 较大的无功变化和电压偏差。 ( 3 ) 三级电压控制:是系统优化控制。它通过改变二级电压控制器的控制目 标,完成全局的电压管理,实现全系统的经济运行。其目标可以是全系统网损最小, 也可以是电厂煤耗最小,同时保证系统的安全运行。 分级电压控制系统中,每一级都有其独立的控制目标,同时,低级控制系统也 6 华北电力大学硕士学位论文 可以根据上级控制系统的要求调整自己的控制目标。 分级电压控制思想可以把一个较大规模的电力系统分割成多个子区域,只需分 别对各个子区域进行电压无功优化控制就能实现对整个电力系统的电压无功优化 控制。这种方法已有一些相关的研究成果,但仍然存在一些尚未解决的问题,包括 如何对电力系统进行优化分区、如何选取先导节点、如何设计鲁棒性较强的二级电 压控制策略等。所以总体而言,分级电压控制研究还在初级阶段,还没有形成系统 的分析和设计方法,实用化的研究也有待进一步加强。 1 3 本文主要工作 本论文的主要工作是从实用化和经济化的角度探讨了地区电网电压无功控制 的新方法和新策略,重点是将模糊集合理论和决策树算法相结合引入到地区电网电 压无功控制的研究中,以一种新的思路来实现地区电网电压无功控制,提高全网电 压无功的协调控制水平。课题研究的目标是建立一套基于策略的地区电网电压无功 协调控制系统,该系统无须进行地区电网电压无功优化计算,而是通过构建的规则, 来较好的解决电网电压无功控制问题。 本文主要完成了以下几方面内容: 1 、阐述了电压无功控制课题的意义,介绍了地区电网中电压无功控制方法的 研究动态,并指出了它们存在的问题。 2 、在介绍模糊集合理论和决策树算法的原理、特点及方法的基础上,提出把 模糊集合理论和决策树算法相结合用于地区电网电压无功控制。阐述了模糊决策树 的原理,对变电站电压无功控制方式和原理进行详细地说明。 3 、根据地区电网的特点,按照分级分区协调控制的方式对电压无功进行控制, 在每一个独立予区内,把基于模糊决策树的电压无功控制方法推广应用于变电站电 压无功控制中,对地区电网电压无功协调控制原理、控制过程及功能等问题进行了 具体的论述。 4 、根据所提出的控制方法,以仿真网络和实际地区电网作为测试系统,将该 方法的控制效果与传统电压无功控制方法的控制效果进行了比较分析。结果表明, 本文所提出的方法是可行的。 5 、总结了本论文的主要研究成果,并指出了有待进一步深入研究和改善的问 题。 华北电力大学硕士学位论文 第二章基于模糊决策树的电压无功控制 模糊集合理论4 2 4 5 1 和信息论是模糊决策树和模糊一i d 3 算法的重要理论基础, 本章首先要对其中的一些基本概念给出数学上的定义。 2 1 模糊集合理论基础 为了用数学方法描述和处理自然界出现的不精确、不完整的信息如人类语言描 述和图像信息,美国控制论专家l a z a d e h 于1 9 6 5 年发表了题为“f i l z z ys e t ”的论 文,提出了模糊理论。模糊理论建立在模糊集合( f i l z z ys e t ) 和模糊逻辑( f i l z z y l o 西c ) 基础上,引入了隶属函数( m e m b e r s h i pf i m c t i o n ) 的概念来描述那些介于“属于” 和“不属于”的中间过渡过程,使得每个元素不仅以“0 ”或“l ”属于某一集合, 而且还以一定的介于“o ”和“1 ”之间的程度属于某一集合。模糊集合是以一定程 度具备某种特性元素的全体。提出模糊集合理论的出发点,是将人类特有的这种语 言模糊描述加以数学上的描述,变成计算机可以接受的形式。模糊理论建立了大脑 和计算机之间的桥梁,它将大脑中的以模糊信息形式存储的经验和知识,转化为计 算机可以接受的形式,使得计算机可以模拟大脑处理模糊信息,进行分析和判断。 模糊集合( f u z z ys e t ) 实现了对因为没有严格界限划分而使得难以精确刻划的 模糊现象( 模糊概念) 进行有效的定量描述。下面将介绍模糊集合理论中最基本的 几个概念。 2 1 1 基本概念 论域:讨论的范围,常用u ,层表示; 元素:论域中的每个对象,常用口,6 ,c ,五y ,z 表示; 集合:论域中具有某种相同属性的确定的、可以彼此区别的元素的全体成为集 合,常用彳,曰,c ,x ,j ,z 表示。 元素口和集合4 的关系只有两种,口属于彳( 记号口彳) 或4 不属于4 ( 记号 口匹爿) 。 定义1 :模糊集是以不同强度( 隶属度) 具备某种特性的所有元素的整体。设4 是论域【,到【o ,l 】的一个映射,即爿:u j o ,l 】,“j 一( ) ,称爿是u 上的模糊集,而函 数爿( ) 称为模糊集一的隶属函数,爿( “) 称为甜对模糊集彳的隶属度。论域u 上的全 华北电力大学硕士学位论文 体模糊集所构成的集合记为f ( u ) 当论域【,为有限集 毡,心,) 时,模糊集合爿可以表示为三种形式: 序对表示法:一= ( ,么( m ) ) i f = l ,2 ,打 ; 扎德表示法:爿:譬竽,其中一,和并不是普通意义下的分式和 m e u , 求和符号,只是一个记号。兰啦表示论域u 中的元素咋与其隶属度彳以) 之间的对 应关系。 向量表示法:爿= ( 4 ( m ) ,爿( “:) ,一( “。) ) 定义2 :设4 ,曰,( ,若v “e 【,4 ( 1 1 ) 曰( “) ,则称口包含_ ,或称4 含于曰, 并记作a c 曰。 定义3 :设一,占f ( u ) ,则规定彳u b ,4 n 曰,为彳与口的并、交和补,即任取 “( ,均 ( 一u b ) ( 甜) = m a x _ ( 甜) b ( 甜) ) = 4 ( 甜) v b ( “) ( 2 - 1 ) ( 4 n b ) ) = i i 讧n 4 ( ) ,b ( “) ) = 4 ( “) b ( ) ( 2 2 ) 彳( “) = 1 一彳( “) ( 2 3 ) 其中,算子“v ”与“ ”分别表示取最大值和最小值。 定义4 :设4 f ( ( ,) ,则4 的基数度量( 或求和) 由公式 m ( 爿) = 4 ( 甜) ( 2 - 4 ) 来定义。 定义5 :设a ,马( f = 1 ,2 ,朋) f ( 【,) ,且满足e c 爿( f = 1 ,2 ,j 1 ) ,则称 e i f = 1 ,2 ,m 构成4 的一个模糊分割。 2 1 2 模糊关系 人类思维判断的基本形式是: 如果( 条件) _ 则( 结论) 在条件和结论中所包含的集合常常是模糊的。因此,人们称这种推理形式为模 糊关系。模糊关系的标准形式为: r :如果彳则口 9 华北电力大学硕士学位论文 其中彳,口为两个模糊集。在模糊数学上该关系可用叉积表示: r :一b 斗【o ;1 】 每一数对( ,6 ) 都对应于介于o 和1 中的一个实数,它描述了该数对相互之间关 系的强弱。在模糊逻辑中这种叉积常用最小算子运算: o ( 口) 曰( 6 ) = m i n 彳( 口) ,b ( 6 ) ( 2 5 ) 2 1 3 模糊化 将非模糊量转化为模糊量的过程,称为模糊化。输入量的取值一般为语言值即 模糊集: 输入量 语言值l ,语言值2 ,语言值玎 输入量本身也称为语言变量。下面通过一个例子来说明。例如在温控系统中, 温度r 为语言变量,其语言值可为: r 冷( c o l d ) ,温( w 锄) ,热( h o t ) 语言变量的定义大都将其语言值的隶属函数画在一个坐标系内,图2 1 是语言 变量r 的语言值定义。 温度t 图2 一l 语言变量温度r 的语言取值 当输入r = 2 0 时其输入量的模糊化 ,( 2 0 ) = o 6 尥( 2 0 ) = o 4 如( 2 0 即 0 6 ;o 4 ;0 ) 称为温度2 0 的语言解释。在语言中人们认为温度= 2 0 为冷。 一个非模糊值的模糊化就是根据输入语言变量的定义确定相应于每个语言值的隶 属度。 2 1 4 隶属函数的确定 隶属函数在模糊数学中占有突出的地位。对于模糊问题,首先要建立模糊集的 1 0 h x 趟曩辑 华北电力大学硕士学位论文 隶属函数。隶属函数的确定过程,本质上是客观的,但又容许有一定的人为技巧, 确定隶属函数的常用方法有模糊统计试验法、二元对比排序法、逐级估量法和与模 糊分布拟合。 2 1 4 1 模糊统计试验法 隶属函数在某些场合下,也可以通过模糊统计而得到。要做一个模糊统计试验, 首先要选取一个论域u ,在u 中选择一个固定的元素e u ,然后再考虑u 的一个 运动着的,边界可变的普通集合。这个概念是随着不同的条件、场合和不同的观 点而改变的。对彳的隶属度) 可以表示为: ( ) :l i m 雏兰塑堕 ( 2 6 ) 4 一 万 其中”是总的试验次数,只要要求它充分大就可以了。实践表明,随着 的增 大( “。) 会趋向一个【o ,l 】闭区间的数,这个数就是隶属度。多次试验中,隶属度不 等于o 的那些元素“。,和隶属度一起搭配起来组成的“单点”( 或称序偶( ( ) ,) ) 的集合,就是u 的模糊集彳。 2 1 4 2 二元对比排序法 二元对比排序法是把事物两两相比,从而确定顺序,由此决定隶属函数的大致 形状。二元对比排序法有多种,以下仅介绍三种:相对比较法、择优比较法和对比 平均法 ( 1 ) 相对比较法 它是把论域中各元素,按某种特性,在两两元素之间进行对比,建立所谓二元 比较级。设数对( 工 ) ,正( y ) ) 是【o ,l 】【o ,l 】上的数偶,在二元比较级后,通过相及 矩降转化为总体的排序。 ( 2 ) 择优比较法 该法是经抽样试验后,利用统计方法求隶属度的一种方法。 ( 3 ) 对比平均法 如果将上述二元比较法经加权后求隶属度,即为对比平均法,权分平权( 乘数 相同) 和非平权( 乘数不同) 。 2 1 4 3 逐级估量法 逐级估量法又叫模糊集法,运用时首先要规定( 或给出) 若干等级,在给出等 级后,就可在给定的全部等级上逐级估量,估量以指定适当的置信度表示,置信度 的分数从o 到1 0 变化。 逐级估量法的步骤如下: ( 1 ) 在给定的全部等级上作选择,以确定出自己最倾向属于的一个等级,并 华北电力大学硕士学位论文 给出最高置信度分数。 ( 2 ) 在给出的最高置信度等级的两边作对偶比较与估量,直至对全部等级都 给出适当的置信度为止。 ( 3 ) 将所得分数除以常数1 0 ,则变换成在闭区间 o ,l 】上取值的隶属度了,并 可用模糊集记法给以表示。 2 1 4 4 与模糊分布拟合 法国学者卡夫曼收集整理2 0 余种常见的隶属函数类似概率统计,我们可根 据实际情况,选定某些带有参数的函数表示某类型的模糊概念的隶属函数( 论域为 实数域r ) ,然后通过实验确定参数。这是应用工作者通常采用的方法。 、 把实数域r 上模糊集的隶属函数称为模糊分布。在实际中选择合适的模糊分布, 会使隶属函数的确定显得简便快捷。下面介绍几种常用的模糊分布。 1 、梯形分布或半梯形分布 ( 1 ) 偏小型 彳( 功= lx 6 ( 2 ) 偏大型 彳( 工) = o工 6 ( 3 ) 中间型 彳( 工) = o x 一口 6 4 d 一工 d c l 工 口 4 j 6 c 工 d d j 2 、矩形分布或半矩形分布 ( 1 ) 偏小型 特器:;: ( 2 ) 偏大型 华北电力大学硕士学位论文 f o 4 ( : l 【o 工 口 4 s x 6 6 s 石 除此之外,还有三角分布、抛物形分布、正态分布和哥西分布等。以上几种分 布模型在实际应用中可根据讨论对象所具有的特点加以选择,或通过统计资料描述 出大致曲线,将它与给出的五种模糊分布比较,选择最接近的一个,再根据实验确 定较符合实际的参数,在这个过程中,专家经验也非常重要。 2 2 决策树原理 2 2 1 决策树简介 决策树”( d e c i s i t r e e ) 学习是以实例为基础的归纳学习算法。它从一组无次 序、无规则的事例中推理出决策树表示形式的分类规则。它采用自顶向下的递归方 式,在决策树的内部节点进行属性值的比较并根据不同的属性值判断从该节点向下 的分支,在树的叶节点得到结论。所以从根到叶节点的一条路径对应一条合取规则, 整棵决策树对应一组析取规则【5 0 1 。学习得到的决策树也能被表示为多个i f - t h e n 的规 则,以提高可读性。 一棵决策树的内部节点是属性或者属性的集合,叶节点是所要划分的类。经过 一批训练实例集的训练产生一棵决策树,决策树可以根据属性的取值对一个未知实 例集进行分类【5 1 1 。使用决策树对实例集进行分类的时候,由树根开始对该对象的属 性测试其取值,并顺着分支往下走,直到走到某个叶节点。此时,叶节点的类标号 即为该对象的类。 2 2 2 决策树算法基本原理 2 2 2 1 信息论 决策树算法是以信息论原理为基础的。信息论是美国数学家申农( c e s h a 衄o n ) 为解决信息传递( 通信) 过程问题建立的理论,也称为统计通信理论。一个传递信 息的系统是由发送端( 信源) 和接收端( 信宿) 以及联接两者的通道( 信道) 三部 分组成。信息论把通信过程看成是随机干扰的环境中传递信息的过程,在这个通信 “垃 型g 蝴 净 舡 o 华北电力大学硕士学位论文 模型中,信息源和干扰( 噪声) 都被理解为某种随机过程或随机序列。因此,在进 行实际的通信之前,收信者( 信宿) 不可能确切了解信源究竟会发出什么样的具体 信息,不可能判断信源会处于什么样的状态,这种情形就称为信宿对于信源状态具 有不确定性,而且这种不确定性是存在于通信之前的,因此又叫先验不确定性。 在进行了通信之后,信宿收到了信源发来的信息,这种先验不确定性才会被消 除或者被减少。如果干扰很小,不会对传递的信息产生任何可察觉的影响,信源发 出的信息能够被信宿全部收到,在这种情况下,信宿的先验不确定性就会被完全消 除。但是,在一般情况下,干扰总是会对信源发出的信息造成某种破坏,使信宿收 到的信息不完全因此,先验不确定性不能全部被消除,只能部分被消除。换句话 说,通信结束之后,信宿还仍然具有一定程度的不确定性,这就叫后验不确定性。 显然,后验不确定性总要小于先验不确定性,不可能大于先验不确定性。如果后验 不确定性的大小正好等于先验不确定性的大小,这就表示信宿根本没有收到信息。 如果后验不确定性的大小等于零,这就表示信宿收到了全部信息。可见,信息是用 来消除( 随机) 不定性的东西,信息量的大小,由所消除的不定性的大小来计量。 2 2 2 2 信息论中的重要概念 ( 1 ) 信道模型。信道的数学模型可以用三元组( 石,p ( x y ) ,y ) 来表示,z 为信 源状态集,y 为信宿状态集( 收到的信息) ,条件概率p ( x y ) 称为信道的传输概率, 它反映信道的输入与输出的关系,而且它实际上是一个矩阵,称为传输概率矩阵。 信息论的信道模型如图2 2 所示。信源z 的取值为,恐,工。,变量y 取值为 y l ,y 2 ,y n 。 图2 - 2 信道模型 ( 2 ) 自信息量。在收到而之前,收信者对信源发出的而不确定性定义为信息符 号而的自信息量,( ) 。即f ,( 而) = 一l 0 9 2 p ( 而) ( 2 - 7 ) 其中p ( 葺) 为信源发出而的概率。 ( 3 ) 信息熵。如果一个离散随机变量x 有m 种取值( f - 1 ,2 ,以) ,其中每一 种取值的概率分别为j p ( t ) ,五x ,则x 的熵为: 盟 日( ) = 志p ( 一) l 0 9 2 p “) ( 2 - 8 ) 熵所度量的是随机变量的不确定性,当随机变量x 每个取值五的概率分量越接 近相等时,不确定性越大,熵就越大;反之,当各概率分量相差越大时,表示有选 华北电力大学硕士学位论文 择概率分量较大的那个五值的倾向,这时不确定性有所减少,熵较少,直至当一个 概率分量为l 而其它概率分量为o 时,不确定性为零,熵为零。 当已知某一随机变量y 时,随机变量剩余的不确定性由条件熵来计算。 ( 4 ) 条件熵。如果信源x 与随机变量】,不是相互独立的,收信者收到信息y 。 那么,用条件熵日( x i y ) 来度量收信者在收到随机变量y 之后,对随机变量x 仍然存 在的不确定性。设x 对应信源而,y 对应信源咒,p “,咒) 就是当y 为咒时x 为玉的 概率。条件熵是指在给定条件】r 的情况下随机变量x 的熵。即: h ( x i j ,) = p ( j ,) 日( x | y = 力= 一p ( 力p ( x i y ) l o g :p ( x l 力 ( 2 - 9 ) ,e r,e r x e j ( 5 ) 交互信息。两个随机变量之间的交互信息是指在给定条件y 的情况下所带 来随机变量所具有的熵的减少量。两个随机变量之间的交互信息的计算公式为: 日噬;y ) 2 萎否p 力l o g z 羞! 嚣 q j o ) 艇xy e r, ,u 7 , 两个随机变量之间的交互信息与熵的关系见图2 3 。 i y ) 图2 3 熵与交互信息之间的关系 因此,交互信息也可由下列公式来计算。 何( x ;y ) = 日( x ) 一日( x l y ) = 日( 即一日( y i j ) = 日( 】,;x ) ( 2 1 1 ) 从图2 3 中也可以推断出两个极端情况: ( 1 ) 当x = y 时,日( x ;d = 日( x ) = 灯( y ) ;或者有日( 石;x ) = 日( x ) 。如图2 4 所示; ( 2 ) 当变量x 和变量y 互相独立时,日( x ;y ) = o ,如图2 5 所示。 图2 4 相同变量之间的交互信息 图2 5 相互独立的变量之间的交互信息 1 5 华北电力大学硕士学位论文 很明显,日( 工;y ) = 日( y ;石) ,这表示无论以哪个变量为条件,另一个变量的 不确定性的消除都是相同的,即“你中有我,我中有你”因此,两个随机变量之 间的交互信息能够反映出它们之间的相关性。两个随机变量越相关,它们之间的交 互信息越大,当两个变量独立时,它们之间的交互信息等于零。熵越大,交互信息 越小。 虽然s h 啪o n 提出的信息论是建立在概率不确定性基础上的,但随着信息论 的发展,已经出现了信息论在模糊集合理论上的推广。 ( 6 ) 模糊信息熵。设瓜4 ( f = 1 ,2 ,埘) ,) , 4 i f = 1 ,2 ,聊 为彳的一个 模糊分割。称 一一善哉b g 哉 协 为在爿的背景下分割似i ,= l ,2 ,m ) 的模糊信息熵。 ( 7 ) 模糊条件熵。设爪4 ( f = 1 ,2 ,m ) 、及4 0 = 1 ,2 ,j ) f ) , 4 1 扛1 ,2 ,所) 和 e | f = 1 ,2 ,七) 为爪曰的模糊分割。称 州陟喜爨鲁c 从属, 协 为在已知模糊集合b 的条件下4 的模糊条件熵。 则两模糊变量之间的交互信息: 日( 彳;口) = 日( 彳) 一月( 4 i b ) = 日( b ;彳) ( 2 。1 4 ) 这其实就是模糊一i d 3 算法中使用的启发式信息增益函数。 2 2 3 决策树的i d 3 算法 决策树学习算法中最有影响的首推j r o s s q u i n l a n 于1 9 8 6 年提出的以基于 c e s h a 皿o n 信息论原理计算信息的下降速度为选取测试属性的标准的m 3 算法以 及改进版本c 4 5 5 o 。它的工作过程为:首先找出数据集最有判别力的属性( 树的 节点) ,把数据分成多个子集( 树的分支节点) ,每个子集又选择最有判别力的属性 进行划分,一直进行到所有子集仅包含同一类型的数据为止( 树的叶节点) ,最后 得到一棵决策树,整棵决策树就对应着一组析取表达式规则,可以用它来对新的样 例进行分析。 在每一节点,属性的选择是寻找最大的信息增益( 交互信息) 即最小熵。设s 为 一个包含j 个样本的集合,类别属性可以取m 个不同的值,对应于肌个不同的类别 e ,f 1 ,2 ,3 ,脚 。设s ,为类别q 中的样本数,则对一个给定数据对象进行分类所需 的信息量为: 1 6 华北电力大学硕士学位论文 ,( 焉,屯,) = 一p f l o g : ) ( 2 1 5 ) k i 其中b = 墨s ,为任一个数据对象属于类别q 的概率。 若属性爿被选为测试属性,一有y 个不同的值h ,口:,口, ,彳将集合s 划分为, 个子集 s ,岛,s ,其中s ,包含了s 集合中属性a 取口,值的数据样本。设为子集 s ,中属于g 的样本数则利用彳来划分当前样本集合所需要的信息( 熵) 计算如下: e ( 4 ) :壹型等等乌( 墨,咖,) ( 2 “) 卢l 4 其中( 墨,+ 岛,+ + ) s 项被当作第j 个子集的权值,它是由所有子集中属性a 取口,值的样本数之和除以s 集合中的样本总数。e ( 4 ) 计算结果越小,就表示其子集 划分结果越好。面对给定的子集s ,其信息为: ,( s i ,屯,) = 一毋l 0 9 2 ( 乃) ( 2 - 1 7 ) 其中岛= 呀b l ,为s 中任一个数据样本属于类别g 的概率。 这样利用属性爿对当前分支节点进行相应样本集合划分所得到的信息增益为: g 口m ( 4 ) = ,( ,毛,) 一e ( 4 ) ( 2 - 1 8 ) 计算每个属性的信息增益,然后选择增益最大( 最小熵) 的那个属性作为给定 集合s 的测试属性,并由此产生相应的分支节点。 2 2 4i d 3 算法描述 l 、主算法 ( 1 ) 从训练集中随机选择一个既含正例又含反例的子集( 称为窗口) ; ( 2 ) 用建树算法使当前窗口形成一棵决策树; ( 3 ) 对训练集( 窗口除外) 中例子用所得决策树进行类别判定,找出错判的 例子; ( 4 ) 若存在错判的例子,把它们插入窗口,转( 2 ) ,否则结束。 主算法流程图用图2 6 表示,其中阳和肥分别表示正例集和反例集,它们共 同组成训练集。p e 、p e 、跌e 分别表示正例集和反例集的子集。 华北电力大学硕士学位论文 图2 6d 3 算法主算法流程图 主算法中每迭代循环一次,生成的决策树将会不相同。 2 、建树算法 ( 1 ) 对当前例子集合,计算各特征的交互信息; ( 2 ) 选择交互信息最大的特征4 : ( 3 ) 把在4 处取值相同的例子归于同一子集,4 取几个值就得到几个子集: ( 4 ) 对既含正例又含反例的子集,递归调用建树算法; ( 5 ) 若子集仅含正例或反例,对应分枝标上p 或,返回调用处。 一般地,一棵决策树是利用从根节点到叶节点的不同路径来表示成规则的。我 们事先对已有的实例集( 作为我们的先验知识) 利用m 3 算法来处理,目的在于进 行分类;而一旦分类的结果形成决策树并转换成分类规则之后,我们就可以对以后 新加入的实例进行归类、判定或是预测,到那个时候,我们可能不一定知道详细具 体的规则内容,计算机在决策树分类的处理过程中已经习得了决策树的规则集,因 此这一切就由计算机代劳了。 2 3 模糊决策树 模糊决策树算法是传统决策树算法的一个扩充和完善,使得决策树学习的应用 范围扩大到了能处理不确定性。从对连续型变量作为属性类型的数据的预处理,到 产生决策树选取的分支属性,以及决策树的匹配等过程都引入了模糊集理论。 模糊决策树的归纳学习合理地处理了不确定信息、噪音数据等问题,有较强的 分类能力及稳健性,使知识表示的方式更为自然,能生成不同水平和不同置信度的 推理规则,可为决策者提供丰富的决策信息。 在传统的决策树方法中,著名的i d 3 算法就是以信息论中的“熵”概念为理论 基础对属性进行排序的。在信息论中,熵对应着系统的无序性。在通信开始之前, 接收方完全不知道对方将要发来什么信息,此时不确定性最大,相当于完全无序状 华北电力大学硕士学位论文 态。随着通信的进行,接收方逐渐获得信息,不确定性减少,有序程度增加。收到 全部信息后,不确定性降为零,到达了完全有序状态。而在d 3 算法构建决策树的 过程中,根节点对应于最大的不确定状态,表示在分类开始之前对待分类对象一无 所知,随着每个测试属性的选择,不确定状态就小一些,直至到达叶子节点,分类 任务完成,不确定性也降为零。因此,要想构造一棵规模较小的树,就要求在每一 个节点选择使熵值平均下降最快的属性作为测试属性,这就是i d 3 算法的宗旨。同 样,f u z z y 一i d 3 算法也是基于信息熵的,只不过它用到的熵概念是模糊信息熵。 2 3 1 模糊决策树的定义 典型的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 语文国培二次培训
- 中班幼儿法制启蒙教育
- 团队培训展示简单
- 中班健康课件:鼻子出血怎么办
- 中药饮片企业设备部培训
- 小儿急性咽喉炎护理查房
- 神经外科入院患者健康宣教
- 中医药现代化进程中跨境电商市场拓展研究报告
- 污水厂员工培训
- 制造业数字化转型数据治理策略在智能制造成本控制中的应用报告
- 诊所托管合同协议
- 信息必刷卷04(广东省卷专用)2025年中考数学(解析版)
- 餐饮服务与管理课件 菜单的设计与制作
- 2025年度次季度工业级5G专网部署技术服务合同模板
- 大数据分析在食品检测精度提高中的应用策略
- 山东师范大学《大学英语本科(专升本)》期末考试复习题及参考答案
- Unit 6 A great week (教学设计)-2024-2025学年外研版(三起)(2024)英语三年级下册
- 2025版小细胞肺癌免疫治疗专家共识解读
- 职业技能培训:保健按摩师
- JJF(津) 5003-2024 汽车制造专用加注机校准规范
- 2025年绍兴市部分市属国有企业招聘笔试参考题库含答案解析
评论
0/150
提交评论