




已阅读5页,还剩45页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
声明 本人郑重声明:此处所提交的硕士学位论文变电站遥视图像的识别研究, 是本人在华北电力大学攻读硕士学位期问,在导师指导下进行的研究工作和取得 的研究成果。据本人所知,除了文中特别加以标注和致谢之处外,论文中不包含 其他人已经发表或撰写过的研究成果,也不包含为获得华北电力大学或其他教育 机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡 献均己在论文中作了明确的说明并表示了谢意。 学位论文作者签名:盔立6 灸 日 关于学位论文使用授权的说明 本人完全了解华北电力大学有关保留、使用学位论文的规定,即:学校有 权保管、并向有关部门送交学位论文的原件与复印件:学校可以采用影印、缩 印或其它复制手段复制并保存学位论文;学校可允许学位论文被查阅或借阅; 学校可以学术交流为目的,复制赠送和交换学位论文;同意学校可以用不同 方式在不同媒体上发表、传播学位论文的全部或部分内容。 ( 涉密的学位论文在解密后遵守此规定) 作者签名:查受4 整 e t 期:笠赴捡如b 导师签名:重盘查 日期:兰盥:丝:墨d 华北电力大学硕士学位论文 1 1 课题的提出 第一章引言 变电站的无人值守运行是电力系统当今的发展趋势。人们已经实现了将电力系 统的设备运行数据、状态转送到远方的调度中心,同时也能在调度中心对现场设备 进行控制及调节,这就是常称的“四遥”:遥视、遥信、遥控、遥调。然而现场还 需要对环境和设备的状况进行监视,如火灾、偷盗情况:刀闸的状态、变压器是否 漏油、刀闸是否放电等,当人们要实现运行现场完全无人化的时候,仅凭这“四遥” 手段是不足以实现这一目的“ 。 随着计算机技术、多媒体技术及通信技术的发展,已经实现了图像、声音的数 字化、及对声像信号的深入处理和远距离的传送技术。这些技术完全可以引入到电 力系统运行无人值守的领域中,即除了遥测、遥信、遥控、遥调外,增加了另一内 容:遥视。遥视不仅是指在调度中心能看到设备现场的实景,而且还必须具有警戒 甚至必要时能启动安全设施的功能。例如启动消防系统、排水系统、启动警笛驱赶 非法闯入者等,并将警报信号通知给监控人员。常规的警戒系统一般是通过采用各 种不同工作原理的传感器( 例如红外线探测器、超声探测器、微波探测器、烟感探 测器) 等得到警报信号,这些传感器的弊端在于其探测面受限于个很小的局部区 域。 为了加强对重要变电站及无人值守变电站在安全生产、防盗保安、火警监控等 方面的综合管理水平,实现创一流的目标,越来越多的电力企业正在考虑建设集中 式远程图像监控系统。它可以对各变电站的现场进行实时视频监控,将变电站的各 监视点,如主控制室,高压室、设备情况、断路器、隔离刀闸、室外场地等现场图 像通过通讯网实时地传输到集控站豉地方调度中心;同时可以按照多种方式进行数 字录像,保存在服务器上供事后调用。现在所有供电公司安装的监控系统只有视频 监控功能,为了能够更充分发挥视频监控网络的功能,更准确地判断现场发生告警 地原因,在原来监控系统的基础上,几乎不需增加任何硬件设备,就能实现现场环 境、设备告警的图像识别,为事后调查,检测提供可靠的依据“ 。 如今,随着视频技术的发展,视频监控越来越多的被使用在各个领域,而且有 许多我们人体肉眼所不能及的地方,各种数字成像技术发挥着重要的作用,借助图 像处理技术,我们则可以实现智能监控,即利用图像处理和图像分析,让计算机自 动识别和判断故障或隐患,达到实时监控和故障诊断及预警的目的。 图像处理技术从广义上可看作是各种图像加工技术的总称。它包括利用计算机 华北电力大学硕士学位论文 和其他电子设备进行和完成一系列工作,如图像的采集、编码、存储和传输、图像 的合成;图像的显示和输出;图像变换,增强,恢复和重建;图像的分割,特征提 取和测量,目标的检测,表达和描述:图像的分类,表示和识别,图像和场景的解 释和理解,3 d 图像的重建和处理等等。 在工业应用中,有许多场合都存在设备内部无法有效地监控的情况,本文所做 的利用数字图像处理技术来实现无人值守变电站的遥视图像识别既可以满足了本 应用实际生产的需要,对其它的行业及设备也有一定的借鉴意义。 1 2 课题研究发展现状 图像处理与识别的研究已有3 0 多年的历史。随着计算机科学的发展,图像处 理与识别在理论研究和实际应用中都取得了飞速的发展,目前已进入全面应用的新 时代。 国内数字视频监控与识别系统应用的研究起步较晚,但技术水平很高。在十六 大会议上,一种证件智能识别系统成功实现了与会人员身份的计算机自动识别。这 种系统就采用了视频监控与面像识别系统,传统的面像识别系统多是利用人体独一 无二的指纹和虹膜血管分布图案,实现高质量的身份识别。但这个系统中,计算机 并不是提取眼睛、鼻子、嘴巴的轮廓和相对位置等特征进行识别,而是对人们脸部 的凹凸起伏进行模数转换,通过一系列复杂的算法实现分辨,能够实时地检测人脸, 具有比同类算法更高地正确识别率,对光照地变化有更强地适应能力。 国外对数字视频监控与识别的研究较早,并且应用的领域也比较广泛”1 。这个 例子说明了这一点。从1 9 9 1 年开始美国海岸地质观察中心( u sg e o l o g i c a l s u r v e r y sc e n t e rf o rc o a s t a lg e o l o g y ) 通过与俄勒冈州立大学( o r e g o ns t a t e u n i v e r s i t y ) 合作建立了一套远程视频监控系统,在此之前该大学已经对视频数据 采集和处理技术( v i d e od a t aa c q u i s i t i o na n dp r o c e s s i n gt e c h n i q u e s ) 研究十 年了。这套系统能够提供数字视频,用像素强度来表示一幅数字图像的颜色和灰度。 实际使用的效果已经证明,这种方式能够对所采集的视频数据进行准确的定量分 析。而这是其他常规方式无法做到的。这种系统主要用来监控海岸地形的变化情况, 利用图像识别技术来判断不同时期海岸的变迁情况。 视频监控技术是现代i t 技术中的一类主要技术领域,它也是信息系统科学中 的一个主要的研究热点。在生活中,场景视频监控技术有着非常广阔的应用前景, 它在电力系统、国防、交通领域以及人民的日常生活和工作中发挥着日益主要的作 用。其中基于差分图像处理是建立应用视觉系统的常规技术,主要用于印刷电路版 的检验、交通及保安监测等。近年来,应用视觉研究在西方发达国家得到普遍重视, 华北电力大学硕士学位论文 这是由于微电子与计算机技术的高速发展,使得低成本的视觉系统成为可能,以摄 像机作为传感器能够超越传统传感器所固有的局限性,有望研究开发出新一代的高 技术产品,如交通流量检测器、智能闭路监控系统等。就我国的国情而言,随着经 济的高速发展,流动人口激增,城市的交通问题、治安问题等日益严重,急需现代 化的监测手段。在这方面,应用视觉研究将起到十分重要的作用。 近几年,国内的电力行业直在致力于无人值守变电站的推广应用。目前已有 相当多的变电站实现了“四遥”,即遥测、遥信、遥控、遥调功能。然而,实现变 电站综合全面的自动化管理,大面积推广无人值守变电站的必要保证是建立套完 善的远程监控报警系统一一电力行业称之为“遥视”。“遥视”功能使电力调度部 门可以远程监视变电站的设备及现场环境。“遥视”作为传统“四遥”的补充,进 一步提高了电力自动化系统的安全性、可靠性。因此,越来越多的电力局把远程图 像监控系统作为无人值守变电站管理的重要手段。 1 3 本文所做工作 经过调查研究,在前人研究的基础上,本论文进行了变电站视频监控系统的图 像识别的研究。本文共分为五章,主要内容如下: 一、论文首先分析了远程数字视频监控系统和图像处理、图像识别技术的发展、 应用及国内外的研究现状。在参阅了大量的文献的基础上,结合我们所要处理的实 际问题,本论文选用适合本课题的图像处理与识别的方法。例如对两帧差分法运动 目标的检测与提取的算法进行了详尽的阐述,然后在此基础上,提出采用三帧差分 法对运动目标的检测与提取,并用软件实现。 二、本文立足一些已有的图像识别的模型,分析了传统的图像处理方法。在变 电站防火与非法入侵者的检测中采用了一种基于连续三帧图像检测和提取运动目 标的算法,并用软件实现。 三帧差分法的原理就是在连续的三帧图像中,分别做前两帧和后两帧的差分运 算,根据未变化区域与运动变化区域服从不同的统计规律设计检测门限,将检测到 的运动变化图像作去嗓和空域图像分割,再对得到的两幅差分图像进行相与运算以 确定目标图像的位置,最后可以得到目标本身的灰度值,再基于运动物体自身的灰 度信息,恢复出完整的目标图像,基于这时运动变化区域的灰度值所设定灰度检测 门限将是完全基于目标的本身。 三、对无入值守变电站刀闸开合状态的图像识别。分别取得变电站刀闸( 1 l o k v 为例) 处于闭合状态、断开状态的图像。为了提高运行速度,从原始图像中剪切出 主要包括刀阐的局部图像。分别求出刀闸处于闭合状态、断开状态时的局部图像的 华北电力大学硕士学位论文 灰度图。并分别作为基准图像,待实际的图像采集、处理后做图像检索并比较, 从而判断刀闸的状态。 四、由于图像亮度范围不足或非线性,以及各种噪声的影响。我们采用增强对 比度和高频增强的方法来修正其灰度分布,采用中值滤波等方法去除图像的噪声。 五、当照明不均匀、背景灰度变化比较大时,整幅图像分割没有合适的单一阈 值门限,我们使用自适应阈值分割对图像按照坐标分块,对每一块分别选一阈值进 行分割。 六、计算机图像识别技术是监控系统智能化的基础,变电站智能监控系统的智 能识别功能应通过软件方法实现,以使其具有较好的模块化和可移植性。本文针对 变电站监控系统的特点采用v c + + 与m a t l a b 混合编程,即提高了程序的运行速度, 又使程序简练。 本文对变电站遥视图像的识别研究了一个开发试验的思路,可以达到对理论上 的实验和验证。自然,要想成功地开发出一个成熟、可以推向市场地电力系统内图 像工程系统,需要经过多人长时间的辛苦努力。笔者所做的工作仅仅是提供一个图 像识别的研究,相对于整个成熟的系统而言,笔者所做的开发工作仅仅是九牛一毛, 微不足道。后期,针对电力系统中不同的应用,可以扩展开发出不同系统以服务于 社会和人民。 4 华北电力大学硕士学位论文 第二章变电站图像的低层处理 实现计算机图像识别的,就必须靠计算机视觉模拟人眼,完成对周围环境事物 的感知、识别或理解。在成像过程中,因受各种条件的限制和许多随机因素的干扰, 由成像装置获得的数字图像必须要经过低层处理。图像低层处理主要完成原始图像 的噪声滤波、灰度校正、几何校正、信息变换、图像增强等。图像的低层处理算法 面对的是大量的原始图像数据,所以在基于计算机视觉的变电站图像识别的研究 中,识别的准确性在很大程度上取决于图像的低层处理算法的好坏。本章对常用的 图像低层处理算法进行了研究、比较和分析,确定了适合变电站遥视图像处理的实 用性算法,为后面的识别奠定了基础。 2 1 数字图像的基本知识 当前是信息时代,信息的获得、加工、处理和应用等都有了飞跃发展。图像信 息处理已经得到一定的发展,但随着对图像处理的要求不断提高,应用领域不断扩 大,图像理论必须不断补充和发展。图像的处理已经从可见光谱扩展到各个波段, 从静止图像发展到运动图像,从物体的外部延伸到物体的内部,以及进行人工智能 化的图像处理。 2 1 1 图像 图像,从广义上说,是自然界景物的客观反映,是人类认识世界和人类本身的 重要源泉。图像对我们来说并不陌生。它是用各种观测系统以不同形式和手段观测 客观世界而获得的,可以直接或者间接作用于人眼并进而产生视知觉的实体。人的 视觉就是一个观测系统,通过它得到的图像就是客观景物在人心目中形成的影像。 科学研究和统计表明,人类传递信息主要有语言、文字和图像( i m a g e ) 三个渠道, 人类从外界获得的信息约有7 0 以上来自视觉系统,也就是从图像中获得的。图像 带有大量的信息,它是用各种观测系统以不同的形式和手段观测客观世界而获得 的,这里的图像是比较广义的,例如照片、绘图、视像等”1 。 从信息论的角度来看,“图像”所包含的信息量最大,不仅有灰度,还有色彩, 不仅有平面,还有立体等,其内容极为广泛。在许多场合里。没有任何其它形式比 图像所传递的信息更丰富和真切。 一般的图像都是模拟图像,即图像上的信息是连续变化的模拟量。如一幅黑白 华北电力大学硕士学位论文 灰度照片上的物体是通过照片上各点的光的强度不同而体现的,而照片上的光强是 一个连续变化的量,也就是说,在一定的范围内,光强的任何值都可能出现。对于 这种模拟图像只能采用模拟处理方法进行处理( 例如按光学原理用透镜将照片放 大) 。计算机不能接受和处理模拟信号,只有将连续的模拟信号变换为离散的数字 信号,或者说将模拟图像变换为数字图像方能接受。因此,常将计算机图像处理称 作为数字图像处理。 2 。1 。2 数字图像 数字图像处理”“,即用计算机对图像进行处理。与人类对视觉机理着迷的历史 相比,它是一门相对年轻的学科。但在其短短的历史中,它却以程度不同的成功被 应用于几乎所有与成像有关的领域。由于其表现方式( 用图像显示) 所固有的魅力, 它似乎吸引了从科学家到平民百姓太多的注意。在其自然的形式下,。图像并不能直 接由计算机分析。因为计算机只能处理数字而不是图片,所以一幅图像在用计算机 进行图像处理前必须先转化为数字形式,一般我们用一个数字阵列来表示一个物理 图像。物理图像被划分为称作图像元素( p i c t u r ee l e m e n t ) 的小区域,图像元素简称 为像素( p i x e l ) 。最常见的划分方案是用方形采样网络,图像被分割成由相邻像素 组成的许多水平线,赋予每个像素位置的数值反应了物理图像上对应点的亮度。 当用数学方法描述图像信息时,通常着重于考虑它的点的性质。例如一幅图像 可以被看成是空间各个坐标殿上强度的集合。它的最普通的数学表达式为: i = 吣弘z ,久f ) ( 2 一1 ) 其中 只z ) 是空间坐标,五是波长。f 是时间,是图像的强度。这样一个表达 式可以代表一幅活动的、彩色的、立体图像。当我们研究的是静止图像( s t i l li m a g e ) 时,则上式与时间t 无关,当研究的是单色图像时,显然与波长丑无关,对于平面 图像来说则与坐标z 无关。因此,对于静止的,平面的、单色的图像来说其数学表 达式可以简化为i = f ( x , y 1 。模拟图像是不能直接用数字计算机来处理的。为使图 像能在数字计算机内进行处理,首先必须将各类图像( 如照片、图形、x 光照片等 等) 转化为数字图像。 客观世界在空间上是三维的( 3 一d ) 的,但一般从客观景物得到的图像是二维 的( 2 d ) 的。一幅图像可以用一个2 一d 数组f ( x ,y ) 来表示,这里x 和y 表示2 一d 空间x y 中一个坐标点的位置,而,则代表图像在点( t y ) 的某种性质的f 的数值, 它反应了图像中的某种信息( 比如亮度、温度、海拔等) 。常用的图像一般是灰度 图,这时,厂表示灰度值,它常对应客观景物被观察到的亮度。 6 华北电力大学硕士学位论文 2 1 3 数字图像处理的主要研究内容 完整的数字图像处理工程大体上可以分为如下几个方面:图像信息的获取;图 像信息的存储;图像信息的传送:图像信息处理;图像信息的输出和显示。 一、图像信息的获取( i m a g ei n f o r m a t i o na c q u i s i t i o n ) 就数字图像处理而言,主要是把一幅图像转换成适合输入计算机或数字设备的 数字信号,这一过程主要包括摄取图像、光电转换及数字化等几个步骤。通常图像 获取的方法有如下几种: 电视摄像机,飞点扫描器,扫描鼓,扫描仪,显微光密度计,遥 感中常用的图像获取设备 二、图像信息的存储( i m a g ei n f o r m a t i o i ls t o r a g e ) 图像信息的突出特点是数据量巨大。一般作档案存储主要采用磁带、磁盘或光 盘。为解决海量存储问题主要研究数据压缩、图像格式及图像数据库技术等。 三、图像信息的传送( i m a g ei n f o r m a t i o nt r a n s m i s s i o l l ) 图像信息的传送可分为系统内部传送与远距离传送。内部传送多采用d m a 技术 ( d i r e c tm e m o r ya c c e s s ) 以解决速度问题,外部远距离传送主要解决占用带宽问 题。目前,己有多种国际压缩标准来解决这个问题,图像通信网正在逐步建立。 四、数字图像处理( d i g i t a li m a g ep r o c e s s i n g ) 目前,数字图像处理多采用计算机处理,因此,有时也称之为计算机图像处理。 数字图像处理概括地说主要包括如下几项内容:几何处理,算术处理,图像增强, 图像复原,图像重建,图像编码压缩,图像识别,图像理解。 1 几何处理 几何处理主要包括坐标变换,图像的放大、缩小、旋转、移动,多个图像配准, 全景畸变校正,扭曲校正,周长、面积、体积计算等。 2 算术处理 算术处理主要对图像施以+ 、一、等运算,虽然该处理主要针对像素点 地处理,但是非常有用,如医学图像的减影处理就有显著的效果。 3 图像增强 图像增强处理主要是突出图像中感兴趣的信息,而减弱或去除不需要的信息。 从而使有用信息得到加强,便于区分或解释。主要方法有直方图增强、伪彩色增强 法、灰度窗口等技术。 4 图像复原 图像复原处理的主要目的是去除干扰和模糊,恢复图像的本来面目。典型的例 子如去噪就属于复原处理。图像噪声包括随机噪声和相干噪声,随机噪声干扰表现 7 华北电力大学硕士学位论文 为麻点干扰,相干噪声表现为网纹干扰。去模糊也是复原处理的任务。这些模糊来 自透镜散焦,相对运动,大气漏流,以及云层遮挡等。这些干扰可用维纳滤波、逆 滤波、同态滤波等方法加以去除。 5 图像重建 利用x 射线、超声波等手段取得物体的多橱来自不同角度的二维投影图( 它们 反映了物体内部情形) ,通过计算可得出物体内部部位的图像,这种技术就是投影 重建,医学上广为采用的计算机层析术( c t ) 即是一例。而利用明暗、运动、体视 等图像信息恢复三维物体形状则是另一类复杂的重建技术。 6 图像编码压缩 图像编码压缩技术可减少描述图像的数据量( 即比特数) ,以便节省图像传输、 处理时间和减少所占用的存储器的容量。压缩可以在不失真的前提下获得,也可以 在允许的失真条件下进行。 7 图像描述 图像描述是图像识别和理解的必要前提。作为最简单的二值图像可采用其几何 特性描述物体的特性,一般图像的描述方法采用二维形状描述,它有边界描述和区 域描述两类方法。对于特殊的文理图像可采用二维纹理特征描述。随着图像处理研 究的深入发展,已经开始进行三维物体描述的研究,提出了体积描述、表露描述、 广义圆柱体描述等方法。 8 图像分类( 识别) 图像分类属于模式识别的范畴,其主要内容是图像经过某些预处理( 增强、复 原、压缩) 后,进行图像分割和特征提取,从而进行判断分类。图像分类常采用经 典的模式识别方法,有统计模式分类程句法结构模式分类,近年来新发展起来的模 糊模式识别和人工神经网络模式分类在图像识别中也越来越受到重视。 五、图像的输出与显示 图像处理的最终目的是为人或机器提供一幅更便于解译和识别的图像。因此, 图像输出也是图像处理的重要内容之一。图像的输出有两种,一种是硬拷贝,另一 种是软拷贝。其分辨率随着科学技术的发展从分辨率2 5 6 x 2 5 6 、5 1 2 5 1 2 、1 0 2 4 1 0 2 4 ,至今已有2 0 4 8 x 2 0 4 8 的高分辨率的显示设备问世。通常的硬拷贝方法有照相、 激光拷贝、彩色喷墨打印等几种方法。软拷贝方法有c r t 显示( c a t h o d er a yt u b e ) , 液晶显示器( l e d ) ,场致发光显示器( f e b ) 。 2 1 4 数字图像处理的基本术语 图像处理中用到很多概念、名词术语和方法,很多的概念都是从人们认识图像 的过程中直接移植过来的“1 。 华北电力大学硕士学位论文 一、颜色 颜色的本质是牛顿最早研究发现的。早在1 7 世纪,牛顿就用三棱镜把白色的 光分解成一系列的光谱,证明了白色是由不同颜色的光线混合而成的。不同颜色的 光线是一些频率不同的电磁波。人们因此而将这些不同频率的电磁波感知为不同的 颜色。根据人眼的感觉以及颜色的可合成性,可以把所有的颜色都看着几种颜色的 组合。人们都普遍接受r g b 颜色标准,即认为各种颜色都是由红( r ,r e d ) ,绿( g , g r e e n ) 和蓝( b ,b l u e ) 的不同组合。但是谁也不能确切的说多少频率的电磁波就 代表r g b 具体的颜色值。为了统一标准,国际上规定了这三种颜色的波长分别为 r :7 0 0 n m ,g :5 4 6 n m 。b :4 3 5 8 n m 。值得提的是定义了这三种基波,并不是说只有 这三种波才能合成各种颜色,事实上,这三种基波对有些颜色还不能合成。r g b 颜 色系统是常用的种颜色系统,但是还有几个颜色系统我们也能遇到,它们都是不 同的用户根据自己需要选用的。 二、灰度图 灰度,就是图像的亮度。我们知道各种颜色系统不能完全地把所有颜色反映出 来,为了能区别各种不同地颜色,定义三个区别颜色的基本特征量,它们是亮度、 色调和饱和度。在看物体时,我们视觉的感受和照射到物体光线以及物体表面的反 射光线有关。亮度与物体反射率成正比,反射率是一个与反射光强和入射光强相关 的量,因而亮度是与反射光能量相关的量。如果颜色无彩色变化,颜色的变化就只 是亮度的改变。对于彩色而言。颜色中掺入的白色越多就越明亮,反之越暗淡。色 调是指这些由各种光谱混合而成的颜色中的主要光谱的颜色,换句话说色调反映某 种颜色中占主导的光线。饱和度是与色调相关的量,它是指在这些由各种光谱混合 而成的颜色中主要光谱的纯度,也就是说它反映色调的纯度。纯光谱是饱和的,但 是随着白光加入的增加,饱和度逐渐降低。通常,将色调和饱和度通称为色度。 通过上面的表达我们可以看到,亮度是受入射光线影响很小的量,而色度几乎 完全受入射光和物体表面颜色的影响。但是我们在识别物体时,常常希望是物体在 各种场合都能被识另i j ,为此,研究图像的灰度对我 f 3 来讲是有益的。因此人们把图 像上的各点的灰度提取出来组成一个反映各点亮度的图像,这就是灰度图。灰度就 是图像上各点亮度,因此它本来是个连续的量,但是为了进一步用数字图像处理 研究图像,必须将灰度量化。通常我们把灰度分成0 到2 5 5 的数值,得到2 5 6 个灰 度级。其中0 最暗,显示为黑色;2 5 5 晟亮,显示为白色。 三、灰度直方图 在数字图像处理中,一个最简单和最有用的工具是灰度直方图。灰度直方图是 灰度级的函数,它表示图像中具有每种灰度级的像素的个数,反映图像中每种灰度 出现的频率。 华北电力大学硕士学位论文 设图像f ( x ,y ) 的像素总数为n ,灰度级数为l ,灰度为,的像素共有,个,则 n 尸( r ) 2 音( ,= o 1 l 一1 ) ( 2 2 ) 称为f ( x , y ) 的直方图。 面积为a 的连续图像f ( x ,y ) 经数字化后,成为m 行n 列的数字图像f ( m ,”) 。一 般而言,在数字图像f ( m ,”) 中取不同灰度值的像素的数目是不同的。直方图是用于 表达图像灰度分布情况的统计图表。其横坐标是灰度值,纵坐标是出现这个灰度 值的概率p ( r ) ( 对连续图像f ( x ,y ) 而言) ,或者是出现这个灰度值的概率值p ( ,;) ( 对 数字图像f ( m ,帕而言) 。 直方图能给出图像的概貌描述,它反映了在幅图像中不同灰度级像素所占图 像总像素的比例,可以看出各灰度级数目的多少及其分布情况,由此得出进一步分 析和处理的依据。要研究图像灰度变化范围及各个灰度级像素数的多少,就应当利 用直方图这一方法。对一幅图像进行各灰度级像素的统计,就可以得出图像的直方 图。有了图像直方图,就有了图像的改正方向,可以进步制定方案进行图像处理 的其他研究。 现有一幅图像为4 x4 的像素点占有8 个灰度级( 从0 到7 ) ,图像如下图2 一l ( a ) 所示。对其进行统计的结果,就可作出对应的直方图如图2 1 所示( b ) 所 示。 表2 1 图像灰度级像素统计 i 灰度级 01 2 3 4567 1 像素数 i24)ll l l 3 2 03 3 l2 6 1247 23 5 3 ( a ) 4 4 的图像( b ) 对应图像的直方图 国2 1 直方图生成步骤 0 华北电力大学硕士学位论文 由此可以看出灰度直方图有如下性质: 灰度直方图实际上是一幅图像中的各个像素灰度值出现次数的统计结果,它反 映了图像中不同灰度值出现的次数,但不能反映菜灰度值像素所在图像的位置。 即它包含了该图像中某灰度值的像素出现的概率,却失去了其所处的位置信息。 图2 2 是常见的p o u t 图的直方图。 图2 2p o u t 直方图 任意幅图像,能够唯一求出一幅与它对应的直方图,但是不同的图像,可能 会有相同的直方圈。也就是说,图像与灰度直方图之间存在着多对一的映射关系。 由于直方图是通过对具有相同灰度值的像素统计数得到的,因此,一幅图像各个子 区的直方图应当等于对应全图的直方图。 直方图的主要特征有: 均值 l - 1,、 2 磊卯 ( 2 q ) 这里,三为量化层数,即灰度等级,b 为量化层的值。 p ( 6 ) :掣 cz 叫 n ( b 1 为灰度值为b 的像素数,m 为像素总数。 方差 仃= ( 6 一) 2 尸( 6 ) ( 2 一j ) 偏差:是分布偏离对称情况程度的量。 华北电力大学硕士学位论文 小仃1 。l 高- l ( b 一) 3 尸( 6 ) 小仃。硒一) 3 p ( 6 ) 2 2 数字图像处理的基本方法 2 2 1 基本处理过程 ( 2 6 ) 数字图像信息可看成是一个二维数组f ( i ,】,对它处理的基本过程如同电视光 栅扫描过程,按照由左到右,由上到下的顺序进行,并在扫描过程中逐点对各像素 进行处理,如图2 3 ( a ) 所示。这样的扫描过程称为顺向扫描。与此相应的,由下 到上,由右到左的逆向扫描,如图2 3 ( b ) 所示,也是一种常见的处理过程。这种 如同光栅扫描的过程仅仅是图像处理中最基本的处理过程”3 。 起点 。! :一 _ 。 。”。- 1 - 7 终点 ( a ) 2 。2 2 基本运算形式 l 1 j 1 。1 。一 图2 3 数字图像的处理过程 ( b ) 一、点运算 针对图像各像素进行处理时,只输入该像素本身灰度的运算方式称为点运算。 如图2 4 中,输入图像f 上某像素的灰度为f ( i ) ,现在采用点运算方式作某种p 处理,得到输出图像g 上该像素的灰度为g ( i ,- ,) ,即 g ( i ,) = p ( f ( i ,朋 ( 2 - - 7 ) 对图像作点运算处理时各像素间不发生关系,各像素的处理是独立进行的。 1 2 华北电力大学硕士学位论文 f g 图2 4 点运算 二、领域运算 在对图像各级像素进行处理时,不仅输入该像素本身的灰度,还要输入以该像 素为中心的某局部区域( 即领域) 中的一些像素的灰度进行运算方式,称为领域运 算:6 _ “。 领域运算的概念可用图2 - - 5 表示。将输入图像f 作领域运算方式的仃处理,得 到输出图像g 。为了表达简便,将被处理的像素f ( i ,j ) 写作工,该像素的处理结果 写作甄。设像素z ,正, 组成像素工的领域;g 处理为 g o = ( 五+ z + 五+ + 五) ,9 ,此时对输入图像各像素所进行的处理就是领域运算。由 于领域运算能将像素周围领域内的诸像素状况反映在处理结果中,因而便于实现多 种处理内容。 q 处理 厨 圈 fg 图2 5 领域运算 三、并行运算 并行运算指的是对图像上各像素同时进行相问处理的运算方式。这种运算方式 处理速度快,但只能用于处理的结果与处理的顺序无关的场合。 点运算处理中,由于各像素的处理与其他像素无关,因而不论采用顺向扫描还 是逆向扫描,处理结果是相同的,因此,点运算处理可采用并行运算方式。 对于领域运算的处理能否采用并行方式则不能一概而论。具体来说,领域运算 的处理可分为两种情况,一种情况如图2 5 所示,在这种情况下,尽管各像素的 处理与领域像素有关系,但是这种关系与处理顺序无关,不论采用何种处理顺序, 其结果是不变的,因此可以采用并行运算。另一种情况是f ,g 分别代表输入、输 出图像的灰度,对输入图像像素工进行领域运算的d 处理,得到输出结果g o 。d 处 华北电力大学硕士学位论文 理的特点是运算中采用了领域中像素的灰度输出值,而不是原灰度z ,2 ,3 ,4 , 工,五,工,石a 这一点与前一种情况有很大的不同,这里对各像素进行处理的是 在领域中的部分像素已经被处理的基础上进行的,不同的处理顺序将会得到不同的 处理结果。 四、串行运算 串行运算是相对于并行运算而言的,指的是在图像上按照规定的顺序逐个对像 索进行处理的运算形式。可以说,凡是对像素的处理是在领域像素处理的基础上进 行的处理方法,都必须采用串行运算形式,并规定处理顺序。 从以上讨论可知,点运算具有既可以采用并行运算方式,又可以采用串行运算 方式的特点。 五、迭代运算 反复多次进行相同处理的运算,称为迭代运算。迭代运算常用于一次运算不能 达到处理目的的情况。迭代运算的反复次数可以在处理前设定,也可以在处理过程 中根据是否达到处理目的由计算机自动判别后确定。 2 3 变电站图像的低层处理 图像处理就是对图像中的像素点进行运算,因此需要很多的运算方法,而且根 据不同的需要有不同的算法。而图像处理功能的实现也在于算法的提出和实现。到 目前为止,图像处理中算法研究已经有了丰富的成果,但是还是有很多图像对于某 些算法不适用,需要进一步研究探索出新的成果。本课题综合采用直方图增强、中 值滤波、边缘检测等多种算法对变电站遥视图像进行图像处理。 和大多数图像识别系统一样,变电站图像识别在提取特征时首先经过图像增强 处理,以增强需要的信息,消弱或消除干扰、无用的信息。本课题在设计过程中对 图像按先后顺序进行了直方图增强、中值滤波、边缘提取、图像二值化、图像分割 等处理。图2 6 是图像预处理的过程。 2 3 1 直方图增强 图2 6图像预处理过程 图像的直方图是图像的重要统计特征,它可以认为是图像灰度密度函数的近 似。直方图虽然不能直接反映出图像内容,但对它进行分析可以得出图像的一些有 1 4 华北电力大学硕士学位论文 用特征,这些特征能反映出图像的特点。当图像对比度较小时,它的灰度直方图只 在灰度轴上较小的一段区间上非零,较暗的图像由于较多的像素灰度值低,因此它 的直方图的主体出现在低值灰度区间上,其在高值灰度区间上的幅度较小或为零, 而较亮的图像情况正好相反。通常一幅均匀量化的自然图像的灰度直方图在低值灰 度区间上频率较大,这样的图像较暗区域中的细节常常看不清楚。为使图像变清晰, 可以通过变换使图像的灰度动态范围变大,并且让灰度频率较小的灰度级经变换 后,其频率变得大一些,使变换后的图像灰度直方图在较大的动态范围内趋于均化。 事实证明,通过图像直方图修改进行图像增强是一种有效的方法。 2 3 1 1 直方图均化 均匀量化的自然图像的灰度直方图通常在低值灰度区间上频率较大,使得图像 中较暗区域中的细节常常看不清楚。为了使图像清晰,可将图像的灰度范围拉开, 并且让灰度频率较小的灰度级变大,即让灰度直方图在较大的动态范围内趋于一 致。 用图像f ( x ,y ) 的直方图代替灰度的分布密度函数鼻( f ) ,则直方图均化后的图 像g 为: g = r = g 弓 协 ( 2 8 ) 对于数字图像,可以对上述公式做离散近似。若原图像f ( x ,y ) 在像素点( x ,) 处 的灰度为r k ,则直方图均化后的图像占( t y ) 在点( j ,) 处的灰度盈为: & = 丁 名 = 七兰n cz 一。) 图2 7 是变电站内的一幅图像的直方图均化,可以看出,在直方图调整之前, 低灰度的比例很大,经过直方图均化后,各灰度等级的比例更加平衡。 华北电力大学硕士学位论文 :i 。:i 一轨i i:。掣。“:_ ”梁:j 麓: 薯琴;黪缕 :j ,冀甜 誊 3 蝴- 蔓 篓黧i 囊爨囊。 毫 曩蟪 j i 搿搿:翱潮4 ,毫j 蕊: 童j ! | 瓣荔 : 荔囊 篱戮 鏊 鬟, 囊i 懑暌 _蕤蓊 i t l 二j 妻j , 、。蔓| 嚣飘 蠹: 鞲 。0 7 _ ”:一 i : l 。 i黼溉li l :_ 囊荔孽譬:+ | 鞠 麓 | ;曩等。= = 冀蠢i :i ;霉璧黪。 1 。_囊囊誊i 鬟l 毒毒辫; 鬻籀蕈黼 + 鬟i 滚磬 k 。一删 | :、一州 i 爱i ; 二拿孵 :”、。i 甜;。 :2 二“- 一p 4 _ ; 翳戮誊麓馨| | | 霪器! ; 、: 馥蛾:搿:罐熬麓疆f 戡* v 一* :崩童b c鲢i 2 薹鏊i 嚣;。i 嚣;- ;:麟i 、+ 、,一 。“、嚣7 蹴 、v - v 2 3 2 中值滤波 图2 7 进行直方图均化操作前后的直方图 中值滤波是抑制噪声的非线性处理方法。减少模糊边缘的有效平滑技术是中值 过滤,它用领域点的中值代替该点的数值,即 g ( x ,y ) = m e d i a n | x a ,x z ,翰l ( 2 1 0 ) 其中x 1 ,x ,为点( x ,y ) 及其领域的灰度值。 中值滤波就是这样的一个式( 2 1 0 ) 变换,图像中滤波后某像素的输出等于 该像素领域中各像素灰度的中值。对二维图像,根据需要不同。可以利用各种形式 的滤波窗口,可以是矩形、圆形及十字形等,它的中心一般位于被处理点上。相对 而言,中值滤波容易去除孤立点、线的噪声,同时保持图像的边缘。它能很好的去 除二值噪声,但对高斯噪声无能为力。图2 8 是在图像处理中采用中值滤波的前 后对照,可以看出,中值滤波的效果明显,消除了原图中的大量噪声( 扫描线和孤 立点) 。 华北电力大学硕士学位论文 图2 8 图像的中值滤波( 左图是原图,右图是中值滤波后的图像) 2 3 3s o b e l 边缘提取 睢l 华北电力大学硕士学位论文 图2 - - 9 图像s o b e l 边缘提取( 左图是原图,右图是s o b e l 边缘提取后的图像) 2 3 4 图像分割 图像分割从本质上说是将各像素进行分类的过程。分类所依据的特陡可以是像 素的灰度值、颜色或多谱特性、空间特性和文理特性等。把图像分割成具有某种意 义的部分图像的方法称为图像的区域分割,区域分割的目的是为了将图像分割成有 意义的区域,这个“意义”的含义根据解决的问题不同而不同。分割结果的好坏需 要根据具体的场合及要求衡量,图像分割是从图像处理到图像分析的关键步骤,可 以说,图像分割结果的好坏直接影响对图像的理解。本文主要是利用像素的灰度值, 通过取阂值进行分类。 阈值分割的基本想法是确定一个阁值,然后把每个像素点的像素值和闽值相比 较,根据比较的结果把该像素划分为两类:前景和背景。般可以分成以下3 步: ( 1 ) 确定阈值。 ( 2 ) 将阈值和像素值比较。 ( 3 ) 把像素归类。 上面的3 个步骤,第一步是关键的,如果能确定一个合适的阙值。就可以对图 像进行正确、方便的分割。 当照明不均匀、有突发噪声,或者背景灰度变化比较大时,整幅图像分割将没 有合适的单一门限,因为单一的闺值不能兼顾图像各个像素的实际情况。这时,可 对图像按照坐标分块,对每一块分别选一闺值进行分割,这种选择与坐标相关的闽 值进行图像分割的方法称为动态阈值方法,也称为自适应闽值方法。 自适应阈值选取比较简单的方法则是对每个像素确定以它为中心的一个领域 窗口,计算窗口内像素的最大值和最小值,然后取它们的均值作为阙值。图2 一l o 所示选取的窗口为当前像索的8 领域窗口,实际的窗口可以步选取8 领域窗口,可 以选择更大一些的窗口。但是,一般来说,同一种运算窗口越大,需要处理的数据 越多,时间复杂度越大。 华北电力大学硕士学位论文 彭 c 图2 1 0自适应阚值确定方法 在图2 一l o 中,令c 表示当前像素,p 为c 的8 领域像素,令m a x v a l u e 表示8 领域像素的最大灰度值,m i n v a u e 表示8 领域像素的最小灰度值,则阀值可以设定 为: ,= m a x v a l u e 丁+ m i n v a l u e 也可以采用均值设定阙值: 鼻 r 。牛 其中只是c 的8 领域像素。 ) ) l 2 l l 一 一 2 2 ( ( 华北电力大学硕士学位论文 第三章图像识别算法选择 虽然图像工程中,处理和识别是两个相辅相成的两个不同部分,但是,作为图 像工作者,在研究和工作过程中。自然地将其分开而进行。在本论文中,笔者将处 理和识别连为体,虽然有些牵强附会,但利用一个软件平台。对两者进行了不同 程度上的连贯。 3 1 图像检测与识别技术的概述 目前,视频序列中运动目标的检测与识别还是一个需要继续深入研究的问题。 现有的主要检测运动目标的方法主要有光流法、块匹配法和差分图像法。 一、光流法 当人的眼睛观察运动物体时候,物体的景象在人眼的视网膜上形成一系列联系 变化的图像,这一系列连续变化的信息不断“流”过视网膜( 即图像平面) ,好像 一种光的“流”,故称之为光流“1 。光流表达了图像的变化,由于它包含了目标运动 的信息,因此可被观察者用来确定目标的运动情况。从光流的定义可以看出,由于 光流有如下3 个要素:一是运动( 速度场) ,这是光流形成的必要条件:二是带光 学特性的部位( 例如有灰度的像素点) ,它能携带信息;三是成像投影( 从场景到 图像平面) ,因而能被观察到。光流在视觉运动的研究中有非常重要的作用。视觉 运动分析就是研究如何从变化着场景的一系列不同时刻的图像中,提取出有关场景 中物体的结构、位置和运动信息。 光流场的计算最初是由美国学者h o r n 和s c h u n k 提出的“o 。1 9 8 1 年,h o r n 等人 在相邻图像之间的间隔时间很小,且其图像中灰度变化也很小的前提下,推导出灰 度图像光流场计算的基本等式。记时刻t 时,图像上一点( x ,y ) 处的灰度值为 e ,y 幻。在时刻f + 匮r 时,这一点运动到新位置,其在图像上的位置变为 0 邶工,y + 露y ) ,灰度值记为e ( x + 匹工,j ,+ 匹y ,t 姐o ,假设它与e 0 ,m 0 相等,即: e ( x 彤幻= e ( x 姐x ,y 翎y ,t 蝴o ( 3 - - 1 ) 将右边用泰勒公式展开,那么经化简和略去两次以上的项,得 孽“+ 孽+ 孽:0 一( 3 2 )“+ f + = l 3 一zj d x 砂 d f 这就是光流场计算得基本公式,其写成梯度形式为 (ie)ru+e=0(3-3) 华北电力大学硕士学位论文 由于光流场u = ”l 有两个变量,而基本等式只有一个方程,因此只能求出光流 l vj 场沿梯度方向上的值,而不能同时求出光流场的两个速度分量2 和1 ,。这就是说, 从基本等式求解光流场是一个不适合问题。 为了解决光流场计算不适定问题的方法,需要外加一些相应的约束条件,使方 程有解。例如,h o r n 等人依据同一运动物体引起的光流场应该是连续的、平滑的, 即同一物体上相邻点的速度是相似的,那么其投影到图像上的光流变化也应该是平 滑的这一特点,提出了一种利用加在光流场上的附加约束,即整体平滑约束来将光 流场的计算问题转化为一个变分问题。n a g e l 考虑到由于在该点灰度场的梯度方向 上,已对光流场有了约束,因而提出了种新的迭代算法“”。t r e t i a k 和n a g e l 认 为光流场计算属于一类微分阉题,由于它涉及到图像灰度的时空导数的计算,因而 提出了一个基于二阶微分算予的附加约束“。此外,还有基于块( 区域) 的光流场 计算方法,基于像索递归的光流场计算方法,基于随即平滑约束条件的贝叶斯光流 场分析法“,以及傅立叶自适应平滑约束方法和几何约束方法等。 光流法的特点是不考虑特征匹配问题,在实际应用中可减少难度,但算法由于 涉及偏微分,故抗噪性能比较差;同时,光流法需要较高的图像帧采样率。另外, 有人指出光流不一定对应二维速度域,这给基于光流的运动分析法投下了阴影。 二、匹配法 块匹配算法通过对图像序列中的相邻两帧图像间的子块的匹配来进行运动估 值“。快匹配算法中,图像被分割为子块,子块中所有像素的运动矢量被认为是相 同的,由于复杂的运动可以被近似地分解为一组平移运动之和,所以块匹配算法采 用的运动模型是假定图像中的运动物体由平移运动的刚体组成。且这里有一个附加 条件,那就是假设图像场景中没有大的遮挡物,这样,采用块匹配算法就比较简单 快速,同时也保证了较高地精度。块匹配法地基本思想是,对于帧k 中地像素( n l , n 2 ) 地位移通过考虑一个中心定位在( r 1 1 ,n 2 ) 的1 m 块,同时搜索帧k + l 来找 出同样大小的最佳匹配块的位置。从计算的因素考虑,搜索通常限制在 ( l + 2 m ) ( n 2 + w ,) 的范围内,称之为搜索窗口。 运动检测中应用块匹配算法需要进行以下几个方面的选择: 选择匹配法则。一般方法有最大互相关函数。最小均方误差函数( m s e ) ,最 小平均绝对差值函数( m a d ) ,最大匹配像素统计( m p c ) 。这里为了计算的速度, 采用m a d 或m s e 来实现。 选择搜索方法。由于搜索的是匹配块。匹配并不与实际的投影运动有好的相关 性,在忽
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农业强镇建设资金申请:2025年产业升级与转型策略报告
- 牧童遥课件教学课件
- 农业产业园项目可行性研究及2025年农业资源环境承载能力评估报告
- 安全教育培训课程讲师课件
- 资源型城市绿色转型发展模式2025:绿色建筑与城市污水处理实践报告
- 安全教育培训讲师介绍课件
- 美容护肤品牌营销
- 会议开场白及安排范本
- 文化行业政策报告与市场分析
- 绿色矿山建设2025年:尾矿资源化利用与生态修复策略报告
- 道路运输安全员考试题库及答案
- 2025年全国高考一卷英语真题(解析版)
- 食品安全包保制度
- Module 1 Unit 1 How long is the Great Wall(教学设计)-2023-2024学年外研版(一起)英语六年级上册
- 2025重庆某国有企业招聘新媒体运营(偏拍摄剪辑)参考题库含答案
- 考勤管理制度全套表格
- 联邦学习在二零二五年保险精算模型跨机构协作中的实践
- 招投标技术服务及售后承诺书
- 项目合作分成方案(3篇)
- 校友数据管理办法
- 2025-2026年秋季学期各周国旗下讲话安排表+2025-2026学年上学期升旗仪式演讲主题安排表
评论
0/150
提交评论