




已阅读5页,还剩53页未读, 继续免费阅读
(模式识别与智能系统专业论文)图像特征提取及其在电缆故障信号识别中的应用.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
论文题目:图像特征提取及其在电缆故障信号识别中的应用 专 业:模式识别与智能系统 硕 士 生:王 梨 (签名) 指导老师:汪 梅 (签名) 摘 要 随着多媒体技术、数码技术以及互联网应用的快速发展,多媒体信息在各个领域 得到了广泛的应用,如数字图书馆、医学图像、卫星遥感图像、公安系统等。如何从浩 瀚的图像海洋中快速、准确地找出所需的图像,已成为迫切需要解决的问题。 论文首先介绍了图像检索中常用的三种图像特征,即颜色特征、形状特征、和纹 理特征。由于基于单一特征的图像检索只是利用了图像的部分信息,所以检索效果往往 不够理想。这种矛盾随着图像数据库应用的深入而日趋突出。为提高图像检索的平均查 全率和平均查准率,本文提出一种改进的特征加权融合算法。首先,提取出图像的形状 特征和纹理特征,分别进行特征向量内部归一化。然后,用欧式距离、平方欧式距离及 棋盘格距离三种方法分别计算并取结果的平均值作为图像之间的形状相似距离和纹理 相似距离。最后,外部归一化后,再对特征向量进行加权融合,获得图像相似度的衡量 依据,以此进行图像检索。实验证明基于此方法的图像检索系统,其平均查全率和平均 查准率都有所提高。 论文随后介绍了电缆故障的形成原因和常见的故障类型及特点,利用 matlab 软 件建立电缆故障系统模型, 仿真得到常见的几种电缆故障信号图像, 故障处的单相断路、 单相短路接地、两相短路接地、三相短路电压波形等。 论文最后针对早期电缆故障在线识别问题,首次将图像纹理特征应用于电缆行波信 号的故障识别。 定义了基于灰度共生矩阵的参数 r, 给出了纹理特征参数 r 的提取方法, 提出了基于图像处理的纹理特征参数 r 的电缆故障信号的识别方法。 实验证明此方法正 确有效地实现了几种常见故障的识别。 关 键 词:图像检索;特征提取;形状;纹理;融合特征;电缆故障 研究类型:应用研究 subject : image feature extraction and its application in cable fault signal recognition specialty : pattern recognition and intelligent systems name : wang li (signature) instructor : wang mei (signature) abstract with the rapid development of multimedia technology, digital technology and the internet applications, multimedia information have been widely applied in various fields, such as digital libraries, medical images, satellite remote sensing images, and the public security system. how to find the desired image rapidly and accurately from the vast ocean is an urgent problem need to solve. first, the three types of commonly used image retrieval image features, color features, shape features and texture features,were introduced. as the image retrieval based on single feature using only part of the image information, so the search results are not very satisfactory. with the deep application of image database the contradiction increasingly prominent. in order to improve the average recall rate and the average precision rate of image retrieval, an improved fusion algorithm of the weighted features is presented. firstly, the shape features and the texture features of images are extracted. then the elements of the vectors are normalized respectively. in the next step, the euclidian distance and the squared euclidian distance and the city-block distance are calculated. the mean values of the 3 kinds of distances are obtained and used as the shape similarity distance and the texture similarity distance. finally, the weighted feature vectors are fused and the similarities between images are obtained and used as the measure bases to implement the image retrieval. the experiments show that the tangible results of image retrieval are realized and the average recall rate and the average precision rate are improved. then, the formation of cable fault and the common fault types was described in this paper. the cable fault system model was build using the matlab software, and several common cable fault signal images were simulated from the model. such as single-phase open circuit fault, single-phase short-circuit ground, the two phase short circuit ground, three-phase short-circuit voltage waveform and so on. finally, the image texture features are first applied in cable signal fault recognition in the early cable fault on line recognition problems. r parameter based on gray-level co-occurrence matrix is defined, the method of texture features r parameter extraction is given, and the cable fault signal recognition method based on r parameters of texture features image processing is proposed. the recognition of several common fault patterns can be achieved correctly and effectively proved by the experiments. key words: image retrieval feature extraction shape texture features fusion algorithm cable fault thesis : application research 1 绪论 1 1 绪论 1.1 选题背景及研究意义 人们早在远古时代就开始使用图像了,比如古代居住在山洞中的猿人就开始在山洞 的墙壁上绘画图片。人们利用图像来传递信息可以追溯到古罗马时代。但是,在二十世 纪,人们才开始意识到大量的图像在他们生活中起到重要的作用。近年来,随着多媒体 技术和数字照相机、摄像机、扫描仪、打印机这些图像电子设备的普及,全世界的数字 图像的容量正以惊人的速度增长, 每天都会产生数以百万记的图像1。 特别是 90 年代初 期 internet 的飞速发展,越来越多的人能够更加方便、快捷、经济地接触到这些图 向媒体,人们面临的问题不再是缺少图像媒体的内容,而是如何在浩瀚的图像世界中找 到自己所关注的信息。这就要求有一种能够快速而且准确地查找图像的技术,这就是所 谓的图像检索技术。 基于内容的图像检索指由计算机对于图像的内容进行分析,制成索引,用户根据自 己的需要提出查询要求,而不是苦苦思索寻找关键字来进行图像检索。基于内容的检索 技术自动提取每幅图像的视觉内容特征作为其索引,如颜色、纹理、形状等,这与原有 系统中对图像进行人工标注的做法大有不同。如何实现快速有效的图像检索,关键在于 采用何种特征作为索引以及特征如何匹配,这正是基于内容的图像检索技术的核心,对 它的研究具有十分重要的意义。 1.2 图像检索技术发展概况 第一代图像检索系统允许通过字符串属性访问图像,用字符串表达与内容无关的元 数据,使用如框架模型、相关模型、面向目标的模型等表达方案。与内容相关的元数据 通过关键字或文本描述。关键字比较适合于识别/认证,如图像和视频中的有意义实体, 前后文相关的概念或场景表达。检索可基于在文字领域工作的传统的搜索引擎,使用传 统的查询语言或全文检索。 新一代图像检索系统支持基于视觉内容的检索。对图像信息的访问不仅在概念层利 用关键字进行,而且也在感知层利用对视觉内容的客观测量和合适的相似模型进行。用 户不仅可以借助文字查询方法,也可以借助视觉浏览和范例查询方法利用搜索引擎进入 索引进行检索,返回的结果仍可以用可视化的手段显示给用户,使用户能借助相关反馈 开始新一轮查询。 西安科技大学硕士学位论文 2 1.2.1 基于文本索引的图像检索 当前几乎所有的商用图像检索系统(包括 google) ,都是先用文本来描述图像的语 义, 然后在这些图像文本标注基础上应用成熟的文本搜索算法, 为用户搜索预期的图像。 与基于内容的检索相比,设计一个基于关键字或文本描述的图像检索系统要简单得多。 由于这种搜索引擎可以利用成熟的关系数据库技术,所以检索比较准确,速度也快。这 种技术可以用来管理数量不多,但比较有价值的图片库,例如,博物馆收集的图片。 但是随着图像数据库规模的不断增大,基于关键字或文本标注的图像检索存在的问 题就突显出来了。首先,对图像进行人工标注太费时费力效率偏低,其次人工标注具有 主观性和多义性等特点。例如,对于同一幅图像,不同的用户、不同的应用给出的标注 可能完全不同,这使得准确地响应用户的查询非常困难。许多研究者通过分析网页对其 链接图像的说明获得图像的文本标注,这在一定程度上减少了人工标注的劳动量,但是 网页对图像的说明仍然是人工的,因此不能避免主观性和不确定性问题。 尽管如此,但由于图像的高层语义特征不能由图像的底层可视特征有效地表示,基 于文本标注的图像检索技术仍然起着不可替代的作用。例如,为了实现对多媒体内容的 存取、索引和检索,mpeg-7 标准提出了多媒体内容的层次表示,其中最低层次是可由 计算机自动提取的物理统计特征,最高层次是与多媒体内容相对应地类似文字描述的特 征,在必要时语义层次的特征还需要提供人工标注的方式2。 1.2.2 基于内容的图像检索 鉴于基于文本索引图像检索的一些缺点,人们提出了一种新的图像检索技术基 于图像自身内容的检索。 该项检索技术不需要用户的参与, 由系统对图像进行特征描述、 提取与识别,克服了传统的基于关键词检索中人工注解图像的主观性、不准确性和工作 量大的缺陷3。用户检索的过程一般是提供一个样例图像,系统抽取该样例图像的相应 特征,然后同数据库中所有被检索对象的特征进行比较,并将与样例特征相似的图像返 回给用户,这个过程称之为基于内容的图像检索。从早期对罪犯指纹的识别与管理、面 貌特征的识别与管理等专用系统的研究开始,经过相当长一段时间的发展,在理论上和 技术上做了不少探索,产生了许多较成熟的基于图像特征的检索算法(如基于颜色特征 检索的颜色累加直方图法和颜色集法、基于形状特征检索的形状不变矩法和傅里叶形状 描述符法、基于纹理特征检索的 tamura 纹理法、灰度共生矩阵法和马尔可夫随机场模 型法等) ,并相应地开发了出一些有价值的通用系统。譬如,国外较著名的有:美国 ramesh jain 等人设计的“视觉信息管理系统 vims(vision information management system) ” 4、 ibm almaden 研究中心开发的“基于内容检索系统 qbic (queryby image content) ”等5。国内较有代表性的有:清华大学开发的 internet 上静态图像的基于内 1 绪论 3 容检索的原型系统,浙江大学开发的 photo navigator、photo engine 和 webscopecbr, 中国科学院计算技术研究所和北京图书馆联合开发的“基于特征的多媒体信息检索系统 mires6”等。 基于内容的图像检索是一门涉及面很广的交叉学科,包括:图像处理、机器视觉、 信号处理、数据库、信息检索、模式识别等相关技术,与传统的文本检索系统相比,具 有如下特点: (1)直接以图像底层视觉特征为描述内容提取信息线索。基于内容的图像检索直 接分析图像的底层可视特征如,颜色、纹理、形状、空间关系等,并将其表示为特征向 量的形式从中抽取特征,以利于图像的检索。 (2)以形似性为度量准则。基于内容的图像检索的目的是找出并返回与用户查询 要求最相似的图像,并不要求精确匹配,因为也许给定的查询信息本身就是不完全、不 精确的, 因此只要求检索系统能够按照相似性度量准则返回那些可能满足要求的图像集 合,并且按照相似度大小排序。 (3)整个过程是一个逐步逼近和相关反馈的过程。基于内容的图像检索系统应具 有很强的交互能力,用户参与整个检索的过程。当用户提供一副查询图像并要求找出与 此相似的图像时,用户的意识中已经有了相似性判别标准。理想情况下,系统的相似性 度量应该与用户的判别一致,它涉及到人类视觉系统对图像的认知和高层语义的解释。 因此通过用户的相关反馈,检索系统学习用户的意图和准则来指导图像检索过程,有效 提高图像检索的效率。 1.3 图像检索中的关键技术 基于内容的检索系统一般通过可视化界面和用户进行频繁的交互,以便于用户能够 方便地构造查询、评估检索结果和改进检索结果。其思路是:把图像的可视特征,如颜 色、纹理、形状、位置关系等作为图像的内容来进行匹配、查找。事实上,可视特征是 对图像内容的压缩、抽象,与人类的观察角度具有相当程度的相似。在这一思路的指导 下,无论是在理论研究还是在商业应用,短时间内,发展了许多技术,促进了 cbir 的 发展。 图 1.1 给出了基于内容的图像检索系统中的关键技术: 由图 1.1 可知基于内容的图像检索技术是一个综合多学科的研究领域,它从图像处 理、计算机视觉、模式识别以及数据库等研究领域借鉴了很多方法。它的最终研究目标 是如何方便快速地从大规模的数据库中提取出满足特定要求的相似图像。但是,实质上 基于内容的图像检索研究的关键技术主要围绕如下两个核心问题展开: (1)图像内容的表示问题,即以什么样的方式来表示图像内容。图像内容的表示 通过图像特征的提取完成。图像特征的提取与图像分析是密不可分的,它研究如何通过 西安科技大学硕士学位论文 4 各种图像分析方法将数字图像转换成若干可表示的数字或者文本特征,然后,使用这些 特征来表征图像的内容。一般来说,这些特征的提取最好是计算机自动完成。 (2)图像特征的相似性匹配问题,即以什么样的方式来表示这些图像之间的相似 性,以及如何快速有效的计算这种相似性。图像经过特征提取后,所获得的特征就可以 作为图像内容的表示,因此,图像间的相似性就转换成了特征空间中的相似性问题。图 像特征的匹配问题就是研究如何获得图像特征间相似性的有效方式,而且,这种相似性 还应该与人的视觉具有较好的一致性。即人眼认为比较相似的图像它们间的相似性就应 该大,反之则小。通常,特征间的相似性是通过距离来表示的,而且,它的计算策略可 随外界的反馈信息进行动态调整。 体系结构 支持基于内容检索 基 图像数据库的结构 框架结构 全局颜色特征索引 于 颜色特征索引 局部颜色特征索引 内 容 形状特征索引 形状轮廓特征索引 的 支持基于内容的图 形状区域特征索引 图 像检索的索引技术 像 纹理特征索引 纹理结构特征索引 检 纹理统计特征索引 索 主 空间特征索引 2d-string 及其变种的索引 要 空间对象点集拓扑关系 研 几何度量方法 究 图像内容的相似度量方法 技 基于集合理论的度量方法 术 图像多特征的相关反馈 基于内容的图像检索效果评判 图 1.1 基于内容的图像检索主要技术 1.4 图像检索系统功能和概况 对 2-d静止图像的检索,系统需要完成的主要功能如下。 (1)提取视觉信息的感知特征; (2)提取高层特征和图像语义; (3)人工注解内容无关或内容描述元数据; (4)对所检验数据进行合成视图表达的可视化,以提高检索效率; 1 绪论 5 (5)借助图像查询工具创作范例,用户可指定能定位具有相似视觉信息的图像的视 觉线索; (6)根据特定的索引结构滤除与查询无关的图像,仅提取与查询相关的内容; (7)使用视觉数据的属性和应用的背景进行匹配; (8)使用户可以通过指出正的和反的实例来进行反馈,这能帮助系统根据用户意向 调节检索进展并渐进的细化检索。 鉴于基于内容的图像检索的重要性、有效性和优越性,国际上已投入了大量人力物 力对此进行研究。许多研究者已研制开发了许多试验系统,并已在一些领域应用。 1.5 论文的主要工作与全文结构 由于图像检索涉及到很多领域:模式识别、计算机视觉、人工智能、数字信号处理 以及多媒体数据库,因此它是一个交叉学科。本论文在理解相关领域的知识后,主要研 究了基于内容的图像检索技术的特征提取,数据模型的建立和系统设计。 本文第二章主要研究了图像三种特征的提取,即颜色特征、形状特征和纹理特征。 颜色特征提取只做了简单理论介绍,没有应用到后边的系统中。 第三章建立了一个简单的图像检索系统,验证了第二章所研究算法对形状特征检索 和纹理特征检索的有效性。同时介绍了一种特征加权融合算法,融合形状特征和纹理特 征检索,并验证了这种融合特征检索比起单一特征检索,其准确性提高了。 第四章简单介绍了电缆故障的形成原因,几种常见的故障类型及其特点,以及电缆 故障的诊断流程,并通过 matlab7.0 软件建立电缆故障系统模型,进行实例仿真,得 到理想故障信号模型及有干扰状态下的故障信号图形,为下一章新型特征的故障信号识 别做准备。 第五章针对早期电缆故障在线识别问题,首次将图像纹理特征应用于电缆行波信号 的故障识别。定义了基于灰度共生矩阵的参数 r,提出了基于图像处理的纹理特征参数 r 的电缆故障信号的识别方法。实验证明此方法正确有效地实现了几种常见故障信号的 识别。 第六章是结束语, 对全文进行总结, 指出本文的主要工作和需要进一步研究的方向。 西安科技大学硕士学位论文 6 2 图像底层特征提取 基于内容的图像检索技术的基础和核心技术就是图像特征提取。广义上来说,图像 特征包括基于文本的特征如关键字、注释等和可视化特征如色彩、纹理、形状、对象表 面等两类。可视化特征又可分为通用的可视化特征和邻域相关的可视化特征。前者与图 像的具体内容或类型无关,用于描述所有图像所共有的特征,主要包括色彩、纹理和形 状;后者则建立在对所描述图像内容的某些先验知识的基础上,与具体的应用有着密切 的关联,例如人的面部特征或指纹特征等。本章重点介绍可视化特征的提取和表达。对 于某个特定的图像特征,通常又有多种不同的表达方法。由于人们主观认识上的差别, 对于某个特征并不存在一个所谓的最佳的表达方式。事实上,图像特征的不同表达方式 从各个不同的角度刻画了该特征的某些性质。 本章只介绍在图像检索中应用最广泛的特 征和相应的表达方法。 2.1 颜色特征提取 颜色是所有图像中最简单最直接的特征,实验证明人眼对图像的阴暗程度非常敏 感。颜色在图像检索中应用最为广泛,主要原因在于颜色往往和图像中所包含的物体或 场景十分相关。此外,与其他的视觉特征相比,颜色特征对图像本身的尺寸,方向,视 角的依赖性较小。 图像的颜色特征可以是各种颜色的比例分布以及颜色的空间分布等,目前,大部分 的检索系统都采用颜色比例分布作为颜色基本特征,这方面算法的研究,也多以此为基 点,这就是图像领域中的直方图法。具体做法是,在确定颜色空间的基础上,统计每种 颜色分量的比例分布直方图,最后把直方图作为图像颜色特征进行图像检索。由于图 像的直方图具有尺度,旋转不变性,因此被广泛采用,在著名的 qbic 系统中,颜色特 征便是用直方图来表示的7。后来,人们又对这种算法进行改进,产生了累积直方图法, 实验表明,这种方法对检索效果有明显改善。 2.1.1 颜色空间 颜色空间可以定义为一种用亮度值来表示颜色的模型。一般是一个三维空间,空间 每一维代表一个颜色分量或一个颜色通道。颜色空间维度表征空间灰度值。 为了使各种颜色能按照一定的排列次序并容纳在一个空间内,将三维坐标轴与颜色 的三个独立参数对应起来,使每一个颜色都有一个对应的空间位置,反过来,在空间中 的任何一点都代表一个特定的颜色, 我们把这个空间称为色彩空间。 色彩空间是三维的, 作为色彩空间三维坐标的三个独立参数可以是色彩的心理三属性: 色相、 明度、 饱和度, 2 图像底层特征提取 7 也可以是其它三个参数如 rgb 或者 cmy,只要描述色彩的三个参数相互独立都可以作为 色彩空间的三维坐标。例如,以色料三原色黄、品红、青为基色,对应三维空间作色量 的均匀变化,互相交织起来,组成一个理想的颜色立方体。 (1)rgb 颜色空间 在计算机中经常采用的色彩空间主要是 rgb 空间,由红(r) ,绿(g) ,蓝(b)三 原色组成的彩色空间。一旦各种颜色相复合成为所期望得到的颜色,那么它们就被认为 是原始添加物。rgb 模型使用笛卡儿坐标系如图 2.1 所示。注意从(0,0,0)黑点到(1, 1,1)白点的直线,是表示灰度值的。图 2.2 从白色原点以一个俯视的角度来观察 rgb 颜色模型的8。 有几种方法可以定量地表示颜色,如彩色数字图像中像素的颜色。最直接的方法是 使用红、绿、蓝的亮度值,大小可以限定到一定的范围,如0,1,255,我们把这 种约定称为 rgb 格式。每个像素都能用三维空间中第一象限的一个点来表示。 图 2.1 rgb 坐标系 图 2.2 rgb 颜色模型 在 rgb 彩色空间的原点上,任一基色均没有亮度,即原点为黑色。三基色都达到 最高的亮度时则表现为白色。亮度较低的等量的三种基色产生灰色的影调。所有这些点 均落在彩色立方体的对角线上,该对角线被称为灰色线。彩色立方体中有三个角对应于 三基色红、绿和蓝色。剩下的三个角对应于二次色黄色、青色和品红9。 一幅图像可以看作从点坐标映射到 r、g、b 空间。如果在图像中点的位置忽略掉, 图像可以认为是 r3空间中的点集。 在色度系统中,不是只用颜色的三基色表示颜色,而是经常用他们的比例值色 度坐标(r,g,b)来表示,r、g、b 与三基色的关系为: bgr r r (2.1) 西安科技大学硕士学位论文 8 bgr g g (2.2) bgr b b (2.3) 由于色度坐标1bgr,因此,只有两个坐标是相互独立的。根据两个相互独立的色 度坐标绘出的光谱曲线称为色度图。 (2)hsv 颜色空间 hsv(色调,饱和度,数值)是人们用来从调色板或颜色轮中挑选颜色(如颜料或 墨水)所用的彩色系统之一。值得注意的是,该颜色系统比 rgb 系统更接近于人们的经 验和对彩色的感知。在画家的术语里,色调,饱和度和数值称为色泽,明暗和调色。 hsv 标准对于色度,饱和度和亮度值是由图像本身决定的(色彩,明暗和色调) 。同 样的系统在一个六角圆锥体中如图 2.3。 图 2.4 是从 hsv 颜色模型角度观察的。 亮度表示 的是颜色的明亮程度。色度和饱和度的组成直接关乎人眼感知颜色的方式,使得生理基 础成为图像处理的数学运算法则。 图 2.3 hsv 坐标系 图 2.4 hsv 颜色模型 色度从 0 到 1.0 被划分,颜色各有不同,从红色开始,过渡到黄色,绿,青,蓝和 紫,然后又回到红,因此,红色在 0 点和 1.0 点都可以获得。饱和度也从 0 到 1.0 被划 分,颜色从无饱和到全饱和。对于亮度,同样从 0 到 1.0 划分,在这个过程中颜色逐渐 明亮。 (3)rgb 颜色空间向 hsv 颜色空间的变换 在图 2.5 中,已获得的 hsv 颜色系由一个三角体表示,其各顶点由 rgb 空间的三原 色表示: p点的色度是由p点到三角体中心的直线和 red 点到三角体中心的直线构成的已知 角。p点的饱和度是p点与三角体中心的距离。p点的亮度由过三角体中心并与其垂直 2 图像底层特征提取 9 的的线段的高度。灰度值的各点位于相同的直线上。对任何 3 个在0,1范围内的 r,g, b 值,变换的公式如下10: )()( )()( 2 1 arccos 2 bgbrgr brgr h (2.4) ) ), , ,min(min( 3 3 1 1b bg gr r b bg gr r s s (2.5) )( 3 1 bgrv (2.6) 图 2.5 从 rgb 颜色空间获得 hsv 颜色空间 2.1.2 颜色直方图 图像的颜色直方图由每种颜色的像素数决定。 一幅图像的灰度直方图是指图像亮度的概率密度函数,从而颜色直方图可以定义为 图像中三个颜色通道的联合概率密度函数: ),(),( , ccbbaapncbah cba (2.7) 式中a,b,c表示图像的颜色通道(rgb 或 hsi);n表示图像的大小,即整幅图像包 含的像素数目;p表示概率密度函数;h为直方图函数。根据计算,颜色直方图的形成 就是每种颜色像素数的离散化。 运用颜色直方图进行检索有如下三种方式: (1)指明颜色组成该方法需要用户对图像中的颜色非常敏感,而且使用起来 也不方便,检索的查准率和查全率并不高,因此暂时不做进一步开发。 (2)指明一幅示例图像通过与用户确定的图像的颜色直方图的相似性匹配得 到查询结果。 (3)指明图像中一个子图分割图像为各个小块,然后利用选择小块来确定图 西安科技大学硕士学位论文 10 像中感兴趣的对象的轮廓,通过建立更复杂的颜色关系(如颜色对方法)来查询图像, 该方法是进一步优化检索的一个设想。 下面介绍几个最基本的表达方法。 (1)统计直方图 为利用图像的颜色特征描述图像,可借助特征的统计直方图。图像特征的统计直方 图实际上是一个 1-d的离散函数,即 n n kh k )( k = 0,1,,l-1 (2.8) 上式中 k 代表图像的特征取值,l 是特征可取值的个数, k n是图像中具有特征值为 k 的 像素的个数,n 是图像像素的总数。 (2)累加直方图 图像特征统计的累加直方图也是一个 1-d的离散函数,即有 k i i n n ki 0 )( k = 0,1,l-1 (2.9) 上式中 k 代表图像的特征取值,l 是特征可取值的个数, i n是图像中具有特征值为 i )(ki1 , 0的像素的个数,n 是图像像素的总数。 2.1.3 颜色矩 另一种非常简单而有效的颜色特征是由 stricker 和 orengo 所提出的颜色矩。 这种方 法的数学基础在于图像中任何的颜色分布均可以用它的矩来表示。此外,由于颜色分布 信息主要集中在低阶矩,因此仅采用颜色的一阶矩,二阶矩和三阶矩就足以表达图像的 颜色分布。与颜色直方图相比,该方法的另一个好处在于无需对特征进行向量化11。颜 色的三个低次矩在数学上表达为: n j iji p n 1 1 (2.10) 2 1 1 2) )( 1 ( n j iiji p n (2.11) 3 13 1 )( 1 ( n j iiji p n s (2.12) 其中, ij p是图像中第 j 个像素的第 i 个颜色分量。因此,图像的颜色矩一共只需要 9 个 分量(3 个颜色分量,每个分量上 3 个低阶矩) ,与其他的颜色特征相比是非常简洁的。 在实际应用中为避免低阶矩较弱的分辨能力,颜色矩常和其他特征结合使用,而且一般 在使用其他特征前起到过滤缩小范围的作用。 2 图像底层特征提取 11 2.1.4 颜色匹配算法直方图相交 令)(khq和)(khd分别为查询图像q和数据库图像d的特征的统计直方图,则两图 像之间的匹配值p(q,d)可借助直方图相交来计算12,即 1 0 1 0 )( )(),(min ),( l k q l k dq kh khkh dqp (2.13) 式中,k 代表图像的特征取值,l 是特征可取值的个数。 2.2 形状特征提取 对计算机图像识别系统而言, 物体的形状是一个赖以识别的重要特征。 一个图像形 状和结构特征有两种形式,一种是数字特征主要包括几何属性(如长短、面积、距离和 凹凸特性等),统计属性(如黑色像素点在垂直方向的投影)和拓扑结构(如连通、欧 拉数);另一种是有字符串和图等所表示的句法结构。它可以刻画某一图像不同部分之 间的相互关系(如文字识别中的笔划关系),也可以描述不同目标间的关系。 物体和区域的形状是图像表达和图像检索中的另一重要特征。 但不同于颜色或纹理 等底层特征,形状特征的表达必须以对图像中物体或区域的划分为基础。另一方面,由 于人们对物体形状的变换,旋转和缩放主观上不太敏感,合适的形状特征必须满足对变 换,旋转和缩放无关,这对形状相似度的计算也带来了难度。 通常来说,形状特征有两种表示方法,一种是轮廓特征,一种是区域特征。前者只 用到物体的外边界,而后者则关系到整个形状区域。这两类形状特征的最典型方法分别 是傅立叶描述和形状无关矩。 2.2.1 图像分割 图像分割是由图像处理进到图像分析的关键步骤,这是因为图像的分割、目标的分 离、特征的提取和参数的测量将原始图像转化为更抽象的形式,使得更高层的分析和理 解成为可能。图像分割多年来一直得到人们的高度重视。当前的技术还无法做到准确而 鲁棒的自动图像分割,所以图像检索中的形状特征只能用于某些特殊的应用,在这些应 用中图像包含的物体或区域可以直接获得。因此,本文基于形状特征的图像检索也仅限 于那些背景相对简单的图像13。 下面介绍一种对图像的迭代域值分割的方法。 首先选取图像的灰度范围的中值作为初始值 0 t,然后按式(2.14)迭代: 西安科技大学硕士学位论文 12 1 1 1 1 0 0 1 2 1 l tk k l tk k t k k t k k i i i i i h kh h kh t (2.14) 式中 k h是灰度为k值的像素个数,共有l个灰度级。迭代一直进行到 ii tt 1 结束,取 结束时的 i t为域值。得到二值图像后,就可以实现提取其不变矩特征的算法。由于矩的 计算量较大,因此,可以先使用算法提取出其矩不变量特征,存放于图像的形状特征索 引库中,然后提供给图像检索算法执行图像查询14。 下面给出了利用迭代阈值分割法对一副背景相对简单的花朵图像分割的结果,由结 果可以看出,此方法较好的分割出了目标区域花朵的轮廓。 图 2.6 原始图像 图 2.7 分割后图像 2 图像底层特征提取 13 2.2.2 基于轮廓的全局方法的形状特征 基于轮廓的全局方法是用从整个边界得到的特征矢量来描述形状。 (1)简单的形状特征 可以用以下简单的形状特征来描述轮廓15。 周长。区域周长 b 和曲线长度一般按欧式距离来计算,即水平和垂直方向上相 邻两像素点间的距离为 1, 倾斜方向上相邻两像素点的距离为2,曲线长度定义为按上 述两点距离定义的逐点累加。 面积。图像中的区域面积 s 可以用同一标记的区域中像素的个数来表示。 形状参数。根据边界的周长 b 和区域的面积 s 计算得到形状参数 f 为 s b f 4 2 2 (2.15) 长轴和短轴。 指在区域边界上距离最远的两点的连线。 边界上与长轴垂直的连线 中最长的线段称为短轴。 偏心率。区域边界的长轴长度与短轴长度的比值为偏心率。 弯曲能量。 p dppk p b 0 )( 1 (2.16) 式中,)(pk是曲率参数,p 是弧长参数,p 是曲线长度。 (2)形状标识函数 形状标识函数)(tu是任意一个表示二维区域或边界的一维函数,并且唯一的表示一 个形状。形状标识通常获取了人们对形状感觉到的特征16。 位置函数。位置函数也称为复数坐标,可以从边界坐标得到复数坐标,即 )()()( cc ytyixtxtz (2.17) 其中,),( cc yx是形状的质心。 1 0 )( 1 n t c tx n x, 1 0 )( 1 n t c ty n y (2.18) 质心距离。质心距离)(tr为边界点到形状的质心),( cc yx的距离, 22 )()()( cc ytyxtxtr (2.19) 弦长标识。对于每一个边界点 p,它的弦长函数)(tr是点 p 到另外一个边界点 p 之间的距离, 这里的 pp必须与点 p 处的切线垂直, 附加条件是线段 pp必须在形状内部。 累积角度函数。 从直觉上来说, 形状边界的切线角度表示了形状边界的方向变化, 形状可以用边界的切线角度来表示, 西安科技大学硕士学位论文 14 )()( )()( arctan)( wtxtx wtyty t (2.20) 这里的 w 是实际中使用的一个步长,取整数。 累积角度函数)(t定义为形状边界上从起始点)0( z到点)(tz的角度弯曲值 )2mod()0()()(tt (2.21) 曲率标识。曲率标识函数)(tk定义为 dt d tk )( (2.22) 式中,为区域边界的切线角度函数。 2.2.3 基于区域的全局方法的形状特征 全局方法将形状看做一个整体,提取描述形状的特征量,主要有 zernike 矩和几何 不变矩。 (1)zernike 矩 在极坐标下,n 阶 m 重 zernike 矩定义为17 y nm x mn yxvyxf n z),(),( 1 , ,1 22 yx (2.23) 式中,),(yxf为进行图像分割后的二值图像,),(yxvnm 表示),(yxvmn的共轭 )exp()()sin,cos(),(jmrvyxv mnmnmn (2.24) sn mn s s nm s mn s mn s sn r 2 2 )( 0 ! 2 ! 2 ! )!( ) 1()( (2.25) 式中,为点),(yx到形状质心的半径;为与 x 轴的夹角;n,m 为整数,并且mn为 偶数,nm 。 由于 zernike 基函数的定义域在单位园内, 所以在计算 zernike 矩之前, 必须指定单 位圆。在实现时,所有的形状都必须归一化到单位圆内。单位圆以形状质心为中心,这 样得到 zernike 矩具有平移性和尺度不变形。 (2)hu 矩 矩是对图像的一种统计形式,作为一组关于形状的统计值,矩不变量的表示形式有 多种。hu 矩在图像像素数目一定的情况下,具有对图像的旋转、平移和尺度变化的不 变性。 一幅大小为 m n 的二维图像h (i ,j) | i = 0 , ,m; j =0 , ,n ,其(s + t)阶矩如 2 图像底层特征提取 15 下式所示18。 11 ( , ) mn st st ij zh i j i j , s ,t = 0 ,1 ,2 , (2.26) s 和 t 可取所有的非负整数值,它产生一个矩的无限集。根据帕普利斯唯一性定理, 这个无限集完全可以确定二维图像函数 h (i ,j) 本身。其零阶矩只有一个,即 00 11 ( , ) mn ij zh i j 。对于二值图像,令其背景值为 0,形状区域内值为 1 ,则零阶矩表 示该形状区域的面积。 为了保证形状特征的位置不变性,必须计算中心矩,即以物体的质心为原点计算图 像的不变矩值。由零阶矩和一阶矩可以算出图像的质心 10000100 ( , )(/,/)ijzzzz。图像 的(s + t) 阶中心矩为 11 ( , )() () mn st st ij zh i j iijj , s ,t =0 ,1 ,2 , (2.27) 根据形状区域面积,进一步对中心矩进行归一化,即将 st z用 ()/2 00 / s t st zz 代替,则 得到的不变矩可以满足尺度无关性19。这里的尺度指的是形状区域的尺度,而不是整个 图像的尺度。 提取图像的七个面积归一化中心矩 11022021120330 ,zzzzzzz之后,就可 计算出相应的 hu 不变矩 721 ,hu 不变矩即是关于这七个矩的函数,满足形 状的平移、旋转和尺度不变性,其计算如下: 12002 zz 22 2200211 ()4zzz 22 330122103 (3)(3)zzzz 22 430122103 ()()zzzz 22 53012301230122103 22 2103210330122103 (3)()()3() (3)()3()() zzzzzzzz zzzzzzzz 22 62002301221031130122103 ()()() 4()()zzzzzzzzzzz 22 72103301230122103 22 2103210330121203 (3)()()3() (3)()3()() zzzzzzzz zzzzzzzz (2.28) 本文实验中正是利用 hu 不变矩法提取的图像形状特征 x f 20。 基于矩的形状描述可以保存原有形状的信息, 矩也足以重建原始函数 h (i ,j)。 但是, hu 不变矩的不变性是在连续情况下,假设图像像素数目在线性变换过程中保持不变的 条件下进行的。而在离散情况下,图像变换是不连续的,除平移变换外,旋转和尺度变 换均会导致图像像素数目的变化,从而使计算结果产生误差。由于图像的大小会影响不 变矩特征值,因此,在进行图像相似性匹配时,应首先将图像库中的图像规范为相同尺 西安科技大学硕士学位论文 16 寸大小的图像。 对于一幅彩色 rgb 图像, 计算其 hu 不变矩特征量的过程如图 2.8 所 示。 图 2.8 彩色图像 hu 不变矩计算流程 将一幅彩色图像灰度化,再用迭代域值分割法将其二值化,然后计算不变矩函数, 不变矩函数满足平移和旋转不变性,因而可被广泛地应用于区域形状识别中。 2.3 纹理特征提取 纹理特征是一种不依赖于颜色或亮度的反
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 广西壮族自治区来宾市公路工程试验检测师资格考试(公共基础)综合能力测试题及答案(2025年)
- 2025年职业病诊断医师资格考试(基础理论及法律法规)练习题及答案
- 裁边拉毛工三级安全教育(班组级)考核试卷及答案
- 洗衣机制造工转正考核试卷及答案
- 纺丝凝固浴液配制工内部技能考核试卷及答案
- 2025年临淄区英语考试题及答案
- 白酒配酒工测试考核试卷及答案
- 井下采煤机司机新员工入职考核试卷及答案
- 2025年公路工程试验检测师资格考试(公共基础)综合能力测试题及答案(肇庆)
- 2025年医师资格考试(实践技能)复习题库及答案阳江
- 香雪制药资本结构优化分析
- 中国药科大学-导师及联系方式
- 2024年高考作文备考之“有用无用”作文导写素材及范文
- DZ∕T 0214-2020 矿产地质勘查规范 铜、铅、锌、银、镍、钼(正式版)
- 无创呼吸机通气模式介绍及临床应用课件
- MOOC 模拟电子电路实验-东南大学 中国大学慕课答案
- (正式版)SHT 3158-2024 石油化工管壳式余热锅炉
- 多格列艾汀使用指南2024课件
- 居民电费户名更改委托书
- 道路车辆 局域互联网络(LIN) 第3部分:协议规范
- 客户反馈管理方案处理客户反馈的有效举措
评论
0/150
提交评论