




已阅读5页,还剩71页未读, 继续免费阅读
(船舶与海洋结构物设计制造专业论文)基于人工神经网络的水面运动目标识别技术研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
哈尔滨工稃大学硕十学位论文 摘要 智能化和高速化一直是船舶研究的重要方向,船舶速度的提高使人们对 船舶的智能化提出了更高的要求。视觉是人类获得外界信息的重要途径,因 此。视觉智能化的发展对提高船舶的自主能力,使其准确识别目标,并对信 息做出相应反应,从而顺利完成水面作业有着重要的意义。 首先,本文针对水面运动目标的特点,在循环水槽环境下进行模拟试验, 获得了不同环境下,船模不同姿态的运动目标图像,建立了目标图像库。 其次,在对图像进行中值滤波后,考虑运动目标实时性要求高的特点, 尝试各种分割算法,最后选择了一种计算速度快,适应性强的o t s u 自适应阈 值法进行图像分割,取得了满意的分割效果。然后,在特征提取、计算和特 征选择方面进行研究,在对h u 矩的研究基础上,采用了一种新的在离散状 态下同时具有平移、旋转和比例不变性的六个不变矩作为特征值,并通过对 选择的四类目标共计3 0 0 幅图像进行仿真实验,验证了该六个特征值使同类 目标具有较好的聚类性,异类目标具有较好的可分性。 最后,在人工神经网络识别方面进行重点研究。针对传统b p 神经网络 识别存在的缺陷,采用了粒子群优化神经网络权值的方法。在对粒子群算法 原理迸行理论分析的基础上,设置参数以及设计流程,通过对样本训练得到 最终优化结果。粒子群优化算法具有很好的收敛性,避免了b p 网络陷入局 部极小值的情况,可以达到满意的识别效果。 鉴于视觉智能化信息处理的复杂性,本文做的工作比较简单,但所提出 的一些理论,也是对将来工作的一种有益的探索,为深入研究船舶的智能系 统打下了基础。 关键词:水面运动目标;o t s u 自适应阈值分割;b p 神经网络识别;粒子群 优化算法 哈尔滨t 稗大学硕十学仿论文 a b s t r a c t i n t e l l i g e n c ea n dh i 曲s p e e da r ea l w a y si m p o r t a n td i r e c t i o n so fs h i pr e s e a r c h a st h es p e e do fs h i pi n c r e a s i n g ,w en e e ds h i pm o r ei n t e l l i g e n t v i s i o ni sa n i m p o r t a n ta p p r o a c ht oa c q u i r ei n f o r m a t i o n t h e r e f o r e ,t h ed e v e l o p m e n to fv i s i o n i n t e l l i g e n c ei si m p o r t a n tt oe n h a n c es h i p si n d e p e n d e n ta b i l i t y , w h i c hm a k e ss h i p r e c o g n i z et a r g e te x a c t l y , r e s p o n s et oc o r r e s p o n d i n gi n f o r m a t i o na n dc o m p l e t et h e t a s ks u c c e s s f u l l y f i r s t l y , c o n s i d e r i n gt h ec h a r a c t e r i s t i co fm o v i n go b j e c t sa b o v et h ew a t e r , w e d os i m u l a t i v ee x p e r i m e n t si nt h ef l u m e i m a g e so fs h i pm o d e l si nd i f f e r e n t c i r c u m s t a n c e sa n da t t i t u d e sa r ea c q u i r e dt ob u i l da ni m a g ed a t a b a s e s e c o n d l y ,a f t e rm e d i a nf i l t e r i n gt h ei m a g e s ,o nt h eb a s i so ft h er e a l t i m e c h a r a c t e r i s t i co fm o v i n go b j e c t s ,af e a s i b l ea n de f f e c t i v em e t h o d 一- o t s ui s p r e s e n t e d t o s e g m e n ti m a g e s f i n a l l y w ea c q u i r e d s a t i s f a c t o r ye f f e c to f s e g m e n t a t i o n t h ee i g e n v e c t o r so fi m a g e sa l eg o tt h r o u g ht h ef e a t u r ee x t r a c t i o n a n df e a t u r es e l e c t i o n ,w h i c ha r et h es i xf e a t u r ev e c t o r s t h r o u g h3 0 0f l a m e so f f o u ro b j e c t s i m a g e s ,w ek n o wt h a tt h es i xf e a t u r ev e c t o r sh a db e t t e rc l u s t e r i n g e f f e c tt oc o n g e n e ro b j e c t sa n ds e p a r a b l ee f f e c tt od i f f e r e n tk i n d so f o b j e c t s f i n a l l y , w em a i n l yd or e s e a r c ho na r t i f i c i a ln e u r a ln e t w o r kf o ri d e n t i f i c a t i o n c o n s i d e r i n gt h el i m i t a t i o no ft r a d i t i o n a lb pn e u r a ln e t w o r k , w eu s ean e w p a r t i c l e s w a r mo p t i m i z e rm e t h o d a f t e ra n a l y z i n gt h ea l g o r i t h m i ct h e o r ya n dp a r a m e t e r s e t t i n g ,w ed e s i g n e dt h ep r o g r a m e x p e r i m e n t a lr e s u l t ss h o wt h a tp a r t i c l es w a r m o p t i m i z e rh a sag o o da s t r i n g e n c ya n dc a na v o i dt h ed e f e c to fb pn e u r a ln e t w o r k c o l l i g a t i n gp a r t i c l es w a r mo p t i m i z e ra n db pn e u r a ln e t w o r k ,w ec a na c q u i r e s a t i s f a c t o r ye f f e c t a c c o r d i n gt ot h ec o m p l e xo f t h ev i s i o ni n t e l l i g e n c ea n di n f o r m a t i o nd i s p o s i n g , t h ep a p e ri so n l yt h eg r o u n d w o r k h o w e v e r , t h ea v a i l a b l ee x p l o r e m e t h o d s m e n t i o n e di nt h ep a p e rl a yt h ef o u n d a t i o nf o r t h ef u r t h e rw o r k k e yw o r d s :m o v i n go b j e c ta b o v ew a t e r ,o t s ua u t o m a t i cs e g m e n t a t i o n , b pn e u r a ln e t w o r k ,p a r t i c l es w a r mo p t i m i z e r 哈尔滨工程大学 学位论文原创性声明 本人郑重声明:本论文的所有工作,是在导师的指导 下,由作者本人独立完成的。有关观点、方法、数据和文 献的引用已在文中指出,并与参考文献相对应。除文中已 注明引用的内容外,本论文不包含任何其他个人或集体已 经公开发表的作品成果。对本文的研究做出重要贡献的个 人和集体,均已在文中以明确方式标明。本人完全意识到 本声明的法律结果由本人承担。 作者( 签字) :皿 日期:a ,占7 年2 月奠驴日 哈尔滨i 。程人学硕十学忙论文 第1 章绪论 1 1 引言 人类的发展和社会的进步,海洋_ 丌= 发的不断深入,促使水上运输蓬勃发 展,用于水面的交通工具同益增多,并朝着多元化方向发展。船舶作为水上 重要的交通工具,其性能不断提高,而船舶的高速化和智能化一直是人们所 关注的,也是近年束人们研究的热点问题。 船舶的速度提高和智能化的要求带给人们一系列的问题,如船舶自身对 周围环境的认知能力,和对状态改变的反应能力等等。众所周知,视觉是人 类从大自然中获取信息的最主要的手段,外部世界丰富多彩的信息有百分之 六十是通过视觉感知的,这足以体现视觉对于人类认知的重要性,人类可以 通过眼睛与大脑来获取、理解与处理视觉信息。人们对智能化的渴求,随着 计算机技术的发展而不断提高,人们希望机器能够模拟人类的视觉,通过机 器视觉束认知周围环境信息,这包括感知环境中物体的几何信息,包括它的 形状、位置、姿态、运动等,而且能对它们进行描述、存储、识别与理解, 并为特定的任务提供有用的信息。 1 2 本课题的研究背景和意义 运动目标的检测识别技术是一个对实时性和识别精度有较高要求的高科 学技术。在过去的二十多年里,运动目标识别一直是一项非常活跃的研究领 域。图像中运动目标的识别就是指在视频序列中提取每一帧图像的运动目标 的信息,它对于计算机可视化、机器人视觉、智能控制、模式识别等领域有 着非凡的意义。这个方向的研究是许多人工智能工作者重点关注的方向,因 为运动目标的信息往往是在图像中人们首要关注的事情,它传递给人们至关 重要的数据信息,使得人们可以清楚地找到所要关注的目标,并对此进行强 而有力的分析,通过分析得到的结果,来重新模拟目标运动的轨迹、运动的 哈尔滨f 稃人1 学硕十学何论文 矢量变化、运动的币确性与恰当性等,这十分有利于人们对目标物体的原始 不规范运动做出调整、改进,使之更加适合于在规定的环境下进行有效的工 作。它是生物学、人工智能、模式识别、信号处理、信息论及计算机科学等 众多学科的综合学科。这门学科虽然发展时间不长,但由于许多专家的通力 合作使得图像识别技术得到了迅速的发展,它的应用领域己扩充到生物学、 遥感、军事、天文、地理、地质等许多学科和领域。 在现代高技术条件下的战争中,尽早对有严重威胁的军事目标进行探测 和识别是非常重要的,这对舰船能够做出正确的反应提供了有力的保障。对 于静止的水下目标识别,我们实验室已经取得了满意的研究成果,为以后的 研究奠定了理论基础。对于实时的、动态的、高速条件下的成像,则对目标 的识别提出了更高的要求,要提高识别的精度和快速性。在此基础上,本文 对采集到的模拟真实的水面环境以及目标运动状态下的实时图像进行处理, 并对图像进行识别,这为以后的运动目标跟踪和轨迹预测打下了基础。 1 3 国内外研究现状 图像识别的发展经历了三个阶段:文字识别、图像处理和识别及物体识 别。文字识别的研究是从1 9 5 0 年开始的,一般是识别字母、数字和符号,从 印刷文字识别到手写文字识别,应用非常广泛,并且已经研制了许多专用设 备。图像处理和识别的研究,是从1 9 6 5 年丌始的。过去人们主要是对照相技 术、光学技术的研究,而现在则是利用计算技术,通过计算机来完成。计算 机图像处理不但可以消除图像的失真、噪声,同时还可以进行图像的增强与 复原,然后进行图像的判读、解析与识别,如航空照片的解析、遥感图像的 处理与识别等。物体识别也就是对三维世界的认识,它是和机器人的研究有 着密切关系的一个领域,在图像处理上没有特殊的难点,但必须知道距离信 息,并且必须将环境模型化。在自动化技术己从体力劳动向部分智力劳动自 动化发展的今天,尽管机器人的研究非常盛行,但还只限于视觉能够观察到 的场景。随着计算机和信息科学的发展,计算机视觉、人工智能的研究已成 2 哈尔滨_ 稃大学硕十学付论文 为新的方向。 自2 0 世纪7 0 年代术以来,由于数字技术和微机技术迅猛发展给数字图 像处理提供了先进的技术手段,“图像科学”也就从信息处理、自动控制系统 理论、计算机科学、数据通信、电视技术等学科中脱颖而出,成长为旨在研 究“图像信息的获取、传输、存储、变换、显示、理解与综合利用”的崭新学 科。 随着图像科学各基本理论的进展,具有“数据量大、运算速度快、算法 严密、可靠性强、集成度高、智能性强”等特点的各种应用图文系统在国民经 济各部门得到广泛的应用,并在逐步深入家庭生活。现在,通信、广播、计 算机技术、工业自动化、国防工业乃至印刷、医疗等部门的尖端课题无一不 与图像科学的进展密切相关。事实上,图像科学己成为各高技术领域的汇流 点,将是2 1 世纪影响国民经济、国家防务和世界经济的举足轻重的产业。 自2 0 世纪8 0 年代后期复兴的“神经元网络”更是以模拟人的“形象思维” 能力,特别是其识别能力为目标,十余年来得到长足的进展,新一代的“神经 元计算机”将在2 l 世纪初进入实用化,从而大大提高现有图像的速度及可靠 性。 目前,国内、国外已经把图像处理技术应用到很多领域,如遥感图像处 理和空间探测,医用图像处理,图像跟踪和光学制导,机器人视觉及图像测 量,通信工程,军事公安,文化艺术等多个方面。 随着人们对自动化智能系统要求的不断提高,技术和器件的发展,模式 识别的应用范围越来越广,人们不仅仅是要求自动化系统能够替代人完成繁 重单调或危险环境下的工作,而是面向于使人们的生活更加方便和舒适。因 而,模式识别技术所面临的挑战除了要求解决大数量模式类的识别和复杂畸 变不变性识别的传统难题,同时开始了更复杂的带有感性色彩的识别,如运 动员训练动作及姿势矫正,由人走路的姿势识别人,对人的嘴形变化甚至面 部表情的识别等等。 哈尔滨j 程人j :硕十¥,1 市论文 1 4 论文的主要工作 本文的主要任务是模拟真实的水上环境,采集水面运动目标的运动图像, 建立模型图像库,并建立模式识别系统,对图像库中的图像进行处理和识别, 最后得到运动目标的识别结果。 一个完整的图像识别系统如下所示: 图像采集卜4 图像予负处理卜_ 1 图像分割 分类识别 捆鐾匣鍪 _ j 特征 训练用 二值图像库 待识别一二值 图像 图1 1 模式识别系统 值 图 像 本文在借鉴实验室原有的研究成果基础上,重点研究了图像的识别技术。 论文的第一部分为图像的采集,建立船模目标图像库。第二部分选用中值滤 波和o t s u 自适应阈值法对获得的图像进行预处理和分割。第三部分对分割后 的图像进行特征提取,选取离散状态下具有平移、旋转和比例不变性的矩作 为特征值用于神经网络输入。第四部分为本论文的重点内容,介绍了三层b p 神经网络用于目标识别的原理,并针对b p 网络存在的缺陷,引入了一种粒 子群优化算法,用来优化神经网络的初始权值。仿真实验表明,这种方法能 够提高收敛性,达到避免b p 网络陷入局部极小值的效果,并在一定的误差 范围内,有较好的识别效果,实现了本课题研究的最终目的。 4 哈尔滨t 稃人学硕十学付论文 第2 章水面运动目标识别的前期处理 2 1 引言 一个完整的目标识别系统由图像采集、图像处理和分类识别三大部分组 成,图像处理又包括图像预处理( 也称图像增强) 、图像分割和特征提取三方 面内容。图像采集和图像处理是最终分类识别的基础。要想进行分类识别, 必须对要识别的目标进行图像采集,采集过程中因为各种因素所产生的随机 噪声,会影响图像的质量。因此,在图像分析之i ; f 必须对图像预处理,使原 始的图像得到改善,并将图像中感兴趣的特征有选择地突出,而衰减不需要 的特征。经过预处理后的图像包含的信息量太多,不能直接用于机器的识别, 必须提取适合分类的特征,用于进行分类识别。本课题重点在于对基于人工 神经网络的目标 : 别方法的研究,在本章中,从模式识别的角度出发,介绍 了适用于本课题的图像采集,图像预处理和图像分割方法,作为目标识别的 前期处理内容。 2 2 模式识别概述 2 2 1 模式和模式识别 广义的说,存在于时问和空间中可观察的事物,如果我们可以区别他们 是否相同或相似,都可以称之为“模式”【l 】。而将观察目标与已有模式相比较、 配准,判断其类属的过程就是模式识别。 人类具有很强的模式识别能力,通过视觉信息识别文字、图片和周围的 环境,通过听觉信息识别与理解语言等。模式识别是人类的一种基本认知能 力,是人类智能的重要组成部分,在各种人类活动中都有着重要作用。在现 实生活中,几乎每个人都会在不经意间轻而易举地完成模式识别的过程。但 是,要让机器具有人的模式识别能力,却绝非易事。因此,模式识别是研究 如何让机器观察周围环境,学会从背景中识别感兴趣的模式,并对该模式的 类属作出准确合理的判断的学科。 哈尔演l 。科大学硕十号何论文 2 2 2 模式识别方法 常用的模式识别方法有以下几种: ( 1 ) 模板匹配 模板匹配是最早出现,也是最简单的模式识别方法之一。匹配是模式识 别的种分类操作,主要是判断同一类的两个实体( 如点、曲线、形状等) 之间的相似性。要进行模板匹配,首先需要存储一些己知模板,然后考虑所 有可能的变化,将待识别模板与已知模板相比较,从而得出二者之问的相似 性度量。己知模板般是通过训练得到的。模板匹配方法在字符识别、人脸 识别等领域有广泛的应用,但是该方法计算量非常大,而且该方法的识别率 严重依赖于已知模板。如果已知模板产生变形,会导致错误的识别,由此产 生了可变形模板匹配方法。 ( 2 ) 统计模式识别 自上世纪6 0 年代用统计决策理论求解模式识别问题以来,统计模式识别 方法得到了迅速的发展,7 0 年代前后出版了系列反映统计模式识别理论和 方法的专著【2 j - 6 1 。到目前为止,统计模式识别的理论体系已经相当完善。统 计模式识别,又称决策理论识别方法,该方法根据模式的统计特征,用一个n 维特征空间( 特征集) 来描述每个模式,然后基于概率论、数理统计以及矩 阵理论和向量代数的知识,利用合适的判别函数( 每个模式类的特征值分布 函数) ,将这个n 维特征空间划分为m 个区域,即类别。特征值分布函数可以 通过指定或学习得到。统计模式识别技术对于解决分类问题非常有用。在统 计模式识别中,贝叶斯决策规则从理论上解决了最优分类器的设计问题,但 其实施却必须首先解决更困难的概率密度估计问题。 ( 3 ) 句法( 结构) 模式识别 1 9 6 2 年,r n a r a s i m a h a n 提出了种基于基元关系的句法模式识别法, 傅京孙在这个领域进行了卓有成效的工作,形成了句法模式识别的系统理论。 句法( 结构) 模式识别主要是基于特征的结构相关性进行内部模式结构的描 述。比如,图像分析常常涉及到图像的描述而不仅仅是分类,一个描述包括 6 哈尔滨1 。稗人学硕十学伊论文 图像基元的信息以及这些信息之问的关系。句法模式识别( 结构模式识别的 一种) 利用句法、句法分析和自动推理机理论来描述和分析个模式的结构, 是相对较成熟的模式识别方法。一维字符串的语法分析可以在许多方面进行 拓宽,从而应用于二维和三维模式的识别。错误信息和不确定信息的句法处 理是目静的研究热点。统计模式识别和句法模式识别是模式识别领域的两大 主流研究方向。 ( 4 ) 模糊模式识别 1 9 6 5 年l a z a d e h 的模糊集合论宣告了模糊数学的诞生,从那以来, 有关模糊信息处理的理论和应用取得了重大进展,并由此产生了模糊模式识 别方法。模糊模式识别是基于模糊数学的模式识别方法。现实世界中存在许 多界限不分明、难以精确描述的事物或现象,而模糊数学则可以用数学的方 法研究和处理这类具有“模糊性”的事物或现象。模糊数学的出现使得人们可 以模拟人类神经系统的活动,描述模式属于某类的程度,因此,模糊数学在 模式识别中得到很好的应用。模糊聚类分析是非监督模式识别的重要分支。 1 9 9 4 年,r a n d a s 利用模糊聚类从原始数据中直接提取特征,并对提取 出来的特征进行优选和降维操作,以免造成维数灾害。在模糊模式识别中, 隶属函数的选取是关键。 ( 5 ) 人工神经元网络模式识别 上世纪5 0 年代术,f r o s e n b l a t t 7 1 提出了一种简化的模拟人脑进行识别的 数学模型一感知机,初步实现了通过给定类别的各个样本对识别系统进行训 练,使系统在学习完毕后具有对其他未知类别的模式进行币确分类的能力。 8 0 年代,j h o p f l e l d 溅l l 揭示出入工神经元网络所具有的联想存储和计算能 力,为模式识别技术提出了一种新的途径,短短几年在很多方面就取得了显 著成果,从而形成了人工神经元网络模式识别方法。神经元模式识别利用神 经元网络中出现的神经计算模式进行。大部分神经元网络都有某种训练规则, 如基于现有模式调节连接权值。人工神经元网络可以超越传统基于计算机的 模式识别系统的能力,人们可以利用计算机或神经元网络进行模式识别,计 7 哈尔滨l 群人学硕十尹传论文 算机利用传统的数学算法来检测给定的模式是否跟现有模式相匹配,这是一 个简单易懂的方法。但是,该方法只能进行是或非的判断,且不允许模式有 噪声。另一方面,神经元网络允许模式可以有噪声,而且如果训练得当,神 经元网络会对未知模式的类别做出证确的响应。虽然神经元网络不能创造奇 迹,但是如果采用合适的结构,对好的数掘进行j 下确的训练,不仅在模式识 别领域,而且在其他科学或商业应用中,神经元网络都可以给出令人惊异的 结果。比如,b p 神经网络直接从训练样本学习,非常简便有效,因而获得了 广泛应用,但它是一种启发式技术,缺乏指定工程实践的峰实理论基础。模 糊模式识别和神经元网络模式识别是新近发展起来的模式识别方法,是信息 科学和人工智能的重要组成部分。在过去的几十年里,人们对模糊数学、人 工智能和基于规则的专家系统的兴趣高涨。在这些研究领域罩,模式识别起 着重要作用。实际上,现在的专家系统和模式分析之间存在着许多交叉,而 模式识别的核心,包括“学习技术”和“推理”在人工智能中也起着非常重要作 用。模式识别中的视觉理解、情景分析、图像理解对于机器人视觉也是绝对 必要的。另一方面,人工智能中的方法,如知识表示、语义网络和启发式搜 索算法,也能被用在许多模式识别问题中来改善模式描述和匹配,从而产生 “聪明的”模式识别。此外,像语音或图像这样的感觉数据总被认为是人工智 能领域的重要分支,同时它们也是模式识别的研究热点。 2 3 运动目标图像采集 一个完整的模式识别系统由图像采集、图像处理和分类识别三大部分组 成,在这三部分中,图像采集是其中重要环节,为以后的处理和识别作准备。 在目标图像的获取过程中,要模拟真实水面目标的运动状态,利用现有的水 槽提供的条件,完成试验的设计。考虑到水面目标多种多样,以我们关注的 船舶目标为出发点,制作了货船、油船、舰船三类船舶模型和一个假目标模 型,作为水面目标的代表;考虑到水面环境复杂多变,调节光线强度,加入 随机波浪,增加背景因素来改变环境;考虑到目标运动状态的变化,改变目 哈尔滨群人中硕十。学伊论文 标运动速度的大小、方向等,来使拍摄的图像更具泛化性。本文针对以上设 想,做以下模拟。 2 3 1 模拟构想 ( 1 ) 由于使用的是微光摄像机,对光线非常敏感,这对模拟真实水面环 境产生困难。为减少曝光度,只能将目标置于暗色背景下,根据光照情况调 节背景,以此形成了各种光线情况下的拍摄图像; ( 2 ) 水面目标种类繁多,我们关注的是船舶目标,但某时刻拍摄到的 图像中可能不仅包括船舶,还包括一些其它目标,因此背景变得相对复杂起 来。怎样在复杂的背景下提取感兴趣的目标,以及怎样对背景进行处理,是 要考虑的内容。因此,模拟拍摄情况下,可在背景中适量增加人为因素,形 成要关注的目标和需要排除的背景元素,增加图像处理的难度; ( 3 ) 考虑水面区别于陆地上的重要特性。以及波浪因素的影响,本文以 随机波浪来形成船模的各种运动姿态,包括横摇、纵摇和转首等; ( 4 ) 本文针对的是运动的目标,这就要考虑到运动速度大小和方向的问 题。应该提取不同速度,不同角度下拍摄的图像。船模运动过程中,手动控 制使船模以不同速度来运动,但由于受到水槽可用进程的限制,加上没有专 门的控制系统,所拍摄的船模的运动速度都比较低,并且没有量化的速度值。 变换摄像机的位置,尽量得到各方位拍摄角度下的图像。 实验的目的是在水槽所提供的条件下,尽量真实地还原运动目标在水面 的运动特性,包括不同的环境,不同的背景,不同的姿态,不同的运动速度 形成的图像都用束装备各个目标的图像库,使之更具泛化性。 2 3 2 图像采集过程 9 哈尔滨i 聪人学硕+ 中何论文 图2 1 实验场地示意图 实验场地布景如图所示,由于摄像机受光线影响很大,所以,将水槽三 面用黑色背景布遮挡起来,借助自然光线和灯光来调节亮度,达到满意的拍 摄效果。由于光线较暗,船模本身颜色暗淡,表面粗糙处,不易反光,若光 线太强,则会造成曝光度过大,不能很好地拍摄到目标,因此,将目标表面 用亮黄色不干胶包裹,增强其反光能力,并模拟不同的船舶类型,利用原有 的船模,制作其上层建筑,形成三类分别代表货船( 模型1 ) 、油轮( 模型3 ) 、 舰船( 模型4 ) 的三个目标模型,并设置其它目标( 模型2 ) 。 如图所示,摄像机在图示位置处要想拍摄船模由0 3 向0 - 处运动的图像, 此时船模运动范围非常小,不易拍摄。因此,可考虑将摄像机移至a 位置附 近与a ,b 3 平行,船模从b 3 向a i 位置运动可明显提高进程。因此,怎样利 用有限的空间来拍摄多姿态的图片,是本次试验的一个难点。根据实际经验, 本试验按照以下步骤得以进行。 o 哈尔滨f 群人硕十学竹论文 模型i模型2 模型3模型4 图2 2 四类目标 如图2 1 所示位置,本图像采集按以下六个步骤进行。 第一步: ( 1 ) 船模位于仞始位置,摄像机从a 位置向b 位置平行移动,保持速度 尽量均匀。 ( 2 ) 船模位于初始位置,摄像机从0 点远离船模移动,保持匀速。 ( 3 ) 船模位于初始位置,摄像机垂直于平砸向上匀速运动。 第二步: ( 1 ) 摄像机位于初始位置,船模由a 3 向b 3 运动,由a 2 向b 2 运动,由 a 1 向b 1 运动,保持船模较小速度。 ( 2 ) 摄像机位于初始位置,船模反向,由b 2 向a 2 运动。 哈尔滨:f + 稃人学硕十学何论文 ( 3 ) 摄像机位于初始位置,船模由a 3 向b 1 运动,由b 3 向a l 运动,由 b l 向a 3 运动,由a 1 向b 3 运动,保持较小的速度。 第三步: ( 1 ) 摄像机位于初始位置,船模由b 3 向a 1 运动时,在船模尾部造随机 波,推动船模前进。 ( 2 ) 摄像机位于初始位黄,船模由b 3 向a l 运动时,给以较大初始纵倾 角,并推动船模前进。 ( 3 ) 摄像机位于初始位置,船模由0 1 向0 3 运动,给船模以初始大角度 横倾,并在船模靠近摄像机处造波,推动其运动。 第四步: ( 1 ) 摄像机移至a 2 位置处,因此处摄像机受到固定受到限制,仅拍摄 船模由b 2 向a 2 运动,出b l 向a 3 运动。 第五步: ( 1 ) 变换背景光线,重新进行前四步操作。 第六步: ( 1 ) 变换船模,重新进行前五步操作。 由于时间有限,加上天气原因,光线不好控制,未能达到每一个模型都 进行前五部分的操作,但每个模型都有各种姿态和不同光线及背景下的图像。 本试验共两天时间,转录的录像带有三个小时,在较好的拍摄状态下,以每 o 5 s 抓拍的图像约有月张,大小约为4 g ,以此建立的目标模型库,可以完成 本课题的图像采集以及后续处理要求。具体的实验设备和模型各种姿态及环 境状况拍摄效果,附有图像说明在附录a 中。 2 4 图像预处理 2 4 1 图像预处理概述 图像预处理也称图像增强,图像增强可以提高图像的视觉效果,有利于 进一步的自动处理。增强可以指减少图像中的噪声,也可以指强调或抑制图 哈尔滨l 稃人。亨硕十宁竹论文 像中的某些细节。在实际的应用中,由于多方面的原因,如光照不均,由摄 像机获得的图像经过转换、线路传送过程中的干扰等,导致图像质量下降。 轻者表现为图像不干净、难以看清细节;严重的会使图像模糊不清,甚至导 致轮廓畸变,形状尺寸失真。因此,在对原始图像进行分析之f ; ,必须对原 始图像的质量进行改善。 图像增强不考虑图像质量下降的原因,只将图像中感兴趣的特征有选择 地突出,而衰减不需要的特征。这样做主要有两个目的:是改善图像的视 觉效果,提高图像成分的清晰度;二是使图像变得更有利于计算机的处理。 目前的图像增强技术根据其处理的空l 、日j 不同,可分为两大类:空域增强法和 频域增强法。空域增强法是直接对图像中的像素进行处理,从根本上说是以 图像的灰度映射变换为基础的,所用的映射变换取决于增强的目的。频域增 强法是为了有效和快速地对图像进行处理和分析,将原来的图像进行傅罩叶 变换后在频域上间接进行处理,最后转换回原来的图像空间,得到处理后的 图像的方法。频域增强方法的关键是在于图像的空域与频域的变换类型。【s 】 2 4 2 中值滤波 本文采用的是中值滤波方法,中值滤波是基于排序统计理论的一种有效 抑制噪声的非线性滤波技术,属于空域增强法。它的主要功能就是让与周围 像素灰度值的差值比较大的像素改取与周围像素值接近的值。中值滤波器是 一个含有奇数个象素的模板,模板正中那个像素的灰度用模板内所有象素的 中值代替,用公式可表示为: g ( m ,竹) = 聊e 即胛阮( 聊,n ) 】 ( 2 一1 ) 上式中,m e d 。i a h 表示在a 模板下取中间值,f a ( m ,n ) 表示以象素( m ,聆) 为中 心的a 模板下的各个狄度值。中值滤波的核心运算是将模板中的数掘进行排 序,这样,如果一个亮点( 暗点) 的噪声,就会在排序过程中被排在数据序 列的最右侧或是最左侧,因此,最终选择的数据序列中间位置的值一般不是 哈尔滨i 稃人学硕十学伊论文 噪声点的值,以此便可以达到抑制噪声的目的。 abcd ; 、 一:_ 一一:- - i 一 。 。: i _ 一5 。 。 】【 一 i 。一 。 ,f , : i j ;一j _ 一二一一 ef g 图2 3 中值滤波的几种常用窗口 一维中值滤波不影响阶跃函数和斜坡函数,并可以有效地消除单、双脉 冲,使三角函数的顶端变平。二维中值滤波比一维中值滤波更能抑制噪声。 二维中值滤波的窗口如上图所示,不同形状的窗口产生不同的滤波效果,所 以使用时必须根据图像的内容和不同的要求加以选择。一般方形或圆形窗口 适宜于外廓线较长的图像,而十字形窗口优选于有尖顶角物体的图像。f 9 】 中值滤波有以下几个优点: ( 1 ) 降低噪声的效果比较明显; ( 2 ) 在灰度值变化比较小的情况下可以得到很好的平滑处理; ( 3 ) 降低了图像边界部分的模糊程度,滤波后图像中的轮廓比较清晰; ( 4 ) 中值滤波对滤除脉冲干扰及图像扫描噪声以及突变噪声最为有效, 且能很好地保留图像的边缘。 以下是中值滤波后的效果图: 4 哈尔滨i + 群人学硕+ 学何论文 原版幽像 图2 4 中值滤波 中值滤波 2 5 图像分割 2 5 1 图像分割概述 对于图像信息的分析与处理,人们常常仅对某一部分感兴趣,而将这个 感兴趣的部分从图像中的某个特定区域与其他部分进行分离并提取出来的处 理就是图像分割。图像预处理后就进入图像分割阶段,因为图像分割处理实 际上就是区分图像中的“前景目标”和“背景”,所以通常又称之为图像的二值 化处理。这些“前景目标”一般对应图像中特定的、具有独特性质的区域,这 里的特性可以是灰度、颜色、边缘、纹理等。 图像分割是图像识别的关键步骤,是一种基本的图像分析技术,也是一 种基本的计算机视觉技术。这是因为图像的分割、目标的分离、特征的提取 和参数的测量将原始图像转化为更抽象更紧凑的形式,使得更高层的分析和 理解成为可能。多年以来,图像分割技术一直受到了人们的关注,至今已提 出了上千种各种类型的分割算法,而且近年来每年都有上百篇有关研究报道 的发表。 2 5 2o t s u 自适应阈值分割方法 图像分割的经典方法是基于灰度阈值的分割方法,它是通过设置阈值t , 哈尔演i 样人 1 页十。半f 市论文 把像素点按灰度缴分为若干类,以确定有意义的区域或物体的边界从而实现 图像的分割。 对于实时性要求较高的图像处理与分析系统,特别要求图像阈值自动选 取方法应计算量小,适应光线的变化,适应图像大小的变化,可抗噪声干扰。因 此,些计算量大或需要人工交互干预的图像阈值选取方法是根本无法在这 些实时性强的系统中使用。如实时拍摄的序列图像,由于各种外界影响,前 后两帧可能在景物的同一部分取到不同的狄度值。因此,寻找计算简单且适用 性强的图像闽值自动选取方法就显得特别的重要。 o t s u 法( 又称大津法) 是由日本学者大津于t 9 7 9 年提出的,是一种使类 问方差最大的自适应闽值选取方法。它是按图像的灰度特性,将图像分成背景 和目标两部分。背景和目标之间的类问方差越大,说明构成图像的两部分的差 别越大,当部分目标错分为背景或部分背景错分为目标都会导致两部分差别 变小。因此,使类问方差最大的分割意味着错分概率最小。该方法具有简单、 处理速度快的特点,是一种常用的阈值选取方法。该算法的原理如下【l o 】: 假设原始图像欢度级为三,灰度为i 的像素的个数为m ,图像的总像素 数为: l l m = m , ( 2 - 2 ) 0 则可以得到灰度级i 出现的概率: p=m,m(2-3) 1 - f p,=1(2-4) t = o 在图像分割中,按照及度级用阂值f 将灰度划分为两类c o = ( o ,l ,2 , - - - f ) 和c 1 = ( f + 1 ,+ 2 ,l 一1 ) 。c o 和c i 类出现的概率均值分别为: = p ,= c o ( t ) ( 2 5 ) ,一0 l - 1 0 3 l = p ,= 1 - c o ( t ) ( 2 6 ) 哈尔滨l 稃人学硕+ 学何论文 划g 和g 出现的平均灰度分别为 a 。= p ,c o o = ( f ) ( f ) ( 2 7 ) t = o 。= 驴c o 。= 阻,( r ) 一o ) 】d c o ( t ) 】 ( 2 8 ) ,;n 其中( f ) = e ,所( ,) = 穆 1 = 0t = o c 。和g 类的方差可由下式得到 o - g ( o = 窆虹1 p ,】 ( 2 _ 9 ) ,。0 仃1 2 ( ,) = 窆 ( f h ) 2 p , i c o ; ( 2 1 0 ) ,= ,+ i 定义类内方差为 盯:( ,) = 。仃;( r ) + 。仃? ( f ) ( 2 一1 1 ) 定义类间方差为口;( f ) = d o o ( , u o - , u r ) 2 + q ( 局- , u r ) 2 ( 2 1 2 ) 定义总体方差为盯;( f ) = 盯;( ,) + 仃:( f ) ( 2 1 3 ) 由于盯:是基于值二阶统计特性,而盯;是基于f 值的一阶统计特性,盯: 和盯;是阈值f 的函数,而盯;与f 无关。引进简单的判决准则7 ( f ) = 盯;o ;,该 准则将使两类得到最佳分离的f 值作为最佳阈值。因此将q ( t ) 定为最大判定 准则: r ( t + ) = m a x r ( t )( 0 t l 1 )( 2 1 4 ) 以下为用o t s u 法分割图像的效果:从分割后的二值图像可以看出,相对 于p 参数法和灰度均衡法对同一幅图像进行分割,采用o t s u 法可以使目标分 割准确,轮廓清晰。此方法对噪声不敏感,而且处理速度快,分割可达到满 意的效果。 哈尔滨f 拌人。字硕+ 学伊论文 原始幽像 p 参数法 2 6 本章小结 图2 5 分割效果图 全局阈值化o c s u 灰度均衡法 本章从模式识别的基本概念出发,介绍了什么是模式识别,并介绍了几 种常用的模式识别方法。分析个完整的模式识别系统的构成,介绍完成分 类识别静所需要做的一些准备工作,包括图像的采集,图像的预处理和图像 分割。这罩重点介绍了模拟试验的过程,以及介绍了用于图像预处理的中值 滤波方法以及计算简单,计算速度快,适应性强的o t s u 自适应闽值分割方法。 从处理的效果来看,选取的方法比较满意。 哈尔滨t 稃大学硕十学付论文 第3 章图像的特征提取 3 1 引言 在进行图像的预处理和图像分割之后我们将图像二值化为两部分:目 标和背景。其中目标是我们所感兴趣的,可以用于分类识别的部分,但经分 割后的目标包含大量信息,不能直接用于识别,因此要想对图像进行进一步 的分析和理解,就必须对目标对象的性质做各种测量,提取数据中与分类有 关的信息,即通常所说的特征提取。严格意义上浼,特征提取部分可以看作 是特征形成、特征提取和特征选择的过程。【l l 】【1 6 】 特征形成是根据被识别的对象产生出一组基本特征,它可以是计算出来 的( 当识别对象是波形或数字图像时) ,也可以是用仪表或传感器测量出来的 ( 当识别对象是某种过程时) ,这样产生出来的特征口q 做原始特征。当原始特 征的数量很大,或者样本处于一个高维空间中时,通过影射( 或变换) 的方 法用低维空间柬表示样本,这个过程叫做特征提取。而从组特征中挑选出 一些最有效的特征以达到降低特征空间维数的目的,这个过程叫做特征选择。 特征提取和特征选择都是用柬筛选出最有效的分类特征的方法,在大多数情 况下,特征提取和特征选择并不是截然分开的。例如,可以将原始特征空间 映射到维数较低的空间,在这个空间中再进行选择以进一步降低维数。 在特征提取时,可能遇到两种情况:一种是由于条件限制,获得的特征 维数不多,这时需要考虑的是现有的特征提供的识别信息是否充分,能否得 到较好的识别效果:另一种是获得的特征数目很多,如果将这些数目很多的 特征不加分析全部用于识别,这不仅费时,而且识别效果也不一定好。正确 的作法是需要对原始的特征集进行选择或变换,构成一个新的用于识别的特 征集,在保证识别精度与可靠性的前提下,减少特征数目,使识别过程既快 而又准确。要达到上述目的,关键是所选用的识别特征应具有很好的可分性, 对于混叠、不易判别的特征应舍去。再就是所提供的特征不应重复,即对相 1 9 哈尔滨i 群人弓。硕十学何论文 关性强的特征,因为没有增加更多的识别信息,也应去掉。 为了识别某一物体,我们就要对物体在视场中的图像进行描述。对图像 的描述有许多种方法,形状描述是其中很重要的一种。为了能区分不同形状 的物体,保证图像识别的_ i f 确性,我们希望这种描述相对不同形状的物体有 较大的差异;而相对同一物体,这种描述对其在视场中的不同位置、大小和 方向的变化保持不变。对于我们要识别的船模图像来说,根据形状计算所进 行的特征选择和提取可以使用于分类的特征具有很好的可分性。基于以上原 因,我们选择在离散状念下具有具有平移、旋转和比例因子不变矩理论柬用 于图像的识别问题。 3 2 不变矩理论 图像平移问题可以在图像归一化时解决,对于旋转问题虽然有的研究者 采取旋转校陋的方法解决,但由于很多情况下旋转角度或倾角是随机而不是 先验知道的,而且旋转校正也很麻烦,故提取对旋转角度不敏感的特征是一 种更可靠与简便的方法。经过大量研究,人们理论上己经找到具有旋转不变 性的一些变换,如傅立叶变换、梅林变换、矩变换等,这些变换大多都是非 线性的,变换后的模式中的特征信息会有所损失,但如果我们所使用的识尉 方法不需要足够的信息或对这种损失不敏感,那么,这种变换还是很有必要 的。本论文中对矩不变量进行研究,利用改进的算法提取目标形状特征的六 个不变矩作为特征向量用于目标识别的输入。 3 2 1 矩的基本概念 在二维图像处理中,习惯上用二维坐标函数f ( x ,y ) 表示图像在( 工,y ) 点的 狄度值。若将二维图像看作具有一定质量的片面薄片,灰度值f ( x ,y ) 表示图 像在( x ,y ) 点的质量,结合其物理意义,二维图像的质量和重心有如下定义: 1 7 l 一【1 8 1 ( 1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 校本安全知识培训课件
- 复试介入试题及答案
- 找车队考试题及答案
- javaunittest面试题及答案
- 校园安全知识培训课件报道
- 计量法相关考试题及答案
- java中赋值运算符面试题及答案
- ERAS考试题及答案
- 城管单位面试题及答案
- 中药学士考试试题及答案
- 2021起重设备安装工程施工及验收标准
- 中药制剂检验技术题库+参考答案
- DSM-V美国精神疾病诊断标准
- 劳动防护用品使用安全检查表
- 《简单教数学》读书心得
- 基础餐时胰岛素方案治疗儿童1型糖尿病患者
- 液压系统 基础知识
- 特灵RTAC控制系统
- GB/T 35770-2022合规管理体系要求及使用指南
- 社会组织规范化建设评价指标体系解读课件
- 英语剧本 小王子
评论
0/150
提交评论