（计算机应用技术专业论文）基于纹理与勾描的物体识别.pdf

上传人：活*** IP属地：宁夏上传时间：2020-01-10 格式：PDF 页数：55 大小：5.15MB 积分：0 举报 版权申诉

已阅读5页，还剩50页未读，继续免费阅读

（计算机应用技术专业论文）基于纹理与勾描的物体识别.pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

基于纹理与勾描的物体识别摘要物体识别是近年来图像处理和计算机视觉领域一个十分活跃的分支和备受关注的前沿课题该领域的研究有着广泛的应用价值如应用于智能安全监控人机接口人体运动细节分析等方面可变形模板和勾描特征都是物体识别方面非常重要的元素在物体识别中勾描可以简单又直观地表示物体信息最近针对可变形模板 w u 等人提出动态基 a c t i v eb a s i s 模型来共享物体勾描特征其中每一笔勾描都允许在位置和方向上有一定的平移和旋转本文在总结和分析了国内外相关研究工作的基础上针对复杂场景中物体识别问题展开研究在上述动态基模型的完整理论框架下设计出一种基于可变形模板的混合模型该模型结合物体的纹理特征和勾描特征利用它大大提高了其在复杂场景中的物体识别效果对同一物体的不同样本上的细微差别 w u 等人提出了动态基模型来提取它们模型中的每一笔勾描特征都允许在方向和位置上有一定的旋转或平移而对于不同样本中的纹理差异假设它们和自然图像集有相同的纹理特征在模型中不需要对其进行描述然而事实上对某一类特定的物体其纹理特征和自然图像集的纹理特征服从完全不同的分布我们从一个前景掩膜 m a s k 上提取对应物体这部分特征的均值并把每个方向上的均值作为一个独立的特征用高斯分布分别拟合特定物体集和自然图像集上的边缘分布然后把这个分布结合动态基特征形成一个联合概率以区分前景物体和背景跟原始的动态基模型比较实验表明新模型明显提高了物体的识别效果并且可以有效地识别复杂场景中的物体本文进行了大量的物体识别实验分别对5 0 类不同的物体样本训练出对应的模板并将它们的检测结果与用相应的动态基模板得到的识别结果进行了比较结果显示利用本文设计出的模板的检测性能基本上优于用原始的动态基模板检测性能关键词物体识别纹理特征可变形模板动态基 d e f o r m a b l et e m p l a t e sb a s e do nt h ec o m b i n a t i o no fa l i g n a b l e a n dn o n a l i g n a b l es k e c h e s a b s t r a c t t h er e c o g n i t i o no fo b j e c ti sav e r ya c t i v eb r a n c hi nt h ei m a g ep r o c e s s i n ga n d c o m p u t e rv i s i o nf i e l d r e s e a r c hi nt h i sd o m a i ni n v o l v e sw i d ea p p l i c a t i o n s i n c l u d i n g s e c u r i t ys u r v e i l l a n c e h u m a n c o m p u t e ri n t e r f a c ea n dt h ed e t a i l sa n a l y s i so fh u m a n m o v e m e n t d e f o r m a b l et e m p l a t e sa n ds k e t c h e sa r eb o t hi m p o r t a n te l e m e n t si no b j e c t r e c o g n i t i o n s k e t c h e sa r ec h o s e nf o ro b j e c tr e c o g n i t i o nb e c a u s et h a ti sav e r ys i m p l e a n di n t u i t i v ew a yt or e p r e s e n to b je c ti n f o r m a t i o n r e c e n t l y w ue ta lp r o p o s e da c t i v e b a s i sm o d e lf o rd e f o r m a b l et e m p l a t e st os h a r es k e t c h e s w h e r ee a c hs k e t c hi sa l l o w e d t os h i f ti np o s i t i o na n do r i e n t a t i o n b a s e do nt h es u m m a r ya n da n a l y s i so ft h er e l e v a n tr e s e a r c h t h i sp a p e rp r o p o s e sa h y b r i dm o d e lf o rd e f o r m a b l et e m p l a t e sw h i c hc o m b i n ea l i g n a b l ea n dn o n a l i g n a b l e s k e t c h e s t h e s es k e t c h e sa r es u b je c tt os l i g h to rc o n s i d e r a b l et r a n s l a t i o n si nd i f f e r e n t i m a g e s f o rs l i g h tt r a n s l a t i o n s w ue ta lp r o p o s e da c t i v eb a s i sm o d e lt oc a p t u r et h e m w h e r ee a c hs k e t c hi sa l l o w e dt os h i f ti np o s i t i o na n do r i e n t a t i o n f o rl a r g e r t r a n s l a t i o n so fs k e t c h e s w ue ta la s s u m e d 廿l a tt h e yf o l l o wt h es a m ed i s t r i b u t i o na s s k e t c h e so fn a t u r a li m a g ee n s e m b l e s w h i c hn e e dn o tb ee x p l i c i t l ym o d e l e d b u ti n f a c t f o ras p e c i f i e do b je c tc l a s s t h eu n a l i g n e ds k e t c h e sf o l l o wat o t a l l yd i f f e r e n t d i s t r i b u t i o nf r o mt h o s eo fn a t u r a li m a g e s t h i st h e s i ss u m m a r i z e st h e s es k e t c h e sb y t h e i rm e a n si nt h ef o r e g r o u n dm a s ka n dt r e a t st h em e a nv a l u ei ne a c hd i r e c t i o na s i n d e p e n d e n tf e a t u r e s m o r e o v e rt h i st h e s i sf i t st h e i rm a r g i n a ld i s t r i b u t i o n so no b j e c t e n s e m b l ea n dn a t u r a li m a g ee n s e m b l eu s i n gg a u s s i a nd i s t r i b u t i o n t h em a r g i n a l d i s t r i b u t i o n sa r ec o m b i n e dw i t ha c t i v eb a s i si n t oaj o i n tp r o b a b i l i t yr a t i ot o d i s t i n g u i s hf o r e g r o u n do b j e c t f r o mn a t u r a lb a c k g r o u n d c o m p a r e dw i t ho r i g i n a l a c t i v eb a s i sa n di t sv a r i a n t s e x p e r i m e n t ss h o wt h a tt h i sn e wm o d e ls i g n i f i c a n t l y i m p r o v e dt h er e c o g n i t i o np e r f o r m a n c ea n dc a nr e c o g n i z eo b j e c t s 析也c l u t t e r e d b a c k g r o u n d e x p e r i m e n t sa r ec o n d u c t e do n5 0o b j e c tc l a s s e s f i r s to fa l l t h i st h e s i st r a i n s c o r r e s p o n d i n ga c t i v eb a s i sm o d e la n d n e wm o d e lf o re v e r yo b j e c t t h e ne x p e r i m e n t s a r es e p a r a t e l yc a r r i e do u ti nt e s t i n gs a m p l e su s i n gt h et w om o d e l sa n dd r a wt h e i rr o c c u r v e s t h er e s u l t ss h o wt h a tt h er e c o g n i t i o nc a p a b i l i t yo ft h en e wm o d e l c o n s i d e r a b l yi m p r o v e dt h ep e r f o r m a n c ei nr o c k e yw o r d s o b j e c td e t e c t i o n t e x t u r ef e a t u r e d e f o r m a b l et e m p l a t e a c t i v e b a s i s 独创声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果据我所知除了文中特别加以标注和致谢的地方外论文中不包含其他人已经发表或撰写过的研究成果也不包含未获得洼麴逡直墓丝噩蔓壁型直堕的奎拦亘窒2 或其他教育机构的学位或证书使用过的材料与我同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意学位论文作者签名锩犹朱恕签字日期伽1 年月歹日学位论文版权使用授权书本学位论文作者完全了解学校有关保留使用学位论文的规定有权保留并向国家有关部门或机构送交论文的复印件和磁盘允许论文被查阅和借阅本人授权学校可以将学位论文的全部或部分内容编入有关数据库进行检索可以采用影印缩印或扫描等复制手段保存汇编学位论文同时授权中国科学技术信息研究所将本学位论文收录到中国学位论文全文数据库并通过网络向社会公众提供信息服务保密的学位论文在解密后适用本授权书靴做作栏名象懒导师签字苇芴签字日期沙叩年厂月日签字日期产6 月占日基于纹理与勾描的物体识别 l 绪论本章简单介绍了课题的研究背景物体识别问题的研究状况和存在的问题以及进一步研究的必要性阐明了本课题所作的主要工作 1 1 课题研究背景物体识另l j o b j e c tr e c o g n i t i o n 问题是当前国内外计算机视觉与模式识别领域研究的热点它是任何一个以图像或视频作为输入的实际应用系统中的核心问题和关键技术 1 0 2 2 6 3 3 这类系统的性能和应用前景都依赖于其中物体检测和识别所能达到的水平如在军事和民用中都有着广泛需求和应用的智能视频监控车辆辅助驾驶为盲人提供视觉伺服数字图书馆和i n t e m e t 互联网中所需的在海量视频或图像库中基于内容的检索基于内容的图像和视频编码与压缩以及各类身份识别和认证系统等 1 1 1 物体识别的主要任务物体识别问题包含2 类任务 1 从包含复杂背景的图像中进行检测识别 o b j e c td e t e c t i o na n dr e c o g n i t i o n 如图l l 所示其本质是搜索并且匹配物体的个体实例特征图1 1 a 为给定物体实例图 b 表示根据物体实例特征在目标图像中检测和识别相似物体其中不同颜色的轮廓表示识别出的不同物体实例 2 通过对物体类别特征建模实现物体类型识另j o b j e c tc a t e g o r yr e c o g n i t i o n 如图1 2 所示其本质则是首先建模描述类别特征如外观结构等在物体类别之内通用而共享的特征再通过计算测试图像与物体类别模型的相似程度来实现物体分类图1 2 给出了5 种常见的组合型 c o m p o s i t i o n a l 物体由于此类的结构复杂外观变化较大不但不同类别间有明显的特征差异而且在同一类别之内的物体实例都有较大差异因此难以建模和计算是目前物体类型识别研究中的难题物体识别的过程通常表现为 2 6 4 2 5 1 6 3 首先建立待识别物体的一种表示模型在一定量的训练样本中学习得到一组满足预定要求如训练的识别错误率 1 基于纹日与日物体识别 t r a i n i n ge r r o rr a t e 的模型参数同时根据表示模型建立一套从实际图像中进行推理的识别算法通过在实际图像中测试可获得系统的泛化能力 o e n e r a l i z a t i o n a b i l i t y 对其进行性能评估 l a l 譬驾粤到食i 图1 1 从复杂背景图像中检测物体实例图 a 为给定物体实例图 b 为从复杂背景图像中识别物体的结果其中被识g 物体用外框标注这一过程中需要关心的四个主要方面是建模学刊推理计算和数据测试标准 b e n c h m a r k t i 性能评估已有研究中大多数物体表示与识别方法是针对特定的物体实例 o q i e c ti n s t a n c e 1 1 表现形式 c o n f i g u r a t i o n 如人脸字符车牌前视 f r o n t a lv i ew 或侧视 s i d ev i e w 的车等此时建模学习推理与数据都有很强的引对性从而也就缺少了通用性和可扩充性当前物体识别的前沿研究是如何对大规模物体类别如上百类常见物体 1 9 而不再是单个物体实例进行表示和识别这导致在建模学刊推理与数据四个方面都遇到很大的挑战具体而言有以下五点基f 纹g 与勾描物体m 别图i 一25 类常见组合型物体示例组合型物体具有结构复杂多变物体配置复杂的特点是目前物体类型识别研究中的挑战性对象如何对大量物体统一建模 6 2 7 3 5 4 0 5 8 6 1 6 3 自然图像中可能出现的 9篓奢一毋一国藤一豳固懑一冈圉蝈赶圈邈矗蠢文氍了瀛圆圈囵露霉舅霪基于纹理与勾描的物体识别物体有成千上万种它们千差万异同时不同视角与不同尺度下同一类物体的表现形式又千姿百态其所需的表示模型都有不一样的地方那么如何对大量物体进行统一建模使得不同物体之间可以相互比较同一物体不同视角与不同尺度之间建立相互联系来完成最终识别这是构建一个鲁棒的大规模物体识别系统的前提如何基于小样本学习 2 4 1 9 2 0 5 3 5 6 大多数物体类别的类i 为 i n t r a c l a s s 结构变化十分大如钟椅子和衣服等每类都具有千变万化和千姿百态的表现形式 c o n f i g u r a t i o n 如何在统一建模框架下来描述这类物体给出数学模型定义同时要能使得模型的学习是基于小样本类似人类感知机理人能从少量几个蛩j 1 0 0 个左右样本中学习而推广到一般即举一反三的泛化能力强从而可以保证实现具备识别上百类物体的系统的可行性传统针对单个物体实例所建立的表示方法如目前流行的机器学习算法 7 1 在处理类内变化维度大的物体时都会遇到所谓的维度灾难 c u r s eo fd i m e n s i o n a l i t y 问题即所需的样本数量按照维度的指数级方式增长如需要上百万的正负样本再加上同时处理大规模物体类别就使得其不再实际可行和有效如何同时进行多尺度 m u l t i s c a l e 多视角 m u l t i v i e w 情况下识别并融入场景信息来提升识别率 8 2 7 2 8 4 0 5 l 5 6 5 5 6 3 物体在图像中能以任意尺度和视角出现并且系统无法预先知道其具体尺度和视角同时每种特征都只在一定尺度范围内具有可感知意义不同尺度下和不同视角下对识别起作用的特征是不同的已有大部分识别算法都是针对某一固定尺度下对某种视角进行学习而没有考虑如何同时处理不同尺度与视角的情况这会导致识别的丢失率 m i s s i n gm t e l 匕较高在低尺度情况下物体本身的本质信皂 i n t r i n s i ci n f o r m a t i o n 已经丢失这些情况下识别必须依靠其所在图像区域的上下文相关信息即场景信息 c o n t e x ti n f o r m a t i o n 来帮助进行推理提升识别率所以如何在统一建模和学习过程中表达多尺度信息和场景信息就十分重要如何在贝叶斯框架下进行有效推理计算自底向上 b o t t o m u p 的辨别式模型 d i s c r i m i n a t i v em o d e l 和自顶向下 t o p d o w n 的产生式模型 g e n e r a t i v e m o d e l 是目前主流的推理计算模型如何在统一框架下有效调度这两者是系统鲁棒性的保h q 4 7 2 8 5 6 6 5 辨别式模型通过自底向上 b o t t o m u p 在图像局部区域 4 基于纹理与勾描的物体识别计算各种特征来对不同的物体进行提议 p r o p o s a l 而对提议自身的确认 v a l i d a t i o n 以及不同提议之间相互有重叠 o v e r l a p 的最终解释权都应该由产生式模型自顶向下 t o p d o w n 来负责解决它通过在贝叶斯框架下从全局出发进行仲裁进一步需要研究产生式模型如何帮助辨别式模型使其能更好的提议从而提高推理的有效性和快速收敛物体的客观表达 g r o l l i l dm a t hr e p r e s e n t a t i o n 是什么如何基于这种表达提供客观有效的训练和测试数据 2 3 4 4 5 0 6 3 1 数据是建模学习和推理计算的根本没有数据一切都无从谈起同时训练和测试的图像与视频数据必须是客观标准的才能保证模型和算法的实际可用性但是如何进行客观标注本身就是视觉中由来己久的问题必须综合在物体表示与识别的统一框架下进行研究综上所述当前物体表示和识别的国内外前沿研究中必须综合考虑解决以上五点挑战接下来将介绍目前物体识别问题发展现状和主流方法 1 1 2 物体识别研究与相关研究的关系物体识别问题作为一个跨学科的研究领域为模式识别图像处理分析与理解计算机视觉人工智能机器学习人机交互计算机图形学认识科学神经计算生理学心理学等多种学科提供了一个良好的具体问题有利于构建这些学科领域的基础实验平台并以此为基础尝试新方法验证新理论解释新现象例如作为一个典型的模式识别问题物体识别问题被认为是最具有挑战性的问题之一首先它是一个不确定性的数学问题因为人们事先不知道样本可能的分布情况在采集样本时可能有些特性的样本被采集得比较充分而另外一些特性的样本在这次采集中根本就不出现这样导致后面的统计学习有很大的偏差即训练出来的模型只对某个测试集有用对另外的某个测试集就很糟糕这就要求统计学习在处理小样本甚至偏差样本方面的能力有比较大的提高另外模式种类繁多不同类别模式的差别非常微妙这一点由于数据采集过程的噪声成像设备的精度外界条件的变化以及数据缺损等原因而显得更加突出这就促进硬件设备的设计水平和制造工艺发展再如作为一个计算机视觉问题如何融合物体的一般性先验形状信息来准确地恢复特定物体的3 d 结构也是一个非常有 s 基于纹理与勾描的物体识别价值的研究问题从机器学习角度出发如何将具有坚实理论基础的统计学习算法应用于真实物体环境中的具体问题提高系统的鲁棒性和推广能力对于拉近基础研究与应用实践的距离具有重要的指导意义此外物体识别还将是下一代智能计算环境的重要组成部分 1 2 国内外研究现状物体识别问题从对物体建模以及特征选取的方法来划分可以大致区分为两大类方法基于结构的方法 s t r u c t u r e b a s e dm e t h o d 与基于外观模型的方法 a p p e a r a n c e b a s e dm e t h o d 1 2 1 传统的基于结构模型的方法传统的基于结构方法 1 6 2 7 3 0 3 3 3 8 3 9 4 0 4 6 6 3 本质是通过图像语法来对物体进行建模因此基于结构的方法也通常称为基于语法的方法 g r a m m a r b a s e dm e t h o d 其中较著名的方法有随机上下文无关语法 s t o c h a s t i c c o n t e x tf r e eg r a m m a r s c f g 带属性的语法 a t t r i b u t eg r a m m a r 1 以及视觉部件的多层次分解 h i e r a r c h i c a ld e c o m p o s i t i o no f v i s u a lc o m p o n e n t s 等在上个世纪 7 0 年代基于语法的方法是主流它表达了物体多层次分解和构成 h i e r a r c h i c a l d e c o m p o s i t i o na n dc o m p o s i t i o n 的语法特性如著名华人科学家傅京生张 s r u 在上个世纪7 0 年代提出的语法模式识别 s y n t a c t i cp a t t e r nr e c o g n i t i o n b i e d e r m a n 提出的通过部件识别物体 r e c o g n i t i o n b y c o m p o n e n t 6 1 等但由于当时没有数学模型来建立语法基元 p r i m i t i v e 与真实图像块 i m a g ep a t c h 之间的对应使其与真实图像之间产生很大的语义鸿沟 s e m a n t i cg a p 而无法处理自然图像同时缺少学习能力也就没有取得非常好的进展这些主要是受当时的种种条件不足的限制具体分析主要体现在建模学习推理计算和测试标准图像数据库四个方面缺少统一建模的数学框架来对各种物体统一表示由于当时相关学科研究相对滞后没有统一的表示框架的理论和方法物体之间就无法通过相互合作和竞争来完成最终识别 6 基于纹理与勾描的物体识别缺少建立语法基元 p d m i t i v e 至u 真实图像块 i m a g ep a t c h 对应的真实外观模型 r e a l i s t i ca p p e a r a n c em o d e l 没有这种对应基于语法规则的推理就成了纸上谈兵根本无法应用到真实自然场景图像中而只能处理简单的人工合成图像缺少好的机器学习算法来解决检测和分类问题没有学习表示模型的参数和推理算法的计算都只能定性分析而无法定量分析也就无法进行实际应用当时缺少建立大型的图像数据库的条件没有客观标准 g r o u n dt r u t h 也就无法进行学习以及检验算法的结果 1 2 2 基于外观模型的方法基于外观模型的方法 2 9 1 2 1 4 1 6 1 7 1 8 6 6 2 6 2 7 4 6 5 1 5 4 基于外观模型方法又可以进一步分为基于全局外观和局部外观两个主要研究路线基于全局外观模型如主成分分析 p r i n c i p a lc o m p o n e n ta n a l y s i s p c a 通用主成分分析 g e n e r a l i z e dp c a 等以及基于局部外观模型如以尺度不变特征点变换 s c a l e i n v a r i a n tf e a t u r et r a n s f o r m s i f t 3 6 与基于熵的显著性度量 e n t r o p y b a s e d s a l i e n c ym e a s u r e m e n t 为代表的各种不变性特征点方法 i n v a r i a n tf e a t u r ep o i n t 图像块 p a t c h e sa n df r a g m e n t s 的编码字典 c o d eb o o k 5 1 包括c o n s t e l l a t i o n 模型 1 6 1 8 b a g o f w o r d s 模型 1 4 等发展到9 0 年代基于外观模型的方法由于与真实图像相结合紧密而较为直观并且相对容易实现逐渐为大多数研究者所采用但是这类方法依赖于物体实例的某些表现形式下外观的纹理特征而没有对物体本质上多层次分解和构成特性进行表示所以它们无法表达类内结构变化大的物体也就是说这类方法是放弃了原本基于结构语法方法的优点其中基于全局外观模型的方法是将物体的图像看作高维图像空间中一点对其作数学上的线性或非线性变换投影到某些低维的特征子空间中形成对物体的表示识别就表现为在所得特征空间中对样本点的聚类分析和决策分类对于一个大规模物体识别系统不仅有很多类为 i n t r a c l a s s 结构变化大的物体同时也存在许多物体类型的类间 i n t e r c l a s s 有较大的相似性这导致在特征空间通过划分来识别就力不从心以及现实图像中物体之间的遮挡会导致基于全局外观的表示失效这些都是基于全局外观模型方法不可逾越的困难 7 基于纹理与勾描的物体识别基于局部外观模型相对于全局外观模型有了较大的改进其过程是将物体看作由一组局部外观块组成这些局部外观块的选取可以通过先检测某种不变性特征点 s i f t 特征点 3 6 此后以特征点为中心取一定形状和大小的区域或按照某种信息度量准则来取局部外观块如f r a g m e n t 模型 6 1 然后将这些局部外观块作为基元对物体进行编码如b a g o f w o r d s 方法或者再加入一些几何形状模型约束 j t n c o n s t e l l a t i o n 模型与其相关改进模型最后基于此模型进行物体识别基于局部外观模型的方法从形式上看也对物体做分解这可以使得其表示能力有一定的提高以及可以应付一些遮挡情况但是它采用的分解没有真正从语法意义上体现物体的多层次分解和构成特性没有显式的结构分解分析指导也就没有语法上统一表示和多层次构成的能力 1 2 3 新的基于结构的方法由上可知传统的基于语法结构方法和基于外观模型方法各有优缺点应该相互取其优势才能解决大规模物体统一表示问题当前机器视觉的国际前沿研究中也正朝这个方向发展 3 5 5 2 5 9 3 9 6 3 通过结合基于外观模型方法取得的发展去改善传统基于结构语法方法中存在的四点不足对于缺少统一建模的数学框架问题近年来视觉研究飞速发展产生了大量表示框架理论如何统一马尔可夫随机场 m a r k o vr a n d o mm o d e l m r f 等图模型 g r a p h i c a lm o d e l 和稀疏编码 s p a r s ec o d i n g 与随机上下文无关文法 s c f o 脑奇对于如何建立语法结构基元与真实图像块对应问题出现了如上述的主动外观模型 a c t i v ea p p e a r a n c em o d e l aa m 模型 1 2 基于p a t c h e s 和f r a g m e n t s 的模型各种编码字典 c o d e b o o k s t e x t o n 纹理 t e x t u r e 以及具有不变性特征点方法 i n v a r i a n tf e a t u r ep o i n t s 等解决方法对于缺少机器学习算法的问题出现t a d a b o o s t 和支持向量机 s u p p o r t v e c t o rm a c h i n e s v m 等较好的机器学习框架对于问题图像数据库的缺乏问题目前国际上已经开始研究建立各种图像和视频数据库如美国伯克利大学 b e r k e l e y 的分割图像数据库 3 8 美国加州 8 基于纹理与勾描的物体识别理工大学 c a l t e c h 1 0 1 类物体图像数据库 2 3 美国麻省理工大学 m i t 的 l a b e l m e 图像数据库 4 2 以及2 0 0 6 年新兴的中国莲花山人工图像与视频标注数据库 6 0 等基于结构方法的回归代表着物体表示与识别正确的发展思路和前进方向已经又成为前沿研究课题和发展主流本文正是沿着这个思路研究基于物体结构的物体识别相关方法 1 2 4 纹理分析的研究概况实际上对纹理的研究有两个目的一个是研究纹理的观赏特性即如何设计具有特定效果的纹理使之具有一定的美学价值或自然逼真效果这是计算机图形学所研究的主要目标另一个是研究纹理图像的特性即纹理分析以便分类和识别场景这是机器视觉追求的目标也即对机器视觉来说纹理是分割和识别场景或物体表明类型的一种视觉标记纹理分析的基本内容包括纹理定义纹理分类纹理分割以及纹理合成等其中纹理定义是纹理分析的核心内容为使纹理分析具有一个规范的测试标准人们发布了b r o d a t z m i t n e a s t e x 和o u t e x 等各种纹理图像库纹理分类用于判别图像纹理的类型 4 9 5 7 6 2 6 4 6 8 纹理分类需要预先知道尽可能多的纹理类型在实际应用中一般首先提取能够反映纹理整体性质的全局纹理特征然后再利用各种模式识别方法对纹理类型进行判别纹理分割的目的是把图像分割成不同的纹理区域每个区域应具有均匀的纹理性质同时相邻区域应具有不同的纹理性质纹理分割的困难在于缺乏足够的先验知识例如在纹理分割前往往不知道图像含有几种纹理类型纹理分割的重点不在于确认图像哪个区域存在何种纹理而在于通过某种途径有效区分相邻的不同纹理并正确找到相邻不同纹理间的边界纹理分割方法包括基于区域的方法和基于边界的方法前者侧重区域纹理的一致性后者侧重区域边界的差异性纹理合成主要应用于计算机图形学领域纹理合成首先对纹理图像进行建模通过学习优化确定模型参数并用该纹理模型生成纹理常用的纹理模型包括自相关模型自回归模型分形模型 m a r k o v 随机场模型 g i b b s 随机场模型和 w o l d 模型 9 基于纹理与勾描的物体识别图像中有许多信息可用于推测物体的三维形状如物体表面的阴影变化边界的相对结构以及边界连接的形状等在纹理图像中纹理基元的尺寸形状及密度变化可用于评估物体表面的形状和姿态根据纹理的基本特征目前已出现了很多纹理分析的方法 m h a r a l i c k 曾作了较为全面的总结基本上可归纳为统计法结构法模型法和空间频域联合分析法等4 类 6 9 由于纹理分析各种方法都存在一些问题故近年来呈现了相互渗透的趋势近年来随着大量相关学术论文的发表也出现了许多纹理分析的新方法在基于统计法的研究方面 7 0 运用一种矢量量化技术从而生成原始图像的符号图像再构造共生矩阵选用矩阵的统计特征实现对纹理图像的快速匹配对于尺寸较大信息冗余度也较大的图像该方法具有较好的适用性 7 2 在变差函数理论基础上提出了描述图像纹理特征的新方法不仅考虑区域化变量的随机性而且考虑数据的空间结构特征用变差函数的单步变差函数值描述图像空间相邻两点的统计特征不同的纹理有不同的变差函数值在基于模型法的研究方面 7 3 运用特征符号随机场的概念将灰度图像变换为特征符号随机场然后采用g i b b s 一马尔科夫随机场描述特征符号随机场具有简单的形式同时排除了传统的空间干涉关系对b r o d a t z 标准图像纹理的分割效果较好分形维数因其与人眼对图像表面粗糙度的判断一致而倍受重视 7 4 通过对不同的分形维数估计方法的比较发现差分盒计数估计方法和基于分形布朗运动自相似模型的估计方法覆盖了图像f d 较大的动态范围差分盒计数方法对粗糙度小的纹理敏感而基于分形布朗运动自相似模型的估计方法在高粗糙度的情况下变化剧烈因此 7 4 综合运用两种f d 估计方法对真实的图像进行分割取得了较好的效果在基于信号处理法的研究方面 7 7 1 着眼于单g a b o r 滤波器分割双纹理图像提出一种利用功率谱选择最佳滤波器的方法给出了利用滤波器频率带宽参数指导搜索最佳滤波器的策略计算量小且效果好为多滤波器分割多纹理图像这种更为通用的方法提供了一种有用的思路 7 8 深入分析了傅里叶变换具有的自配准特性提出了一种基于傅里叶变换自配准特性的图像纹理识别和分割方法对自然纹理和遥感图像进行分割比较有效实现简单抗噪能力强且纹理的亮度 1 0 基于纹理与勾描的物体识别不均和旋转容易处理在基于结合法的研究方面 1 5 将统计法与信号处理方法相结合基于纹理基元直方图导出了一种纹理表示的新方法并根据正交镜像滤波器的小波变换能量的转换和量化来定义纹理基元还给出了多种小波纹理特征集的实验评价 4 8 利用了小波变换与分形的联系在计算多尺度h 参数特征时用小波变换低频分量图像的差分代替原定义中的图像各尺度的灰度差得到了较好的分类效果虽然现有的纹理分析方法有很多种但从理论上来看找到一种适合各种纹理分析的通用方法还是很难且很多方法对纹理的描述随分辨率而变化对方向敏感易受噪声影响因此对于一个具体纹理图像寻找综合性方法充分利用各自优势是近年来的一个研究趋势 1 3 论文主要研究工作及内容安排本文主要针对复杂场景中物体识别问题改进动态基算法进一步提高了物体的识别率提高了复杂场景中物体的检测性能本文所做的主要工作有改进动态基算法并将其应用到物体识别领域因为原始的动态基算法假设物体的纹理特征和背景纹理特征服从同一分布以致在复杂场景中识别物体时漏检率很高为此我们加入了纹理特征设计出一种基于纹理与勾描的可变形模板用于复杂场景中的物体识别进一步提高了在这类场景中的物体识别率提高了检测性能本文的主要内容安排如下第一章绪论介绍了本文的研究背景和应用方向综合介绍了当前物体识别技术的主要研究成果最新进展研究动态以及存在的主要问题等说明了本文研究工作的必要性和理论价值同时提出本文的创新点说明论题的实用性新颖性和前沿性第二章物体纹理特征及识别算法本章主要介绍了论文中所用到的一些相关知识如物体知识表示物体纹理特征在识别中的应用以及已有的各种物体识别算法后面章节的展开做准备第三章基于动态基的物体识别方法及改进本章首先简单介绍了动态基算法然后针对动态基模型中纹理信息的缺失在识别过程中设计出一种新的可 1 1 基于纹理与勾描的物体识别变形模板其中加入了纹理信息提高了检测率即本文的主要工作第四章多组物体检测及实验结果本文一共进行了5 0 类不同物体的识别分别和原始的动态基算法检测结果做了比较实验结果表明大部分识别结果优于之前的动态基算法第五章总结及展望对本文所做工作作了总结并提出了今后进一步研究的方向及本人在研究过程中的一些感想 1 4 论文主要创新点基于动态基模型特征的理论框架本文提出了一个结合纹理特征和勾描特征的可变形模板充分运用了动态基在物体识别方面的优势和纹理特征对物体识别的贡献 1 2 基于纹理与勾描的物体识别 2 物体纹理特征及识别算法 2 1 引言本章首先介绍了物体知识表示方法然后简单介绍了一下常用的物体识别算法最后阐述了纹理特征在物体识别方面的重要应用为后面章节的展开做准备 2 2 物体知识表示由上分析可知基于结构的分析方法首先要从图像中获取图像结构信息即组织图像底层知识即从像素到结构特征结构基元才能进一步对物体进行语法建模和推理因此在本章节中将先讨论用于图像结构表示 i m a g es t r u c t u r e r e p r e s e n t a t i o n 的结构属性图再引入描述物体高层语义信息的解译图 p a r s eg r a p h 和与或图 a n d o rg r a p h 2 2 1 结构属性图通常来说图像可以分为两种本质的元素即结构元素 s 仃u c t u r a lc o m p o n e n t 和纹理元素 t e x t u r a lc o m p o n e n t 其中结构元素指图像中能够被显式建模的部分又被j u l e s z 称作为 t e x t o n s 而被m a r r 称为 t o k e n 纹理元素指图像中只能模糊感知的部分 i 扫g u o z h u 2 7 1 等提出的一个原始简约图模型 p r i m a ls k e t c h m o d e l 可知一个完整的图像底层知识表示应该具备如下要素 1 能够统一表示图像中的结构信息和纹理信息 2 能够将底层图像特征矢量化表示这些特征的属性包含几何形变拓扑变换以及外观差异 3 能够描述图像特征之间关系使图像特征不再是孤立从而可以表达图像复杂结构信息在实际的应用中考虑到建模和计算的复杂性我们往往不需要完整的图像知识表示例如根据不同的物体识别任务我们只需要能够表示相应的图像信息由图1 1 和图1 2 所示在我们面对的物体检测和识别任务中图像中的结构信基于纹理与勾描的物件识别息是比较稳定而可靠的因此在本文中采用了原始简约图理论 2 7 并简化其模型对物体结构信息进行表示称之为结构属性图已知图像区域为a 可以分为独立的结构部分a k 和纹理部分 s k 则有 s k u a n s k s k n n s k2 巾 1 一i 而结构部分又可以显式地分解为图像中的各个结构单元即 5 k u 箍 1 k k s k k n k k 巾 k 1 k 2 0 2 假设每一个结构单元业k 对应于一个产生式图像基元 i m a g e r r f i t i v e 定义为 b k 则图像的结构属性图可以定义为 s k k k 闰b b a k k 1 2 l i s k k b k n k 1 2 k 1 3 1 4 其中3 k 表示结构单元 s k k 与其他基元的邻接关系公式 1 5 表示结构单元所对应图像可以由图像基元产生 1 1 为随机扰动 b 图2 1 典型图像基元以及示例基十纹理与勾描的物体识别因此根据调和分析和稀疏编码理论结构属性图的概率模型可以定义为 p i j s n b s n s k e x p 一嘉匙t u me 5 k i u v 一b u v 2e s s k 0 5 其中e s s k 表示先验能量函数由上分析可知对图像结构信息表示是通过对图像基元的属性描述来实现的根据图像流形研究可以大量的自然图像样本中学习得到主要的图像基元如图 2 i 所示其中图1 3 a 表示基元的拓扑属性图l 一3 体现了基元对应的图像区域上包含的几何变化与外观差异的属性 222 解释图和与或图物体高层语义的表示是基于结构方法的核心 t u 和z h u 2 8 4 6 7 5 1 最早提出了图像解译i 园 i m a g e p a r s e g r a p h 它是对物体图像语义内容的完整解释并且提出了一种从自然图像中自动计算解译图的思路但是在建立物体语义表示阶段还是必须用监督学习的思路于工标注物体的解译图两副手动标注的解译图如图2 2 所示来自中国莲花山人工图像与视频标注数据库f 6 0 在标注图中每个物体按照语义关系层次性地分解成相应的各个部件并且各个部件中的关系都被明确地定义 i 墨f 主 f 心二图2 2 手工标注的解释图实例通过物体的大量解译图就可以学习出整个物体类型的语义表示物体与或图 a n d o rg r a p h 与或图的概念是 c h e n d z h u 7 6 最早在2 0 0 6 年提出用于衣服建模和识别简而言之与或图表示能对复杂物体的多层次构造特性 h i e r a r c

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（计算机应用技术专业论文）基于纹理与勾描的物体识别.pdf

文档简介

温馨提示

最新文档

评论

（计算机应用技术专业论文）基于纹理与勾描的物体识别.pdf

文档简介

温馨提示

最新文档

评论

相关文档