已阅读5页,还剩60页未读, 继续免费阅读
(物理电子学专业论文)基于区域分割与熵差匹配的图像预测编码技术.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
华中科技大学硕士学位论文 摘要 鞭浏绫疆是,+ 年枝发疑怒寒熬一种露像蘑续编码方法。垂予蘩颞了塑像痔列之 闻的时空相关性,在采用运动补偿技术之藤,帧间预测的准确度相当离,近年来在运 动附像编码中得删了广泛的应用。本文主要研究帧间预测编码中的一种基于对象的图 像逶凌惩诗算法。 豳像分害d 是运动补偿技术的基础,通过豳像分割可弘将图像划分为各个特征一教 性的区域,作为图像匹配单元。我们讨论了几种常用的不同的图像分割方法,并在阪 壤i 夔踩分裁秘理谂蒺稿上,投瓣耋长点兹掇敬及生长方法骢不蘑提出了耱可获褥鬟 佳效柴的区域生长图像分害方法。对于分割艏的图像,我们提取出其中的运动部分, 得到矮匹配的运动区域,然后辩用局部最小熵差匹配算法进行匹配,得到所需的煎构 霪豫。毽为之嚣较为糖确豹援淑了霆像中熊逶动罄努,羧她这墨我镌霹疆采翅楚纯了 的熵公式进行匹配计算,从而提高匹配效率。同时由于该算法不存在门限选取、参数 确定等人为因素的影响,因此算法稳定性好,且能在一定程度上抵抗噪声和几何失舆 魏影嫡。 区域生长法岛局部最小墒瓣匹配的有力结合,充分利用了前后帧逡动信息的楣笑 性,同时保证了蹶配区域内运动矢量的一致性,提高了避动部分提取殿运动矢量估计 筑精确瞧,兼蹶了嚣豫瓣莲配效率,菱稳嚣豫圭露褰客戏皴暴邦较强。 实验结果表明,基于区域生长与局部最小熵差匹配的帧间预测算法能够取得与念 域搜索法和三步法相当的正确贩配率和信噪比,重构图像质量较好,而匹配效率却大 大爨凌。嚣鼓,演差逛密算法瓣其有一定礤声或旋转及形变麴蚕豫兵鸯较磐懿簇配效 果,这些都是传统的块匹配法所做不到的。 荧键词:序列强豫犊越鞭溅壤筠送域生长 爨蘩德菱烫豫嚣配 华中科技大学硕士学位论文 = = 。# = = = # = _ = = = = ;= 目= _ = = = = = a b s 抒a c t 髓l e 掣e d i e 蛀o n d i n gi san e w 耗e h n o i o 嚣yo f 主强矗蓼毡攀r e s s 妇l 幽v e b p e d 弧黝s + b e c a u s eo f 舀谛璩熊e n 蛀。娃t ob o 磕o ft 圭l et 。m p o r a la 蟠s p 8 垃a lr e l 越i v t i e so ft 垩l e m 矗g e s e q 、l e n c e s ,t h ev e r a c i t yo fi n 协轴抒蛳蝎p r e d i c t i o ni sv e r yh i 曲8 f k ra d o p l i n gm em o t i o n c o m p e n s a t i o na n dm i sp r e d i c 矗o nm 。t h o dh a sb e e nw i d e l yu s e di nm o v i n gi m a g ec o d 抽g i n l 甄s 媾主s s e 船畦锄,鑫轻e w 懿耐氆搬o fi m 曩g el 张嫩i o ne s t 蕊鑫蛙蛳b 磊s e 矗雠沁。巧e c to f 濂 i n t e 卜f 锄ep r e d i c t i o ni ss m d i e d i m a g es e g m e n 僦i o ni s 也eb a s eo f 也em o t i o nc o n 叩e n s a t i o na n dw i 聩l “w ec a n d i v i d e 也ei 擞a g e 醢。s e 搀l 豫瘿。璐磁爨建搀e o n s i 黜撼e 妇戳溆t ok 建匿秣趣o f 氆e 确a 辨 m a t c h 主l g ,w 毫s 如d ys e v e r a li m a g es e g m e n t g 【i o r tm e t h o d s8 n dp u tf o 俐a r da n e wm e t l 喃do f r e 酉o ng r o w i n g t h a tc a ng e tb e t t 材e 饪醣ta c c o r d i n gt o 也es e l e 。t i o no f m ep o i n t sa i 】dd i f f 醅r e n t 酬i 鹅f 积h o d s b 僦o n 也e 魄e o r y o f 也e 羚嚣o n 燃i n g s e g 嫩e 鲢a 主i o n 。a 堍r 铡:毪笳妇g 嫩 m o 诫嘴r e 垂。璐,w 尊c a n 如t 酶粼辘c b i n gu s i n g 协el o c 啦m i 妊酶越e n 匍翻) y 蕊蜘c e 强dt g e tt h er e c o n s 讥l c t e di i i l a g e 也a ti sn e e d e d b o c a u s eo ft h ea c c u r a t es e g m e n t a t l o n ,w ec a n u s e t h e8 i m p l i 矗e de i l 昀p yf b m m l at oe n h a n c et h em 戤c h i n ge m c i e n c y in i sa l g 雠i t h 】h a sv e 科 g o 蕊锨b i l 酶鞠de 黻獭矗髓矗e 驹汝鞠蘸g e o 瓣e 姆d i s 童。薅髓稻鞠o s e 溉塔谂ep 糊。t o 搭 1 m ec o m b i i i a t i o no ff e g i o ng r o w i n gm a t h o da i l dl o c a le n t r o p ym 枷n gu s e st h e i m e 卜舭吼em o v i n gi n f o f m a n o na 1 1 dt h ec 咖s i s t c n c y0 f m o v m gv e c t o fs u m c i e n l l yt oe 1 1 h a l l c e 氆ee s l 融a l i 强8 c c 戳彝c y 强d h 。搬a l 馥i n ge 臻e i o 羲e y 0 群碡羚f i 妇瞧a s 麴o do 萄e c 畦v ea n d s u 翰e c t i v ep e r f b 凇a l l c ei ni m a g eq l l a l i 够 1 h er e s u l t so fe x p e r h n e ms h o wt h a tt h ei 姗f 胁ep r e d i c t i o nb a s e do nr e 酉o ng r o w i n g a n dl o e 赳鞠扫o p yn 1 8 e h 洫ge a ng e te o n d e r a b l ec o l 他e tm a h 嫩g 赋ea n dp s n rw i 也f s a 王l d3 s sa n dg o o d 黼c o n s 妞王c 纽娃i m a | 弦w 越l ee 穗a n c i n g 穗em a t e h n g 磷c i e n e yg f e a 畦弘 b e g i d e sm e s e ,e n t r o p ym a t c h i n g c a i lg e tb e t i e re f r e c tt ot 1 1 ei n l a g e sw i n ln o i s ea 1 1 dr o t a t i o n t h a nt b e 拄a d i t i o n a lb j o c km a t c h i n gm e t h o d k e y w o r d s :i m a g es e q u e n c e i m e r - 觚ep r e d i c t i o n 卦e g i o ng r 0 、诎嘻 l o c “e n t r o p yd i 蟥b r e n c e i m a g em a t c h m g i i 独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究 成果。尽我所知,除文中已经标明引用的内容外,本论文不包含任何其他个人或集体 已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在文中以 明确方式标明。本人完全意识到本声明的法律结果由本人承担。 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权保 留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本 人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检索, 可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。 保密口,在年解密后适用本授权书。 本论文属于, 不保密瓯 ( 请在以上方框内打“”) 学位论文作者签名:万骨硫 日期:扣;年z 月8 同 指导教师签名铭z 妒 日期现助z 年华月2 9 日 华中科技大学硕士学位论文 l 绪论 近年来,随着计算机与数字通信技术的迅速发展,特别是网络和多媒体技术的兴 起,图像压缩编码已受到了人们越来越多的关注【l l 。 1 1 图像的压缩编码 图像编码与压缩从本质上来说就是对要处理的图像源数据按一定的规则进行变换 和组合,它是实现图像通信和存储的必要前提。图像数据的特点之就是信息量大。 一幅5 1 2 5 1 2 、灰度等级为8 比特的图像,其数据量为2 5 6 k 字节。以四通道卫星遥感 探测器为例,以此视窗,一个时次即达1 m 字节。实际上,卫星遥感探测时,视窗远 大于次,通道远多于此,试想要保存这些图像数据,该需要多大的存储空间。 可以这样认为,没有压缩编码技术的发展,大容量图像信息的存储于传输是难以 实现的,多媒体等新技术在实际中的应用也会碰到困难。 图像信息压缩的可能性存在于图像本身之中。其中,明显可以利用的一点是图像 各像素之间的相关性。从统计观点出发,简单直观的讲,就是一个像素的灰度值总是 和其周围其他像素灰度值有某种关系,应用某种编码方法提取并减少这些相关特性, 便可实现图像信息的数据压缩。从信息论观点出发,就是减少图像信息中无用的冗余 信息,仍然保留有效信息,这样既减少了描述信息的数据量,又保证了图像有效信息 没有丢失,实现所谓信息保持编码。从图像信息的研究中可以看到自然图像有很大冗 余性,图像压缩编码的潜力是很大的。从另一个角度出发,图像信息的信宿往往是人 眼,而人的视觉系统接受信息的能力是有限的,如灰度和空间分辨率都不是太高,即 使是记录或显示设备,也往往受本身特性的限制,只能接受某种程度量的信息,而并 不能全部接受。所以可以根据图像信息固有的统计特性和信宿接受能力,尽可能的去 除无用信息,进行所谓的保真度编码( 非信息保持编码) 。 1 2 当前所能实现的图像压缩编码技术 图像压缩编码的研究始于4 0 年代,而从7 0 年代开始到8 0 年代中后期,相关学科 的迅速发展和新兴学科的不断出现为图像压缩编码的发展注入了新的活力,人们对图 华中科技大学硕士学位论文 像信息需求的剃增也有力鹃键进了图像聪缩编码技术的进步。冗余艨压缩编码、分形 编码、小波编码1 2 】、熵压缩编码等图像处理技术不断涌现,为图像编码技术的发展提供 了鸯力静条传。 ( 1 ) 冗余魔压缩编码 减少或完全去除行内相邻像素间、帧内相邻像素行间以及帧间对应像素间的相关 谯( 冗余) ,以减少存储、盘b 瀑及谨输酶数爨量,这一避程熬之秀趸众蘧缩。冗念发基 缩法的核心是誉于统计模型,减少或完全盛除源数据流中的冗余,同时保持信息不变。 如把图像数据中出现概率大的灰度级以短的代码表示,概率小的灰殿级用相对长的代 蕊农示,处理鹣乎穗鹳长必然短予素压缩缀妈蓑豹平均璐长。在解璐 l 篷程中,霹竣蔽 掇糟对应的规则线算法,将冗余量插入到图像数据中去,严格恢复原图像,实现编码 与解码的互逆。因此,冗余聪缩编码又称为无损压缩豉是无失真压缩。它包括哈夫曼 编粥、算术编礤、游程编码、蚕农绽璃及耱辩绩羁等几秘攀薅的编璐方法。 ( 2 ) 分形编码 分形图像编码是在m a n 如1 b r o t 分形几何理论的基础上发展起来的一种编码方法。 分影理论是欧氏足谤程关理谂戆扩震,是醭究苓裁裂图形和混速运渤靛门毅秘学, 它描述了自然界物体的自相似性,这种自糟似可以是确定的,也可以跫统计意义灰的。 m b a r n s l e 引入迭代函数系统( i f s ) 来刻馘这种自相似性,并将其用于图像编码。 醚。器8 糟s l e 约方法鬟要人工予羧下进行,为魏恁熬学生蚴毯n 提出了罄子迭钱压缨嶷 羧的自动分形图像编码方法,将分形在图像编码上的应用推进了一大步。 ( 3 ) 小波编码 1 9 8 9 年,s 娃m 越l e l 营先将奎波变换臻予多分辨率黧豫夔接述。这个多分薅搴熬蓬 像描述口q 做图像的小波分解。小波的图像分解方案实际上是属于子带分解的一个特例, 小波变换特别要求滤波器的藏则性。小波分解是完备的、正交的、且是多分辨率的分 解。在窒霾壤璧,l 、波分解将傣号分瑟为不麓层次,每瑶次豹分瓣率不阉。耄予小 波分解方法本身的正交性,分解后不同层次数据之间的相关性完全由数据本身的相关 性决定。由此排除了由于分解方法内在的相必性而造成数据之间呈现相关性的混淆。 夺波交换在空藏域孛逶行多鼷次分簸运募貔溺薅影藏了菝搴缄孛魏多漂次分簿。 2 华中科技大学硕士学位论文 ( 4 ) 熵压缩编码 熵压缩编码是一种以牺牲部分信息量为代价而换取缩短平均码长的压缩编码方 案。它利用人的视觉心理特性,在允许的失真度下,减少信息熵。熵压缩编码后恢复 的图像与原图像有一定的差别,因此属于有损编码。它包括以下几种基本方法: 1 ) 变换编码 从理论上来说,正交变换本身不能对图像数据进行有效的压缩。但正交变换改变 了图像数据的表现域或表现形式,为压缩编码提供了可能。变换编码也就是经正交变 换( d f t ,d c t ,k l t 等) 获得图像的变换域,再对变换系数作抽样编码的一种编码 方法。它包括区域编码、阈值编码等两种常用的变换编码方法。 区域编码是选择能量集中的区域进行编码,舍弃能量为零和零星能量区域,从而 达到数据压缩的目的。而阈值编码方法则是按变换系数的幅度进行编码的方法,它将 变换系数与门限制相比较,大于门限的给予编码,否则舍弃。 2 ) 预测编码 预测编码( p r e d i c t i v ec o d i n g ) 是统计冗余数据压缩理论的重要分支之一,其理论 基础是现代统计学和控制论,而其技术基础是信号的最佳预测和最佳量化。 预测编码主要是减少数据在时间和空间上的相关性,对图像信源而言,就是减少 图像帧内和帧问的相关性,分别称为帧内预测和帧问预测。它是根据某一模型利用以 往的样本值对新样本值进行预测,然后将样本的实际值与其预测值相减得到一个误差, 再对这个误差进行编码。如果模型足够好且样本序列在时间上的相关性较强,则误差 信号的幅度将远远小于原始信号,从而可以用较少的电平来对差值进行量化,进而得 到较大的数据压缩结果。如收发两端的预测器完全一样,且发送端不经过量化,则在 接收端完全可以实现无失真的恢复图像,即预测本身并不引入误差,只是由于在实际 使用过程中常常使用量化器以提高压缩比。因此,在接收端经解码得到的预测误差值 存在量化误差,导致最终恢复的图像也出现失真。在预测编码方法中,既可以利用图 像信号的统计特性,又可以利用人眼的视觉特性,以降低编码率。 预测编码中最常用的就是线性预测法,也称为差分脉冲编码调制( d p c m ) 。此方 法较为简单,且易于硬件实现。图像的一维预测或二维帧内预测中,一般都采用此编 华中科技大学硕士学位论文 码方法。 预测法在图像压缩编码中应用时,还普遍采用帧间预测,也就是由前一帧或前几 帧图像来预测当前的图像,这样只需要对帧间误差进行量化编码即可。帧间预测利用 各帧图像之间的时空相关性,可以减少时间域上的冗余度。如果仅仅是将上一帧相同 空间位置上的像素值作为待编码的当前帧的预测值,则对图像中的静止背景而言效果 较好,而对图像中的运动部分效果则相对较差。如果知道待编码的像素是上一帧哪个 位置移过来的,那么在预测时以那个位置上的像素值作为预测值,则预测的准确性将 大大提高。换句话说就是通过运动补偿帧间预测可以使预测误差的方差与原始图像相 比大大减小,从而降低码率,提高压缩比。目前运动补偿技术已被广泛应用于视频压 缩的国际标准之中,如h 2 6 1 标准、m p e g 一1 标准、m p e g 一2 标准等。 运动补偿技术的内容主要包括图像分割、运动检测与估值、运动补偿和预测信息 编码几部分。图像分割即将图像分割成静止部分和运动部分;运动检测与估值即检测 运动的类型( 平移、旋转或缩放等) ,并估计物体运动的位移值;运动补偿即用位移估 值进行运动补偿预测;预测信息编码即对预测信息( 如预测误差、运动矢量) 进行编 码,并作为传送给接收端的信息。 图像分割是运动补偿技术的基础,但是,在实际使用过程中要把图像分割成不同 运动的物体是很困难的。通常采用两种简单的预测方法:一种是对每个像素的位移进 行递归估计,也称为像素递归法( p i 泌) ;另一种是把图像分为具有适当大小的若干个 矩形子块,把子块分为静止和运动两类,并估计运动子块的位移,再进行预测编码, 这就是所谓的块匹配法( b m a ) 。这两种方法各有特点,p r a 法精度高,对多运动画 面的适应能力强,但只能跟踪较小的位移( 2 像素帧3 像素帧) ,且实现复杂;b m a 法精度低于p r a 法,但其位移跟踪能力强( 不低于6 像素帧7 像素,帧) ,且实现简 单,因此获得了更广泛的应用。除了这两种方法之外,还有许多其他运动估值方法, 如二维运动估值的光流分析法、贝叶斯法和三位运动估值的点对应法、直接法等。这 些方法与p r a 法和b m a 法相比运算复杂,因而目前它们的应用范围还不大。目前, 运动补偿技术正向着并行处理、神经网络方法等方向发展。 3 ) 混合编码 4 华中科技大学硕士学位论文 如前面所述,预测编码利用邻近像素的灰度相关性对某个时刻的某个像素进行预 测,并对其预测误差进行编码。而变换编码则是利用正交变换域中能量分布比较集中 这一特性,在约定规则下对部分变换系数进行编码。相比较而言,预测编码实现起来 较为简单,但其抗误码能力较差:而变换编码抗误码能力强,但是实现起来比较复杂。 因此,为了适应图像信息千变万化这一实际情况和充分利用不同编码方法的优点以进 一步提高编码的可靠性及编码效率,哈比比( h a b i b i ) 在1 9 7 4 年提出了混合编码的问 题,也就是集预测编码和变换编码于一个系统中。如行内变换编码行间d p c m 、帧内 余弦变换巾贞间d p c m 或是帧内傅立叶变换帧间d p c m 等。 以可视电话和会议电视为目的的低速运动图像编码中,多数情况下都组合了上述 的运动补尝预测和二维d c t 。这种用运动补偿预测来消除时间冗余度和变换编码 ( d c t ) 来消除空间冗余度的编码方式也称为混合编码方式。 1 3 研究的意义及相关技术 图像变换编码方法以离散余弦变换为基础,通过去掉或分配少的比特数给能量较 小的分量而获得图像信息的压缩编码。而该算法复杂,使用的硬件也比较复杂,成本 较高。分形编码利用迭代函数系统恢复原始图像,但是如何较好的分割图像以及如何 构造迭代函数一直是其难点所在。小波变换编码利用完备的、正交的且多分辨率的小 波分解方法进行图像分解,在时域和频域上均有良好的局部性,不过小波变换没有直 流分量,对波形变化点特别敏感。 图像的预测编码方法主要是利用图像像素间的相关性,用已传送的像素的亮度值 对待传送像素的亮度值进行预测,并传送二者的差值,在量化器设计中考虑到量化误 差的统计特性以及人眼的视觉掩盖效应,即在图像亮度变化较大的地方允许图像亮度 值有较大的误差。 预测法在图像编码中应用时,并不局限于一维预测或二维的帧内预测,通常都普 遍采用帧间预测,即由前一帧或前几帧图像来预测当前图像,这样只需对帧间误差进 行量化编码即可。在采用运动补偿技术之后,帧间预测的准确度相当高,其预测误差 的方差与原始图像相比明显减少,压缩比明显提高。而且,从硬件制作来说,预测法 使用的硬件比较简单,成本也较低。 挚中稽技大学颈壹学位论文 预测编码的应用相当广泛,在一些国际标准中不仅对像素值( 或像块值) 进行预 测,还可将预测法推广应用到其他量的编码中,如: ( i ) 对运动矢量进行预测,即把左邻块的运动矢量作为本块运动矢量的预测值, 然后对运动矢量的预测误差进行编码传输。 ( 2 ) 在模型编码中对模型参数进行预测编码。 ( 3 ) 对各像素块的直流分量进行预测编码等。 正是由于预测编码方法的上述优点,国内外很多专家对这种图像编码方法展开了 广泛的研究,硕果累累。本文就二维序列图像的帧间预测编码方法进行研究。 6 华中科技大学硕士学位论文 2 预测编码系统 分割彝疆配蔻净囊圈豫峻鬻颈瓣缠磋懿嫠疆,是诗簿懿援塞领域中翡一顼关键按 术,是实现自动图像分析时酋先需要完成的操作,也是逡动补偿技术的基础。图像分 割的好坏直接的影响着匹配的效果,而不同的匹配方法也决定着恢簸图像的质量。在 零交孛,援基了蒸予速蠛分割写痿蘩最小薅差懿疆配鞠缀合戆绫玛方法,采臻较梵麓 单、直接的区域分割法,可以较为准确的掇取出图像中的运动部分,从而提高匹配区 域的运动一致性,减小匹配的计算量,可以在很大程度上提高编码的抗干扰能力和抗 霜露失寞戆力,掇藏复嚣图豫簇塞。 本文运用的预测编码系统如图2 1 所示。 图2 - l 图像预测编码系统 2 1图像分割 图像分裁愚校据图像的菜些特征或特鬣集合的相戗穗准戴,对图象进行分类,将 图像平面划分成系列“有意义”的区域。这些区域具荫特殊的涵义且互不相交,每 一个隧城邦满足特定区域豹熬性弘,4 。 2 。1 1 图像分割的数学描述 图像分割是将图像分成若于个区域,每个区域内酃肖相同或者相似的特性,而 程邻送缓熬特性不嚣,下嚣给嬲謦稼努害l 戆镶切数学撵逡嘲。 设( x ,y ) 为数字图像像素的空间坐标,( 净 o ,1 ,k ,为像素的灰廉层次;一幅数字 化图像i 由m m 个像素组成,m = 1 ,2 ,n ) ,( x ,y ) m m ,于是图像函数可以定义 为一耱浃瓣f - 磁m g ,霾豫在点 垦 ( 3 ) 且的内郜是连通的 ( 连) 最琏) 2 鞭乏匹 f = | ,2 ,辫 ( 5 ) 骂n 玛2 庐 ( 1 s i ,鸺怠f j ) ( s ) ,( 骂“哆) = 捌蹦涝 f ,劐感0 ,力记擞物髂 点,反之则记作背景点。根据对r 的不同限制,可得到三种不同类型的闽值,即; 仝局阈值r 2 7 1 p ( 工,y ) 】( 只与全图各像素的本身性质有关) 爨部溪篷f 。? 【p 聋,) ,鼋( 善,瑚( 与速城内各豫素懿壤,程邻豫素壤瓣关系等蠢笑) 动态阈值r r 【x ,y ,p ( x ,”,g ( x ,y ) 】( 与像素空间坐标、该点像索性质、该点的局 部邻域特征有关) 漩毽懿选择逶鬻莛弱蘑蠢方强。绘予寰方强分撬静门隘分害| | 法最豢残,疲耀最饕 遍。这种方法对于盥方图具有明显双峰的图像,可获得很好的分割效果。一般来说, 对予目标与背景的获度级有明鼹差别的图像,其灰度直方图分布呈双峰状,两个波峰 分裂与强豫孛懿瓣稼帮背景耱怼痤,渡谷与鬻豫边缘稳对疲,兰分害l 域簸位予谷底薅雩, 华中科技大学硕士学位论文 := := := = = = = = = = = = = = = = = = = = ;= = _ t # ;= = = = = = 图像分割可取得最好的效果 6 1 。在图像内容不太复杂、灰度分布较集中的情况下,往往 采用最简单的全局阈值,并不考虑图像中点的位置和其邻域性质。但现实生活中大多 数自然景象的图像直方图变化丰富,很少表现为明显的双峰。对于这类图像,一种方 法是将图像分成若干块子图像,再对每个子图像分别求出最优分割域值,用这种方法 分割后的图像在不同子图像的边界处有灰度的不连续分布,因此必须采用平滑技术来 消除灰度不连续性,c l o w 和k a n e k 0 采用了一个7 7 的窗口来消除灰度的不连续性嘿 另一种方法是根据空间信息和灰度信息采用动态阈值。近年来,随着视觉特性、神经 网络、模糊数学、遗传算法、小波变换、信息论等工具在阈值分割算法中的应用,使 得此类方法得到了很大的发展。 ( 3 ) 区域跟踪分割法 区域跟踪是以区域为处理对象,它考虑区域内部和区域之间的同异性,寻找具有 相似性的像素群,它们对应某种实体世界的平面或物体,它的方法是从某一像素出发 按照属性一致性原则( 这个一致性可以是灰度级、彩色、组织、梯度或由图像的灰度 值或色彩变换得到的特征的相似性等其他特性) 对同一灰度级或是相同组织结构的像 素进行逐步的累加,即区域增长,对由这些像素组成的区域使用某种均匀测度函数测 试其均匀性。若为真,则继续扩大区域,直到均匀测度为假。常用的方法有区域分裂 一合并法和区域生长法。 1 ) 区域合并法 区域合并,就是首先用某种方法把图像分割成许多小区域,通过定义合并相邻区 域的准则,合并所有相邻的区域,如果没有能够再合并的块,则停止合并。因此不同 的初始分割方法和不同的合并准则将形成不同的区域合并方法,区域合并的结果通常 还依赖于区域合并的顺序 引。可见,区域合并的分割方法是一个迭代过程,每一步都要 重新计算被扩大的区域成员隶属关系,并消除弱边界。没有弱边晃可消除时,合并过 程才结束。这样的个过程看起来像一个物体内部区域不断增长,直到到达边界为止 的过程。区域合并的方法计算量很大,但是它能够同时利用图像的多种性质,对自然 景物分割方面效果相对较好。 2 ) 区域分裂法 区域分裂是与区域合并相反的一个过程,这是一种自顶向下的方法。首先假定整 1 0 华中科技大学硕士学位论文 幅图像是一致的。通过判别准则,如果发现与实际不一致,则将其分裂为四个子图像, 重复上面的过程,直到所有的子区域都满足一致性准则。区域分裂有一些有趣的性质: 如果原始图像是n n ( 其中n = 2 “,n n ) 大小的正方形,则分裂后的所有区域都是正 方形;因为如果区域不满足一致性准则的时候是要把该区域分裂为四个不重叠的子区 域,因此区域分裂生成的图像是可以用四叉树结构形式来表示,这给运算带来了方便。 3 ) 区域分裂一合并法 区域的分裂方法存在一个缺陷,就是在最后可能出现分裂的两个区域r i 和r l 是相 邻的,而且两个区域满足均一性条件,但是却不能合成个区域的现象。解决这个问 题的办法就是引入区域分裂一合并方法,它首先将图像分割为初始的区域,然后分裂 合并这些区域,逐步改善区域分割的性能,直到最后将图像分割为最少的均匀区域为 止。这种方法同样是一种迭代的方法,只是在每次分裂后根据均一性条件进行合并操 作。具体的步骤可以归纳如下。 如果一个区域r i 不满足均一性条件,即有e ( r i ) - f a l s e ,则把该区域分裂成不 重叠的四部分; 对相邻的两个区域r i 和玛,如果满足均一性条件,即e ( r i u 玛) = t r u e ,则把这 两个区域合并起来; 当对于任区域,既不能继续分裂也不能合并的时候,算法结束。 在这里,均一性准则可以是像素点的灰度值是否小于平均灰度,也可以采用统计 检验诸如均方误差最小、f 检验等方法。 4 ) 区域生长法 区域生长法又叫区域扩张法,是图像分割常用方法之一,它有许多不同的方法【9 】。 该方法从被称作“生长点”( 可以是单个像素,也可以是某个小区域) 的地方开始,搜 索其邻域,把符合接受准则的点或予区域归并进来,形成新的“生长点”,反复操作, 直到当前区域不能再合并为止。 区域生长法在用来分割图像时,首先需要选定一些代表不同区域的起始像素,即 生长点。然后从这些生长点出发,按照一定的规则,一般是检查它与周围像素( 或区 域) 的一致性,把那些通过一致性测试的像素( 或区域) 合并进来,直到这些区域覆 华中科技大学硕士学位论文 盖整个图像区域为止。生长点的选取通常需要使用者指定,如需要划分图像为n 个区 域,那么每区域r l 必须要有一个生长点s i ,其中i = 1 ,2 , n 。区域生长需要满足均一 性准则,即针对每一将要划入区域r i 的像素x ,需要检套均一性准则e ( 对u x ) ) = t r u e 是否成立,如果x 满足上式,即满足均一性条件,就把z 点划入区域r j 。这种准则在实 际应用的时候可以有不同的形式,比较简单的比如考虑灰度特性,选择一个没有被考 察过的像素x 点,考虑其3 3 的邻域特性,来确定该点是否可以被划入区域r i ,而且 要求其灰度接近区域r i 的灰度平均值,即有f ,( x ) 一ri 砌,当区域无法生长的时候, 则停止生长。由上式我们看到,闽值2 a 和生长点的选取对区域分割至关重要,因此需 要使用者对每一个区域选择生长点,并慎重选择阈值。生长点也可以根据图像的灰度 直方图自动选取,一般来说,图像中的生长点有多个,这就需要将具有相同灰度统计 特性的相邻图像区域合并起来。 区域生长法更多的把灰度或纹理的同一性与空间的位置联系在一起,因此能得到 满意效果。对于图像块的一致性度量,现有文献中常常采用利用灰度或灰度统计特性 的方法。用灰度的方法比较简单但效果不好,用灰度统计特性的方法效果比较好,但 计算量大,影响处理速度,因此也有必要探求更有效的度量图像块属性一致性的方法。 ( 4 ) 结合特定理论工具的分割技术 近年来随着各学科新理论和方法的提出,人们也提出了许多与一些特定理论、方 法和工具相结合的分割技术。首先,数学形态学是研究区域整体形状特征的数学工具, 它的基本思想是用一定形态的结构元素去度量和提取图像中的对应形状已达到对图像 分析和识别的目的。它利用膨胀、腐蚀、开启和闭合四个基本运算进行推导和组合, 对图像分割具有优异的特性。其主要缺陷是还不能很好的解决耗时问题。 其次是模式识别的方法。图像中区域具有不同的特征,可看作是不同的模式,一 个模式类是一组具有某些共同特征的模式。模式识别的目的是将不同的模式分类,将 目标从背景中分割出来也可看作将不同的区域区分出来。借助统计模式中对目标分类 的技术是进行图像分割的有效方法之一。 遗传算法是基于进化论自然选择机制的、并行的、统计的、随机化搜索方法。在 分割复杂的图像时,人们往往采用多参量进行信息融合,在多参量参与的最优值的求 1 2 华中科技大学硕士学位论文 取过程中,优化计算是最重要的,把自然进化的特征应用到计算机算法中,将能解决 很多困难。遗传算法的出现为解决这类问题提供了新而有效的方法,它不仅可以得到 全局最优解,而且大量缩短了计算时间。 小波变换是近年来得到广泛应用的数学工具。从图像分割的角度来看,小波分解 提供了一个数学上完备的描述,它通过选取合适的滤波器,可以极大的减少或去除所 提取的不同特征之间的相关性,不仅具有“变焦”特性而且在实现上有快速算法。用 于纹理图像分割的小波变换和小波包变换已经有多种算法。 此外,熵的二值化算法及神经网络技术在图像分割技术中也取得了很大的成就。 实际应用中可选择性的将上述方法结合起来,以取得最佳的分割效果。 2 1 3 几种图像分割方法的比较 在以上几种图像分割方法中,我们可以看到,边缘检测法可以利用各种算子提取 图像各个部分的边缘,将其用于进行部分图像识别时简单快速,但是该方法得到的只 是边缘部分像素的信息,难以进行图像的后续处理。二值法虽然可以利用图像的灰度 特性进行图像的二值分割,但是其域值单一,容易丢失大量的图像细节,甚至是一些 重要的图像信息。区域合并法先将图像进行矩形分块再利用灰度一致性准则进行区域 合并以得到所需的图像分割,但是只能在分块大小和运算效率之间取得折衷,而且如 果最初的矩形分块较大,则容易产生方块效应,分割所得的区域误差较大。而区域生 长法虽然精确性在一定程度上也受到分割域值的影响,但分割所得区域连续、平滑, 只要域值的取值合适,便可以得到较为精确的分割结果,且各分块内所有像素的信息 都得以保存,便于进行图像的后续处理。 这里我们分别采用以上几种分割方法对月p 和p 肠h p 图像进行区域分割处理,分 割所得各部分利用其灰度均值进行重构。其中肋卯图像和用册p 图像的二值化处理域 值分别取为2 0 0 和1 6 0 ,区域合并分块大小为2 2 ,灰度域值和区域生长法样,取 为2 0 。图2 2 和图2 3 给出了重构后的只删和纠册p 图像。 由此可见,无论是从分割区域的连贯平滑性、所得图像信息的完整性还是各区域 的分割精确性来看,我们所做的区域生长所得结果都明显优于其他各种图像分割方法, 为精确和简化后来的图像匹配打下了基础。 华中科技大学硕士学位论丈 a ,r 蜀辨疆豳 b 、s 曲e l 篓子麴边缘检溺 c 、c a f l n y 算子的边缘梭测d 、二值化结果 e 、区域合并结果 f 、区域生长结果 窝2 麓不弱靛弱稼努躺方法怼霆粥8 溺豫进程医域努澍簿弱载熏捣整 1 4 华中科技大学硕士学位论文 a 、p l a n e 原圈 e 、e 孙琏y 簿予簿透缭棱溺 e 、区域台并结果 b 、8 0 b e i 算子的边缘检澳 d 、二馥纯结莱 f 、区域生长嫱果 蕊各3 不褥嚣溪豫努粼方洼慰蹶粼稼避孬区域努瓤褥蘩嚣重掬瓣 2 2 图像匹配 农机器谖裂事糍懿过茬孛,必了隶褥运麓黪落在葫悫鬻像蔷禳主懿变拖,誊露嚣 1 5 华中科技大学硕士学位论文 要将已知图像与黼生图像的全部或部分在窝间上对准,撤据已知模式的图像在一幅陌 生图像中寻找对应该模式的予图像,这种蝣动估计和分析的方法就怒匹配技术。我们 将溅麴强像或醋知模式的强像秣终摸板,农疆生霆橡中溪姥与它对疵躲子图舔诈该模 板的潜在匹配予豳像。 2 2 1 图像匹酉已技术 篷嚣特 垂、鞠锾涯溺发酸及莲配策臻怒踅豫莲配串鹣三令技拳赡豢。 ( 1 ) 匹配特征的选取 图像匹配的籀一步是选取用于描述模板和潜在匹配子图像的特征。如果能找到 耱戆够有效表承疆鬻对象零袋,蒡曼不受秘钵旋转、位移、臻敖、 襞籀纛交影影稿熬 特祗,那么图像阪配就交得简单了。可这仅仅是一种理想化的模式而已,现实中我们 只熊根据实际情况提取图像的不周特征来对图像进行描述。 蔷隽是强像弱基本特薤,它毽摇点豹获发、特征点、边瀣及绞璎。获凄特 蒌蔻黼 像的原始信息,墩易获得。特征点是图像中满足一定要求的像点,例如图像中由线条 相交形成的交点铸。边沿是指图像中由于灰度或色彩变化不连续而形成的边界。纹理 是蘩释绩擒在较大范围痰傲黧笈簿蘸两形藏蠡冬特 歪。缀筏蘧获度特徭焱容荔受蘩器耱 因素的影响而发缴较大的改变。而特征点、边沿和纹理对图像灰度的羧体改变不敏感, 但是它们的提取效果依赖于获取它们的各种算子以及如何为它设置参数是一项困难的 工嚣。上述特援辩旋转、位移、缩放、 羲瓣稻交形没毒羝獍髓力。 为了提高匹配精度,人们往往将多个旗本特征综合越来考虑。对上述基本特征进 行备零申变换后可取镊具有特殊性能的新特缎。典型的变换肖如“r 泐变换、芷一三变换、 攮。氆渗交换戳及蕊纯坐标变获。图像特征缀物“,f 8 r 交接麓获褥频谱的低频部分包含了 图像的主要组成成分。根据遮频谱的低频部分进行图像匹配可以排除噪声引起的不 一致。然两这种频谱与实际躅像的关联性不赐曼,不适合予对图像的遴一步分析。通 遥鬈一三交换可取褥有关强豫箨缀成成分的臻怠。它取蚕像灰度矩阵瓣对麓形式酶将征 值矩阵中的部分特征值进行图像匹配。由于在此情况下特征值反映的是图像各组成成 分作用的强弱程艘,所以它对旋转具有不交性,对轻微变形不敏感及与缩放倍数阉步 交诧等特点。然舔爱一三交换臻莱反获静信感往往不是嚣酝耩应考虑静关键信息。蠢增 华中科技大学硕士学位论文 加域减少参与甄配的特征僖的数日不会对糕配的成功率造成必然的影响,使用这一变 换方法进行图像胍配存在的另大问题在于它要求大尺寸的矩阵运辫。爿d “助变换可 戳穗来检嚣爱豫巾菜秘鏊线豹象闫分毒,擞据这秘分毒霹毅进行露缳殛配。典型豹镀 法懋首先获得翻像的边沿,然后将边沿各点转换成对殿某种曲线的势数空间中的点或 点集,最后检测该参数空间中有大量点聚集的位置,它们往往对应阐像中的一条特定 惑缝。肋卿交换对轻徽变形帮噪声不敏黪,它熬软患楚诗算量大,参数空藏戆逡择 形式有限。 除了上述变换特征以外,在匹配对象的轮廓可以准确获得的前搬下还可以使粥傅 空睁跨遮子终梵骐配特征。该方法逶过一豢菇线蛙坐撂变换,溃除了位移、旋转、缀 放和倾斜变化可能带来的影响,并且它的取值不涉及初始点的选取。这些新特征便是 图像的变换特征。它们可咀猩某种程度上克服基本特征所不能克服的某些缺点。 ( 2 ) 疆配标准兹选择 图像匹配还必须有一定的标准,也就怒相似性测度。常见的刻划模板与潜在旺配 予网像间相似程度的参数有距离测度、相似测度和概率测度。在块隧穗己中提到的均方 误熬距离窝绝鼹误差距离裁怒距离灏麦豹礴耪其落形式。它们以模数与疆配子霆豫熟 灰魔差值作为衡髓两幅图像相似性的标准。除了以上的常用距离外,还可利用相似性 测度s ( x ,y ) 衡墩模板与潜在臌配予图像的近似程度,怒义 y r y s 晖玲。而而,其删雌,| | y | 桫j , 、。 i m i y ,其中0 l i i j2 ,f i y f f _ f 7 j ,僻1 ) 这里x 表示陌生图像的特征序列,】,淡示模板的特镊序列,s ( 搿,聊越大表示模板 与潜在嚣配孑圈像蔻葙钕。露穰率溺度鬃蒸袋露螽验概率译佶模薮与潜在医甏子黧豫 间的相似程度。精验概率越大表示两者越相近。 ( 3 ) 匹配策略 图像匿酝酶蘩三熹便是菠素方法,朝瑟醚策略。梵了簌陌生瑟像审我餮与模缀嚣 配的子图像,往往要进行大范围的搜索,就算不计及旋转、缩放等因索的影响,暇配 的开销也是十分惊人的。因此我们常用基予相似性检测、金字塔方法朔遗传算法的搜 索德亿方法。 华中科技大学硕士学位论文 = 一= 一= = = = = = = ;= = = = = = = = = = = ;= 基于相似性检测的优化方法并不等到模板与陌生圈像中的某一子图像完全飚配结 束腐决定该子图像是否为一熙配对象,而烂在该次匹配过程中检测融处理的部分与模 扳黥鞠戳程度,旦发现予强豫与模叛鸯较大差别裂放彝该次莲嚣,重薪选择参数进 行新的匹配。 金字塔方法魁一种减少嘿配搜索时间的有效方法。它采用金字塔式的数据结构, 酋怒将耱匹配懿疆疆錾缘降级为爨分辨率豹各级强豫,然螽扶它翻豹蔟一令低分辨搴 级歼始进行匹配搜索,通过对粗糙图像做横板匹配寻找粮匹配点,融子这两幅图像不 但像点数目少,高频信息也平滑掉了一部分,因此粗匹鹈已结果可能出现不止一个匹配 搜攘,僵出于圈孛轰数少,黩嚣搜索懿这发缀块。然鬈辑在褰级分辨攀夔塑上避纾嚣 配搜索,逐步找剿原始图像的精确匹配点。由于搜索空间只限于一个或几个粗殴配点 附= i 瞧,所以计算燃不大,计算总时间大大减少。 一般寒说疆生豳豫淡及横叛奉身郝难激怒燕单盈耱确熬数学模爨寒表示,要扶錾 生图像中找到对应模板的最德匹配子图像搬难利用先验知识,而遗传算法却能在对象 描述不明确的情况下在全局械围内找到次锻优解乃至最优解,因此露可能用遗传弹法 饶键搜索遥程。然嚣将邃馋冀法弱予图像毅酝遇蘩豹蓠黉困难是绽璐形式夔确定。魏 果将二进制形式的坐标位置作为编码,那么将无法保证杂交过程中产生的新个体包含 父代的优良特性。为此需设计一种有效的编码方式或对遄传算法做必要的改动,如将 匿醒送行熬方囊缡筠莠在魏蒸旗土矮逮传葵法求解。 为了提高图像匹配的性能,人们还在不断探索新的方法,但是可以发现,目前的 许多方法仍然停留在机械加工的方法上,邀可能无意间给图像匹配的性能加上了上限。 也 每疫该搽索一藏综台囊二懿、露鸯基上瑟下凌焘豹方法。 2 2 2 几种常用的图像匹配方法 1 ) 相关骐配法 裁髓知道,蝠灰度霞豫滋转换为耨戍鹄匿豫艇簿。鼙像矩降蔗帮嚣的福荧矩 阵c 是这样定义的,假如4 矩阵为肼矩阵,且不小于b 矩阵,则 村 c ,刃= 么( m ,撑) 雪( 群一j ,嚣一歹 m 2 0 ”o f 2 * 2 ) 华中科技大学硕士学位论文 t 一= = = = 目= = = ;目_ = = ;= = = # _ = = = = = = 相关矩阵c 的元素有这样的性质,若么与嚣是相简的,则在图像几何中心位黧处 有峰值,其它位置都是较小的值。若4 与嚣不相同,则c 矩阵不稃猩峰值,整个矩 终郝怒穗差不大瓣较小擅。樱关运算耪当予怒疆强豫放在另一堰圈缘上移动,每穆 动一次进行一次比较。若两幅瞬像全部或部分相同,刚程某位置将出现全部或部分 重擞,这时出现峰值。若两幅图像毫不相同,则在任何僦置都不会熏疆,这时无峰值 氆瑷。因魏,只婺把要援索黧倦与瑟绘强缘分要l 进季亍娟关运算,然瑟嬲颤套鞠关强像 是否存在峰值,即可判断匹配的是哪幅图像,或是在予块搜索匹配之前将大量显著不 相关的子块剔除摊,从而大大缩小搜索空间们。 ( 2 ) 蒋缝感黢嚣法 用相关算法米估计物体运劝的瞬时位置速度的运葬藏徽大,且估计运动物体的旋 转和尺度变化一般也比较复杂。那么,我们可想到在帧图像中选择一组在运动中具 有不变栏震豹结稳,帮耱薤点,镄魏,获庭髑都摄丈馥淼、局零透缘、囊等,将其与 下一帧图像中的同类特征点做暇配,从而求褥视差。这就是特征点隧粼法【l 。 特征点匹配算法的关键在于对具体运动景物选择和确定特征点的种类和性质以及 采耀蠢效麴匹配繁嚷。特薤点瓣类墼毽摄获发熬是部最大篷点,是秘边缘,点、毙答。 选择的特征点一般应具有以下特征: 1 ) 在不同时剡的图像,即不同帧中,都位于物体图像的相同位鼹上。 2 ) 应当是其蠢较大灰度交纯载运域豹中心( 热爨、棼蕹立熹等) 。 3 ) 以特征点位置为中心,所有方向的荻度方差应当较大。 特征点匹配方法有以下优点: 1 ) 处理基数摇垂褪对于穰关法来强大大减少。 2 ) 由一帧的特征去寻找下帧的特征的可能匹配数目大大少于稠荚方法。 3 ) 特征点的精心选择使得在照度改变和目标发生几何形变时,对旺配精度的影响 减裂簸,l 、。这是襁美法爨骰不鬟煞。 ( 3 ) 最小绝对差值法 上面的相关法题配中,编程时需要二重循环,对于稍大一点的图像
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 幼儿园教师专业成长档案建设-基于幼儿园教师成长档案袋分析
- 2025年中考化学专题:金属与金属矿物(二)
- 化工安全与环保
- 山西大学附属中学2025-2026学年高一下学期期中考试数学试卷
- 山西省临汾市广播电视编辑记者、播音员主持人资格考试(综合知识)模拟题库含答案(2025年)
- 2025年广播电视编辑记者资格考试(广播电视业务)能力提高训练试题库衢州
- 义务教育学校校长任期结束综合督导评估指标
- 2025-2030年猪肉批发行业直播电商战略分析研究报告
- 2025-2030年油脂加工机械行业直播电商战略分析研究报告
- 磨具磨料企业县域市场拓展与下沉战略分析报告
- T/DZJN 36-2021退役动力电池拆解无害化破碎分选技术规范
- 设备开机关机培训
- 企业员工培训与发展制度
- DBJ50-T-157-2022房屋建筑和市政基础设施工程施工现场从业人员配备标准
- 同理心在护理临床的应用
- UL2703标准中文版-2019平板光伏模块和面板使用的安装系统安装设备夹紧固定设备和接地片
- 教师跟岗二次培训
- 2022年中华护理学会输液连接装置安全管理专家共识解读
- 地方病防治技能理论考核试题
- 基于三菱PLC的工业洗衣机控制
- 第19课+资本主义国家的新变化+说课稿 高一下学期统编版(2019)必修中外历史纲要下
评论
0/150
提交评论