(信号与信息处理专业论文)基于视觉特性选取图像压缩预处理方式.pdf_第1页
(信号与信息处理专业论文)基于视觉特性选取图像压缩预处理方式.pdf_第2页
(信号与信息处理专业论文)基于视觉特性选取图像压缩预处理方式.pdf_第3页
(信号与信息处理专业论文)基于视觉特性选取图像压缩预处理方式.pdf_第4页
(信号与信息处理专业论文)基于视觉特性选取图像压缩预处理方式.pdf_第5页
已阅读5页,还剩48页未读 继续免费阅读

(信号与信息处理专业论文)基于视觉特性选取图像压缩预处理方式.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独 立进行研究所取得的成果。除文中已经注明引用的内容外,本论文不 包含任何其他个人或集体已经发表或撰写过的科研成果。对本文的研 究作出重要贡献的个人和集体,均已在文中以明确方式标明。本声明 的法律责任由本人承担。 论文作者签名;查兰叠 日期:圣! 堕皇! 翌 关于学位论文使用授权的声明 本人完全了解山东大学有关保留、使用学位论文的规定,同意学 校保留或向国家有关部门或机构送交论文的复印件和电子版,允许论 文被查阅和借阅;本人授权山东大学可以将本学位论文的全部或部分 内容编入有关数据库进行检索,可以采用影印、缩印或其他复制手段 保存论文和汇编本学位论文。 ( 保密论文在解密后应遵守此规定) 论文作者签名: 查盔导师签名日期:趔 摘要 就图像传输而言,数字图像处理过程中经常要产生很多包含图像数据的大型 文件,而且这种数据会经常在不同的用户及系统之间进行交换大数据量的图像 信息会给存储器的存储容量,通信干线信道的带宽,以及计算机的处理速度增加 极大的压力单纯靠增加存储器容量,提高信道带宽以及计算机的处理速度等方 法来解决这个问题是不现实的,这时就要考虑利用图像压缩方法 很多情况下,我们需要在窄带信道中传输大量静态图像,但并不需要图像多 么清晰,而是只需要让人眼能够识别出来即可,这时我们通常选用高倍有损压缩 来对图片进行处理 对于图像的高倍有损压缩来说,面临这么一个问题:压缩率太高时,压缩后 的视觉效果往往不能满足人视觉需要,为解决这一问题。可以在压缩前增加预处 理环节本文提出了基于视觉特性选取图像压缩预处理的方式,即,在对图像进 行压缩前,根据人的视觉掩盖效应及其采用的压缩方法和压缩后要求的效果不 同,选取不同的预处理方法,将其压缩时会产生较大失真的视觉敏感部分做增强 处理,减少这部分信息量在压缩时的损失,进而在一定程度上实现图像压缩比的 提高和图像质量的明显增强,较好地解决了图像实现高压缩比与图像质量下降过 大的矛盾 选取合理的预处理方法对小波压缩前的图像进行增强处理,可以有效的抑 制图像的视觉不敏感部分,增强视觉敏感信息量在图像中的比重,同时能够使小 波变换后系数量化的损失相对较少,解码后恢复图像的p s n r 数值保持较高的水 平更重要的一点是:针对图像压缩效果的不同需要,使用相应的图像预处理方 法可以在同样的压缩率下提高图像视觉质量,或者是在相近的图像质量下实现图 像的压缩率的提高 关键词:视觉特性;预处理方法;图像压缩 a b s t r a c t a sf a ra si m a g l ! l a a n s m i s s i o ni sc o n c e r n e dm a n yl a r g e - s c a l ef i l e si n c l u d m gi m a g e d a t aw i l lb ep r o d u e li nt h ed i s i t a l i m a g ep l _ o 嘲s i n g f u r t h e r m o r et h e s ed a t aa m o f t e ne x c h a n g e da m o n gd i f f e r e n tu s e 砖a n ds y s t e m s l a r g ei l l l l l g t ! i n f o r m a t i o nb r i n g m u e l a c o m p r e s s i v e 吼瞄s t o c a p a c i t yo fn l c l n o l i t _ 既, e h a n n e ib a n d w i d t ho f e o m m u n i e a t i o mm i n ka n dp r o c e s s i n gs p e e do ft h ec o m p u t e r i ti sn o tp r a c t i c a lt o i m p r o v eh a r d w a r ep e r f o r m a n c em e r e l y h e r e 讹t a k ei n l a g cc o m p r e s s i o ni n t o a c c o u n t u s u a l l yam a s so fs t a t i ci m a g et r a n s m i t t e di nn a r r o w b a n dc h a n n e ln e e dn o t g r e a t l yc l e a r - c u tb u tl e g i b l et oh v s ( h u m a nv i s u a ls y s l e m ) t h u sw ee l a o o s ei m a g e p r o c e s s i n go f l a r g ec o m p r e s s i o nr a t e t h ep r o b l e mi si m a g eq u a l i t yn o tg o o de n o u g ht os a t i s f yw i t hi - i v si np r o c e s s i n g o fl a r g ec o m p r e s s i o nr a t e s ow ea d das t e pb e f o r ei m a g ec o m p r e s s i o n , p r e t t e a l l l l e n l t h i sp a p e rp r e s e n ta p r e t r e a t m e n tm e t h o do fm r r o w b a n di m a g ci z l m s p o r tb a s e do n i - 1 v s t h a ti st os a y , w ec h o o s ed i f f e r e n t p r e l x e a l m e n ta c c o r d i n gt o d i f f e r e n t c o m p r e s s i o nf o r m a tw i t hv i s u a lc o w - r i n ge f f e c tt h es e n s i t i v ei m a g ep a r to f i - i v st h a t w i l l g r e a t l yd i s t o r t i sb ee n h a n c e dt or e d u c et h el o s i n gi n f o r m a t i o ni n i m a t g t e c o m p r e s s i o n c o n s e q u e n t l yt h ep r e l z e a t m e n tm e t h o dr e a l i z e se n h a n c e m e n to ft h e c o m p r e s s i o nr a t i oa n di m p r o v e m e n to fi m a g eq u a l i t yt oag r e a tc x t e r l ts ot h a tt oc l e a r l l pt h ec o n f l i c tb c t w 1 3l a r g ec o m p r e s s i o na n dg r e a t l yd i g r e s s i v ei m a g eq u a l i t y i fr e a s o n a b l yc h o o s et h ep r 咀障砒m 如tm e t h o dt o1 1 3 1 l k ee n l 卫m e e m e n tp r o c e s s i n g t oo r i g i n a li l n a g cb e f o r ew a v e l e tc o m p r e s s i o n , w e 锄c f f e e t i v e l yr e s t r a i nt h e i n s e n s i t i v ei m a g ep a r to fi - i v s ,i n c r e a s et h ep r o p o r t i o no fs e n s i t i v ei n f o r m a t i o nt ot h e w h o l ei l n a g c ,a n dr e d u c et h el o s i n go fc o e f f i c i e n tq u a n t i f i c a t i o ni nw a v e l e tt r a n s f o r m s ot h a tt h ep s n rv a l u eo f r e s u m e di m a g l ! k e e p s r e l a t i v e l yh i g hl e v e li nd c a d d c lm o r e i m p o r t a n t l y , i fr e a s o n a b l yc h o o s et h ec o m s p o n c u n g 讲哦坞锄c n tm e t h o db a s e do n l a c e do f d i f f e r e n ti m a g l :c o m p r e s s i o nf o r m a t s , w ec a l li m p r o v ev i s u a lq u a l i t yw i t ht h e 姗c c o m p r e s s i o nr a t i oo ra 出锄c o m p r e s s i o nr a t i ow i t hs i m i l a ri l l l a g l q u a l i t y i k e ,w o r c l s :i t v s ( 1 a u m a nv i s u n ls y s t e m ) ;p l 吼咒缸e n lm e t l a 饿l ;i 脚g e m 哗i 。 山东大学硕士学位论文 1 1 概述 第一章绪论 随着计算机技术、网络技术的发展,人类社会已经进入了信息化时代的今天, 图像通信问题越来越成为通信发展中的研究热点 举个例子,如今i n t e m e t 给人们带来了很多的方便上。传统基于字符界面的 应用逐渐被能够测览图像信息的w w w ( w o r l d 晰d ew e b ) 方式所取代w w w 尽 管漂亮,但是也带来了一个问题:图像信息的数据量太大了,本来就已经非常紧 张的网络带宽变得更加不堪重负。使得w o r l dw i d ew e b 变成了w o r l dw i d ew a i t 就图像传输而言,数字图像处理过程中经常要产生很多包含图像数据的大型 文件,而且这种数据会经常在不同的用户及系统之间进行交换大数据量的图像 信息会给存储器的存储容量,通信干线信道的带宽,以及计算机的处理速度增加 极大的压力单纯靠增加存储器容量,提高信道带宽以及计算机的处理速度等方 法来解决这个问题是不现实的,这时就要考虑利用压缩方法 压缩的理论基础是信息论从信息论的角度来看,压缩就是去掉信息中的冗 余,即保留不确定的信息,去掉确定的信息( 可推知的) ,也就是用一种更接近信 息本质的描述来代替原有冗余的描述这个本质的东西就是信息量( 即不确定因 素) 压缩的依据有三个:a 、空域相关b 、时域相关c 、视觉掩盖效应 很多情况下,需要在窄带信道中传输大量静态图像。但并不需要图像多么清 晰,而是只需要让人眼能够识别出来即可这时我们通常选用高倍有损压缩来对 图片进行处理 但是,对于图像的高倍有损压缩来说,却面临这么一个问题:压缩率太高时, 压缩后的视觉效果往往不能满足人视觉需要,针对这一问题,可以在压缩前进行 图像预处理,在预处理方法的选择上。本文提出了基于人眼视觉特性选择压缩预 处理的方式 r : ;“, # ? : i , 。0 , 山东大学硕士学位论文 1 2 本文研究的内容和实际意义 图像经过高比例的有损压缩后往往在细节,轮廓方面都有较大失真为解决 这一问题,本文提出了一种基于人的视觉特性实现图像压缩的预处理方法,即在 对图像进行压缩前,根据人的视觉特性对将要压缩的图像进行预处理,将压缩时 会产生较大失真的部分在压缩前作增强处理,使之与一定的压缩方法结合起来, 进而在一定程度上实现图像压缩比的提高和图像质量的明显增强,较好地解决了 图像实现高压缩比与图像质量下降过大的矛盾 图像压缩可广泛地应用于广播电视、电视会议、计算机通讯、传真、多媒体 系统、医学图像、卫星图像等领域,与此相应的对图像压缩预处理,有着同样广 泛的应用范围 棼 ; 山东大学硕士学位论文 第二章图像压缩简介 作为通信、介质存储、数据发行、多媒体计算机等技术的关键环节,图像压 缩编码算法的研究是信息技术中最活跃的研究领域之一尤其是进入2 l 世纪以 后,随着可视电话、会议电视、数字电视、高清晰度电视、多媒体计算机、信息 高速公路等电子技术和通信技术的发展,探索高效的图像压缩编码算法无疑将成 为主要的任务之一,对其研究也将成为国际公认的热点之一 2 1 图像压缩编码算法的研究发展历程 图像压缩编码是指用尽可能少的数据表示信源发出的图像信号,以减少容纳 给定消息集合的信号空间。信号空间是指被压缩的图像,它通常有三方面的含义: ( 1 ) 物理空间,指内存储器、磁盘、磁带等数据存储介质;( 2 ) 时间空间,指 传输给定消息集合所需要的时间;( 3 ) 电磁频谱空间,指传输给定消息所要求的 频带等信号空间通常是指信号所占的空域、时域及频域空间通过对图像数据 的压缩减少数据占用的存储空间,从而减少传输图像数据所需要的时间和信道带 宽图像压缩编码算法的研究历程可分为如下两个阶段 2 1 1 第一代图像压缩编码阶段 图像压缩编码算法的研究起源于传统的数据压缩理论,有些学者认为始于 1 8 世纪末s h e p p a r d s 所做的“实数舍入为十进制数”的研究,也有人认为1 9 世 纪末研制的莫尔斯代码是数据压缩的第一次尝试1 9 3 9 年,d u d l e y 研制了声码 器,他把声音频谱的能量划分为有限数目的频带,并且在每个频带内传输相应的 能级,因此能够达到较高的压缩比较系统的研究始于2 0 世纪4 0 年代初形成的 信息论,尽管当时数字计算机尚未出现,但其研究与当今数字计算机所使用的压 缩技术有着密切的联系,许多算法,如h u f f m a n 编码等仍有很大的应用价值近 2 0 年以来,由于模式识别,图像处理,计算机视觉等技术的发展,促进了数据 压缩的研究1 9 7 7 年以前。基于符号频率统计的h u f f m a n 编码具有良好的压缩 山东大学硕士学位论文 性能,一直占据重要的地位,并不断有基于其改进的算法提出洲2 1 1 9 7 7 年。以 色列科学家j a c o b z i v 和a b r a h a m l e m p e l 提出了不同于以往的基于字典的压缩编 码算法l z7 7 ,1 9 7 8 年又推出了改进算法l z7 8 ,把无损压缩编码算法的研究推 向了一个全新的阶段随着数字信号处理研究的不断发展,数字图像信号,语音 信号等被大量地引入有关领域由于图像信息占有较多的存储空问,因此数据压 缩编码技术在图像通信中得到了广泛的应用最早研究的是预测压缩编码,它曾 作为经典理论得到广泛应用它是以像素为处理单位,基于高阶m a r k o v 过程和 w i e n e r 线性滤波的图像最佳线性预测理论近年来,随着神经网络理论的兴起, 有人采用b p 网进行非线性预测的尝试,取得了较好的效果i 甜自1 9 6 9 年在美国 举行首届“图像编码会议”以来,图像压缩编码算法的研究有了很大的进展其 中变换压缩编码1 2 1 1 3 1 与量化压缩编码1 4 1 1 5 i i i 是研究热点变换压缩编码是通过对图 像进行正交变换,然后通过量化去除对视觉影响不大的高频分量,再采用游程编 码和h u f f m a n 编码达到压缩效果按照正交变换的不同,常用的变换压缩编码又 分为k a r h u n e n - l o e v e 变换( k l t ) 、离散余弦变换( d c t ) 、离散哈德玛变换( d h t ) 、 离散斜变换( d s t ) 等由于d c t 压缩编码算法具有编码效果良好、运算复杂 度适中等优点,目前已经成为国际图像编码标准的核心算法量化压缩编码是另 一类行之有效的图像压缩方法,它包括标量量化和向量量化两种方案 2 1 2 第二代图像压缩编码阶段 为了克服第一代图像压缩编码存在的压缩比小,图像恢复质量不理想等弱 点,1 9 8 5 年k u n t 等人充分利用了人跟视觉特性提出了第二代图像压缩编码的概 念2 0 世纪8 0 年代中后期,人们相继提出了在多个分辨率下表示图像的方案, 主要方法有子带压缩编码、金字塔压缩编码等它们首先利用不同类型的线性滤 波器,将图像分解到不同的频带中,然后对不同的频带系数采用不同的压缩编码 方法这些方法均在不同程度上有如下优点:多分辨率的信号表示有利于图形信 号的渐进式传输;不同分辨率的信号占用不同的频带,便于引入视觉特性1 9 8 8 年b a r n s l e y 和共同提出了分形图像编码压缩方案川,该方案利用图像中固有的 字相似性来构造一个紧缩交换,并使原图像成为该紧缩变换的吸引子编码时只 需要存储变化的参数,解码时,需要利用该变化对任一幅图像不断进行迭代变换 山东大学硕士学位论文 该方案思路新颖,解码时与分辨率无关,使得压缩潜力得到进一步的提高1 9 8 7 年,m a t l a b 首次巧妙地将计算机视觉领域内的多尺度分析思想引入到小波变换 中,统一了在此之前的各种小波的构造方法之后,他又研究了小波变换的离散 形式,并将相应的算法应用于图像的分解与重构中,为随后的小波图像压缩编码 奠定了基础进入90 年代以来,又取得了一系列图像压缩编码研究的阶段性新 成果其中,e z w 编码算法、s p i h t 编码算法被认为是目前世界上比较先进的 图像压缩编码算法,这两种算法均具有结构简单,无需任何训练,支持多编码率, 图像恢复质量较理想等优点,但同时又不同程度地存在算法时阃复杂度和空间复 杂度过高的弱点,而小波变换的图像压缩编码算法已成为目前图像压缩研究领域 的一个主要方向 2 1 3 常用的图像压缩编码算法的研究现状 目前已有4 0 多种图像压缩编码算法面世依据图像压缩编码的失真程度, 可将其划分为两大类,即无损图像压缩编码算法和有损图像压缩编码算法嘲前 者普遍存在压缩比过小( 一般为1 7 - 2 1 ) 的弱点,故应用领域受到限制后者 是指原始图像数据不能由压缩数据完全恢复出来。恢复数据只是某种失真度下的 近似从数据质量来讲,有损图像压缩当然不如无损图像压缩好,但由于图像的 最终使用者是人。且人眼并不是一个完善的系统,对图像的某些失真( 如对高频 成分的丢失) 并不敏感,所以有损压缩编码算法在图像通信系统及视频娱乐设备 中得到广泛应用而根据工作原理之差异,有损图像压缩编码算法又可分为预测 压缩编码,变换压缩编码、向量量化压缩编码和分形压缩编码等几类 2 2 几种常用压缩编码方法简介 2 2 1 预测压缩编码算法 预测压缩编码算法眦1 0 1 是图像压缩技术领域的重要分支,其理论基础是现代 统计学和控制论在信源数据流中,由于相邻像素之间存在相关性,因此前面像 素和当前像素的数据之问存在某种相近性。预测压缩编码就是试图用以前数据的 某种函数形式来替代当前像素,以降低信源的不确定性,减少数码率目前,真 山东大学硕士学位论文 正实用的预测压缩编码方案为差分脉冲编码调制( 简称d p c l l ) 压缩编码d p q i 工 作时发送端首先发送数据流的前面n 个像素数据x l 。x 2 。,x n ,然后利用 这n 个像素数据来预测第n + 1 个像素数据x n + l ,从而得到预测值x n + l ,真实值 与预测值之间的误差e n + l 经量化后直接传输或经编码器编码后传输在d p c m 系统中,有一个反馈结构,实际上是一个预测解码器,它将量化后预测误差与预 测值相加作为预测器的输入以预测下一个值预测压缩编码的性能主要取决于预 测器,对于一个n 阶的预测器可表示为x 。= f ( x 。x ,。x o 这里, x 。x 。,x 。是经过量化后得到的预测值,如果不进行量化,则上式 可以简化为x f f ( 酢。,x 。,0 根据函数f 的不同,预测编码可分为线性 预测和非线性预测前者可根据信源数据的统计特性给出最佳预测器在实际应 用过程中,预测压缩编码常常与h u f f m a n 编码、算术编码等无损压缩编码算法联 合使用,可取得更好的压缩效果预测压缩编码已在j p e g ,咿e g 等国际标准中 得到广泛应用 由于预测压缩编码是根据某一模型函数f 进行的,因此从理论上讲,只要模 型选取得好,只需要存储或传输起始像素与模型参数就可以代替整个一帧图像 但实际上,预测不总是正确与精确的,在边界处的预测中往往失败与其他图像 压缩编码算法相比,预测压缩编码具有压缩比小、算法不稳定等缺点 2 2 2 变换压缩编码算法 处理数字图像通常有两类方法:空间域处理法和频率域处理法前者是直接 对图像像素值进行处理,方法直观、简单;后者则是利用正交变换将图像从空间 域变换到频率域,再对频率分量进行处理方法更有效、更有实质性在图像压 缩的各种方法中同样可分为空间域和频率域两类。变换压缩编码算法f l i l 【1 2 】属 于后者它是图像压缩技术领域的一个重要分支,是目前比较有效、应用比较广 泛的一类方法在频率域的处理中,首先要对图像进行线性正交变换,所谓线性 变换是指变换后的输出量是由输入图像像素的线性组合而成的 设有一个m n 大小的输入图像f ( x ,y ) ,经线性运算后得到m n 的输出阵 列f ( u ,v ) = f ( x ,y ) ( i ,y ;u ,v ) 其中,u = o ,l ,i i - i :v = 0 ,l ,n - i : ( x ,y ;u ,v ) 称为交换核,代表了加权系数所谓正交变换( 也称酉变换) ,是线性变换的一种 山东大学硕士学位论文 特殊形式,它要同时满足以下两个要求 1 ) 变换是可逆的。 即f ( x ,y ) - f ( u ,v ) b ( x ,y :u ,v ) 其中 x = 0 ,l 。,卜l :y :0 ,l ,b o t n - l ;s ( x ,:u ,v ) 为反变换核 2 ) 变换核和反变换核满足一定的正交性,即要满足以下四个等式: a ( x ,y ;u ,v ) a ( j ,j ;u ,v ) = 6 ( x j ,y j ) , 8 ( x ,y ;u ,v ) b ( j ,j :u ,v ) = 6 ( x j ,y - j ) , ( x ,y ;u ,v ) a ( x ,y :k ,k ) = 6 ( u - k ,v k ) , a ( x ,i t ;u ,v ) 8 ( x ,y :k ,k ) = 6 ( u - k ,v - k ) 式中的6 函数定义为6 ( i ,j ) = ( e i ,e j ) 正交变换具有以下几个性质:( 1 ) 熵保持特性,即图像经正交变换后不丢失任何信息;( 2 ) 能量保持特性,即变换前 后能量相等:( 3 ) 能量重新分配特性,即能量在空间的分布发生变换,对一般的 图像来说,变换后能量大部分集中在低频部分,高频部分的系数较小,因此可通过 去除高频成分而达到压缩的效果:( 4 ) 去相关性,即可以将高度相关的空问样值 变为相关性较弱的变换参数 基于正交变换的图像压缩编码过程为:( 1 ) 通过正交变换将图像从空间域转 化到频域,因图像的能量大部分分布在低频部分,高频部分的系数很小;( 2 ) 对 变换域系数进行量化,量化后的系数分布呈尖锐的曲线,有利于后续的熵编码: ( 3 ) 利用h u f f m a n 和算术等无损压缩编码方法对其进行熵编码,从而达到压缩的 目的 常见的正交变换包括离散傅立叶变换( d f i ) 、离敖余弦变换( d c t ) 、 k m h u n e n - l y e v e 变换( k l t ) 等等基于上述传统正交变换的图像压缩编码不仅具 有图像复原质量不理想的缺点,而且在大压缩比时还会出现明显的。方块”效应 和蚊式噪声 2 2 3 向量量化压缩编码算法 量化是图像压缩编码的重要环节,量化能够有效改变系数的分布特性,为后 续的熵编码作好铺型1 3 1 4 1 量化又分为标量量化和向量量化两种标量量化就 是对单个参数进行映射和取整,它在模一数转换和一般的编码系统中得至广泛应 用向量量化编码( v q ) 是一种高效的图像压缩编码算法,能有效利用向量中各分 山东大掌硕士学位论文 -i | l - _ _ _ l _ i i _ _ - - 量之间以及各向量之间的关联特性来消除冗余v q 压缩编码是一种图像块编码 方法,其编码过程是从k 维向量空间对到对的有限子集c 的映射过程,即q :矿 - - c 。其中,称c ; c 。,i = 1 ,2 ,hl 为向量量化中的码书大小采用一个失 真测度( 如均方误差m s e 测度) ,在码书中寻找输入向量的最佳匹配码字,两个k 维向量x 和y 之间的m s e 测度定义为 k - i d ( x ,y ) = o x - y 2 = ( 一乃户 j o v q 压缩编码系统传送的是这个最佳匹配码字在码书中的地址( 即序号) ,并 非向量本身这是向量量化能进行有效压缩的根本所在。它的压缩效率取决于码 书的大小 虽然向量量化图像压缩编码算法具有压缩比高、懈码迅速等优点,但也存在 如下缺陷:( 1 ) 算法对初始码书要求敏感,在训练中存在无效码多且训练时间长; ( 2 ) 复原图像存在可见的方块效应:( 3 ) 图像细节、边缘部分失真严重;( 4 ) 编码 时间比较长 2 2 4 分形压缩编码算法 分形图像压缩u s - i s 是由美国数学家b a r n s l e y l 9 8 7 年首次提出的,之后,他 和合作者将h u t c h i n s o n l 9 8 1 年提出的迭代函数系统( 该理论是由h u t c h i n s o n 提出的,但i f s 一词是由b a r n s l e y 命名的) 应用到图像压缩编码中,并获得了 极好的压缩性能。1 9 9 0 年,j a c q u i n 发表了基于方块划分的分形图像压缩方案, 迸一步丰富和完善了分形图像编码算法理论 1 分形压缩编码基本原理 令( q , ) 为一完备度量空间,待编码的原始图像x 为该空间的一个元素,那 么。对x 的分形压缩编码过程是构造一个变换t ,满足: ( 1 ) 对于任意x l ,x 2 eq ,x ( t ( x 1 ) ,t ( 】【2 ) ) s ( x 1 x 2 ) ,其中0 s 1 : ( 2 ) t ( x ) * x 由条件( 1 ) 可知,变换t 是一个紧缩变换,而根据紧缩交换的不 动点定理知,紧缩变换t 存在唯一的不动点x ( 即t ( x7 ) = x ) ,且该不动点可 由t 对任意一个元素的不断迭代变换而得到 由条件( 2 ) 知。原始图像x 是t 的一个近似不动点由这两个条件可知,对原 山东大学硕士擘位论文 i i _ _ _ _ _ _ _ _ _ - _ _ _ _ _ _ _ _ _ _ _ _ 一 始图像x 的分形变换就是构造一个满足以上两个条件的变换,在压缩编码端,存 储或传输t 的参数,通常需要较少的存储量,由此可以获得较高的压缩比;在解 压缩端,利用t 对任意一幅初始图像不断变换可得到不动点,即恢复图像以 j a c q u i n 压缩编码算法为代表的分形图像压缩码方案就是基于这一思想提出的 2 编码方案 一般说来,分形图像压缩编码算法主要包括如下三步首先,对原始图像进 行分块设x 是待压缩编码的原始图像,将x 分成两种大小的子块:小块的大小 为k x k ,称之为值域子块,记为r l ,r 2 ,r n ,当i # j 时r i n r j - v ;且r l u r 2 u u r n = x ;大块的大小为l x l ,称之为定义域子块,记为d 1 。d 2 。,d m , 定义域子块之间允许有部分重叠一般情况下l y k ,这主要是为了满足紧缩变换 的要求其次,寻找合适的变换t 据条件( 2 ) 知,需要寻找一个紧缩变换t ,使 得t ( x ) 与x 尽可能接近对分形图像压缩编码算法中的每一个值域子块的压缩编 码就是要寻找合适的仿射变换。及定义域子块d j ,满足r 。* 。( d ,) 仿射变换 u ,通常具有不变、尺度、对折、平移、旋转等特性,它们主要由其系数决定 最后,存储分形变换参数当最佳仿射变换。及定义域子块d ,找到之后,存储 或传输其参数,完成该值域子块的编码待所有的值域子块都被编码之后,也就 完成了对原图像的分形压缩编码+ 分形图像压缩编码算法具有思路新颖、算法简单、与原图像分辨率无关、压 缩确定性分析图像时图像复原质量较高等优点。但在处理不具有明显确定性分形 结构的图像( 如人像) 时,图像复原质量不理想,另外,分形图像压缩编码算法所 需时间较长 2 2 5 小波变换压缩编码算法 小波变换是2 0 世纪8 0 年代后期发展起来的一种新的信息处理方法,因其本 质是多分辨率分析信号,在时域和频域都具有分辨率,对高频分量采用逐渐精细 的时域或空域步长,可以聚焦到分析对象的任意细节,对于剧烈变换的边缘,比 常规的傅里叶变换具有更好的适应性,故特别适用于分析非平稳信号 9 - 2 5 1 i a t l a b 将多分辨分析思想与离散小波变换巧妙结合起来,由于小波变换的优良 特性与m a t l a b 算法的简便易行使得小波变换图像编码压缩算法成为目前图像 一 1_十 。 一 1 3 山东大学硕士学位论文 压缩领域的一个主要研究方向 一般说来利用小波变换进行图像压缩需要经过以下步骤阳:( 1 ) 选择具有 紧支集的正交小波及其对应的小波滤波器;( 2 ) 输入待压缩图像点值序列;( 3 ) 给出分解层数l 和图像数据向量长度k :( 4 ) 对源图像采用二维m a t l a b 分解算法 进行小波变换,得到不同层次不同图号的子图;( 5 ) 根据不同层次不同子图的特 点,对相应小波系数的各个部分进行数据向量的量化编码对最高层子图需要进 行无失真压缩编码;反过来。在恢复图像( 图像解压缩) 时,需先进行无失真解码, 再根据密码书还原出各层小波系数最后利用二维m a t l a b 重构算法对还原后的 小波系数进行反交换以重建源图像 尽管小波交换图像压缩编码算法具有结构简单、无需任何训练,支持多码率, 压缩比较大、图像复原质量较理想等特点,但在不同程度上存在压缩解压缩速 度慢、图像复原质量不理想等问题,为了进一步改善此算法的工作效率,需要解 决以下两个主要问题:1 ) 正交小波基的选择闯题正交小波基的选取对图像压缩 效果有很大的影响,在实际应用中,由于可供选择的正交小波基很多( 目前完全 或基本上套用d a u b e c h i e s 小波基) 。如何做出恰当的选择是一个难题2 ) 数据 向量量化编码算法的选择问题在整个图像压缩过程中对小波系数进行向量量 化编码会直接影响图像的压缩效果目前,常用的数据向量量化编码算法有l b g 算法、s o f m 算法、零树编码算法等上述编码算法都不同程度地存在运算复杂、 重构复原图像效果不理想等问题因此,亟需寻找优秀的向量量化算法 2 3 图像压缩的国际标准- - m p e g m p e g ( m o v i n gp i c t u r e se x p e r t sg r o u p ) 即活动图像专家组,始建于1 9 8 8 年,专门负责为c d 建立视频和音频标准,其成员均为视频、音频及系统领域的 技术专家i s o i e c l l l 7 2 压缩编码标准就是由此小组提出并制定的,m p e g 从此 扬名世界。目前m p e g - i 、m p e g - 2 和m p e g - 4 适用于不同带宽和数字影像质量的要 求m p e g - 7 则制定了一系列规则,对浩如烟海的多媒体信息进行组织、建库。 以达到快速、有效的检索m p e g - 2 1 主要规定数字节目的网上实时交换协议 山东大学硕士学位论文 i _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ - _ _ _ _ _ _ - _ - 2 _ i 1m p e g 发展简介 1 m p e g l i s o 的活动图像专家组( m p e g ) 在1 9 9 1 年1 1 月提出了i s o i e c l l l 7 2 标准 草案,通称m p e g - 1 标准鲫该标准于1 9 9 2 年1 1 月通过,1 9 9 3 年8 月公布它 是为工业级标准而设计的,可适用于不同带宽的设备,如c d - r o m 、v i d e o - c d , c d i 等。m p e g - i 的编码速率最高可达4 - 5 惦i t s s 2 m p e g - 2 1 9 9 5 年出台的m p e g - 2 ( i s o i e c1 3 8 1 8 ) ,它追求的是c c i r 6 0 1 建议的图 像质量即为d v b 、h d t v 、p v d 等制定的3 m b p s l o m b p s 的运动图像及其伴音的编 码标准 m p e g - 2 在n t s c 制式下的分辨率可达7 2 0 x 4 8 6 。r 叩e g - 2 还可以提供广播级 的视像和c d 级的音质m p e g - 2 的音频编码可提供左右中及两个环绕声道以及 一个重低音声道,和多达7 个伴音声道( d v d 可有8 种语言配音的原因) 同时, 由于m p e g 一2 的出色性能袭现,可能适用于h d t v 。使得原打算为h d t v 设计的 m p e g 一3 ,还没出世就被抛弃了 对于最终用户来说,由于电视机分辨率限制,m p e g 一2 所带来的高清晰度画 面质量( 如d v d 画面) 在电视上效果并不明显。倒是其音频特性( 如重低音,多 伴音声道等) 更引人注目 3 m p e g 一4 m p e g 专家组相继成功定义了m p e g - l 和m p e g - 2 之后,于1 9 9 4 年开始制定全 新的m p e g - 4 标准m p e g - 4 标准将众多的多媒体应用集成于一个完整的框架内, 旨在为多媒体通信及应用环境提供标准的算法及工具,用于实现音视频 ( a u d i o - v i s u a l ) 数据的有效编码及更为灵活的存取 m p e g - 4 试图达到两个目标:一是低比特率下的多媒体通信;二是多工业的 多媒体通信的综合据此目标,a v ( a u d i o - v i s u a lo b j e c t s ) 对象,使得更多 的交互操作成为可能 4 m p e g - 7 网络应用最重要的目标之一就是进行多媒体通信而其中的关键就是多媒体 信息的检索和访问,这样m p e g 一7 应运而生m p e g 一7 的目标就是对日渐庞大的图 。, “ 圩 山东大学硕士学位论文 像、声音信息的管理和迅速搜索针对这个问题m p e g 一7 于1 9 9 8 年1 0 月提出, 它将对各种不同类型的多媒体信息进行标准化的描述,并将该描述与所描述的内 容相联系,以实现快速有效的搜索其正式的称谓是。多媒体内容描述接口” 2 3 2m p 系列标准的比较 m p e g 一1 直接针对1 2 m b s 的标准数据流压缩率,其基本算法对于每秒2 4 “3 0 逐行描帧,分辨率3 6 0 x 2 8 0 ,运动图形有很好的压缩效果但随着速率的提高。 解码后图像质量较差,并且它没有定义用于对额外数据流进行编码的格式,因此 这种机制未被广泛采用 m p e g 一2 力争获得更高的分辨率( 7 2 0 x 4 8 6 ) 提供广播级视频和c d 级的音 频作为m p e g l 的一种兼容性扩展,m p e g - 2 支持隔行扫描视频格式和其他先进 功能m p e g 一2 以可扩展档次的形式来定义,每个档次支持一种特殊应用所需的 功能,因此它是一种通用标准但是m p e g 一2 标准数据量依然很大,一部影片的 数据量大到8 g 字节左右不便存放和传输 m p e g 一4 视频格式大大优于m p e g - i 和m p e g - 2 :视频质量与分辨率高,而数据 率相对较低主要原因在m p e g 一4 采用了a c o ( 高级译码效率) 技术,它是一套 首次使用于m p e g - 4 的编码运算规则。与a c e 有关的目标定向可以启用很低的数 据率这可以将整部视频电影以完全p a l 或者n t s c 的分辨率与立体声( 1 6 位, 4 8 k h z ) 存储在单个c d r o m 上具体而言;7 0 0 m b 的容量对多数1 1 0 分钟的电影 来说绰绰有余了,而m p e g - 2 格式的电影在相同的分辨率下需要约1 l 倍以上的存 储空间当m p e g 一2 的数据率加倍至接近真正的特性时,m p e g 一4 可以从音频与视 频流上在广泛的领域升级当视频在5 k b i t s 与l o m b i t s 之间变化时,音频信 号可以在2 k b i t s 与2 4 k b i t s 之间进行处理。由于这种可升级性,音频与视频 数据可以经专门调整适应真正的环境 另外,由于m p e g - i 和m p e g - 2 标准均为高层媒体的表示与结构标准,其交互 性及灵活性较低。而计算机网络具有较高的灵活性和交互性,但它遵循的标准与 m p e g 标准不兼容m p e g - 4 的制定有效的促进了三网的融合m p e g - 4 中一个重要 概念是视频对象( v o ) ,一幅图像的编码时分割成很多任意形状的v o ,分别对各 v 0 进行帧内、帧间编码必要时只传输某些v o ,大大提高了传输效率如果视 l 山东大掌硕士学位论文 频没进行分割,那么编码结构就退化为只处理标准矩形的一层,这种处理方式与 m p e g l m p e g - 2 标准类似,从而达到与m p e g - l n q ) e g - 2 的兼容 继m p e g 一4 之后,人们又对解决日渐庞大的图像、声音信息的管理和迅速搜 索产生了兴趣,m p e g 提出了解决方案m p e g - 7 它重点放在用于描述多媒体素材 ( 描述与内容有关的信息以方便检索等) 的通用接口标准上,因此m p e g - 7 并不 是兼容以前的标准。而是以前标准的扩展和延伸 2 1 3m p e g 系列的应用 m p e g 标准系列由于不存在专利权的问题,所以更适合于我国国情,在近十 年来,m p e g 在我国得到广泛应用 众所周知。基于m p e g - i 的影碟曾风云一时其产品v c d ,早已进入平常的 百姓家庭,它的图像质量和清晰度已被用户接受然而,随着m p e g - 2 标准的出 台,各个厂家都在追逐接近数字演播室标准的c c i r 6 0 1 和h d t v 中所需的视频质 量d v d 的推出使v c d 在市场的霸主地位动摇了。并取代了v c d 的主流地位由 于一路m p e g 一2 码流中可以同时传输多套电视节目。用户可以根据喜好收看其中 莱套节目,即视频点播( r o d ) 业务数字机顶盒的推出也是成功运用m p e g - 2 标准的典型,它是广播业务走向全数字化的过渡产品可以预计,d v d 和数字机 顶盒在未来的几年中将是百姓消费的主流另外,由于m p e g - 2 标准的突出表现, 在高清晰度电视的应用领域占有一席之地。m p e g - 2 标准还可用于为有线电视网、 电缆网络以及卫星直播提供广播级的数字视频( d 、,b ) 如果说m p e g - i 使得v c d 取代了传统的录像机,而m p e g 一2 将使数字电视最终完全取代现有的模拟电视 视频格式m p e g - 4 的应用举不胜举。例如。现在可以在家用个人电脑上将d v i ) 转换为m p e g 一4 格式。然后就可以直接播放了,而无需i ) v d - r o m 驱动器) 音频信 号能够以m p e g - 4 压缩通过i n t e r n e t 实现。声频点播”这种数字声频传播之所 以可能实现是因为它只需要约1 6 k b i t s 的带宽这种情况与视频服务及2 d 或 3 d 对象的动画相似,这些服务与动画能够以不同的数据率通过i n t e r n e t 同时进 行传送另外呻e g r l 4 在以下方面的应用直很好:数字电视、动态图像、互联 网、实时

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论