




已阅读5页,还剩58页未读, 继续免费阅读
(教育技术学专业论文)基于改进层式dct的图像压缩和渐进式传输研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
天津师范大学硕上学位论文 摘要 摘要 人通过眼睛接收的外界信息占接收信息总量的8 0 以上,于是图像媒体信息在教 育教学中发挥的作用就不可忽视了。另一方面,网络已经涉及到生活的方方面面,远 程教育、网络教育就是其在教学中的很好应用。所以,近几年来图像压缩编码和传输 技术成为图像处理领域的一个研究热点。 新的传输媒体的出现要求图像的浏览与传输具有嵌入式码流和多分辨率码流等 新的特点,改进的层式d c t 具有嵌入式码流和多分辨率码流等特点,可以应用于图 像的渐进式传输。改进的层式d c t 压缩效果已经接近小波,但对于有些图像( 如 5 1 2 * 5 1 2 b a r b a r a ) ,改进层式d c t 的压缩效果优于小波,体现出改进的层式d c t 具 有高效压缩性能。 首先,本论文就目前图像压缩编码方法进行了详细的分析,介绍了图像压缩的国 际标准。 其次,详细分析了常用变换编码方法,如小波变换、离散余弦变换( d i s c r e t e c o s i n et r a n s f o r m ,d c t ) 、层式d c t 以及改进的层式d c t 等的特点。 再次,进行了异构网络视频图像的可分级传输的研究。 基于当前网络的异构性,传统的视频编码方法由于其分级编码的每个层产生固定 码率,不适合用于多媒体信息的网络传输。精细可分级编码技术( f i n e g r a n u l a r - s c a l a b i l i t y - v i d e o c o d i n g ,f g s ) 是一种可伸缩编码技术,能很好的适应当前 网络对多媒体信息的传输。针对f g s 存在的不足,本文将改进层式d c t 变换代替 f g s 编解码器中的d c t 变换,用以达到提高f g s 参考图像质量的目的。 最后,本论文设计了基于改进的层式d c t 结合s p i h t ( s e tp a r t i t i o n i n gi n h i e r a r c h i c a lt r e e s ,s p i h t ) 图像编码应用在渐进传输中的实验平台,实现了视频图像 的渐进式传输。 关键词:图像压缩改进的层式d c t 精细可分级传输渐进传输 天津师范人学硕j :学位论义a b s t r a c t a bs t r a c t i t i sr e p o r t e dt h a tm o r et h a n6 0p e r c e n to fm e s s a g ew er e c e i v e df r o mo u t s i d ei s t h r o u g he y e s ,s ot h ei m p o r t a n c eo fm u l t i m e d i ai n f o r m a t i o ns h o u l db ee m p h a s i z e da n d v a l u e d o nt h eo t h e rh a n d ,i n t e r n e th a sb e e nw i d e l yu s e di no u rd a i l yl i f e ,a n di t s s u c c e s s f u la p p l i c a t i o ni ne d u c a t i o ni st h el o n g - d i s t a n c ee d u c a t i o na n dw e be d u c a t i o n s o , i nr e c e n ty e a r si m a g ec o m p r e s s i o nc o d i n ga n dt r a n s m i s s i o nt e c h n o l o g yh a sb e c o m ea r e s e a r c hh o t s p o ti nt h ef i e l do fi m a g ep r o c e s s i n g t h ee m e r g e n c eo fn e wt r a n s m i s s i o nm e d i aa s k st h a tt h eb r o w s e ra n dt r a n s m i s s i o no f t h ev i d e o ,i m a g eh a v et h en e wf e a t u r e so ft h ee m b e d d e dc o d es t r e a ma n dm u l t i r e s o l u t i o n c o d es t r e a m t h ei m p r o v e dl a y e rd c th a st h ef e a t u r e ss u c ha se m b e d d e dc o d es t r e a ma n d m u l t i - r e s o l u t i o nc o d es t r e a m ,a n dc a nb ea p p l i e dt op r o g r e s s i v ei m a g et r a n s m i s s i o n t h e c o m p r e s s i o ne f f e c t so f t h ei m p r o v e dl a y e rd c ta r ec l o s et ow a v e l e tt r a n s f o r m ,b u ta sf o r s o m ei m a g e s ( s u c ha s512 宰512s t a n d a r di m a g e “b a r b a r a ) i t sc o m p r e s s i o ne f f e c t sa r e b e t t e rt h a nw a v e l e tt r a n s f o r m i ti sd e m o n s t r a t e dt h a tt h ei m p r o v e dl a y e rd c th a sa n e f f i c i e n tc o m p r e s s i o np e r f o r m a n c e f i r s t l y , t h et h e s i sh a sc a r r i e do u tad e t a i l e da n a l y s i so ft h ec u r r e n ti m a g ec o m p r e s s i o n c o d i n gm e t h o d ,a n dh a si n t r o d u c t e dt h ei n t e r n a t i o n a ls t a n d a r d so fi m a g ec o m p r e s s i o n s e c o n d l y , t h et h e s i sh a sad e t a i l e da n a l y s i so fc h a r a c t e r i s t i c so nc o m m o n l yu s e d t r a n s f o r mc o d i n gm e t h o d s ,s u c ha sw a v e l e tt r a n s f o r m ,d c t , l a y e r e dd c ta n dt h e i m p r o v e dl a y e r e dd c t t h i r d l y ,t h ep a p e rh a sc a r r i e do nt h es t u d yo fv i d e oh i e r a r c h i c a lt r s m i s s i o nb a s e do n t h eh e t e r o g e n e o u so fn e t w o r k s b a s e do nt h eh e t e r o g e n e o u so fc u r r e n tn e t w o r k st h et r a d i t i o n a lv i d e oc o d i n gm e t h o d s a r en o ts u i t a b l ef o rt h ec u r r e n tm u l t i m e d i ai n f o r m a t i o nn e t w o r kt r a n s m i s s i o nb e c a u s eo f e a c hl a y e rh a v i n gaf i x e db i tr a t ei ns c a l a b l ec o d i n g f i n eg r a n u l a rs c a l a b i l i t yv i d e oc o d i n g i sas c a l a b l ec o d i n gt e c h n o l o g y ,a n dc a nw e l la d a p tt ot h ec u r r e n tn e t w o r kt r a n s m i s s i o no f m u l t i m e d i ai n f o r m a t i o n a sf o rt h ee x i s t e n c eo fd e f i c i e n c i e so ff g st h ep a p e rh a su s e dt h e 天津师范大学硕一l :学位论文 a b s t r a c t i m p r o v e dl a y e r e dd c t i n s t e a do fd c ti nf g sc o d e ct oa c h i e v et h ep u r p o s eo fi m p r o v i n g t h eq u a l i t yo fr e f e r e n c ei m a g e s f i n a l l y ,t h i st h e s i sh a sd e s i g n e dap r o g r e s s i v et r a n s m i s s i o ne x p e r i m e n tp l a t f o r mu s i n g t h ei m p r o v e dl a y e r e dd c ta n ds p i h ti m a g ec o d i n g k e yw o r d s : i m a g ec o m p r e s s i o ni m p r o v e dl a y e rd c t f g s p r o g r e s s i v e t r a n s m i s s i o n 独创性声明 本人声明所晕交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所 知,除了文中特别加以标注和致珊地方外,论文中不包含其他人已经发表或撰写过的研究成果, 也不包含为获得苤盗! 重整盘堂或其它教育机构的学位或证书而使用过的材料。与我一同工作 的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。 签名:日期: 学位论文版权使用授权书 巡红害 广o 本人完全了解天津师范大学有关保留、使用学位论文的规定,即:学校有权将学位论文的全 部或部分内容编入有关数据库进行检索,并采用影印、缩印或扫描等复制手段保存、汇编以供查 阅和借阅。同意学校向国家有关部门或机构送交论文的复印件和磁盘。 ( 保密的论文在解密后应遵守此规定) 签名:导师签名: 天津师范人学硕上学位论文 第一章绪论 第一章绪论 1 1 课题背景 二十世纪末,人类社会开始进入数字化时代,随着计算机技术,现代通信技术, 微电子技术,网络技术等科学技术的发展,基于网络的多媒体信息传输正改变着人类 的生活方式,但是由于多媒体信息本身十分庞大,给图像的处理,存储以及传播都造 成了难以克服的困难。如果将原始信息直接存储和传输,无疑会给存储器的容量和通 信线路的传输带宽带来巨大的压力,但又不能无限扩大存储器容量和通信线路带宽, 因此,为了使得多媒体信息通信成为可能并最大限度地降低通信费用,必须采用有效 的压缩手段将图像数据进行压缩存储和传输。对图像数据的压缩就成为了技术进步的 迫切需求,也正是由于这种需求,使得图像压缩( 编码) 算法和技术成为近3 0 年来 非常活跃的一个研究领域。由于图像信号中存在大量冗余,这就为图像压缩提供了可 能性。 图像压缩的研究历史可以追溯到信息论诞生的时代。图像压缩的基本理论起源于 2 0 世纪4 0 年代末s h a n n o n 的信息理论。s h a n n o n 的信息理论是以经典的集合论为基 础基于某种统计概率模型来描述信源。基于信息论的传统图像编码技术可以有效地消 除信号中冗余,以它们为核心的第一代图像压缩标准己经获得了很大成功。但建立在 统计模型上的信源描述也存在不可克服的缺陷,如它忽略了接受者的主观特性和主观 意义,撇开了事件本身的具体含义、重要程度以及引起的后果,正是这些缺陷导致了 第一代图像压缩标准在低码率下出现了严重性能损失。 2 0 世纪7 0 年代和8 0 年代,图像压缩技术成果主要体现在变换技术上,这主要 是因为对于一幅数字图像,它的原始表示一般是空间像素阵列,这是它的空间域表示。 在空问域表示中,相邻像素间存在着很大的相关性,冗余信息分布在较大范围的空间 像素之中,直接处理比较困难。常用的处理方法是通过一种变换,将图像从空间域映 射到变换域,在变换域中可以进行简洁和有效的处理。这样往往比直接对图像数据本 身进行压缩更容易获得高的压缩效率。 在理论上,k l 变换是在均方误差准则下的最佳变换,它能完全消除子像块内像 素问的线性相关性,大大减少了原始数据的冗余度。但是k l 的变换基是不固定的, 天津师范大学硕一l 二学位论文第一章绪论 这种不确定导致k l 在实际使用中极为困难【l 】。在实际编码应用中,更常采用离散余 弦变换( d c t , d i s c r e t ec o s i n e t r a n s f o r m ) ,d c t 的变换基是固定的,具有快速算法, 且性能最接近k - l 变换,易于用v l s i 实现。所以静止图像的数据压缩标准j p e g 就 是以d c t 编码为核心算法。但是d c t 也有其难以克服的缺点,由于其在应用过程中 图像被分成8 x8 或1 6 1 6 的小块,在低比特率下不可避免地会产生方块效应。 2 0 世纪8 0 年代发展起来的小波变换,作为一种多分辨率分析方法,具有很好的 时域或频率局部特性。一幅图像经过小波变换后,其各个频带的小波系数不仅存在空 间位置相似性和树状结构特性,而且具有能量集中和聚簇特性,为各种可分级图像压 缩编码的实现奠定了基础。并且能够和嵌入式编码技术相结合,实现图像信号的渐进 传输。基于小波变换的图像压缩与渐进传输能够克服传统的基于d c t 编码的j e p g 技术按行下载以及在低比特率时会产生方块效应的缺点,是图像压缩领域的又一重要 突破。 2 0 世纪9 0 年代,建立在计算机和网络技术基础之上的计算机网路技术得到了迅 猛的发展。i n t e m e t 成为了最重要的网络传输媒体之一。i n t e r n e t 上的图像传输与浏览 有一定的要求,例如嵌入式码流和多分辨率码流,这就要求在图像压缩编码实现中, 能灵活地提供关于质量、分辨力等的分级结构。在同益普及而带宽有限的网络应用中, 渐进传输己得到越来越多的应用【2 h 7 1 。渐进传输不像传统方法,需要等到所有的数据 都传输完后才能解码得到一整幅图像,而是在图像传输过程中,先传输图像的大致内 容,再传输图像的细节信息。随着细节信息逐渐增多,接收端得到是一个不断清晰的 图像。渐进传输最大的优点是接收者在图像细节逐渐表现出来的过程中,如果感觉图 像质量己经满意,或者所需要的图像细节已经看到,就可以适时终止图像传输,从而 可以有效的节约带宽,提高图像传输效率。基于小波变换的图像压缩方法可以满足 这一要求。另一方面,嵌入式d c t ( e d c t ) 、层式d c t ( l d c t ) 累进图像编码方法的提 出,获得了类似小波变换的多分解形式,能够采用该方法实现在i n t e r n e t 上对图像进 行渐进式传输。图像压缩与渐进传输是多媒体通信中的一项关键技术,对于网络资源 共享、信息交换有着非常重要的意义。 2 天津师范大学硕i :学位论文 第一章绪论 1 2 图像压缩编码的发展 视觉是人类获取信息的最为重要的途径之一,外部世界丰富多彩的信息大部分是 通过视觉感知的。据统计,在人类所接收的信息中,通过视觉获取的信息约占外界信 息的8 0 以上【8 1 。随着计算机、数字通讯、多媒体和网络技术的发展,图像作为最重 要的信息载体之一,己经深入人们的日常生活和工作当中。 图像压缩编码,就是减少表示图像信息的码数,即图像信息转变成另一种能将数 据量缩减的表达形式,简称为图像编码。图像之所以能被压缩编码,是因为图像信息 中存在着冗余,因此可以通过去除冗余信息来实现对图像的压缩。数据冗余主要有以 下几种: 信息熵冗余 信息熵冗余也称编码冗余,由信息论的有关原理可知,为表示图像数据的一个像 素点,只要按其信息熵的大小分配相应比特数即可。然而对于实际图像数据的每个像 素,很难得到它的信息熵,在数字化一幅图像时,对每个像素是用相同的比特数来表 示,这样必然存在冗余。信息熵冗余、空间冗余统称为统计冗余,因为它们都取决于 图像数据的统计特性。 结构冗余 在有些图像的部分区域内有着很相似的纹理结构,或是图像的各个部分之间存在 着某种关系,例如自相似性等,这些都是结构冗余的表现。 知识冗余 在有些图像中包含的信息与某些先验的基础知识有关,例如在头肩图像中, 头、眼、鼻和嘴的相互位置等信息就是一些常识。这种冗余称为知识冗余。 视觉冗余 在大多数情况下,重建图像的最终接受者是人的眼睛。为了达到较高的压缩比, 可以利用人眼视觉系统的特点。人类的视觉系统对于图像的注意是非均匀和非线性 的,并不是对于图像中的任何变化都感知。所以,在许多应用场合,并不要求经压缩 及解码后的重建图像和原始图像完全相同,而允许有少量的失真,只要这些失真不被 人眼所察觉即可。所以说,如果编码方案能利用人类视觉系统的一些特点,就可以得 3 天津师范大学硕 :学位论文第一章绪论 到较高的压缩比。 以上各种形式的冗余,是压缩图像的出发点。图像压缩编码方法就是要尽可能消 除这些冗余信息,以降低表示图像所需的数据量。 传统的压缩编码以香农信息论为出发点,用概率统计模型描述信源。香农编码定 理指出,在不产生任何失真的前提下,通过合理的编码,对于每一个信源符号分配不 等长的码字,平均码长可以接近于信源的熵。在这个理论框架下,出现了几种信源编 码方法。如霍夫曼编码、算术编码、游程编码等。这些通常被称为熵编码,这种无失 真编码的压缩率是很有限的,对较复杂的自然图像,压缩率一般不超过2 。显然,由 于无失真熵编码压缩率的限制,使其难以满足大多数应用场合的需求。 除熵编码外,实现信源冗余压缩主要依靠变换编码、预测编码、矢量量化以及运 动补偿等传统编码技术。这类有失真信源压缩的目的是去除图像数据中的冗余信息和 对视觉不重要的细节分量,以尽可能少的码字来表示所处理的图像。传统编码技术的 编码实体是像素或像素块,并以显示器件作为图像应用系统的最后环节,以消除图像 数据相关冗余为主要目的。 传统的编码技术,也被称为第一代编码技术,并未考虑信息接受者的主观感受, 也不关心图像信息的具体含义和重要程度等,只是力图去除数据冗余,属于一种低层 次的编码技术。真正代表图像编码方向的是基于内容的第二代编码技术,它所关心的 是如何去除图像的内容冗余,认为人眼是图像信号的最终接受者,图像编码应充分考 虑人眼视觉特性的影响,这是目前图像编码最为活跃的一个领域。许多学者结合计算 机视觉、模式识别、小波分析、分形几何等理论,开始探索图像编码的新途径。同时, 关于人类的视觉生理、心理特性的研究成果也开拓了人们的视野,许多新型编码方法 相继提出。 2 0 世纪9 0 年代以来,移动通讯的迅猛发展,因特网在全球范围的同益普及,网 络传输以及各种新兴多媒体业务向图像编码提出了新的要求,图像编码的研究己从面 向存储转为面向传输。除了传统的良好压缩性能与重建质量外,人们还要求压缩编码 算法能灵活地提供关于质量、分辨率、信噪比等可扩展编码结构,实现嵌入式编码、 多分辨率编码及抗误码传输,能在无线移动环境下向用户提供个性服务,这些都极大 地促进了图像编码技术的进步 9 1 。 4 天津师范人学硕1 :学位论文 第一章绪论 1 3 论文的主要研究工作 本论文的主要研究内容是改进的层式d c t 编码技术在图像压缩与渐进传输中的 应用。 论文框架如下: 第一章绪论。主要介绍了课题的研究背景,图像压缩编码技术的发展,并指出 了课题所做的工作。 第二章图像压缩编码方法及国际标准。 第三章变换编码的方法研究,详细分析了小波变换、d c t 变换、层式d c t 以 及改进的层式d c t 的特点。 第四章压缩图像的渐进式传输。详细分析了异构网络下的分级传输,重点讨论 了精细可分级编码技术,并用改进的层式d c t 代替其中的d c t 变换,达到提高参考 图像质量的目的。 第五章设计了改进层式d c t 的图像压缩在渐进传输中的实验平台。 论文的结束语部分,主要对课题进行总结和展望。 5 天津师范人学硕:l 学位论文 第二章图像压缩编码方法及国际标准 第二章图像压缩编码方法及国际标准 子带编码和分层编码是两种基本的图像压缩编码方法,和本课题的改进层式 d c t 有着密切的联系:渐进编码是一种灰度图像编码方法,使用该方法能够实现对 不同质量图像的传输:熵编码、预测编码、变换编码是三大传统的编码方法,在图像 压缩编码领域有着重要的地位。 本章主要介绍子带编码、分层编码、渐进编码、熵编码、预测编码、图像压缩国 际标准以及编码图像质量的评价。 2 1 子带编码和分层编码 2 1 1 子带编码 子带编码( s b c ,s u b b a n dc o d i n g ) 作为变换编码的一种特殊形式,被w o o d s 等 人于1 9 8 6 年应用到图像编码中。子带编码的基本思想是通过一组带通滤波器将图像 信号分解成若干个在不同频段上的子带信号,然后在每个独立的子带中对信号进行降 采样、量化和编码,最后合并成一个总的码流。这样做一方面通过频率分解去除信号 频率的相关性,减少冗余度;另一方面由于能量在不同频带分布的不同,而且人类视 觉系统对不同频段中噪声的敏感程度不同,因而可以对不同频带内的信号采用不同的 压缩编码方法。子带编码的运算复杂度低,但在高压缩率下会产生振铃效应。 2 1 2 分层编码 通过交换现有编码方式中的传送次序,能够实现具有图像分层传输功能的编码。 例如,在正交变换编码或子带编码中,只要按先传送全画面低频变换系数或通带信号, 再从低频到高频依次传送下去,就实现了分层编码传输。 分层编码有位平面编码、树形结构编码和基于变换的分层编码等方式。通常p c m 是把每个像素按照从最重要位( m o s ts s i g n i f i c a n tb i t ,m s b ) 到最不重要位( l e a s t s i g n i f i c a n tb i t ,l s b ) 或从l s b 到m s b 的顺序传送的,将其改为先全画面传送m s b , 之后依次进行l s b 传送,可以实现分层编码,这样的编码称为位平面编码。对一幅 用多个比特表示其灰度值的图像来说,其中的每个比特可看作表示了1 个二值的平 6 天津师范大学硕f :学位论文第二章图像压缩编码方法及国际标准 面,也称位面。位平面编码是一种将多灰度值图像分解成一系列二值图,然后对每l 幅二值图再用二元压缩方法进行压缩的技术。这类方法主要有两个步骤:位平面分解 和位平面编码。 分层编码是以不同的质量级别( 分辨力) 去访问一个给定图像,经常在“渐进传 输 和“多路环境”中使用。在渐进传输应用中,分层编码首先让用户在数据库中访 问一个低质量( 粗分辨力) 图像形式,用户可以初步确定此图像是否为所需要的图像。 如需要,就继续分级地发送附加信息,以精细加工所需图像。如不需要,可随时中止 传送。在多路环境中,一个图像数据可能用于支持几个输出器件,而这些器件各有不 同的分辨力。采用分层编码技术能让各器件有效地访问具有适当分辨力的图像形式。 图像分层编码分为固定分辨力分层编码和变分辨力分层编码。在固定分辨力分层 编码技术中,重构图像的规模与原图像相同,在任何像素位置的值均被逐级细化,这 种分层处理技术主要用于渐进传输;变分辨力分层编码是一种塔式结构。塔的底座表 示满分辨力图像即原图像。当沿塔身从底向上移动时,图像的规模与分辨力则减小。 变分辨力分层编码特别适用于多路环境。 2 2 渐进编码 在传输率较低的情况下,传送一幅较高质量的静止图像需要花很长时间,以前采 用光栅扫描方式压缩和解压时,接收者需要等待图像大部分显示出来才能了解图像的 内容,而有时等了很长时间接收到的图像可能发现是没有用的,浪费了传输信道资源 和时间,为此,人们提出了渐进( p r o g r e s s i v e ) 编码方式。 渐进编码方式的思想是:在发送端首先传输一幅低分辨率的图像,然后随着传输 过程的进行,逐渐传送细节部分;在接收端,解码器可以快速显示一整幅低质量的图 像,接收者可以较快地看到图像的大致轮廓,随着接收和解压的图像越来越多,显示 质量逐渐提高,最后看到一幅清晰的图像。事实上,注视着屏幕上正在显现中的图像 的接收者,通常在只解压5 1 0 就能识别出大部分图像特征。如果在显示过程中, 接收者觉得不用收看更为仔细的部分,可通知发送端立即停止发送新的细节部分,这 样就提高了传输效率。渐进编码另一个好处是,如果图像经过多次压缩,并需在不同 分辨率的设备上显示时,解码器可根据需要确定解码过程,当图像达到特定输出设备 的分辨率时停止解码。 7 天津师范火学硕上学位论文第二章图像压缩编码方法及国际标准 渐进编码可以先压缩最重要的图像信息,再压缩次要的信息并加到输出流中,如 此继续。因此,渐进编码是一种可控制的有损模式,用户可通过设置参数来确定编码 器何时停止编码,从而控制失真总量。编码停止越早,压缩比越高,数据失真也越大。 使用数码相机,对存储卡中的图像进行浏览时,会看到图像由模糊逐渐“聚焦 变得 清晰,这就是使用了渐进编码方式。 2 3 其他几种常用编码方法 2 3 1 熵编码 熵编码( 又称信息保持编码) 是建立在随机过程的统计特性基础上的,是一种纯 粹基于信号统计特性的编码技术。它是一种无损编码,解码后能无失真地恢复原图像。 熵编码的基本原理是赋予出现概率较大的符号一个短码字,而赋予出现概率较小的符 号一个长码字,这样使得最终的平均码长很小。一个精心设计的熵编码器,其输出的 平均码长接近信源的信息熵,即码长的下限。 由一个离散、无记忆信源产生的一个符号的平均信息量为 kk 日( u ) = p ( a 。) ,( ) = 一p ( 吼) l o g :p ( a ) ( 2 1 ) k = lk = l 其中p ( a 。) 表示符号出现的概率,( 口。) = 一l o g :p ( a 。) 是符号口的信息量。在 无记忆信源的情况下,符号序列中的符号是统计独立的,即某符号在某时刻出现的概 率与在此之前信源的状态无关。由于图像信号具有强相关性,由原图像信号的抽样值 作为信源符号的信源不是无记忆的,但是通过采用图像编码技术中的解相关映射处理 后得到的信号形式,其相关性解除;以它们作为信源符号,采用无记忆信源模型分析 和处理是合理的。 常用的熵编码方法有霍夫曼编码、游程编码和算术编码3 种。霍夫曼编码是可变 长编码( v l c ) 的一种,该方法完全依据符号出现概率来构造异字头的平均长度最短 的码字,有时称之为最佳编码。这里的最佳是指它对相同概率分布的信源的平均码长 比其它任何一种有效编码方法都短。但霍夫曼编码必须知道信源的概率分布,这一般 是无法知道的,通常采用对大量数据进行统计后得到的近似分布来代替i 游程编码 ( r l c ) ,也称行程编码或游程( 行程) 长度编码,这种编码方法是建立在图像相关 性的基础上的。该方法主要用于量化后出现大量零系数的情况,利用游程来表示连零 天津师范人学硕:f = 学位论文 第一二章图像压缩编码方法及国际标准 码,降低用于表示零码的数据量;算术编码是2 0 世纪8 0 年代发展起来的一种熵编码 方法,它的基本原理是任何一个数据序列均可表示成0 和1 之间的一个间隔,该间隔 的位置与输入数据的概率分布有关。有关实验数据表明,在未知信源概率分布的大部 分情形下,算术编码要优于霍夫曼编码。上述3 种熵编码方法均已被各种图像编码标 准采纳,例如以游程编码+ h u f f m a n 编码或游程编码+ 算术编码的形式用于对变换、预 测编码之后图像系数的迸一步编码。 2 3 2 预测编码 预测编码是一种主要的经典图像编码方法,它的硬件实现较简单,通常用在对图 像质量要求高的场合。预测编码是基于图像数据的空间和时间冗余性,用相邻的已知 像素( 或图像块) 来预测当前像素( 或图像块) ,然后再对预测误差进行量化和编码。 这些相邻像素( 或图像块) 可以是同行扫描的,也可以是前几行或前几帧的,相应的 预测编码分别称为一维、二维和三维预测,其中一维和二维预测是帧内预测,三维预 测是帧间预测,即在时间轴上用前一帧的像素( 或图像块) 对后一帧的像素( 或图像 块) 进行预测。预测编码的关键在于预测算法的选取,这与图像信号的概率分稚很有 关系,实际中常根据大量的统计结果采用简化的概率分布形式来设计最佳的预测器, 有时还使用自适应预测器以较好的刻画图像信号的局部特性,提高预测效率。 一 预测编码有两类,即线性预测和非线性预测。由于线性预测的预测公式是线性的, 即预测系数是固定的常数,所以易于硬件实现。线性预测编码又称为差分脉冲编码调 制( d i f f e r e n t i a lp u l s e c e o d em o d u l a t i o n ,d p c m ) 。编码可以在一幅图像内进行( 帧内 预测编码) ,也可以在多幅图像之间进行( 帧间预测编码) 。 帧内预测编码可采用像素预测或像素块预测( h 2 6 4 的帧内预测就是采用4 4 像素块预测) 形式的d p c m 。采用像素预测的优点是算法简单、易于硬件实现,缺点 是对信道噪声及误码很敏感,会产生误码扩散,使图像质量大大下降。同时帧内d p c m 编码压缩比低,一般会结合别的编码方法。 帧间预测编码主要利用活动图像序列相邻帧问的相关性,即通过消除图像数据的 时间冗余来达到压缩的目的,它可以获得比帧内预测编码高得多的压缩比。帧间预测 编码作为消除图像序列帧间相关性的主要手段之一,在视频图像编码方法中占有很重 要的地位。帧间预测编码一般是针对图像块的预测编码,它采用的技术有帧重复法、 9 天津师范大学硕上学位论文 第一二章图像压缩编码方法及国际标准 阈值法、帧内插法、运动补偿法和自适应交替帧内帧问编码法等,其中运动补偿预 测编码现已被各种视频图像编码标准采用,得到了很好的效果。帧间预测编码虽然有 较多的优点,但也存在着较大缺点,即对图像序列不同的区域,预测性能不一样,特 别是在快运动区,预测效率很差。而且为了降低预测算法的运算复杂度和提高预测精 度,一般要对图像进行分块后再进行预测,这也会使得分块边缘变得不连续。 2 4 图像压缩国际标准及评价标准 2 4 1j p e g 标准 j p e g 是连续色调、多灰度级静止图像编码标准,j p e g 标准于1 9 9 1 年公布。它是 由国际电报电话咨询委员会( c c i t t ) 和国际标准组织( i s o ) 的专家联合组织的。j p e g 标准的正式名称是“信息技术连续色调静止图像的数字压缩编码”。j p e g 标准设 计为适应8 b 1 2 b 的不限制图像尺寸、色彩范围、图像内容,基于测试技术和8 * 8o c t 混合的图像压缩编码。j p e g 标准获得了极大的成功,不仅广泛应用于卫星图片、医 疗图片等静止图像的存储和传输,也被应用于视频图像序列的帧内图像压缩编码。其 算法要点在于o c t 编码和可变长编码( v a r i a b l el e n g t hc o d i n g ,v l c ) 压缩技术【1 们。 j p e g 有4 种工作模式。即: 顺序的基于o c t ( s e q u e n t i a lo c t - b a s e d ) 模式。它由o c t 、量化和熵编码3 步组成,对图像按照从左到右,从上到下的扫描顺序编码。 累进的基于o c t ( p r o g r e s s i v eo c t - b a s e d ) 模式。它与基本顺序模式不同的 是对图像进行多次扫描编码。第一次扫描只对图像进行粗糙的扫描压缩,并传输裉糙 图像,接收时重建一帧粗糙轮廓的图像。在后续的扫描中,再对图像作较细的压缩, 这时只需传输增加的信息,便可以改善重建的图像质量,直至达到由量化表建立的图 像质量为止。 分层( h i e r a r c h i c a l ) 模式,提供一种会字塔( p y r a m i d ,或称锥形) 式分辨 率的分层码,相邻的两次编码的分辨率在水平和垂直方向都相差2 倍。编码过程如图 2 1 所示,首先对原始图像信息进行滤波,再以设定的2 的倍数为因子,对滤波的结 果进行降低分辨率抽样( d o w n s a m p l e d ) 和编码,然后再解码重建图像。对低分辨率 的重建图像,再进行提高分辨率抽样( u p s a m p l e d ) ,并把它作为原图像的预测值,接 l o 天津师范大学硕l 学位论文第二章图像压缩编码方法及国际标准 着对相邻量分辨率的差值编码。实现分层编码也需要足够的存储空间,它所传送的数 据包括最低分辨率图像信息和用于解码恢复到全分辨率图像所需的各相邻图像分层 之间的的差分信息。另外,分层编码也可以用作累进传输的手段之一,不过接收端重 建图像的效果是随着图像的空间分辨率由低到高,而对应图像是由小变到大。 无损( 1 0 s s l e s s ) 模式,不采用对图像有损伤的变换编码,仅用无损的预测编 码和熵编码来实现压缩编码。虽然压缩比低于有损编码,但是在保证较好的图像质量 下通常可做到2 :1 的压缩率。 基本的j p e g 编、解码器原理框图如图2 1 所示: 源图像 解码输入 ( a ) 编码器 重建图像 ( b ) 解码器 图2 1j p e g 基本编、解码器原理框图 j p e g 标准基本系统的核心算法为离散余弦变换编码,对“前缀码”进行熵编码,“尾 码”采用稍加变化的p c m 编码。 2 4 2j p e g 2 0 0 0 标准 j p e g 2 0 0 0 是j p e g 组织制定的i s o i e c l 5 4 4 4 图像编码系统。j p e g 2 0 0 0 图像编 码系统共有6 个部分:第一部分是核心编码器( c o r ec o d i n gs y s t e m ) 第2 部分是扩 展( e x t e n s i o n s ) ,对核心部分添加了很多新特性和更先进的算法,以适应各种特定的 天津师范大学硕十学位论文第二章图像压缩编码方法及国际标准 应用( 尚未完成) ;第3 部分是活动图像( m o t i o nj p e g 2 0 0 0 ) ;第4 部分是一致性测 试( c o n f o r m a n c et e s t i n g ) 第5 部分是参考软件( r e f e r e n c es o f t w a r e ) ;第6 部分是 组合图片文件格式( c o m p o u n di m a g ef i l ef o r m a t ) ,适应传真和印相前处理等应用。 j p e g 2 0 0 0 有两种不同的编码模式:一种是它放弃了以d c t 为主的块编码方式, 而改用基于离散小波变换( d i s c r e t ew a v e l e tt r a n s f o r m ,d w t ) 为主的多解析编码;包 括不能还原和能还原的变换。另一种是为了向下兼容而保留基于d c t 的编码模式, 但对算法进行了更新或改进,j p e g 2 0 0 0 的基本结构如图2 2 。其中基于小波的编码模 式采用了d w t 技术、标量量化、上下文建模、位面( b i t p l a n e ) 算术编码方法的熵编 码,以及后压缩率配置等新技术。编码的数据采用后置压缩率配置,组织成质量层 ( q u a l i t yl a y e r s ) 输出到数据包形式的码流( c o d e s t r e a m ) 中,产生的码流是可以 分析并能解析的、分层的、位置或分量累进的等。 源图像编码输出 ( a ) 编码器 重建图像 1 _ ji - ji _ j ( b ) 解码器 图2 2j p e g 2 0 0 0 基本编、解码器原理 j p e g 2 0 0 0 支持多达2 5 6 种成分的图像,每一成分可以是任意维数或者位深度, 并支持可逆的颜色分量变换( r e v e r s i b l ec o m p o n e n tt r a n s f o r m a t i o n ,r c t ) 以及不可 逆的颜色分量变换( i r r e v e r s i b l e c c o m p o n e n tt r a n s f o r m a t i o n ,i c t ) 。 作为j p e g 升级,其压缩率比j p e g 高约3 0 。应用领域可大致分成:l 、传统 j p e g 的市场,如扫描仪、数码相机等;2 、新兴应用领域,如网络流媒体、数字图书 馆、电子商务等。 j p e g 2 0 0 0 标准的主要特点有: 高压缩比:j p e g 2 0 0 0 图像压缩比j p e g 提高了1 0 0 0 , - - 3 0 ,并且消除了方块效 1 2 天津师范人学硕士学位论文第二章图像压缩编码方法及国际标准 应; 渐进传输:j p e g 2 0 0 0 提供了两种渐进传输模式:一是分辨率渐进传输,开始 时图片尺寸较小,随着接收数据的增加逐渐恢复到原始图像大小;二是质量渐进传输, 开始时接收图像大小与原始图像相同,但是质量较差,随着接收数据的增多,图像质 量逐渐提高。j p e g 2 0 0 0 的渐进传输还可以提供由有损编码到无损编码的渐进,这很 好地满足了互联网、打印机和图像文档的应用需要,而j p e g 标准基本系统的图像只 能按“块 传输,一行一行地显示; 感兴趣区域编码:包含两层含义,一是压缩时可以指定图片的感兴趣区域,采 用不同于其他区域的压缩方法;二是传输时用户可以指定其感兴趣区域,通过交互操 作,只传输用户感兴趣的区域; 码流的随机访问与处理:允许用户随机指定感兴趣区域,使该区域质量高于其 他区域,允许用户对图像进行旋转、平移、滤波和特征提取等操作; 良好的容错性和开放的体系结构。 2 4 3h 2 6 1 h 2 6 3 h 2 6 4 标准 h 2 6 1 是l t u t 针对视频电话、视频会议等要求实时编解码和低时延应用提出的 第一个视频编解码标准,公布于1 9 9 0 年2 月,是第一个采用现代编码算法的通用视 频标准,此后在国际上制定的m p e g 1 、m p e g 2 、h 2 6 3 等数字视频编码标准都是 以它为基础和核心的。h 2 6 1 的基础和核心是混合编码技术,即:带有运动补偿的帧 问d p c m + - - 维d c t + 熵编码【1 。 h 2 6 3 标准制定于19 9 5 年,是i t u t 针对6 4 k b i t s 以下的低比特率视频应用而 制定的标准。h 2 6 3 虽然是在h 2 6 1 的基础上发展起来的,基本算法与h 2 6 1 基本相 同,但进行了许多改进,使得h 2 6 3 标准获得了更好的编码性能。在比特率低于 6 4 k b i t s 时,在相同比特率的情况下,与h 2 6 1 相比,h 2 6 3 可以获得3 4 d b 的质量 ( p s n r ) 改善。h 2 6 3 的改进主要包括支持更多的图像格式、更有效的运动预测、 效率更高的三维可变长编码代替二维可变长编码以及增加了4 个可选模式,进一步提 高了压缩性能【1 2 】。 1 9 9 5 年制定h 2 6 3 标准后,又相继出现了h 2 6 3 + 和h 2 6 3 h ,是i t u t 于1 9 9 8 天津师范大学硕 :学位论文第二章图像压缩编码方法及国际标准 年和2 0 0 0 年通过的h 2 6 3 的第二版和第三版。在这两个版本中,一共增加了1 5 个新 的可选模式,并修改了一个h 2 6 3 的已有模式,有效提高了编码效果。 h 2 6 4 标准是j v t 工作组于2 0 0 3 年通过的一项工作成果,它也是m p e g - 4 标准 的第1 0 部分【1 3 】,其名称为“先进视频编码”( a d v a n c e dv i d e oc o d i n g ) 。h 2 6 4 相对 于先前的标准有许多优点,这些优点主要来源于其结构上和算法上的改进。h 2 6 4 不 仅比h 2 6 3 和m p e g - 4 节约了5 0 的码率,而且对网络传输具有更好的支持功能。 它引入了面向p 包的编码机制,有利于网络中的分组传输,支持网络中视频的流媒 体传输
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【正版授权】 ISO 17730:2025 EN Dentistry - Fluoride varnishes
- 特种作业安全培训登高架设作业人员考试模拟试题与答案
- 汽车驾驶员中级工题库试题及答案
- 神经内科护理试题及答案
- 麻醉护士专业知识技能考试题与答案
- 部编八年级语文校本课程开发教学计划
- 在公共场所销售渔产品零食创新创业项目商业计划书
- 智能家居控制软件定制创新创业项目商业计划书
- 智能车辆远程升级服务创新创业项目商业计划书
- 云端茶艺体验馆创新创业项目商业计划书
- 国庆节英语介绍模板
- 《油气管道无人机智能巡检系统技术管理规范》
- 《机械制图(多学时)》中职全套教学课件
- 新教科版小学1-6年级科学需做实验目录
- 安阳简介课件
- 部编版三年级语文上册第2课《花的学校》精美课件
- (精选word)洪恩识字-生字卡片1-200
- 斜拉桥主桥索塔施工监理实施细则
- 部编教材九年级历史(上)全册教案
- 劳动关系理论PPT课件.ppt
- 医院输血科技术人员绩效考核指标
评论
0/150
提交评论