(检测技术与自动化装置专业论文)jpeg算法与矢量量化算法在图像压缩中的应用研究.pdf_第1页
(检测技术与自动化装置专业论文)jpeg算法与矢量量化算法在图像压缩中的应用研究.pdf_第2页
(检测技术与自动化装置专业论文)jpeg算法与矢量量化算法在图像压缩中的应用研究.pdf_第3页
(检测技术与自动化装置专业论文)jpeg算法与矢量量化算法在图像压缩中的应用研究.pdf_第4页
(检测技术与自动化装置专业论文)jpeg算法与矢量量化算法在图像压缩中的应用研究.pdf_第5页
已阅读5页,还剩57页未读 继续免费阅读

(检测技术与自动化装置专业论文)jpeg算法与矢量量化算法在图像压缩中的应用研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

j p e g 算法与矢量量化算法在图像压缩中的应用研究 摘要 图像的数字化表示使得图像信号可以高质量地传输,也便于图像的检索、 分析、处理和存储。但是数字图像的表示需要大量的数据,必须进行图像的压 缩。图像压缩的目的是消除图像中的大量冗余信息,提高图像传输的效率,减 少图像的存储容量。 随着医学的不断进步和发展,产生了大量的图像数据,给医学图像的存储 和传输技术提出了严峻的挑战,因此数字图像压缩技术在医学图像中的应用也 日益广泛。 正是由于其广泛的应用,图像压缩技术的研究就变得相当有意义。 j p e g ( j o i n tp h o t o g r a p h i ce x p e r t sg r o u p ) 联合摄影专家组,制定出了第一套 国标静态图像压缩标准j p e g ,j p e g 压缩算法由于其较高的压缩比和理想的压 缩效果,是目前应用最广泛的图像压缩方法之一。矢量量化( v q ) 是,在量化的 时候,用码书中与输入矢量最匹配的码字来代替这个输入矢量的量化方法。矢 量量化作为一种有效的有损压缩技术,其突出优点是压缩比大以及解码算法简 单,因此它已经成为数据压缩编码的重要技术之一。 本文在介绍j p e g 图像压缩算法、矢量量化图像压缩技术的基础上,用 j p e g 和v q 这两种算法分别对l e n a 图像和医学中的c t 图像进行了压缩处理, 得到在不同压缩比下的峰值信噪比,并对压缩结果进行了分析比较。实验结果 表明,当压缩比较低的时候,j p e g 压缩算法的压缩质量较高,而随着压缩比不 断加大,矢量量化编码算法的压缩效果较j p e g 压缩算法更具优越性。 关键字:数字图像压缩;j p e g ;矢量量化;峰值信噪比( p s n r ) ;l b g 算法 r e s e a r c ho ni m a g ec o m p r e s s i o n b a s e do nj p e ga l g o r i t h ma n dv qa l g o r i t h m a b s t r a c t d i g i t a li m a g et e c h n o l o g yb r i n g sh i g h q u a l i t yi m a g es i g n a l t r a n s m i s s i o n , f a c i l i t a t e si m a g ei n d e x ,i m a g ea n a l y s i s ,i m a g ep r o c e s s i n ga n ds t o r a g e b u tb e c a u s e t h ee x p r e s s i o no fi m a g er e q u i r e sm a s s i v ed a t a ,i m a g ec o m p r e s s i o ni sn e e d e d 。t h e p u r p o s eo fi m a g ec o m p r e s s i o ni s t oe l i m i n a t en u m e r o u si n f o r m a t i o nr e d u n d a n c e , i n c r e a s et h ee f f i c i e n c yo fi m a g et r a n s m i s s i o n ,a n dd e d u c ei m a g es t o r a g ec a p a c i t y w i t ht h ed e v e l o p m e n to fm e d i c i n e ,n u m e r o u si m a g ed a t aa r ep r o d u c e de v e r y d a y t h i sb r i n g ss e v e r ec h a l l e n g et om e d i c a li m a g es t o r a g e a n dt r a n s m i s s i o n ,s o d i g i t a li m a g ec o m p r e s s i o nt e c h n o l o g yi sw i d e l yu s e di nm e d i c a li m a g ef i e l da l s o - t h e r e f o r e ,s t u d yo ni m a g ec o m p r e s s i o nt e c h n o l o g yi sc o n s i d e r a b l ys i g n i f i c a n t b e c a u s eo fi t sw i d ea p p l i c a t i o n j p e g ( j o i n tp h o t o g r a p h i ce x p e r t sg r o u p ) i n s t i t u t i o n d r e wu pt h ef i r s ts t a n d a r d s t a t i ci m a g ec o m p r e s s i o nc r i t e r i o n j p e g d u et oh i g hc o m p r e s s i o nr a t i o a n d e x c e l l e n tc o m p r e s s i o nr e s u l t s ,j p e ga l g o r i t h mi so n eo ft h ew i d e l i s tu s e di m a g e c o m p r e s s i o nt e c h n i q u e sc u r r e n t l y v q ( v e c t o rq u a n t i z a t i o n ) r e p l a c e st h ei n p u t v e c t o r sw i t hc o d e v e c t o r sw h i c ha r em a t c h e d w i t h i n p u t v e c t o r sf r o mt h e c o d e b o o k a sa ne f f e c t i v el o s s yd a t ac o m p r e s s i o na l g o r i t h m ,v q se x c e l l e n tf e a t u r e i sh i g hc o m p r e s s i o nr a t i oa n ds i m p l ed e c o d ea l g o r i t h m v qh a s b e c o m ea s i g n i f i c a n td a t ac o m p r e s s i o nc o d et e c h n o l o g y b a s e do nt h es u m m a r yo fj p e ga n dv q ,“l e n a a n dc t ( c o m p u t e d t o m o g r a p h y ) i m a g ew e r ep r o c e s s e du s i n gj p e g a n dv qi nt h i sa r t i c l e ,p s n r ( p e a k s i g n a l t on o i s er a t i o ) v a l u e sa td i f f e r e n tc o m p r e s s i o nr a t i o s w e r eo b t a i n e d c o m p a r i n ga n da n a l y s i so ft h ec o m p r e s s i o nr e s u l t ss h o w e dt h a tj p e gh a sh i g h e r c o m p r e s s i o nq u a l i t ya tl o w e rc o m p r e s s i o nr a t i o ,a n dv q sc o m p r e s s i o nq u a l i t y 1 s h i g h e rw h e nc o m p r e s s i o nr a t i oi sh i g h e r k e yw o r d s :d i g i t a li m a g ec o m p r e s s i o n ;j p e g ;v e c t o rq u a t i z a t i o n ( v q ) ;p s n r ( p e a ks i n g a lt on o i s er a t i o ) ;l b ga l g o r i t h m 插图清单 图1 1 图像压缩的步骤框图9 图2 - 1j p e g 编码过程1 6 图2 3 相场( n x n ) 的边界褶翻操作1 8 图2 4 离散余弦变换1 9 图2 5 两维变一维d c t 的变换方法2 0 图2 - 6均匀量化2 1 图2 7 非均匀量化2 1 图2 - 8 均匀量化器2 2 图2 - 9量化d c t 系数的编排2 4 图2 1 0z 字形顺序2 5 图2 1 ld c 系数的编码2 6 图2 一1 2 行程编码一2 6 表格清单 表卜1 五级质量尺度和妨碍尺度表。l l 表2 - 1 色度量化值表。2 2 表2 - 2 亮度量化值表2 2 表2 3j p e g 标准推荐的量化表2 3 表2 4 进行修改后的j p e g 量化表2 3 表2 - 5z 型编排后量化d c t 系数的序号2 4 表2 6a c 系数的部分l t u f f m a n 码( 行程,尺寸) 表2 8 表2 7 尺寸分类h u f f m a n 表2 8 表2 - 8具有差分亮度的d c 尺寸的h u f f m a n 码2 9 表2 - 9 亮度图象子块经过量化后的系数2 9 表2 1 0压缩效率与图象质量的关系3 0 表4 一lj p e g 标准推荐的量化表4 4 表4 2 进行修改后的j p e g 量化表4 5 表4 - 3j p e g 峰值信噪比( p s n r ) 比较表4 6 表4 - 4v o 峰值信噪比( p s n r ) 比较表4 8 表4 - 5v q 和j p e g 算法压缩结果比较5 0 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究1 丁作及取得的研究成 果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表 或撰写过的研究成果,也不包含为获得金e 巴! :些厶:鲨 或其他教育机构的学1 :7 :或 证 5 而使川过的材料。与我一同i :作的同忠对本研究所做的任何贡献均已在论文中作了 明确的说明并表示谢意。 学位论文作者签名: 兰la 3 毅 签字日期:2 0 0 8 穆月年日 学位论文版权使用授权书 本学位论文作者完全了解佥a 墨:l 些厶堂有关保留、使川学位论文的规定,有权保 留并向国家有关部f j 或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授 权佥a 巴工些厶堂可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采 用影印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适剧本授权l5 ) 学位论文作者签名:乡乙 签字日期:2 0 。8 年岁月千日 学何论文作者毕业斤去向: j i :作单位: 通讯地址: 跏签名力,骗 签字日期:2 0 0 8 年月】严日 电话: 邮编: 致谢 在母校一一合肥工业大学八年的求学经历,是我人生的转折点。母校这份 沃土,给了我知识和力量,指引了我人生的前进方向。母校,恩师,同学,朋 友,你们给了我欢乐和阳光,给了我勇气和力量! 在即将结束我的研究生学习 生活之际,谨向所有曾经和一直支持与帮助我的老师、同学和朋友致以最诚挚 的谢意! 首先,特别感谢我的导师李国丽教授对我无微不至的关怀、教导和帮助。 导师渊博的学识、严谨的治学态度、对科学研究孜孜不倦的追求以及平易近人 的高尚品德一直熏陶着我。从导师那里学到的做人的道理与做学问的方法,让 我终生受益匪浅! 借此机会对导师及其家人表示最诚挚的谢意和祝福! 在母校将近三年的研究生学习生活中,我被导师对我高度负责的态度所感 动。在学习上,她对我要求精益求精;在论文写作上,她也很严格要求,不放 过任何小的疏忽。对我的每一篇论文,她阅读多遍,然后提出一些好的建议, 修改多次,直到满意为止,可想而知,花了多少时间和精力。在生活上,导师 非常关心我,给了我很多指导、帮助与鞭策。我很幸运成为李老师的学生,她 为我树立了生活和工作上的光辉榜样。 同时,还要特别感谢胡存刚老师,他在学习和日常生活中给了我很多的帮 助和支持。感谢师姐王世芳、史利杰,在学习和生活上,你们给了我很大的帮 助。 论文写作期间得到了夏秋实、周金斌等同学的大力帮助,同时也得到了侯 建成、鞠鲁峰等同学的无私帮助,另外,师弟杨铸、程中杰、张擎等同学也给 与我很多支持和帮助,在这里请你们接受我最真诚的感谢! 感谢韩平平、张文婷、董健健、张俊等好朋友,感谢哥哥纪可华、弟弟纪 文元,谢谢你们一路给我的支持和帮助。 感谢我的父亲母亲,你们永远是我最强大的精神支柱,你们仁爱和无私奉 献的精神,永远是我富足的源泉,你们永远健康快乐是我最大的心愿。 深深感谢所有支持、鼓励和帮助过我的老师、亲人和朋友们! 最后,真诚感谢各位评委在百忙之中抽出时间给我评审。 作者:纪心毅 2 0 0 8 年2 月 第一章绪论 1 1 课题研究背景及意义 1 1 1 数字图像压缩的研究背景 人类社会已经进入信息时代了,信息是现代社会的主要特征。随着社会经 济的发展,科学技术的不断进步,信息视觉化技术越来越受到人们的重视。在 这个时代,人们每天都可以通过各种手段获得大量的信息,而信息的本质,就 要求交流和传播,在有必要的时候还要进行储存,而人们传递信息的重要媒介 是图像。图像传输是现代社会每时每刻都在进行的工作,已经成为社会日常生 活中必不可少的信息产品,具体应用如:电视、电影、会议电视、视频监控、 可视电话等。随着多媒体技术和通信技术的发展,图像信息的存储和传输在社 会生活中的作用越来越突出。但是,在大量信息给人们生活增加了更多色彩的 同时,随之而来的问题一一如何利用有限的传输和储存资源来传输和保存更多 的信息,这就要用到压缩数据的方法。 由上面叙述可知,数据量大是数字图像的一个显著特点,一幅具有中等分 辨率( 6 4 0 x 4 8 0 ) 的彩色( 2 4 b i t 象素) 数字图像的数据量约为7 3 7 m b i t 。大数据量 的图像信息会给存储器的存储容量、通信干线信道的带宽、计算机的处理速度 等增加极大的压力,也给数字图像的传输带来很大的困难。因此,图像数据压 缩技术对现代化社会的发展起着不可忽视的作用。图像信息的数据量庞大,要 实现存储和在有限的信道内进行实时传输,图像压缩是必须解决的主要问题之 一。 从19 4 8 年数字电视传输的思想被提出开始,广大科研技术人员对图像压缩 技术进行了系统而深入的研究,并取得了一系列的理论和应用成果。利用图像 压缩编码技术,在原有图像损失一定精度( 有损图像压缩) 或不损失任何精度( 无 损图像压缩) 的情况下,将原有图像用比原始数据量少得多的数据将其表示出 来,以提高图像的存储效率和传输效率。图像压缩方法种类繁多,经典的图像 压缩方法有预测编码、变换编码和矢量量化等【l 2 ,3 】。近二十年来,一些新的理 论和方法如小波分析、分形、神经网络等也都已经成功应用于图像压缩,使得 这一领域的研究与应用空前活跃,成为当前国际学术界和工程应用领域的研究 热点之一。 1 1 2 数字图像压缩的研究目的 数字信号有很多优点,但当模拟信号数字化后其频带大大加宽,一路6 m h z 的普通电视信号数字化后,其数码率将高达1 6 7 m b p s ,对储存器容量要求很大, 占有的带宽将达8 0 m h z 左右,这样将使数字信号失去实用价值。数字压缩技术 很好地解决了上述困难,压缩后信号所占用的频带大大低于原模拟信号的频带。 因此说,数字压缩编码技术是使数字信号走向实用化的关键技术之一。 具体的说,数据压缩的意义有以下几个方面:首先,是为了减少存储容量, 以利于信息的保存。若图像数据平均压缩比为2 :1 ,那么,同一容量的数据库 可以成倍地增加有效库存。其次,是有利于数据传输。数据压缩之后,可以极 大地减少必须传输的数据量,以满足人眼和机器分析的要求。第三,是便于特 征提取,以利计算机模式识别。如用计算机对图像中不同类型的物体进行分类 时,使用图像压缩方法,只要考虑区分物体的特征以及物体之间类型特征即可, 从而减少了数据量又满足了实际需要。 图像压缩的目的主要是基于两点:( 1 ) 图像信息存在着很大的冗余度,数 据之间存在着相关性,如相邻像素之间色彩的相关性等。从信息论观点来看, 图像作为一个信源,描述信源的数据是信息量( 信源熵) 和信息冗余量之和【2 j j 。 信息冗余量有许多种,如空间冗余、时间冗余、视觉冗余等,而冗余量减少可 以减少数据量而不减少信源的信息量;从数学上讲,图像可以看作一个多维函 数,压缩描述这个函数的数据量实质是减少其相关性;另外在一些情况下,允 许图像有一定的失真,而并不妨碍图像的实际应用,数据压缩实质上是减少冗 余量与相关性。( 2 ) 人眼是图像信息的接收端,因此,可利用人的视觉对于边 缘急剧变化不敏感( 视觉掩盖效应) ,以及人眼对图像的亮度信息敏感、对颜色 分辨率弱的特点实现高压缩比,而解压缩后的图像信号仍有着满意的主观质量。 目前,图像压缩技术正处在不断研究发展和完善的过程中,要实现图像在 低速信道上的有效传输,要使数字图像的压缩效果和效率达到用户十分满意的 程度,还有许多问题需要解决。因此,研究新的、更高效的图像压缩理论和方 法有着重大的实际应用价值。 1 1 3 医学图像压缩的研究意义 近年来随着信息科学和相关技术的发展,传统的基于胶片的成像方式已经 越来越不适应当前的需求,数字图像正在逐步取代传统的胶片和视频模拟信号 录像等方法而成为医学图像的信息载体。数字化是医学图像发展的趋势,其基 本目标是把图像表示为数字格式以使其能支持图像的归档、传输以及其它诊断 信息的操作,如图像增强、分割、配准以及三维可视化重建等。随着医学图像 数字化进程的发展,新的数字化医学图像成像模式也在不断的涌现,并逐步取 代那些传统的、基于胶片的成像方法。医学图像数字化【2 6 】带来的好处不仅仅在 于信息载体媒介的变化,更重要的是它还带来了以下好处: 1 医学图像数字化拓宽了医学图像的使用领域。除了传统医学图像所具有 的诊断和回顾的功能外,数字化的图像使得实时远程医学诊断和监护成 为可能。 2 医学图像数字化为诊断信息的深度加工和利用提供了基础。在数字化图 2 像的基础上,计算机辅助的各种信息处理和挖掘方法,图像的三维实时 重建以及计算机辅助手术成为研究和应用的新热点。 3 医学图像数字化为这些图像的存储、浏览、传送以及各种处理等方面都 带来了革命性的变换。 医学图像数字化程度的不断加深、范围的不断拓展,导致医院的数字化进 程也逐步加快。虽然到目前为止,世界上还没有一个完全意义上的全科数字化 医院,但完成局部数字化改造的医院却不断涌现,医院数字化的程度也在不断 的加深。 医学图像压缩【2 3 1 的首要目的,是运用一种更经济、更有效率的方法保存数 字化医学图像。医学诊断数据作为一种重要的信息档案,需要被保存和使用多 年,逐年积累的庞大数据库无论对所有者、管理者、使用者和处理工具来说都 是一个负担。随着医院数字化程度的加深,相关医学设备的普及和各种成像手 段越来越多的运用到医学检查当中, 所获得的数据量呈现爆炸性的增长,而 且这种数据量还在迅速增加。据调查,一家5 0 0 床位的中型医院中,一年运转 产生的各类检查图像超过2 0 0 万幅,其中一台c t 年生产图像2 0 万幅。以每幅 c t 图像占用5 0 0 k b y t e s 存储空间计算,一年产生的c t 图像要占有1 0 0 g b y t e s 以上的存储空间。如果该医院的全部医学图像数字化,则占有的空间超过 2 0 0 0 g b y t e s 。因此,研究更经济、更有效率的医学图像压缩方法变得更加有意 义。 医学图像压缩的第二个目的,是使图像在网络环境下更快的传递和显示。 现代化的数字医院是以网络为工作平台的,如果失去了网络这个信息交换和传 输平台,医学图像数字化也失去了意义。从通讯的角度看,由于受到技术及通 讯介质本身物体特性的限制,通讯信道带宽永远是不足的资源。如何将信息量 巨大的医学图像数据挤进有限的带宽,同时保证一定的实效性、图像质量和在 医疗诊断中的可信性是医学图像压缩要解决的重要问题之一。 由于医学图像本身及其应用的特殊性,在压缩的时候还有必要考虑一些特 殊的要求。例如必须确保文件携带信息的安全性;对用于诊断的图像,不能损 坏其信息的完整性;对某些用于监控的图像则保证其实时性至关重要;另外, 同一组医学图像可能会用于十分不同的目的。因此对于不同的用户和应用,提 供相应的功能信息内容也是图像压缩存储时应解决的问题。 由以上分析可以看出,医学图像因其本身及应用目的的特殊性,如果直接 将其它通用图像的压缩方法移植过来使用,是十分不妥的,必须针对医学图像 及其应用的特点建立实用有效的图像压缩方法。 1 2 图像压缩算法介绍 1 2 1 图像压缩算法分类 图像压缩可以分为无损压缩和有损压缩这两类。 无损压缩是指,还原压缩文件时,能够准确无误地恢复原始数据。这常用 于数据文件的压缩,例如z i p 文件。它将相同的或相似的数据或数据特征归类, 使用较少的数据量描述原始数据,达到减少数据量的目的。无损压缩又称信息 保持编码,或叫做熵保持编码。图像的无损压缩通常分为两步,即去相关和编 码。去相关就是要去除图像冗余,降低信源熵。无损压缩编码算法可分为两大 类【2 ,l7 】:基于统计概率的方法和基于字典的技术,前者主要包括霍夫曼编码方 法和算术编码,后者主要包括游程编码r l e 和l z w 编码。 1 哈夫曼编码( h u f f m a nc o d i n g ) z j 哈夫曼编码( h u f f m a nc o d i n g ) 由d a v i d a h u f f m a n 发展起来,它是一 种一致性编码法,又称“熵编码法 ,它使用一张特殊的编码表将源字符 进行编码。这张编码表的特殊之处在于,它是根据每一个源字符出现的 估算概率而建立起来的。这种算法统计码字出现的概率,出现概率高的 字符使用较短的编码,反之出现概率低的则使用较长的编码,这便使编 码之后的字符串的平均期望长度降低,从而达到无损压缩数据的目的。 这种压缩算法需要预先统计图像中颜色值出现的概率,编码方案每幅图 像都不相同,编码效率不高。 2 游程编码r l e ( r u n l e n g t he n c o d i n g ) p 1 游程编码是指一个码字可同时表示码的值和前面几个零( 游程长 度) ,游程长度指的是由字符构成的数据流中各个字符连续重复出现而形 成字符串的长度。在图像压缩中,游程编码使用一对参数,即颜色值和 长度,来代替一连串连续存储的相同颜色值,从而减小相同颜色所占用 的存储空间。这种压缩算法压缩黑白图片时非常有用,但是对活动的彩 色图像压缩时并不实用,它受图像复杂度的影响太大,造成压缩率过低, 很难超过3 :1 。 3 算术编码( a r i t h m e t i ce n c o d i n g ) 算术编码把一个信源集合表示为实数线上的0 到1 之间的一个 区间( 0 ,1 ) ,用一个浮点输出数值代替一个流的输入符号。实际上是 对变化长度的符号块分配变化长度的编码,该编码的两个主要的元素分 别是每个符号的出现概率及区间( 0 ,1 ) 。信源集合的元素越多,所得到 的区间就越小,当区间变小时,就需要更多的数位来表示这个区间,这 就是区间作为代码的原理。算术编码首先假设一个信源的概率模型,然 后用这些概率来缩小表示信源集的区间。不必预先定义概率模型,信源 符号概率接近时算术编码较有优势,算术编码实现方法较复杂, 但 4 j p e g 成员对多幅图像的测试结果表明【9 】,算术编码比h u f f m a n 编码 提高了5 左右的效率,因此在j p e g 扩展系统中用算术编码取代 h u f f m a n 编码。 4 l z w 编码( l z we n c o d i n g ) l z w 是一种基于字典压缩算法的方法,如在一本字典中,一个单 词由该单词所在的页号及基本页的次序号决定,这样一个人向他人介绍 所使用的单词时,他只需指明次序号和页码号即可。实际上这就是一种 用地址来代替信息的方法。在图像压缩中可以采用同样的方法,一个像 素序列若经常出现的话,就可以表示成一个索引信息。 允许压缩过程中损失一定信息的压缩方法是有损压缩方法,该压缩方法利 用了人类视觉对图像中的某些频率成分不敏感的特性:虽然不能完全恢复原始 数据,但是所损失的部分对理解原始图像的影响较小,却换来了大得多的压缩 比。换句话说,有损压缩提供原始图像的一个近似,但可以达到更高的压缩比。 有损压缩广泛应用于语音、图像和视频数据的压缩。比较常见的有损压缩编码 有以下几种形式: 1 预测编码( p r e d i c t i v ec o d i n g ) 【2 】 预测编码实际上是基于图像数据的空间冗余特性的,用相邻的己知 像素( 像素块) 来预测当前像素( 像素块) 的值,然后再对预测误差进行量化 和编码,这些相邻像素或像素块可以是同行的,也可以是前几行的,相 应的预测编码分别称为一维、二维预测。预测编码的关键在于预测算法 的选取,这与图像信号的概率分布很有关系。如果模型算法足够好,并 且样本序列在时间上相关性较强,那么误差信号的幅度将远远小于原始 信号,从而可以得到较大的数据压缩,可见,建立一个理想的预测器是 很关键的。实际中常根据大量的统计结果来设计最佳的预测器,有时还 使用自适应预测器以刻画图像信号的局部特性,从而提高编码效率。预 测编码有线性预测和非线性预测两大类,其中,非线性预测的预测方程 式是非线性的,其中自适应预测( a p , a d a p t i v ep r e d i c t i v e ) 是一种非线性 预测;线性预测编码又称为差分脉冲预测编码调制,即d p c m ( d i f f e r e n t i a l p u l s ec o d em o d u l a t i o n ) ,一般采用像素预测形式的d p c m 。其优点是算 法简单,易于硬件实现,缺点是对信道噪声及误差很敏感,会产生误码 扩散,使图像质量大大下降,而且其压缩比很低,一般很少单独使用, 要结合其它编码方法。另外,预测编码中也包括运动估计算法,运动估 计是视频压缩中帧间预测编码的关键技术之一,m p e g 4 规定使用运动 估计的方法【6 j 。运动估计即运动向量的计算,运动估计给出了当前帧和 上一帧之间的运动位移关系,使当前帧的信息能够从上一帧推导得到。 在各个压缩标准中都广泛使用了基于块的运动估计技术,由于运动估计 通常具有较大的运算量,因此对压缩性能具有重要的影响。 2 变换域编码( t r a n s f o r mc o d i n g ) 2 】 变换域编码就是将通常在时间域或空间域描述的信号通过多维坐标 的旋转、变换,将原散布在各坐标轴上的能量集中到少数坐标轴上,减 少各信号分量的相关性。因此,可以使用较少的编码位数来表示一组信 号样本,实现高效率的压缩编码。编码变换是一种有损编码。编码变换 中理论上最佳的是k l 变换( k a r h u n e n l o e v et r a n s f o r m ) t 2 8 1 ,它是建立在 统计特性基础上的一种变换,因为霍特林在1 9 3 3 年最先给出将离散信号 变换成一串不相关系数的方法,有的文献也称之为霍特林( h o t e l l i n g ) 变换。k l 变换的核心过程是计算特征值和特征向量。k l 变换的突出 优点是去相关性好,是均方误差( m s e ,m e a ns q u a r ee r r o r ) 意义下的最 佳变换,它在数据压缩技术中占有重要地位。其去相关最彻底,k l 变 换虽然具有m s e 意义下的最佳性能,但需要先知道信源的协方差矩阵 并求出特征值。求特征值与特征向量并不是一件容易的事,维数较高时 甚至求不出来。即使能借助计算机求解,也很难满足实时处理的要求, 而且从编码应用看还需要将这些信息传输给接收端。这些因素造成了 k l 变换在工程实践中不能广泛使用。因目前尚无快速算法,且变换矩 阵随数据集变化而变化,不能广泛应用。k l 变换常常作为其它一些变 换方法的变换性能的评价标准。而离散余弦变换( d c t ) 是一种实变换, 去相关能力仅次于k l 变换,压缩效果好,压缩比易于调整,压缩率高, 易于硬件实现。本文第二章就将着重介绍d c t 方法。 3 分形编码( f r a c t a lc o d i n g ) 1 j 分形压缩】的基本原理是,利用分形几何中的自相似性原理来进行 图像压缩。所谓自相似性就是指无论几何尺度如何变化,图像中的任何 一小部分的形状都与较大部分的形状是相似的。与d c t 不同,分形编码 利用的“自相似性”不是邻近样本的相关性,而是大范围的相似性,即 图像块的相似性。对相似性的描述是通过仿射变换来确定的,而编码的 对象就是仿射变换的系数,仿射变换是指像移动、旋转或缩放这样的几 何体变换,可以更改点之间或线条之间角度的距离,但是保留直线和平 行线之间的平行关系 2 8 , 3 3 】。由于仿射变换的系数的数据量小于图像块的 数据量,因此可以实现压缩的目的。 4 矢量量化编码( v e c t o rq u a n t i z a t i o nc o d i n g ) p ,1 4 j 矢量量化( v q ) 是7 0 年代后期发展起来的一种数据压缩技术,其 基本思想是,将若干个标量数据组构成一个矢量,然后在矢量空间给以 整体量化,从而压缩了数据而不损失多少信息。矢量量化编码也是在图 像、语音信号编码技术中研究得较多的新型量化编码方法。在传统的预 6 测和变换编码中,首先将信号经某种映射变换变成一个数的序列,然后 对其一个一个地进行标量量化编码;而在矢量量化编码中,则是把输入 数据几个一组地分成许多组,成组地量化编码,即将这些数看成一个k 维矢量,然后以矢量为单位逐个矢量进行量化。矢量量化是一种限失真 编码,其原理仍可用信息论中的率失真函数理论来分析,而率失真理论 指出,即使对无记忆信源,矢量量化编码也总是优于标量量化。 矢量量化是,用k 个样本形成一个k 维空间中的一个矢量,然后对 此矢量进行量化,只传输或存储矢量地址,因而可以大大提高压缩效率。 v q 的码本是根据训练矢量集合来设计的,常用的是l b g 算法。本文第 三章将着重介绍基于l b g 算法的矢量量化编码技术。 5 小波变换编码( w a v e l e tt r a n s f o r mc o d i n g ) 【2 u j 小波( w a v e l e t ) ,“小”是指它具有衰减性,“波”则是指它的波动性, 即振幅正负相间的震荡形式。与f o u r i e r 变换相比,小波变换是时间( 空 间) 频率的局部化分析,它通过伸缩平移运算对信号( 函数) 逐步进行多尺 度细化,最终达到高频处时间细分、低频处频率细分,能自动适应时频 信号分析的要求,从而可聚焦到信号的任意细节,解决了f o u r i e r 变换的 困难问题,有人把小波变换称为“数学显微镜”【2 引。 基于小波变换【l6 】的图像压缩方法能在高压缩比的前提下保持好的 重建图像质量。其压缩算法通常分为如下3 个步骤:小波变换、量化和 编码。首先,选择合适的小波基对原始图像进行小波变换;其次,对变 换系数进行量化,量化方法主要有矢量量化、标量量化和零树量化等; 再次,对量化后的系数进行编码,将量化后的系数转化为字符流,使所 得字符流的熵尽可能的小。它的特点是压缩比高,压缩速度快,压缩后 能保持信号与图像的特征不变,且在传递中可以抗干扰。小波在信号分 析中的应用也十分广泛,它可以用于边界的处理与滤波、时频分析、信 噪分离与提取弱信号、求分形指数、信号的识别与诊断以及多尺度边缘 检测等。在工程技术等方面的应用,包括计算机视觉、计算机图形学、 曲线设计、湍流、远程宇宙的研究与生物医学等方面。 6 神经网络编码( n e u r a ln e t w o r kc o d i n g ) 一1 在各种变换编码中,都是先作变换,然后再对系数进行取舍、量化 和编码以达到数据压缩的目的,但变换本身不仅不能压缩数据,还会增 加许多复杂的运算。神经网络的压缩方法是在这两点上对变换编码进行 有益的改进【4 5 1 。首先,它发展了一种广义变换编码。令输入矢量x r 川, 输出矢量为y r 朋,g 乙为非线性函数,于是定义: 。,占、 j m = g 备毛m + 们, m ( 1 1 ) ,为广义变换。显然,广义变换为一 降维交换( m c 。 。刀 y 。 z 么z 么 ! i a e 系数结束 图2 - 9量化d c t 系数的编排 表2 5z 型编排后量化d c t 系数的序号 ol561 41 52 72 8 2471 31 62 6 2 9 4 2 381 21 7 2 5 3 04 1 4 3 91 l1 82 4314 0 4 45 3 1 01 92 33 23 94 55 25 4 2 02 23 33 84 65 l5 56 0 2 l3 43 74 75 05 65 96 l 3 53 64 8 4 95 75 86 26 3 由前面的叙述可以看出,经过f d c t 和量化两个环节后,较高空间频率的 系数很小,大部分为零,因此,按z 字型的顺序调整系数的用意就是使为零的 高空间频率系数能够连在一起,以利于游程编码( r u n l e n g t hc o d i n g ) 。根据这 一点,应使和v 较小的系数排列在前面,z 字形顺序如图2 1 0 所示,图中a c i j 表示坐标为( i , j ) 的交流系数。 。a 图2 1 0z 字形顺序 a c 0 7 2 3 4 差分脉冲编码调制( d p c m ) 直流系数( d c ) 编码 差分脉冲编码调制 2 0 , 2 1 ( d i f f e r e n t i a lp u l s ec o d em o d u l a t i o n ,d p c m ) 是一种 预测编码技术,其原理是基于图像信号冗余度高的事实,当前的像素值可用与 它邻近的像素值预测获得。在预测编码中,不直接传输像素样值本身,而是对 实际样值与它的一个预测值之间的差值进行量化、编码、再传送,以达到很高 的压缩比,这个差值就是预测误差。实质上,反馈的信号是对输入信号的估计, 该输入信号是通过对被编码的抽样间差异进行积分来获得的。 d c 系数和a c 系数是分开来处理的。由于d c 系数是一块( b l o c k ) 图像 中像素值的平均值,其数值很大,相邻块之间的d c 系数又很大的相关性,即 相差不大,所以按照公式( 2 7 ) 计算: d e l t a = d c ( o ,o ) 七一d c ( o ,o ) 纠 r 2 - 7 、 其中d e l t a 为差值,为当前图块d c 系数减去上一个图块的d c 系数,运用差 分脉冲编码( d p c m ) 技术,对相邻块的d c 系数差值( d e l t a ) 进行编码,其编码 过程如图2 1 1 所示。 紧接着将d e l t a 转变成中间符号: s y m b o l - 1 s y m b o l - 2 : ( size)(amp l i t u d e ) 丌、 。a b l o c k i - i b l o c k i d i f f = d c i d c i - i 图2 1 1d c 系数的编码 s y m b 0 1 1 是d e l t a 的有效位位数( 以二进制来计算) ,记为s i z e 。 如果d a l t a 为3 ,贝l j s y m b o l - l 应为2 ,s y m b o l - 2 为幅度值( a m p l i t u d e ) 。 2 3 5 行程长编码( r l e ) 交流系数( a c ) 编码 量化a c 系数的特点是1 x 6 4 矢量中包含有许多“0 ”系数,并且许多“0 ”是连续 的,因此使用非常简单和直观的游程长度编码( r l e ) 对它们进行编码【1 7 , 2 1 】。 j p e g 使用了第一个字节的高4 位来表示连续“0 ”的个数,而使用它的低4 位 来表示编码下一个非“0 ”系数所需要的位数,跟在这个字节后面的第二个字节是 量化a c 系数的数值。 对于a c 系数,同样变成多个中间符号: s y m b o l 一1s y m b o l 一2 ( r u n l e n g t h ,s i z e )( a m p l i t u d e ) s y m b o l - 1 包含r u n l e n g t h 、s i z e 两部分。r u n l e n g t h 代表某一非零 a c 系数前面连续的a c 系数为零的个数,这是对为零的a c 系数进行游程编码。 s i z e 代表非零a c 系数的有效位数。这6 3 个a c 系数行程编码的码字用两 个字节表示,如图2 1 2 所示。这里要注意,s y m b 0 1 1 的长度是固定的,占八位, r u n l e n g t h 、s i z e 各占4 位,故r u n l e n g t h 最大值为1 5 ,它最多可以记 录1 5 个连续为零的系数。行程编码的两个字节的组成,如图2 1 2 所示。 位7654 3 210 第一个字节 位 第二个字节 、_ 。 ,i 一、。- p _ 一 两个非零值之间连续 下一个非零值所占 零的个数( 行程r u n i , e n g t h )的比特飒s i z e ) 7654 3 2 1 0 、_ - - - - 一产- - , 下一个非零系数的实际值 图2 1 2行程编码 上面,我们得到了d c 码字和a c 行程码字。为了进一步提高压缩比, 需要对其再进行熵编码,这里选用h u f f m a n 编码。 2 3 6 熵编码( e n t r o p yc o d i n g ) 在j p e g 有损压缩算法中,使用h u f f m a n 编码器来减少熵。使用h u f f m a n 编码器的理由是,可以使用很简单的查表( 1 0 0 k u pt a b l e ) 方法进行编码。压缩数 据符号时,霍夫曼编码器对出现频度比较高的符号分配比较短的代码,而对出 现频度较低的符号分配比较长的代码。这种可变长度的霍夫曼码表可以事先进 行定义。j p e g 系列的基本编码器,对d c 和a c 系数各有两张h u f f m a n 编码表。 如第一章所述,哈夫曼( h u f f m a n ) 编码 2 0 , 2 1 】是无损压缩编码的一种。哈夫曼 编码是h u f f m a n 于1 9 5 2 年为压缩文本文件建立的编码方法。它的基本原理是 频繁使用的数据用较短的代码代替,较少使用的数据用较长的代码代替,每个 数据的代码各不相同。这些代码都是二进制码,且码的长度是可变的。 下面给出具体的h u f f m a n 编码算法【3 , 2 5 : ( 1 ) 首先统计出每个符号出现的频率,上例s 0 到s 7 的出现频率分别为 4 1 4 ,3 1 4 ,2 1 4 ,1 1 4 ,1 1 4 ,1 1 4 ,1 1 4 ,1 1 4 ; ( 2 ) 从左到右把上述频率按从小到大的顺序排列; ( 3 ) 每一次选出最小的两个值,作为二叉树的两个叶子节点,将和作为它 们的根节点,这两个叶子节点不再参与比较,新的根节点参与比较; ( 4 ) 重复( 3 ) ,直到最后得到和为1 的根节点; ( 5 ) 将形成的二叉树的左节点标0 ,右节点标1 ,把从最上面的根节点到最 下面的叶子节点途中遇到的0 1 序列串起来,就得到了各个符号的编码。 产生h u f f m a n

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论