(计算机应用技术专业论文)基于聚类搜索的彩色分形图像压缩编码.pdf_第1页
(计算机应用技术专业论文)基于聚类搜索的彩色分形图像压缩编码.pdf_第2页
(计算机应用技术专业论文)基于聚类搜索的彩色分形图像压缩编码.pdf_第3页
(计算机应用技术专业论文)基于聚类搜索的彩色分形图像压缩编码.pdf_第4页
(计算机应用技术专业论文)基于聚类搜索的彩色分形图像压缩编码.pdf_第5页
已阅读5页,还剩53页未读 继续免费阅读

(计算机应用技术专业论文)基于聚类搜索的彩色分形图像压缩编码.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

捅安 为了完整、真实地保存一幅图片信息,需要详细记录每个象素点的颜色信息, 所占用的物理空问是极其庞大的。而这种图像在图像存储和图像传输等环境中几 乎是不可接受的,因此对图像进行数据压缩就被提到议事日程上来了。虽然近年 来图像信息压缩技术取得了飞跃性的进步,但因其数据量极其庞大,它的实用化 步伐仍未达到人们的期望,因此图像压缩仍然是广大图形图像工作者致力研究的 重要课题。而分形技术作为一种全新的图像压缩方法,其潜力是巨大的、令人期 待的。 本文首先介绍了图像压缩技术的发展和应用,图像信息压缩的基本途径、图 像压缩标准、图像质量评价标准,并对图像压缩的相关知识如人眼的视觉特性、 色彩空间进行了较为系统的介绍。 本文在第三章对分形技术的原理,在图像压缩上的应用进行了详细的介绍, 包括它的数学基础、基本理论、两种基本的分形图像压缩算法以及各种改进方法。 最后在基于上述压缩编码方法和分形编码研究的基础上,本文提出了一种基 于二次聚类的分形图像压缩方法,并采用色彩空间的相互映射将三维色彩信息压 缩为一维进行编码,大大减少了编码时间。同时利用图像的亮度均值来恢复图像, 不但能够减少迭代次数,还可进一步利用熵编码提高压缩比。实验结果表明,本 文提出的基于二次聚类的分形图像压缩方法具有耗时少、压缩比比较高等特点。 关键词:分形图像压缩,仿射变换,聚类,i f s 迭代函数系统 中图分类号:t n 9 1 9 8 1 a b s t r a c t t ot r u l ys t o r et h ei n f o r m a t i o no fap i c t u r e ,w en e e dt or e c o r dt h e c o l o ri n f o r m a t i o no fe v e r yp i x e ld e t a i l l ya n dt r e m e n d o u sp h y s i c a ls p a c e a r er e q u i r e d b u tt h i si su n a c c e p t a b l ei nn e t w o r ke n v i r o m e n t s ot h ei s s u e o fi m a g ec o m p r e s s i o nw a sa r o s e d t h o u g ht h e r eb a dm a n yg r e a tp r o g r e s so f t h et e c h i n i q u eo fp i c t u r ei n f o r m a t i o nc o m p r e s s i o ni nr e c e n ty e a r s ,i ti s f a ra w a yt op e o p l e se x p e c t a t i o n t h e r e f o r e ,a c t i v er e s e a r c hi sb e i n g c a r r i e do u tt od e v e l o pe f f i c i e n ti m a g ec o m p r e s s i o n t e c h n i q u e s f r a c t a l b a s e dc o d i n gc o n t i n u e st oa t t r a c ti n t e r e s t ,b e c a u s eo f i t s i n t e ll e c t u a la p p e a la n dv e r ys i m p l ed e c o d e r f i r s tt h ed e v e l o p m e n ta n da p p l i c a t i o n so fi m a g ec o m p r e s s i o n t e c h n i q u e s 、s e v e r a lc r i t e r i o n so fi m a g ec o m p r e s s i o na n di m a g eq u a l i t y a s s e s s m e n ta r es p e c i f i e di nt h et h e s i s t h e ns o m ef o u n d a t i o n a la c k n o w l e d g e o fi m a g ec o m p r e s s i o ni si n t r o d u c e d ,s u c ha sh u m a nv i s u a lc h a r a c t e r i s t i c , c o l o rs p a c e d e t a i l e di n t r o d u c t i o na b o u tf r a c t a li m a g ec o m p r e s s i o ni sg i v e ni n c h a p t e ri i i ,w h i c hi n c l u d e si t sm a t h e m a t i c a lf o u n d a t i o n ,t h e o r i e s ,2b a s i c a l g o r i t h ma n ds o m ei m p r o v i n gm e t h o ds o ft h e s ea l g o r i t h m a f t e rt h e s ean o v e lm e t h o do fr e d u c i n gt h ec o m p u t a t i o nc o m p l e x i t yf o r c o l o ri m a g ec o m p r e s s i o ni sp r o p o s e di nt h i sp a p e r t h em e t h o di sb yu s i n g t w i c ec l u s t e r i n gt oi m p r o v et h ec o m p r e s s i o ne f f i c i e n c y ,a n dm e a nv a l u e i n s t e a do fd i f f e r e n c ei su s e dt oa c h i e v eh i g h e rc o m p r e s s i o nr a t i o n sa n d b e t t e rf i d e l i t y t h ep r o p o s e dm e t h o dh a sb e e nr e a l i z e du n d e rt h e m i s c r o s o f tv i s u a lc + + 6 0i n t e g r a t e dd e v e l o p m e n te n v i r o n m e n t ( i d e ) t o c o m p r e s st h ec o l o ri m a g ea n d t h ee x p e r i m e n t a lr e s u l t si m p r o v e dt h a tt h e m e t h o dw ei n t r o d u e e di sag o o dw a yt oc o m p r e s sc o l o ri m a g ew i t hh i g hs p e e d a n db e t t e re o m p r e s s i o nr a t e k e yw o r d s :f r a c t a li m a g ec o m p r e s s i o n ,a f f i n et r a n s f o r m ,c 1 u s t e r i n g i t e r a t i v ef u n c t i o ns y s t e m 引言 分形( f r a c t a l ) 理论是美国数学家b e n o i tb m a r l d e b r o t 于2 0 世纪 7 0 年代提出的,在之后的二十多年中,对多种学科产牛了巨大的影响。分形图 像压缩方法则是利用自然界广泛存在的自相似性,以简单的仿射变换组合对图像 进行喃损压缩,可得到较高的压缩比。但由于分形图像压缩的计算复杂度较高, 计算量较大,限制了这一方法在现实中的应用,因此,人们一直试圈改进现有的 分形图像压缩方法,使之更加快速和有效。本文提出一种基于均值的二次聚类技 术改进分形图像压缩的方法,在保证图像恢复质量的前提下,降低了分形图像压 缩的计算复杂度,提高了压缩及解码速度,并得到了较高的压缩比。 1 1 论文背景 1 1 1 图像压缩的意义 第一章绪论 近二十年来,随着计算机技术的飞速发展,多媒体技术和i n t e r n e t 互联网 技术的广泛应用加速了全球信息高速公路的建设。越来越多的信息以图像方式传 送。但由于图像信息包含二维或三维空间上的扩展信息或时间变化的信息,因而, 与作为代码信息的文字或作为一维信号的声音相比,其数据量是巨大的。如考虑 中分辩率( 8 0 0 6 0 0 ) 的情况下,全屏幕显示( f u l ls c r e e n ) ,真彩色( t r u ec o l o r 2 4 位) ,全动作( f u l lm o t i o n ,2 5 3 0 帧秒) 的图像序列,播放1 秒钟的视频画 面数据量为: 8 0 0 6 0 0 3 3 0 = 4 3 ,2 0 0 ,0 0 0 字节 相当于存贮两千多万个汉字所占用的空间。即使降低彩色性逼真要求,量化为8 位灰度,每秒显示2 5 帧,数据量也达: 8 0 0 6 0 0 2 5 = 1 2 ,0 0 0 ,0 0 0 字节 如此庞大的数据量,给图像的传输、存贮以及读出等造成了难以克服的困难,例 如在基于i n t e r n e t 的多媒体通信中,虽然目前美国的主干网速率已达1 5 5 m b p s , 面向最终用户的局域网的速率也有l o m b p s 或l o o m b p s ,如此高的传输速率仍无 法完全满足视频通讯等应用的巨大数据量。 为利用现实中可利用的信道和存储媒体,用适当的成本进行通信、存储,有 必要在保持原图像中包含的本质信息基础上,对数据进行压缩。另外,通过数据 压缩,可以实现诸如统一容量信道传送多个电视节目,或在一个存储媒体中存储 由图像、影像、音频、图形构成的复合信息,提供多种多样服务。 图像压缩就是在没有明显失真的前提下,将图像的位图信息转变成另外一种 能将数据量缩减的表达形式。首先,尽管图像中数据量很大,但数据之间不是完 全独立的,图像中存在着各种各样的相关性或冗余信息。即一部分数据可以由另 一部分数据完全推算出来。其次,大部分图像视频信号的最终接收者都是人眼, 而人类的视觉系统是一种高度复杂的系统,它能从极为杂乱的图像中抽象出有意 义的信息,并以非常精练的形式反映给大脑。人眼对图像中的不同部分的敏感程 度是不同的,如果去除图像中对人眼不敏感或意义不大的部分,对图像的主观质 量是不会有很大影响的。 1 1 2 图像压缩技术的应用 正由于图像压缩的必要性和可能性,图像压缩编码研究成为一个越来越活跃 的领域。在诸如基于i n t e r n e t 的多媒体通信、可视电话、数字电视,多媒体计 算机等领域得到了广泛的应用。表1 1 列出了图像信息压缩技术的一些应用实 例。 表1 1 图像压缩技术的应用 图像信号种类应用实例 运动图像广播h d t v 图像,标准制式电视图像,c a t v & c c t v 运动图像通信 会议电视图像,可视电话图像,监控图像,i n t e r n e t 应用,医疗应用程序 运动图像记录 c d - r o m , d v d r o m 记录的图像,移动存储应用 静止图像数字照相,彩色传真,遥感图像,数字图书馆 1 2 图像压缩技术的发展现状 图像编码技术包括三个主要方面:1 ) 图像压缩新算法的研究。2 ) 基于v l s i 技术的压缩算法的硬件实现。3 ) 面向不同应用场合的压缩编码标准的制定。其中, 压缩算法的研究是图像编码技术的关键。 1 2 1 图像信息压缩的基本途径 图像的各个象素一般都有某种程度的相关性,即图像事实上包含大量的冗余 成分。通过将这些冗余成分加以消减,就能够达到相当程度的信息压缩。表1 2 对图像信息压缩中将成为消减对象的各种图像冗余度进行了归纳分类。 表1 2 图像信息压缩中可利用的各种冗余度 种类内容压缩方法举例 空间冗余度取决于图像中图案粗细程度的冗余预测编码,变换编码 时间冗余度取决于图像随时间变化程度的冗余帧间预测,运动补偿 结构冗余度把图像看作是区域集时的结构性冗余 轮廓编码,区域分割编码 知识冗余度与收发端所共有的知识相关联的冗余智能编码 熵冗余度代码出现概率不均匀所产生的冗余熵编码 视觉冗余度 起因于人的知觉有限性的冗余 非线性量化,比特分配 其他冗余度 起因于图像非平稳性的冗余各种自适应编码 空间冗余度是指一幅图像内所包含的冗余度,如规则条纹图像和平坦图像。 这类图像的相邻像素之间相关性很强,可以根据已编过码的像素来对下一待编码 像素进行某种程度的预测。这样只需抽出不可预测到的成分进行编码,图像可望 得到大幅度的信息压缩。基于这种思想的编码称为、厉删纺殍( p r e d i c t i r e c o 出n g ) 。 从频率域来看,相关性强的信号常表现为能量集中于某些特定频率成分上。 这时可对信号先做时频域变换,然后只对能量集中的频率成分系数进行编码。图 像编码中目前用得最多的是二维庸膨余弦芟攒( d c t ;d i s c r e t ec o s i n e t r a n s f o r m ) 。基于这种原理的编码称为受镤笳碍( t r a n s f o r mc o d i n g ) 时间冗余度是指可视电话等运动图像,画面内容随时间变化有限的情形,消 除这种冗余度的编码方法有财彻厨;婀笏碍( z n t e r f r a s n ep r e d i c t i v ec o d i n g ) 运动补偿预溉编码( m o t i o n - c o m p e n s a t e dp r e d i e t i v ec o d i n g ) , 上述的编码,是将图像看作随机信号来削减其统计冗余度,现在的高效编码 方式几乎全都基于这种思路。而另一种思路则是着眼于图像结构及编码对象共有 的一些特性进行编码,以此来提高压缩冗余度的效果。如区砑分割翁膨 ( s e g m e n t a t i o nc o d i n g r e g i o n o r i e n t e dc o d i n g ) 。智能编码( i n t e l l i g e n t c o d i n g k n o w j e d g o _ b a s e dc o d i n g ) 。 由于人眼视觉的特性,一些人眼觉察不到的成分从图像编码的观点来看是一 种冗余度,只是这样的编码必然会包含失真,成为班_ 可:递翁殍( n o n - r e v e r s i b l e c o d i n g ) 。这种编码方法在广播电视及可视电话中得到了广泛应用。 如果图像是非平稳的,则编码器的参数就难以保持固定,需要对编码参数进 行自适应控制。如,自适应减采样,自适应预测,自适应量化,自适应代码分配。 表l - 3 对各种信息压缩方法按算法类别进行了归纳。 h a d a m a r d 变换,s 1 a n t 变换,k l 变换,小波变换 一维变换,二维变换,三维变换 区域编码,自适应变换 矢量量化 平均值分离标准化v q ,g a i n s h a p ev q ,多极v q 全搜索v q ,树形搜索v q 分层编码位平面编码,电平平面编码 逐次再生编码 频带分割编码子带编码,块分割编码 结构抽取编码轮廓编码,区域分割编码,分形编码 分析综合编码,辨识综合编码,智能编码 熵编码哈夫曼编码,游程编码,算术编码 1 2 2 图像压缩标准 图像编码技术的需求和发展促进了图像压缩这一领域国际标准的制定。国际 标准化组织i s o ( i n t e r n a t i o n a ls t a n d a r d i z a t i o no r g a n j z a t i o n ) ,国际电工 委员会i e c ( i n t e r n a t i o n a le l e c t r o t e c h n i c a lc o m m i s s i o n ) 和国际电信联盟 i t u ( i n t e r n 8 t i o n a lt e l e c o m m u n i c a t i o nu n i o n ) 等国际组织先后制定了一系列 的图像编码国际标准,如j p e g ,h 2 6 1 ,m p e g 等,涉及的应用范围包括多媒体、 数字电视、h d t v 、可视电话、视频会议等图像的编码传输。 j p e g 1 9 8 6 年由i s o 和国际电报电话咨询委员会c c i t t ( c o n s u l t a t i v ec o m m i t t e e o fi n t e r n a t i o n a lt e l e g r a p ha n dt e l e p h o n e ,i t u 的前身) 联合成立了联合图 片专家组j p e g ( j o i n tp h o t o g r a p h i ce x p e r tg r o u p ) ,致力于研究静止图像压 缩标准。经过深入细致的工作,于1 9 9 4 年推出了j p e g 正式标准,采用8 x 8 的 自适应d c t ( a p c t :a d a p t i v ed i s c r e t ec o s i n et r a n s f o r m ) 方案,使用加权函 数对d c t 系数进行量化,并对量化系数采用霍夫曼可变字长编码器进行编码。图 1 1 为j p e g 编解码系统原理框图。 j p e g 标准按功能有限次序分为b a s e l i n e s y s t :m ( 最符拦秦统) ,e x t e v d e d s y s i e m ( 扩展系统) , i n d e p e 3 毋e n tf u c t i ( 独立功黝三类,是暇状j p e g 标准的所有系统都必须具有的功能;采用累进编码,将d c t 系数按不同方法分 解后多次传送;是一种实现信息保持型编码方式的功能,采用邻近的三个像素 进行预测编码,预测误差则用d c t 的d c 系数编码方式对预测误差值本身进行编 码和传送。其中应用最广泛的是b a s e l i n es y s t e g o 但这一标准存在着当压缩率 较高时,通常大于3 0 :1 的情况下,解压后的图像中就会出现块状伪迹( 即马赛 克) 。 l 坠查ll 些壁i ( a ) d c t 基压缃塘码步骤 i ) c t 基解聪; d o t 基鼐匝辅步骤 图1 1j p e g 编解码系统框图 j p e g 2 0 0 0 随着编解码技术的进一步发展,特别是分形和小波技术的出现为研究图像数 据的更强有力的压缩提供了可能性。j p e g 委员会于2 0 0 0 推出的新一代j p e g 2 0 0 0 标准,采用了小波变换,位平面编码和算术编码,具有在分辨率和质量两方面允 许可伸缩性的能力。其目的是提高图像的压缩质量,特别是低码率的压缩质量, 同时支持码流的渐进传输和随机存取等。j p e g 2 0 0 0 编解码原理图如下 墨刮蛩雕 叫亟1 燃码 - - 彝位移i7 l 量变换i 呕 墨 熵解码 反向 量化 ( a ) j p e g 2 0 0 0 编码器 反向小 波变换 反向分 最变换 反向d c 电平位移 ( b ) j p e g 2 0 0 0 解码器 图t 2j p e ( ;, 2 0 0 0 编解码系统框图 j p e g 2 0 0 0 包括下列7 个部分: j p e g 2 0 0 0 图像编码系统 扩充( 给部分1 的核心定义添加更多的特征和完善度) 运动j p e g 2 0 0 0 一致性 参考软件( 目前包含j a v a 和c 实现) 复台图像文件格式( 用于文件扫描和传真应用程序) 对部分1 的最小支持( 技术报告) 。 其中定义了核心压缩技术和“最小文件格式”。到定义了压缩和文件 格式的扩充。文件含有的扩充并不妨碍的阅读程序执行的功能。这就保证了 客户的互操作性。 j p e g 2 0 0 0 所具有的特点有: 元数据:元数据被定义为与图像一起进位的数据,目的是提高全局文件或含 有数据的系统的值。元数据与图像一起循环,因此与图像内容密切相关。例如, 元数据可含有以字符显示的描述、作者的名字、创作日期、版权记载、使用条件、 创作参数等。 图像登记:图像登记过程给简单的标识符提供了识别图像的能力,称为 l i c e n s e p l a t e ( 特许板) ,其中包括登记权限( r a ) ,记录请求并传递在j p e g 中被 定义为三逻辑框标识符的标识符。其结构如下:1 6 位用于国家识别,1 6 位用于 国家内r a ,3 2 位用于4 0 亿个单独的标识符。 水印:防止图像内容剽窃或不适当使用。水印将某种信息隐藏于图像数据 之内,眼睛看不见但可以探测得到,它携带着用于链接的足够的信息。现在的提 案是把6 4 位用于给图像加水印,6 4 位恰好是由作为l i c e n s e p l a t e 的登记权限 传递的标识符。 使人感兴趣的区域r o i ( r e g i o no fi n t e r s t ) : 很多种情况下,图像的某 个部分即使人感兴趣的区域比图像的其他部分需要更详细地访问。在j p e g 2 0 0 0 中设计了两种访问r o i 的方法,即有源法和无源法。有源r o i 是整个图像是以高 分辨率存储的,需要图像服务器来传递所选部位细节显示所需要的代码。无源 r o i 是创作者根据j p e g 2 0 0 0 编码过程的可伸缩性,通过额外分辨率或额外质量 对使人感兴趣的区域加以编码。 d c t ,分形和小波压缩技术:d c t ,分形和小波均是算法逼近,目的是试图把 数据变为其他的更容易压缩的数据。在d c t 的情况下是高频率数据;在小波变换 的情况下是高度详细数据。分形方法则以更为简明的方法直接表示数据。 在高压缩率时, p e g 2 0 0 0 没有采用j p e g 时的马赛克现象,但在边缘会出现 飞蚊效应( m o s q u i t oe f f e c t ) 。对于同样的图像,j p e g 2 0 0 0 在5 0 :1 的压缩比 时获得的图像质量与采用j p e g 时3 0 :l 的质量差不多。 h 2 6 1 建议 h 2 6 1 建议是c c i t t 第1 5 研究组( s g x v ) 制定的序列灰度图像压缩标准,主 要应用于会议电视和可视电话业务。它利用基于d c t 的压缩方法对参考帧进行压 缩,以减少帧内冗余度。同时估计目标的运动,以确定如何压缩下一帧,减少帧 间冗余。 m p e g 1 9 8 8 年,i s o 和i e c 联合成立了活动图像专家组m p e g ( m o v i n gp i c t u r e s e x p e r t sg r o u p ) ,随后推出了多个活动图像压缩标准。m p e g 一1 旨在解决多媒体 的存储问题,主要应用于数字存储媒介中活动图像和伴音的编码表示,数码率约 为i 5 m b p s 。m p e g 一2 则是为了满足数字存储媒体、电视广播及通信等领域的需求 而推出的,数码率可达l o m b p s 。m p e g 一4 的目标是达到低比特率下的多媒体通信 和多业务的多媒体综合,具有内容交互性、灵活和可扩展性等重要特征。m p e g 7 致力于视听数据的信息编码表达,是对多媒体材料描述通用接口的标准化。 m p e g 一2 1 的主要工作方向是综合地利用不同层次的多媒体技术标准,最终目的是 试图从消费者的角度出发,通过自上而下地建立一个交互式的多媒体框架来跨越 大范围内不同的网络和设备,以保证用户能透明而广泛地使用多媒体资源。 1 3 图像质量的评价 1 3 1 图像质量的主客观评价 图像的最终接收者是人,因而图像质量的好坏取决于人的主观判断。由于目 前尚未掌握视觉机能系统与画质评价之间的总体关系,因而画质主要是直接由人 来进行主观评价。 主观画质评价试验有许多方案,常用的有堀整缮( m e t h o d o f a d j u s t m e n ) , 极限法( m e t h o d o f l i m i t s ) ? 恒值法( c o n s t a n t m e t h o d ) , 排亭法( o r d i n a l m e t h o d ) , 评定尺麦法( r a r i n gs c a l em e t h o d ) 穿确范畴法( m e t h o do fs u c c e s s i v e c a t e g o r i e s ) 配对比较法( m e t h o do fp a i r e dc o m p a r i s o n ) ? 谢菲配对比较法 ( s c h e f f e 7 sm et h o do fp a r i e dc o m p a r i s o n ) 。一般情况下,前三种方法多 用于图像闽值的评价,后5 种方法多用于对图像构成心理尺度的目的。 而对画质的客观评价,由于视觉机能系统尚未完全掌握而难以有一个系统的 评价方法,但可以通过生物体其它感觉的测量,利用其测量结果来判断系统的好 坏。在这种客观评价中,与视觉系统有关的多是测量眼球转动、眼焦距调节、瞳 孔反应等,也有测量身体重心移动和头部运动等项目的。这类测试在图像系统的 基本参数评价中用得比较多。 1 3 2 图像压缩性能评价 图像压缩分为有损压缩和无损压缩两类。在有损压缩中,编码后恢复的图像 与原图像存在偏差。为评价数据压缩性能,人们引入了保真度准则来度量这种偏 差。常用的准则有客观保真度和主观保真度。 客观保真度 令,h ) 1 为原始图像,n ) 为解压图像,p ,2 赢雨蚤蚤厂,n ) 为 f ( m ,n ) 的均值,则可用作客观保真度度量的有离散均方差 v i s e ,信噪比s n r , 峰值信噪比p s n r : m s e = 嘉薹孙m 棚一;叫2 , s n r = l o l g 20191藤葡f(m,n)-怯鞠赫州。 ( 1 ,2 ) ( 1 3 ) 在相同压缩比下,m s e 越小,性能越好,而s n r 和p s n r 则越大性能越好。 主观保真度: 主观画质评价是对重建的图像质量进行划分评级,常用的分级评价有质量等 级( q u a l i t ys c a l e ) 、优良等级( g o o d n e s ss c a l e ) 及缺陷等级( i m p a i r m e n t s c a l e ) 。质量等级的分级描述如下: 1 0 无损( 1 0 s e l e s s ) :没有损失,每一b i t 都相同 9极好( p e r f e c t ) :在并排的2 0 ”1 0 2 4 7 6 8 的显示器上比较原图像和重 建图像,两者没有差别 8透明( t r a n s p a r e n t ) :在2 0 ”1 0 2 4 x7 6 8 的显示器上间隔一分钟比较原 图像和重建图像,没有差别 7 有吸引力的( a p p e a l i n g ) :对于没有见过原图像的,只有原图像具有的 缺陷能被发现 6一致( a g r e e a b l e ) :画质足够好而不需要原图像 5可接受( a c c e p t a b l e ) :对没有见过原图像的来说是幅好的图像 4 有用的( u s a b l e ) :质量一般的图像 3 糟糕( c r y a b l e ) :有明显的问题 2 可笑( 1 a u g h a b l e ) :可用于识别出原图像 1 无用( u s e l e s s ) :不能识别出原图像 表1 4 给出了质量等级、优良等级、缺陷等级之间的大致对应关系。 表1 4 主观质量评级对应表 q u a li t ys c a l e g o o d n e s ss c a l e i m p a i r m e n ts c a l e l o 1 0 s e l e s s 5e x c e l l e n t1 n o tn o t i c e a b l e 9 p e r f e c t 5e x e e l l e n t1n o tn o t i c e a b i e 8 t r a n s p a r e n t 5e x c e l l e n t2 j u s tn o t i c e a b l e 7 a p p e a l i n g 4 g o o d 2n o tn o t i e e a b l e 6 a g r e e a b l e 4 g o o d 3 d e f i n i t e l yn o t i c e a b l e 5a c c e p t a b l e3f a i r3d e f i n i t e l yn o t i c e a b l e 4u s a b l e3f a i r4 i m p a i r m e n t 3 c r y a b l e 2 p o o r 5s o m e w h a to b j e c t i o n a b l e 2 l a u g h a b l e 1u n s a tis f a c t o r y6 d e f i n i t e l yo b j e c t i o n a b l e lu s e l e s s1u n s a tis f a c t o r y7 e x t r e m e l yo b j e c t i o n a b l e 1 3 本文的工作 本文就图像压缩的相关知识如人眼的视觉特性、图像压缩标准、图像质量评 价标准及色彩空间进行了较为详细地介绍。然后对分形技术的原理,在图像压缩 上的应用进行了细致的叙述分析。分形是利用图像中小尺度的细节与大尺度细节 的某种自相似性,通过收缩变换来实现图像压缩。分形可实现很高的压缩比,具 有广阔的发展前景。但由于分形编码过程非常耗时,为减少编码时间,本文提出 了二次聚类的方法来加速分形编码,同时使用亮度均值来代替亮度调节参数,以 提高图像解码质量。本文安排如下: 第一章:绪论图像压缩技术的发展应用,图像压缩标准及图像质量的评估 等。 第二章:图像压缩的视觉基础和色彩表示,对基本的视觉特性以及在图像信 息压缩中要考虑的内容加以总结,并介绍了常用的一些彩色信息表达模型,如 r g b 色彩空间、h s i 色彩空间、y u v 色彩空间等。 第三章:分形压缩编码详细介绍了分形技术的基本理论,分形编码的基础 拼贴原理,基本算法及近年来所提出的改进方法等。 第四章:提出了一种基于二次聚类搜索的的混合压缩编码方法,并利用亮度 均值来解码,列出了具体的算法实现和试验结果。 第五章:总结和展望。 第二章图像压缩的视觉与色度学基础 2 1 人眼的视觉特性 在实际应用中,许多图像处理结果是由人的视觉来解译的,因此需要了解人 的视觉特性与色度学知识。 视觉不仅具有获得信息还具有处理和分析信息的功能,还是人类从大自然获 取信息的最主要的手段。据统计,在人类获取的信息中,视觉信息占6 0 ,听觉 信息占2 0 ,其它的如味觉信息、触觉信息加起来约占2 0 。由此可见,视觉信 息对人类的重要性,而图像正是人类获取视觉信息的重要手段。人对图像的灰度、 对比度、色调、结构及其变化的感觉是通过光的反射、传输作用到视觉系统而形 成的。所谓“图”,就是物体透射或反射光的分布;“像”是人的视觉系统接收 视觉信息而在人的大脑中形成的印象或认识。阿者是客观存在的,而后者是人的 感觉,图像是两者的结合,因此,人眼视觉特性的研究对于如何更有效地进行图 形压缩具有指导意义。 2 1 1 视觉范围和视觉适应性 视觉范围是指人眼所能感觉的亮度范围,这个范围非常宽,因为眼睛的感光 作用有随外界光的强弱而自动调节的能力。这种调节能力也称眼睛的适应性。但 人眼并不能同时感受这样宽的亮度范围,在人眼适应了某一平均亮度的环境之后 所能感受的亮度范围要小得多。通常,在适当平均亮度下,能分辨的亮度上、下 限之比为1 0 0 0 :1 ;当平均亮度很低时,这一比值只有1 0 :1 。1 。 人眼感光的适应性表现在以下几方面; 1 ) 暗适应:当人们从阳光下走进较暗的房屋,就会感到一片漆黑。稍待片 刻( 几分钟乃至十几分钟) ,视觉才能逐渐恢复。人眼的这种适应暗环境 的功能称为暗适应力。适应过程一般在3 0 分钟左右达到稳定。 2 ) 亮适应:人们在日常生活中都会有这样的体会,当在黑暗里打开电灯时, 很快就能分辨出景物( 包括明暗与彩色) 。这说明环境由暗变到亮时,锥 状细胞很快就恢复了作用,并约在一分钟内达到稳定。 3 ) 局部适应。当视网膜上某点受到强光照射时,这一点的视敏度就与其它 部位的不同。当再看均匀亮度背景时,就会感到背景中相应点呈现黑色。 这是由于受强光照射的光敏细胞的灵敏度还来不及恢复的缘故。这就是 黑林( h e r i n g ) 色颉抗原理,在人眼视网膜上有六种基本的色感觉成颉 抗的出现,即红一绿、黄一蓝、白一黑。 与亮度适应类似,人眼还具有随光谱分布变化而对颜色刺激灵敏度变化的颜 色适应特性。例如,用强红光刺激眼睛后再看本来是黄色的物体却看成是绿色的, 这种依赖光谱分布的视觉灵敏度现象称为色适应。 2 1 2 同时对比效应 物体的亮度和色度受周围背景的影响而使人产生不同感觉的现象叫同时对 比效应。它是由视觉适应性引起的,包括亮度对比和颜色对比。 亮度对比:人眼对某个区域感觉到的亮度不仅依赖于它自身的亮度,还与它 的背景有关。如图2 1 所示,大小、亮度相同的灰色小方块处于不同亮度背景之 中,由于背景亮度不同,人眼所感觉到的亮度也不同。在黑色背景下,灰色方块 的主观亮度感觉要强一些。 图2 1 亮度对比 色度对比:在图像的色度一样而背景不同的情况下,感觉到的图像的色度也 不一样。用同样大小的红色方块在亮度相等的灰色和红色背景下,会感到红色背 景上的方块饱和度较低。这是一种彩色饱和度对比效应,如图2 2 a 所示。另外, 当把桔红色的方块放在红色背景下观看时,会感到比单独观看时更黄些。这是一 种色调对比效应。如图2 2 b 所示。彩色样品的面积不同也会使色感有所不同。 面积大的样品与面积小的相比,给人以亮度和饱和度都强一些的感觉。这是物体 面积对比效应,如图2 2 c 所示。 a 饱和度比对b 色调对比c 面积对比 图2 2 色度对比 2 1 3 对比灵敏度 人眼对不同波长的光有不同的敏感度,波长不同而辐射功率相同的光不仅给 人以不同色彩的感觉,而且亮度的感觉也不同。人眼对亮度光强变化的响应是非 线性的,通常把人眼主观上刚刚可辨别亮度差别所需的最小光强差值称为亮度的 可见度闽值。也就是说,当光强l 增大时,在一定幅度内感觉不出,必须变化到 一定值l + al 时,人眼才能感觉到亮度有变化。al l 一般也称为对比灵敏度。 因此恢复图像的误差如果低于对比灵敏度,就不会被人眼察觉。图2 3 显示了人 眼的亮度感觉与实际亮度之间的关系。 翟 捌 棣 ,搿 矿 j ,白 一, 并嚣壤 睦 袅鹰 尾特) 图2 3 人眼的亮度感觉 对于不同亮度的背景,人眼能觉察到的最小亮度差异l 也不同,即人眼分 辨亮度的能力与背景亮度有关。根据韦伯一费希纳( w e b e r f e c h n e r ) 定律,视觉 产生的亮度感觉e 与亮度值l 的对数成正比。当背景亮度l s 与中央亮度l 。相等 的情况下,l 随l b 增大而增大,韦伯定律成立。若l s 大于l 。,则在某个一定 的l 。以下,l 将比l 。= l 。时大。 由于人眼对于运动图像的对比灵敏度与时间轴上信息的变化速度有关,随着 时间轴变化频率的增加,人眼所能感受到的图像信息的误差阈值呈上升趋势,视 觉上的这种动态对比灵敏度特性表现为图像序列之间相互掩盖效应。可见度阂值 和掩盖效应对图像编码量化器的设计有重要作用,利用这一视觉特性,在图像的 边缘可以容忍较大的量化误差,因而可使量化级减少,从而进行高效编码。 2 1 4 视觉惰性 视觉惰性是人眼的重要特性之一,它描述了主观亮度与光作用时间的关系。 当一定强度的光突然作用于视网膜时,人眼并不能立即产生稳定的亮度感觉,而 须经过一个短暂的变化过程_ 才能达到稳定的亮度感觉。在过渡过程中,亮度感觉 先随时间变化由小到大,达到最大值后,再回降到稳定的亮度感觉值,图2 4 显 示了在不同亮度下亮度感觉随时间的变化过程。 另外,当作用于人眼的光线突然消失后,亮度感觉并非立即消失,亮度感觉 并非立即消失,而是近似按指数规律下降而逐渐消失的。图2 5 显示了人眼对于 较短时间的光脉冲b 0 的亮度感觉s 变化的情况。 i i 、5 4l 也嘶 蕊 。、 、 j - 一、 多 霄 丝 _ - h _ 一 一 l f 1 f 图2 4 不同亮度下亮度感觉与时间关系图2 5 视觉惰性 当光线消失后的视觉残留现象称为视觉暂留或视觉残留。人眼视觉暂觉留时 间,在日间视觉时约为0 0 2 秒,中介视觉( 介于日视觉与夜视觉之间的状态) 时为0 1 秒,夜间视觉时为0 2 秒。人眼亮度感觉变化滞后于实际亮度变化,以 及视觉暂留特性,总称为视觉惰性。 2 1 5 视觉的瞬时特性 1 ) 对于亮度相同但持续时间不同的闪光,当其持续时间低于某个i 临界值时 人眼是觉察不到的,这个临界值大约是3 0 m s 。眼睛适应黑暗的时间越久, 1 4 、m j 6e 量 这个临界值越长。 2 ) 当观察一束缓慢闪烁的光时,单个的闪烁是观察不到的。当闪烁高于临 界停闪频率c f f ( c r i t i c a lf u s i o nf r e q u e n c y ) ,闪烁变得不被察觉。 通常c f f 不超过5 0 6 0 h z 。 3 ) 人眼对于高频闪烁比低频闪烁更为敏感。 以上三方面表明视觉的瞬时特性对于处理运动图像以及涉及静态图像的显 示有着重要意义。 2 1 6 马赫带效应 图2 5 是一幅条状灰阶图像,每个竖条内的亮度是均匀分布的,而相邻两条 的亮度则相差一个固定值。但人眼的亮度感觉却认为各竖条内的亮度不是均匀分 布的。当亮度发生跃变时,会有一种边缘增强的感觉,视觉上会感到亮侧更亮, 暗侧更暗。这种亮度出现变化的地方出现亮条纹和暗条纹的感觉称为马赫带效 应。 马赫带效应会导致局部闽值效应,即在边缘的亮侧,靠近边缘像素的误差感 知闽值比远离边缘闽值高3 4 倍,可以认为边缘掩盖了其邻近像素,因此对靠近 边缘的像素编码误差可以大一些。 2 2 色彩空间 图2 5 马赫带效应 人类色觉的产生是一个复杂的过程。不同频率的电磁波通过反射或透射的方 式传递到眼睛,被视网膜细胞接受引起神经信号,人的视觉系统将不同频率的电 磁波感知为不同的色觉。人类的视觉系统所能观察到的光波段范围从3 8 0 h m ( 紫 色) 到7 8 0 n m ( 红色) “1 。我们称这一波长范围的光为可见光波段。图2 6 显示 了媳型的人眼所感受到的可见光波段。 短波 长波 伽玛射线z 射钱紫外光 可见光缸外光 无栈电皱 图2 ,6 可见光波段 颜色的表示方法大体有两种。一种是设置一套作为标准的颜色样本,通过测 试的颜色与样本比较来表示。另一种方法是建立刺激光的物理性质和色感觉的对 应关系,用相应的量来表示光的物理性质。目前,使用最广的视觉色彩空间c i e 就是这样一种表色系统。 2 2 i 色觉与色度学基础 人对彩色光的感觉通常用亮度( b r i g h t n e s s ) 、色调( h u e ) 和色饱和度 ( s a t u r a t i o n ) 来表征。亮度是人眼所感受到的光的明暗程度,一般来讲,彩色 光的能量大则显得亮,反之则显得暗,如果没有色彩,则只有亮度的一维变化。 色调反映了彩色的类别,如红、绿、蓝,它取决于彩色光的光谱成分。色饱和度 是指彩色光所呈现的彩色的深浅程度,取决于彩色光中混入自光的数量,随着白 光的加入,饱和度逐渐减少。对于同一色调的彩色光,饱和度越高,颜色越深, 饱和度越小,颜色越浅。色调和饱和度合称为色度,它既表明颜色类别,又表明 颜色深浅。 视网膜上的视锥细胞有三种类型:红敏细胞、绿敏细胞、蓝敏细胞。红、绿 和蓝三种锥体细胞对不同频率的光的感知程度不同,对不同亮度的感知程度也不 同,因此不同组成成分的可见光就呈现出不同的颜色,其相对视敏函数曲线如图 2 7 所示。根据格拉斯曼定律,视觉亮度对颜色的反应取决于红、绿、蓝三个输 入量的代数和,并可得到如下结论: 1 ) 所有颜色都可以用相互独立的三基色混合得到。 2 ) 假如三基色的混合比相等,则色调和色饱和度也相等。 3 ) 任意两种颜色相混合产生的新颜色与采用三基色分别合成这两种颜色的 各自成分混合起来的得到的结果相同。 4 ) 混合色的光亮度是原来各分量光亮度的总和。 喜: 釜。 篱。, 4 0 0 5 0 06 0 07 0 0 被长f w a v e k 幛h ) ,x ( m ) 图2 7 视敏函数曲线 由于人眼对于色彩的感受能力有着显著的差异,而扫描仪、模拟及数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论