(控制理论与控制工程专业论文)基于矢量量化的彩色视频图像压缩编码方法研究.pdf_第1页
(控制理论与控制工程专业论文)基于矢量量化的彩色视频图像压缩编码方法研究.pdf_第2页
(控制理论与控制工程专业论文)基于矢量量化的彩色视频图像压缩编码方法研究.pdf_第3页
(控制理论与控制工程专业论文)基于矢量量化的彩色视频图像压缩编码方法研究.pdf_第4页
(控制理论与控制工程专业论文)基于矢量量化的彩色视频图像压缩编码方法研究.pdf_第5页
已阅读5页,还剩56页未读 继续免费阅读

(控制理论与控制工程专业论文)基于矢量量化的彩色视频图像压缩编码方法研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于矢量量化的彩色视频图像压缩编码方法研究 摘要 视频图像压缩是解决图像海量信息的存储和传输问题的关键技术。民用方 面,视频压缩与传输在多媒体、视频会议、可视电话、高清晰度电视、远程医疗 等视频服务中起着至关重要的作用。在空间探测和海洋资源开发勘探方面,同样 面临着海量图像信息的传输问题。如在海底勘探中,必须克服利用有限带宽的水 声信道实时传输大量视频图像数据的瓶颈难题。虽然视频编码技术有了很大发 展,但目前的视频压缩方法仍然不能满足视频图像在甚低比特率下的传输要求。 因此,有必要根据视频的应用特点,进一步研究探索更加高效的视频编码方法。 为此,本文对彩色视频图像,在d c t 域和d w t 域内探讨了基于矢量量化的高效编 码方法,完成的主要工作如下: ( 1 ) d c t 域内基于矢量量化的彩色视频图像压缩编码方法研究 针对彩色视频图像提出了一种d c r 域内基于矢量量化的高效编码方法。为 去掉彩色图像各分量间的相关性,首先将图像由r g b 空间转换到y u v 空间, 然后根据人类视觉特征( h v s ) 对色度信号u 、v 进行了亚采样和平均化处理;对 亮度信号y 则进行分块d c t 变换,并根据h v s 特征对变化域内的块矢量进行 自适应分类,然后根据矢量的类型分别构造码矢和进行全局码书设计。提出的全 局码书设计方案可以根据帧间相关性及码字使用频率,对码书的内容自动进行更 新和替换,以适应场景内容的变化。 ( 2 ) d w t 域内彩色视频图像压缩编码方法研究 对矢量量化和彩色视频图像在d w t 域内的特性进行了深入研究,将二者结 合起来,根据彩色视频图像的特点,在d w t 域内,提出了一种基于矢量自适应 分类的快速全局码书设计方案。首先将彩色图像由r g b 空间转换到空间, 然后对y 、u 、v 三分量分别采用d a u b s 3 小波变换进行处理。u 和v 分量为色 度信号,人眼不敏感,将其高频成分全部丢弃,只保留低频成分;对人眼敏感的 亮度信号y 分量根据小波变换后的三个方向的特性,将其进行分类,然后再利 用自适应分类的快速码书设计方案建立码书。 实验结果表明:在保证彩色视频图像重建质量的前提下,提出的以上两种方 法均具有较高的压缩效率,比较适合于视频会议以及水下视频观测等应用场合。 关键词:矢量量化编码;离散余弦变换( d c t ) ;离散小波变换( d w t ) :全局码书 s t u d yo nc o l o rv i d e oc o m p r e s s i o nt e c h n i q u eb a s e do n v e c t o rq u a n t i z a t i o n a b s t r a c t v i d e oc o m p r e s s i o nh a sb e e nt h ek e yt e c h n o l o g yf o rt r a n s m i t t i n gm a s s i v ea m o u n t o fr e a l t i m ev i d e od a t av i al i m i t e db a n d w i d t hc h a n n e l s v i d e o c o m p r e s s i o nh a s a s s u m e da l li n c r e a s i n g l yi m p o r t a n tr o l ei nm a n ya p p l i c a t i o n ss u c ha sv i d e o c o n f e r e n c e , v i d e os u r v e i l l a n c e ,a n dd i s t a n tm e d i c a lt r e a t m e n ta n ds oo n f u r t h e r , i ti so n eo ft h e k e yt e c h n i q u e sf o rb o t hs a t e l l i t er e m o t es e n s i n ga n ds e ae x p l o r a t i o n s f o re x a m p l e , u n m a n n e dv e h i c l e sa r ee m p l o y e dm o r ea n dm o r ef r e q u e n t l yf o rav a r i e t yo fs c i e n t i f i c a n dc o m m e r c i a lu n d e r s e aa p p l i c a t i o n s h o w e v e r , t h ee l i m i n a t i o no ft h et e t h e rr e q u i r e s t h ec a p a b i l i t yt oc o m p r e s sam a s s i v ea m o u n to fl i v ev i d e od a t at om e e tt h eb a n d w i d t h l i m i t a t i o n so fa c o u s t i c t e l e m e t r y a l t h o u g hv i d e o c o d i n gt e c h n o l o g yh a s b e e n d e v e l o p e dr a p i d l y , t h ee x i s t i n gc o d i n gm e t h o d ss t i ll c a n n o tm e e tt h er e q u i r e m e n t so f v i d e ot r a n s m i s s i o na tv e r yl o wb i tr a t e t h e r e f o r e ,i ti sn e c e s s a r yt oi n v e s t i g a t ea n d d e v e l o pm o r ee f f e c t i v ev i d e oc o d i n gt e c h n i q u e st os a t i s f yt h er e q u i r e m e n to fr e a l t i m e v i d e ot r a n s m i s s i o ni ns o m ep r a c t i c a l a p p l i c a t i o n s s u c ha so c e a na n d s p a c e e x p l o r a t i o n s f o c u s i n go nt h ea b o v eo b j e c t i v e ,t h i sp a p e rs t u d i e st h e c o l o rv i d e o c o d i n gm e t h o d sb a s e do nv e c t o rq u a n t i z a t i o nf v q ) i nd i s c r e t ec o s i n et r a n s f o r m ( d c t ) d o m a i na n dd i s c r e t ew a v e l e tt r a n s f o r m ( d w dd o m a i n n ef o l l o w i n ga c h i e v e m e n t s h a v e b e e na c c o m p l i s h e d ( 1 ) c o l o rv i d e oc o m p r e s s i o ni nd c td o m a i nb a s e do nv q w bp r e s e n ta ne 丘c i e n tv q - b a s e dc o l o rv i d e oc o d i n gm e t h o di nd c td o m a i n i n o r d e rt or e m o v et h ei n h e r e n tc o r r e l a t i o na m o n gt h et h r e ec o m p o n e n t so fc o l o ri m a g e , t h er g b s p a c ei sf i r s tt r a n s f o r m e dt ot h ey u vs p a c e f o rt h eu a n dvc h r o m i n a n c e c o m p o n e n t s ,s u b s a m p l i n go p e r a t i o n s a n da v e r a g ec o m p u t a t i o na r ep e r f o r m e dt o r e m o v et h ev i s u a lr e d u n d a n c y o nt h eo t h e rh a n d , f o rt h el u m i n a n c ey i m a g e ,w ef i r s t p a r t i t i o ni ti n t o8x 8b l o c k sw h i c ha r en o to v e r l a p p e d ,a n dt h e na p p l yd c tt ot h e s e b l o c k s ,t h u sf o r m i n gt h et r a n s f o r m e dv e c t o r s b a s e do nh v s ,t h et r a n s f o r m e dv e c t o r s r i ot h e na u t o m a t i c a l l yc l a s s i 丘e da n dt r u n c a t e d f i n a l l y ,f o re a c ht y p eo ft h ev e c t o r s , t h eg l o b a lc o d e b o o ki sd e s i g n e da c c o r d i n g l y , w h i c hc a na d a p t i v e l yu p d a t ea n d r e p l a c e t h ec o d ew o r d so ft h ec o o k b o o kw i t ht h ec h a n g eo fs c e n ea c c o r d i n gt ot h ei n t e r - f r a m e c o r r e l a t i o na n dt h eu s i n gf r e q u e n c yo fc o d ew o r d s ( 2 ) c o l o rv i d e oc o m p r e s s i o ni nd 、wd o m a i nb a s e do nv q t i l i sp a p e ra l s op r e s e n t sa ne f f i c i e n tv qb a s e dc o l o rv i d e oc o d i n gm e t h o di n d w td o m a i n t h ei n p u tf r a m e sa r ef i r s tt r a n s f o r m e df r o mt h er g b s p a c et ot h ey u v s p a c e ,a n dt h e nt h et h r e ec o m p o n e n t sa r ed e c o m p o s e du s i n gt h ei n t e g e r - t o i n t e g e r v e r s i o n so fl i f t i n gf o r mo fd a u b 5 3 n et r a n s f o r m e dyc o m p o n e n ti sc o d e db y e m p l o y i n gc l a s s i f i e dt r e e s t r u c t u r ev e c t o r sa n dg l o b a lc o d e b o o ks c h e m e n eg l o b a l c o d e b o o kd e s i g n e dc a na d a p t i v e l yu p d a t ea n dr e p l a c et h ec o d ew o r d so ft h ec o o k b o o k w i t ht h ec h a n g eo fs c e n ea c c o r d i n gt ot h ei n t e r - f l a m ec o r r e l a t i o na n dt h ef l e q u e n c yo f c o d ew o r d s t h ec o d i n go fc h r o m i n a n c ec o m p o n e n t so fua n dvi m a g e si sa c h i e v e d b yt h r o wo f fa l lt h eh i :g hf r e q u e n c ys u b b a n d sb a s e do nh v s t h ee x p e r i m e n t a lr e s u l t ss h o wt h a tw h i l em a i n t a i n i n gt h ea c c e p t a b l eq u a l i t yo f t h er e c o n s t r u c t e di m a g e s ,t h eb o t hp r o p o s e da l g o r i t h m sc a np r o v i d eh i g hc o d i n g e f f i c i e n c y , e s p e c i a l l ya p p l y i n gt o s u c hs c e n a r i o sa sv i d e o c o n f e r e n c ea n dv i d e o o b s e r v a t i o no fu n d e r w a t e rs c e n e s k e yw o r d :c o l o rv i d e oc o d i n g ,v e c t o rq u a n t i z a t i o n ( v q ) ,d i s c r e t ec o s i n et r a n s f o r m ( d c t ) ,d i s c r e t ew a v e l e tt r a n s f o r m ( d w t ) ,g l o b a lc o d e b o o k 独创声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的 研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其 他人已经发表或撰写过的研究成果,也不包含未获得洼! 翅遗直墓丝置塞挂别主 堕的:奎拦亘窒或其他教育机构的学位或证书使用过的材料。与我一同工作的 同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。 学位论文作者签名:趱签字日期:枷绔年钥加日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,有权保留并 向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人 授权学校可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用 影印、缩印或扫描等复制手段保存、汇编学位论文。同时授权中国科学技术信息 研究所将本学位论文收录到中国学位论文全文数据库,并通过网络向社会公 众提供信息服务。( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:导师签字: 薪惠 签字日期:k 唁年中月p 日签字日期:2 们矛年户月勘日 基于矢量量化的彩色视频图像压缩编码方法研究 1 绪论 1 1 研究的背景意义 视频图像压缩编码技术的研究首先是以互联网上多媒体通信为应用背景而 展开的,在多媒体、视频会议、视频监控、远程医疗等【1 , 2 , 3 , 4 5 】视频服务中起着至 关重要的作用。视频压缩技术是卫星遥感【6 】和海洋勘探【7 ,8 】领域的关键技术,如对 国民经济和国防有重要意义的海量卫星遥感图像数据传输受到传输带宽和星上 功率的限制;利用水下机器人进行海洋开发勘探领域,也面临着大量视频图像数 据和水声信道有限带宽的矛盾。然而,视频图像压缩就是解决图像海量信息的存 储和传输问题的关键1 9 j 。 本文是以国家8 6 3 科研项目“水下机器人视频图像高压缩比编码关键技术研 究”为背景展开的。无论是研制无脐带电缆限制的遥控水下机器人( r o v s ) ,还 是研制完全自治的自治水下机器人( a u v s ) ,都必须克服利用水声信道实时传送 水下视频图像的障碍。因此,有必要根据水下视频成像特点,在保证图像重建质 量的前提下,研究具有高压缩比率的水下视频图像压缩编码方法和技术,从而达 到利用有限带宽的水声信道,向水面工作站实时传输水下视频图像的目标。该研 究的成功将去掉目前r o v s 对脐带电缆的依赖,提高r o v s 机动性和适应性;对 于自主作业的a u v s ,可以把现场采集的视频信息由水声信道顺利传输到表面工 作站,以供人工跟踪与监视机器人的运动和作业,为人工实时观察、探测海底场 景以及对机器人进行导航和在线任务的规划。本研究是水下机器人的重要关键技 术之一,具有重要研究价值和广阔应用前景。 目前商品化的水声m o d e m 可提供的数据传输速率一般为几k b s ,利用有限 带宽的水声信道实时传输视频图像的关键技术为:一是高效的视频图像压缩技 术,二是高效的水声m o d e m 研制【1 0 1 。本研究主要是针对第一项关键技术。目前 大多数的水下图像传输试验系统还是采用传送静态图像的方式,即每一帧图像采 用独立压缩编码的方式l l u 】,没有考虑帧间存在的时间冗余。为了达到可接受的 视频质量,一般要求最低帧速为1 0 帧秒。如目前国内【1 l ,1 2 1 以及日本【1 3 】、葡萄牙 等【1 4 】早期研制的水下图像压缩传输系统,采用的都是静态图像的压缩方法,一 般采用j p e g 压缩方式,需要的支持的信道传输速率在1 6 k b p s - - 3 0 k b p s 范围之内, 因为没有考虑帧间的时间冗余,所以压缩比不高,一帧图像一般需要几秒的时间 来完成传输。现在国外正在积极进行视频动态压缩编码方法的研究,如日本 1 1 5 1 ( 2 0 0 2 年) 研制的水下视频传输系统,水声信道的数据传输速率可达1 2 8 k b p s , 基于矢量量化的彩色视频图像压缩编码方法研究 视频图像采用m p e g 4 方式压缩,帧速率达1 0 帧秒。文献【1 6 ( 1 9 9 7 美国) 提出了 一种基于小波变换的视频压缩算法,水声信道可支持的传输速率为2 0k b p s ,实 现的帧传输速率为1 0 帧秒,每帧为1 4 4 x1 7 6 像素的灰度图像。美m ( 2 0 0 0 ) 研制 的水下视频传输系统【1 ,压缩比达1 0 0 :1 - 1 5 0 :1 ,利用4 0k b p s 的传输速率,传 输的帧速率可达1 5 帧秒,每帧为1 2 8 1 2 8 像素的灰度图像。从以上国内外的研 究现状可以看出:在水下视频压缩传输方面,国内与国外还存在较大差距;此外, 国外在这方面的研究还远没有达到非常实用和完善的程度,目前仅可以实时传送 1 3 标准电视分辨率的黑白视频图像,还未见进行水下彩色视频图像压缩编码硬 件系统的研究,更未出现成熟的专利技术。 因此,根据视频信号的特点,在保证图像重建质量的前提下,研究甚低比特 率下的视频图像高效的压缩编码方法,将是视频压缩的一个重要研究方向。 1 2 视频图像压缩的发展现状 1 2 1 视频图像压缩的发展现状 从1 9 4 8 年提出的电视信号数字化,图像压缩编码技术已经有6 0 年的历史。 在此期间,出现了很多图像压缩编码方法,不断的推动图像压缩技术的发展。上 世纪五六十年代,限于当时的计算机和电路实施技术的客观条件制约,图像压缩 编码技术仅仅停留在预测编码、亚采样以及内插复原等技术的研究,还很不成熟。 1 9 6 9 年在美国召开的第一届“图像编码会议 标志着图像编码作为一门独立学 科的诞生。七八十年代以后,图像压缩技术取得了迅速的发展,主要成果体现在 一系列图像压缩编码的国际标准的制定,即国际标准化组织( t s o ) 、国际电工委 员会( m c ) 和国际电信联盟( r r u ) 下属的国际电报电话咨询委员会( c c n r ) 陆续完 成了各种数据压缩与通信的标准和建议,如以j p e g ( j o i n tp h o t o g r a p h i ce x p e r t s g r o u p ) 和j p e g 2 0 0 0 为代表的静止图像压缩标准【1 8 1 9 1 :以m p e g 1 ( m o v i n g p h o t o g r a p h i c e x p e l sg r o u p 1 ) 、m p e g 2 和m p e g - 4 为代表的中高码率数据编码 标准【2 0 ,2 1 捌;以h 2 6 1 、h 2 6 3 、h 2 6 3 + 、h 2 6 3 + + 为代表的低码率、甚低码率运 动图像压缩标准【2 3 , 2 4 , 2 5 , 2 6 】;以及适用范围更广的、最新完成的h 2 6 4 标准【刎。这 些图像编码标准融合了各种性能优良的图像编码方法,也是对编码技术的总结。 新标准涉及的应用范围越来越广,性能也越来越好,但各种新技术的算法复 杂度也越来越高,例如,最新的视频标准h 2 6 4 的压缩性能比m p e g - 4 提高1 倍,但算法复杂度却提高了4 5 倍,算法复杂度的提高与压缩比的提高成几何 级数增长。在实际应用中,如视频监控、会议视频、远程医疗等视频服务领域用 现有标准也能实现,但由于各种新标准复杂度随其性能的提高而增大,应用起来 比较繁琐,实用性就大大降低。此外,视频压缩技术也是卫星遥感和海洋勘探领 基于矢量量化的彩色视频图像压缩编码方法研究 域目前面临的关键技术。如对国民经济和国防有重要意义的海量卫星遥感图像数 据的传输要受到传输带宽和星上功率的限制;利用水下机器人进行海洋开发勘 探,也面临着无法利用有限带宽的水声信道实时传输大量视频信息的难题。虽然 视频图像压缩技术在当今信息时代中得到迅猛发展,但目前现有的视频压缩技术 仍不能满足甚低比特率下实时传输视频图像的要求。可见视频图像压缩技术还远 没有发展到完善的地步,有必要继续深入研究视频图像的特点与压缩机理,以实 现甚低比特率下视频图像实时传输的目标。因此,如何在不降低原有压缩性能和 重建图像质量的前提下,尽可能降低传输比特率及压缩算法复杂度己成为当前研 究的热点与重点。 变换编码【3 0 川和矢量量化编码幽刀】是实现视频图像高压缩比编码的重要方 法。变换编码的基本思想就是把原来在空间域描述的图像信号经通过正交变换变 换到另一个正交矢量空间( 变换域) 中用变换系数进行描述,利用变换系数能量 集聚特性和人眼视觉特性( h v s ) ,以消除空间冗余和视觉冗余,常用的方法包 括离散余弦变换【3 0 】( d c t ) 和离散小波变换【3 1 】( d w t ) 。矢量量化编码是一种高 效的图像数据压缩技术,码书的设计和码字的搜索是矢量量化编码的关键。如何 将这两种方法有机融合,充分提高视频图像压缩编码的效率,是本文研究的重点, 其发展情况概要介绍如下。 1 2 2 变换编码的发展现状 变换编码技术迄今已有近3 0 年的历史,技术上比较成熟,理论上也较完备, 广泛应用于各种图像数据压缩标准中,诸如适用于静止图像的j p e g 、适用于运 动图像的m p e g 1 、m p e g 2 以及多媒体计算机技术中的视频帧内图像压缩和帧 间图像压缩等。变换编码的种类很多,如傅立叶( f o u r i e s ) 变换、k - l 变换、余弦 变换、沃尔什哈达玛变换、小波变换等等。 离散傅立叶变换的快速算法提出的最早,并且已经有了完善的快速算法。但 由于一个子图像真正作二维离散傅立叶变换的前提是必须具备周期性,其反变换 恢复出的是成周期性的子图像,而且变换中常常会出现“g i b b s 效应”,此外, 进行傅立叶变换要用到复数,从而导致硬件结构复杂且各变换系数的精确度难以 保证,因此使用并不多。 在均方误差准则下,k - l 变化是失真最小的一种变化,能将信号在变换域的 相关性全部解除,故又称为最优变换。但是它没有快速算法,实现比较困难,目 前在编码中已经不再使用。 1 9 7 4 年a h m e d 等首先提出的离散余弦变换( d c t ) 的概念【3 2 1 ,是仅次子k - l 变换的次最佳变换,其变换核为余弦变换,计算速度较快,有利于图像压缩。在 大多数情况下,离散余弦变换d c t 用于图像压缩的基本思路是,将图像分解成 为8 8 的子块或者1 6 x1 6 的子块,并对每一个子块进行单独的d c t 变换,然 基于矢量量化的彩色视频图像压缩编码方法研究 后对其结果进行量化、编码。该编码是一种正交变换编码,将二维图像变换成它 的空间频谱,将其按由低频到高频的顺序排列,由于图像频谱从低到高逐渐衰减, 故可以在一定量化等级下进行舍弃,从而达到压缩的目的。d c t 变换的去相关 型好,适应人眼的视觉特性,计算量不大,易于实现,理论、算法和硬件相对成 熟,是j p e g 和m p e g 等国际压缩标准的基础。 沃尔什哈达玛变换,是以沃尔什函数为基函数,它只有+ 1 和1 两种取值, 计算快速,只需要加减,但能量集中性不如d c t 小波变换是2 0 世纪8 0 年代才提出的概念,它是一种信号的时间一尺度( 时间 频率) 分析方法,具有多分辨分析的特点,而且在时频两域都有表征信号局部特 性的能力,是一种窗口面积固定不变、形状可以改变的时频局部分析方法,能以 有效的信号表征方式处理图像中的非平稳信号,在静态图像和视频压缩中得到快 速运用。小波变换的思想是将信号通过不同的高通和低通滤波器族,滤波器族将 信号的高频和低频成分分别进行处理,然后重复上述的滤波处理,每次都将相同 的频率成分从信号中消除。 变换编码就是将原来在空闻域描述的信号相关的像素点,通过正交变换映射 到另一个正交矢量空间,在变换域中进行描述,产生一批变换系数,变换后的系 数之间的相关性降低,然后对这些变换系数进行编码处理。在变换域上应满足所 有的系数相互独立,能量集中于少数的几个系数上,这些系数集中于一个最小的 区域。将图像能量的空间域的分散分布变为在变换域的能量相对集中分布,这样 有助于迸一步处理,如z i g - z a g 扫描、自适应量化和变长编码等,从而获得对图 像信息的有效压缩。图像变换在实际应用中广泛采用的是基于块的d c t 编码和 基于子带的小波变换编码技术, 1 2 3 矢量量化编码的发展现状 1 9 5 6 年,s t e i n h a u s 第一次系统地阐述了最佳矢量量化( v e c t o rq u a n t i z a t i o n , v q ) 问题。1 9 7 8 年,b u z o 第一个提出实际的矢量量化器。1 9 8 0 年,l i n d e 、b u z o 和g r a y 将l o y d m a x 算法推广,提出了一种有效的矢量量化码书设计算法一 l b g 算法,这是矢量量化技术的一个里程碑。此后,人们对矢量量化的理论和 应用展开了全面的研究,包括各种矢量量化器、码书设计算法、码字搜索算法、 码字索引分配算法、图像的矢量量化压缩、语音的矢量量化编码和识别、矢量量 化系统【3 3 】的软硬件实现等。 矢量量化的三大关键技术是码书设计、码字搜索和码字索引分配,其中前两 项最为关键。 码书设计的目的就是寻求有效的算法尽可能找到全局最优或者接近全局最 优的码书以提高码书性能,并尽可能减少计算复杂度。常用的码书的设计方法主 要包括: 基于矢量量化的彩色视频图像压缩编码方法研究 ( 1 ) l b g 算法队矧: 该算法是基于最优必要条件的码书迭代改进算法,其基本思想是将训练序列 按初始码书中的码字分组,对这一分组再找到每组的中心作为新码书,并将训练 序列再根据新码书中的码字分组,重复进行迭代过程直到所有码书满足一定条件 为止。对于有限训练矢量集,l b g 算法总能产生一个量化器序列,其相应的平 均失真是递减的且经过有限次迭代后达到收敛。在l b g 算法的初始码书选择中, 应尽量使初始码书的码字能在整个矢量空间中很好地分散开,且尽可能占据感兴 趣的重要区域,即输入概率密度较大的区域。 ( 2 )基于自组织特征映射神经网络的方法哺1 : 该方法也称为k o h o n e n 网络,由芬兰学者k o h o n c n 于1 9 8 1 年提出的,是由 一个由全连接的神经元阵列组成的无教师网络,通过对输入模式的反复学习,捕 捉各个模式中所含的特征,并对其进行自组织,在竞争层将聚类的结果反映出来。 矢量量化既可以作为图像编码系统中的量化环节使用,又可以成为一种独立 的图像编码方法,它不仅利用人的主观视觉特性,还利用被量化图像数据之间的 相关性进行压缩,有较高的压缩性能。 1 3 存在问题及主要工作 1 3 1 存在问题 虽然视频编码技术有了很大发展,但目前的视频压缩方法【3 7 ,3 8 3 9 】仍然不能满 足视频图像在甚低比特率下的传输要求。如对国民经济和国防有重要意义的海量 卫星遥感图像数据的传输要受到传输带宽和星上功率的限制;利用水下机器人进 行海洋资源开发勘探中,也面临着无法利用有限带宽的水声信道实时传输大量视 频信息的难题。因此,根据视频信号的特点,在保证图像重建质量的前提下,研 究甚低比特率下的视频图像高效的压缩编码方法,将是视频压缩的一个重要研究 方向。目前基于矢量量化的视频图像压缩主要存在以下几个问题: ( 1 )没有充分利用人眼的视觉系统h v s ( h u m a nv i s u a ls y s t e m ) 的特性 关于矢量量化的研究【4 0 , 4 1 , 4 2 大多是对图像建立同一长度的矢量,没有充分考 虑人眼的视觉特性。视觉心理学的深入研究表明,人类的视觉系统具有隐蔽性, 主要体现在对平滑区的变化敏感,纹理区变化不敏感;对平均亮度大的区域不敏 感,平均亮度小的区域敏感;对不同角度的空间频率视觉信号的响应也不同等等。 视频最终是给人看的,因此,充分利用人类视觉系统的特性,可以进一步对视频 图像进行压缩。 ( 2 )多集中在静态图像的研究中 基于矢量量化的编码研究大多集中在静态灰度图像的压缩方面【4 3 , 4 4 】,而对于 基于矢量量化的彩色视频图像压缩编码方法研究 彩色视频图像的研究不多。静态图像千差万别,很难设计出一个适用于各种图像 的全局码书,所以静态图像的矢量量化编码算法一般采用局部码书的设计方法。 而视频图像,帧与帧之间存在极强的相关性,因此,必须研究高效的全局码书设 计方法,以有效消除帧间的时间冗余。 ( 3 )实时性差,计算复杂 l b g 算法和相应的改进算法以及基于自组织特征映射神经网络的方法一般 依赖于初始码书,码书的码字个数必须事先确定,不能随着图像内容的变化而自 动变化,且计算复杂,实用性很差,不能满足视频图像实时编解码的要求。 ( 4 )对彩色图像的研究较少 灰度图像只需考虑图像的黑白两色,即二值空间,相对简单。彩色视频图像, 各分量之间间存在着很强的相关性,如何有效地去除彩色图像各分量间存在颜色 空间冗余,对图像进行压缩是一个重要的问题。 1 3 2 主要工作 针对以上问题,深入研究了视频图像特点及压缩机理,重点对变换编码和矢 量量化编码进行了研究,并取得了一些进展。主要体现在在以下两个方面: ( 1 ) d c t 域内基于矢量量化的彩色视频图像压缩编码方法研究 对矢量量化和彩色视频图像在d c t 域内的特性进行了深入研究,将二者结 合起来,根据彩色视频图像的特点,在d c t 域内,提出了一种基于矢量自适应 分类的快速全局码书设计方案。对于每一帧彩色图像,为去掉颜色各分量间的相 关性,首先将彩色图像由r g b 空间转换到空间,然后对于两个色度分量 根据h v s 特征,进行亚取样和平均处理;而对亮度分量则在d c t 域内采用基于 v q 的压缩编码方法,先进行d c t 变换,再将变换后的系数图像根据能量分为 平滑类和非平滑类,平滑类中包含了人类视觉系统不敏感的信息,含有的能量较 少,可以大幅度的截尾,从而使构建的矢量的维数大大降低;非平滑类中包含了 图像的绝大多数细节信息,人类视觉系统很敏感,根据其能量特点进一步分为边 缘类和一般纹理类,分别对其进行适当截尾构建矢量。对于三类矢量使用自适应 分类的快速码书设计方案建立码书。实验结果表明该算法在保证重建图像质量的 前提下,对彩色视频图像能够获得较高的压缩效率。 ( 2 ) d w t 域内彩色视频图像压缩编码方法研究 对矢量量化和彩色视频图像在d w t 域内的特性进行了深入研究,将二者结 合起来,根据彩色视频图像的特点,在d w t 域内,提出了一种基于矢量自适应 分类的快速全局码书设计方案。对于每一帧彩色图像,为去掉颜色各分量间的相 关性,首先将彩色图像由r g b 空间转换到空间,然后对y 、u 、v 三分量 分别采用d a u b 5 3 小波变换进行处理。u 和v 分量为色度信号,人眼不敏感, 将其高频成分全部丢弃,只保留低频成分;对人眼敏感的亮度信号y 分量根据 基于矢量量化的彩色视频图像压缩编码方法研究 小波变换后的三个方向的特性,将其进行分类,再利用自适应分类的快速码书设 计方案建立码书。实验结果表明该算法在保证重建图像质量的前提下,对彩色视 频图像能够获得较高的压缩效率。 l - 4 论文框架及结构安排 全文共分五章。 第一章绪论。 主要介绍课题研究背景意义,目前图像压缩编码研究现状,存在的问题及本 文的主要工作。 第二章图像压缩技术简介。 介绍了常用的视频图像编码技术及彩色视频图像的相关理论知识,包括彩色 视频图像的特点,视频图像压缩的基本原理,同时还介绍了一些常见的图像压缩 国际标准和建议,如j p e g 系列、m p e g 系列和h 2 6 x 系列等。 在本章的基础上,本文的重点就视频图像的矢量量化编码和变换编码这两方 面展开论述,以下各章沿着矢量量化编码和变换编码二者的结合来组织。 第三章d c t 域内基于矢量量化的彩色视频图像压缩编码方法研究。 在深入研究国内外各种图像压缩方法的基础上,充分考虑人眼视觉特性及光 照变化对亮度系数的影响,在d c t 域内提出了一种基于矢量自适应分类的快速 全局码书设计方案。通过实验验证了该方法在视频图像压缩技术应用中的有效 性。 第四章d w t 域内基于矢量量化的视频图像压缩矢量量化编码方法研究。 深入研究小波理论和小波域图像压缩编码方法,在d w t 域内提出了一种高 效的基于矢量量化的彩色视频图像压缩编码方法,通过实验验证了该方法在视频 图像压缩中的有效性。 第五章对全文进行总结,并提出了论文中需要进一步研究的方向。 基于矢量量化的彩色视频图像压缩编码方法研究 2 彩色视频图像压缩技术简介 2 1 引言 图像压缩的依据是图像信号中存在大量的冗余信息。从信息论角度来看,压 缩的基本目的是去除信息中的冗余,即保留不确定信息,去掉确定信息,使用一 种更接近信息本质的描述来替代原有的冗余描述,这样,在解压缩时还能获得与 原始图像完全相同或近似的重建图像。一幅静态图像主要包含空间冗余、视觉冗 余和编码冗余。而视频图像是多帧静态图像在时间上的组合,因此除了以上三种 冗余,视频图像还包括时间冗余,视频压缩的目的是在保证图像重建质量的前提 下尽可能多地去掉这些冗余信息。视频图像压缩包含了图像压缩,其核心就是采 用高效的图像压缩编码方法和充分利用帧间相关性。 彩色图像压缩和灰度图像压缩有很大的差别,。主要体现在,灰度图像压缩只 要考虑黑白两种灰度值及其纹理特性即可,而彩色图像压缩中必须考虑彩色图像 各分量之间的相关性,并有效地去除这些相关性。 从通信系统的角度来划分,图像压缩属于信源编码的范畴,也称为图像编码。 图像编码就是对图像数据采用不同的表达方法,以减少表示图像所需的数据量。 针对图像数据的冗余种类不同,相应地就有不同的编码方法,而按照重建图像与 原图像之间有无差别,又可将图像编码算法分为两类:无损压缩编码和有损压缩 :+ 编码。 2 2 视频图像数据压缩的机理 视频图像压缩编码的目的是以尽可能少的比特数表征图像,同时保证重建图 像的质量,使其符合特定应用场合的要求。研究发现,图像数据中存在大量的冗 余,压缩的机理就是通过各种方法去除冗余,主要包括空间冗余、时间冗余、编 码冗余、知识冗余、视觉冗余等等。 空间冗余是是静态图像存在的最主要的一种数据冗余。同一景物表面上各采 样点的颜色之间往往存在空间连贯性,但是基于离散像素采样来表示的物体颜色 的方式通常没有利用景物表面颜色的连贯性,从而产生空间冗余。 时间冗余是视频图像表示中经常包含的冗余。视频图像一般位于一时间轴区 间内的一组连续画面,其中的相邻帧往往包含相同的背景和移动物体,所以后一 帧图像与前一帧图像之间有许多共同的地方,而原始数据中完整地记录了每一帧 基于矢量量化的彩色视频图像压缩编码方法研究 图像的每一个像素值,这就造成了时间冗余。 编码冗余又称为信息熵冗余。把原始数据看作由符号组成的序列,各个符号 在原始数据中出现的频率不同。在原始数据中都是用相同位数的二进制来表示各 个符号,这种方法既简单又方便,但是无形中增加了总体数据的长度,从而造成 了编码冗余。 知识冗余与图像的理解和某些相关知识有很大的关系。有些图像包含的多数 信息我们实现都是知道的。例如,人脸上五官的位置,是大家都知道的,在图像 上表现出来就是一种多余的信息。这种规律性的结构可由先验知识和背景知识得 到的冗余成为知识冗余。 视觉冗余是由人类的视觉系统的特性决定的。人类视觉系统如下特征:( 1 ) 频率敏感和纹理复杂性,即人眼对平滑区变化敏感,随着频率的增高,人眼的分 辨率降低,且入眼对纹理区的灰度变化不敏感;( 2 ) 亮度敏感性,人眼对亮度具 有非线性的特性,在平均亮度大( 背景亮) 的区域人眼对灰度误差不敏感,在平均 亮度小( 背景暗) 的区域人眼对灰度误差比较敏感;( 3 ) 方向敏感性,即人眼对不同 角度的空间频率视觉信号的响应不同,对在垂直和水平方向的频率具有较强的视 觉响应,而在对角线方向的频率响应显著下降;( 4 ) 边缘敏感性,图像的边缘信 息对视觉很重要,特别是边缘的位置信息,人眼容易感觉边缘位置的变化,而对 于边缘附近的灰度误差,人眼不敏感。综上所述人类视觉系统h v s 是有缺陷的, 只要图像信号在空间、时间以及幅度上进行数字化的精细程度达到了一定限度即 可,更高的精度便没有意义了,通过减少信号精度,就可以进行有效的数据压缩。 随着人类视觉系统和图像模型的进一步研究,人们还会发现更多的冗余及去 除各种冗余的有效的编码方法,使视频图像数据压缩的压缩比更高,从而推动视 频图像压缩技术的进一步发展。 2 3 图像编码方法 针对不同的冗余可以使用不同的压缩方法对视频图像进行压缩。根据压缩后 视频图像能否完全重建,即图像的失真度,可以分为有损压缩( 1 0 s s y ) 编码方法和 无损压缩( 1 0 s s l e s s ) j 玉, 缩编码方法。 2 3 1 无损压缩编码 无损压缩是指对使用压缩后的数据对图像进行重构,解压缩后得到的数据与 原来的数据完全相同,主要去除了可以恢复的时间冗余、空间冗余和编码冗余, 目前常用的方法有h u f f :m a n 编码、行程编码( r u n l e n g t h ) 、算术压缩编码和无损 预测编码。 基于矢量量化的彩色视频图像压缩编码方法研究 2 3 1 1h u 仟m a l l 编码 h u f f m a n 算法是由d a h u f f m a n 于1 9 6 2 年提出的一种用于数据压缩的算法。 基本原理是频繁使用的数据用较短的代码代替,较少使用的数据用较长的代码代 替,每个数据的代码各不相同这些代码都是二进制码,且码长是可变的。它的 实现主要借助于h u f f m a n 树,又称最优二叉树,是一类带权路径最短的树 概率统计,得到n 个不同概率的符号信息。 将信源符号按概率递减顺序排列。 把两个最小概率相加作为新符号的概率,并按重排。 重复、知道概率为l 。 在每次合并信源时,将合并的信源分别赋“o 和“1 。 寻找从每一个信源符号到概率l 的路径,记录路径上的“1 和“0 。 写出每一符号“1 ”和“o 的序列( 从树根到信源节点) 。 解码部分反之,其实现过程为:依次读入文件字符的编码,从h u f f m a n 树的 根结点出发,若当前读入二进制码为0 ,则走向左子树,否则走向右子树,一旦 到达某一叶子时,便译出相应的字符。然后重新从根出发继续译码直至文件结束。 2 3 1 2 行程编码 行程编码的基本思想,是将具有相同数值的( 例如像素的灰度值) 、连续出现 的信源符号构成的符号串用其数值及串的长度表示。以图像编码为例,灰度值相 邻的相同像素的延续长度( 像素数目) 称为延续的行程,简称行程。如果沿图像的 水平方向有一串厶个像素具有相同的灰度值q ,则对其作行程编码,只需传送 数据组( q ,厶) 就可以代替传

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论