




已阅读5页,还剩67页未读, 继续免费阅读
(计算机软件与理论专业论文)vod应用中的图像压缩算法研究与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
v o d 应用中的图像压缩算法研究与实现 学科:计算机软件与理论 研究生签字:槲级 :勿氐 摘要 随着计算机网络技术和计算机通信技术的迅猛发展,使人们对网络上提供的高质量视 频音频等多媒体服务的需求越来越大。以视频点播( v o d ) 为核心的各种网络应用和信息 服务将成为人们生活中不可缺少的一部分。v o d ( v i d e oo nd e m a n d ,即视频点播) 技术是 计算机技术、网络通信技术、多媒体技术、电视技术和数字压缩技术等多学科、多领域融 合交叉结合的产物。v o d 系统的特点是视频图像的实时传输,我们知道图像的信息量巨 大,在传输过程中需要很大的带宽资源,因此,视频图像压缩技术成了v o d 系统中的关 键技术之一。如何在有限的带宽条件下用最少的数据流传输最高质量的视频已经成了视频 压缩研究的热点。 通过对视频图像压缩原理的研究和理解,本文简要阐述了视频压缩的关键技术:变换 编码、量化编码、预测编码、运动估计和运动补偿和编码技术,以及在各关键技术中运用 的经典算法,并对图像量化算法和运动估计和补偿算法进行了改进。经过实验分析表明, 运用小波分频带逐级量化算法的图像量化,具有运算量少和重建图像质量清晰的特点,而 运用小波变换域的运动估计和补偿算法的图像运动估计和补偿,具有运算量少,压缩率大 的特点。 本文也设计和实现了一个简单的v o d 系统,该v o d 系统主要实现对视频节目的播 放、传输,以及对存储视频信息的数据库进行管理的功能,为进一步研究视频图像压缩算 法在v o d 中的应用提供了一个完整的平台。 关键词:v o d ;小波变换;运动估计和补偿;e z 、;多媒体;图像压缩 t h er e s e a r c ha n di m p l e m e n t a t i o no ft h ei m a g ec o m p r e s s i o n m e t h o di nav o da p p l i c a t i o n d i s c i p l i n e :c o m p u t e rs o f t w a r ea n dt h e o r y s t u d e n ts i g n a t u r e : s u p e r v i s o rs i g n a t u r e a b s t r a c t a l o n gw i t ht h er a p i dd e v e l o p m e n to ft h ec o m p u t e r - n e t w o r ka n dc o m p u t e r - c o m m u n i c a t i o n t e c h n o l o g y , t h er e q u i r e m e n t so ft h em u l t i m e d i aa p p l i c a t i o n ,s u c ha sp l a y i n gt h eh i g hq u a l i t y v i d e o a u d i o ,t h r o u g ht h en e t w o r ki n c r e a s ev a s t l y t h ev a r i o u sn e t w o r ka p p l i c a t i o n sa n d i n f o r m a t i o ns e r v i c e sb a s e do nt h ev i d e oo nd e m a n d ( v o d ) h a v eb e c o m eap a r to ft h ed a i l yl i f e o fh u m a nb e i n g t h et e c h n o l o g yo fv o di sak i n do fm u l t i d o m a i nc o n v e r g i n gt e c h n o l o g y , s u c ha st h ec o m p u t e r , n e t w o r k ,m u l t i m e d i a ,t e l e v i s i o na n dt h ed i g i t a lc o m p r e s s i o nt e c h n o l o g y t h ev o d s y s t e m sc h a r a c t e r i s t i ci st h er e a l - t i m et r a n s m i s s i o no ft h ev i d e oi m a g e ,a n da sw e k n o wt h ei m a g ei n c l u d e sh u g ei n f o r m a t i o nw h i c hc o n s u m e sg r e a tr e s o u r c e sf o rt r a n s m i t t i n ga n d s t o r i n g ,t h e r e f o r et h ei m a g ec o m p r e s s i o nh a sb e c o m eo n ek e yt e c h n o l o g yi nv o ds y s t e m h o w t ot r a n s m i tah i g hq u a l i t yi m a g ew i t ht h el e a s td a t as t r e a mt h r o u g ht h el i m i t e db a n d w i d t hh a s a t t r a c t e dm o r ea n d m o r er e s e a r c h e r si nt h i sr e g i o n t h r o u g ht h er e s e a r c ha n du n d e r s t a n d i n go ft h ei m a g ec o m p r e s s i o nt e c h n o l o g y , t h i sp a p e r e l a b o r a t e st h ek e yt e c h n o l o g i e so fv i d e oc o m p r e s s i o n ,s u c ha s t r a n s f o r m i n gc o d e s , q u a n t i f i c a t i o nc o d e s ,p r e d i c t i v ec o d e s ,m o v e m e n te s t i m a t ea n dm o t i o nc o m p e n s a t i o nc o d e sa n d c o d i n gt e c h n i q u e ,a sw e l la st h ev a r i o u sc l a s s i c a la l g o r i t h mu s e di nt h e s ek e yt e c h n o l o g i e s a n d p r o p o s e di n n o v a t i v e l yt w om e t h o d s ,o n ei sc a r r i e do na f t e rt h ew a v e l e tt r a n s f o r m a t i o n si m a g e d i v i d e st h ef r e q u e n c yb a n dp r o g r e s s i v eq u a n t i f i c a t i o na l g o r i t h m ,a n da n o t h e ri st h ew a v e l e t t r a n s f o r m a t i o nt e r r i t o r ym o v e m e n te s t i m a t ea n dt h ec o m p e n s a t i o na l g o r i t h m t h er e s u l to ft h e e x p e r i m e n t i n d i c a t e st h a tt h es m a l l w a v e l e n g t h d i v i s i o n f r e q u e n c y b a n d p r o g r e s s i v e q u a n t i f i c a t i o na l g o r i t h mh a st h ef e a t u r eo fl e s sc o m p u t i n ga n dg o o dq u a l i t yo fr e c o n s t r u c t u r e i m a g e ,a n dt h ew a v e l e tt r a n s f o r m a t i o nt e r r i t o r y sm o v e m e n ta n dt h ec o m p e n s a t i o na l g o r i t h m h a st h ef e a t u r eo fl e s sc o m p u t i n ga n dh i g l lc o m p r e s s i o nr a t e a tt h es a m e ,t h i sp a p e ra l s od e s c r i b e sb r i e f l yo ft h ed e s i g na n di m p l e m e n t a t i o no fas i m p l e v o ds y s t e m ,t h i ss y s t e mh a s t h ef u n c t i o no ft h ev i d e op l a y i n g , t r a n s m i t t i n ga n ds t o r a g e m a n a g i n g ,w h i c hp r o v i d e sap l a t f o r mf o r t h ef u r t h e rr e s e a r c ho ft h ei m a g ec o m p r e s s i o n i nv o d a p p l i c a t i o n k e yw o r d s :v o d ;w a v e l e tt r a n s f o r m ;c o r r o s i o ns c a l e ;m o t i o ne s t i m a t i o na n dc o m p e n s a t i o n ; e z w ;m u l t i m e d i a ;i m a g ec o m p r e s s i o n 学位论文知识产权声明 学位论文知识产权声明 本人完全了解西安工业大学有关保护知识产权的规定,即:研究生在校攻读学位期间 学位论文工作的知识产权属于西安工业大学。本人保证毕业离校后,使用学位论文工作成 果或用学位论文工作成果发表论文时署名单位仍然为西安工业大学。大学有权保留送交的 学位论文的复印件,允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内 容,可以采用影印、缩印或其他复制手段保存学位论文。 ( 保密的学位论文在解密后应遵守此规定) 学位论文作者签名: 彻魄弘 一钥民 学位论文独创性声明 学位论文独创性声明 秉承学校严谨的学风与优良的科学道德,本人声明所呈交的学位论文是我个人在导师 指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地 方外,学位论文中不包含其他人已经发表或撰写过的成果,不包含本人已申请学位或他人 已申请学位或其他用途使用过的成果。与我一同工作的同志对本研究所做的任何贡献均已 在论文中作了明确的说明并表示了致谢。 学位论文与资料若有不实之处,本人承担一切相关责任。 学位论文作者签名:物蛑缎 指剥雠:勿坻 日期: 2 卅,。仃 日期:训,uif 1 绪论 1 绪论 1 1 视频点播的发展和研究现状 1 1 1 视频点播的概念 视频点播( v o d ,v i d e oo nd e m a n d ) 是一种可以按用户需要点播节目的交互式视频 系统,可以为用户提供各种交互式信息服务【。 视频点播系统一般由三部分组成:v o d 服务端系统、传输网络、用户端系统【1 】ov o d 服务端系统主要由视频服务器、档案管理服务器、内部通讯子系统和网络接口组成。v o d 系统结构如图1 1 所示。 用尸果曲终端 图1 1v o d 系统结构图 视频点播是近年来新兴的一种网络传媒方式,它是计算机技术、网络通信技术、多媒 体技术、电视技术和数字压缩技术等多学科、多领域融合交叉的产物。传统的广播电视, 用户只能被动地接收电视台所播出的节目。而v o d 从根本上改变了传统广播电视的单向 传输、用户对视频节目无权选择的状况,使用户不仅能够观看固定节目,而且还可以自由 选择存放在视频点播系统中的视频信号,随时点播自己想看的节目。 1 1 2 视频点播的发展 1 9 8 6 年,南方贝尔( b e l ls o u t h ) 公司就开始了有关v o d 的实验【2 1 。1 9 8 8 年以后,世界 各国相继推出了v o d 的商业、信息和时装数据服务系统等,在地区文化设施、展示设施 及企业内投入运行。当时称之为视频响应系统( v r s ,v i d e or e s p o n s es y s t e m ) 1 3 1 。这些系统 都采用录像机和激光视盘等模拟存储媒体,现在,由于视频信息数字化和数字存储技术的 进步,已经开发了能大量存储并提供视频信息的所谓视频服务器及s t b ( s e tt o pb o x ) 4 。 1 9 9 3 年,联邦政府批准大西洋贝尔( b e l la t l a n t i c ) 公司可以在现有电话线上进行传送 t v 视频拨号音试验。紧接着大西洋贝尔公司和p o t o m a c t e l e p h o n e 公司被授权在1 9 9 4 年 西安工业大学硕士学位论文 3 月对2 0 0 0 个用户进行试验,试验中将m p e g 1 压缩视频节目传送到用户的机顶盒,解码后 送给用户电视机。同年,n y n e x 公司开始向曼哈顿的居民提供第一套试验性的点播电视系 统【5 1 。 1 9 9 4 年1 2 月1 4 日,在美国召开了t i m ew a r n e r 全业务网( f u l ls e r v i c en e t w o r k ) 新闻 发布会,后来通常称这一天为点播电视的诞生日。从此,点播电视系统进入了蓬勃发展的 时期1 5 。 1 9 9 5 年1 月在日本举行的第一届多媒体行业交流会上,第一次提出了“v o d ”的概 念,并进行了专题讨论。由n e c ,s o n y 等公司介绍本公司在v o d 设备、v o d 系统和 v o d 显示等方面的研究情况以及v o d 的公众应用实例掣引。 1 9 9 5 年7 月i b m 公司宣布建立交互式电视应用开发实验室,并选用了m i c r o w a r e 的数 字音频视频交互式解码系统( d i g i t a la u d i o v i s u a li n t e r a c t i v ed e c o d e r ,d a v i d ) 作为交互式 电视应用开发实验室的开发平台。 1 9 9 6 年,我国海南三亚信息工业公司( ( s i i ) 与美国微软公司合作,在上海地区进行了 交互式电视( m i 珊的试验,参加的单位有上海信息工业公司、上海教育电视台、上海广 播电视局以及上海电信局,并于当年投入市场试验。1 9 9 7 年,广东在全省建设了综合业 务宽带网络,并在其上开展点播电视业务。1 9 9 9 年初,四川成都开始实验基于机顶盒接 收的有线电视业务,这一实验无疑对今后点播电视系统的实现打下了良好的基础。 目前,全世界己有几十个国家开发或者提供点播电视的实验和服务。同时,各种小型 点播电视系统也在飞速发展。基于小型服务器和局域网环境的公司培训点播电视系统、旅 馆用娱乐点播电视系统、学校用教学点播系统都已经出现,它标志着视频点播系统己经走 入了我们的生活。 1 1 3 视频点播的研究现状 目前,市面上已经涌现出了不少v o d 产品,基于口网络的有m i c r o s o f t 的m e d i a s e r v e r 、r e a ln e t w o r k 的r e a ls y s t e m ,c i s c o 的m 们,等;基于c a t v 网络的有北京算通 的点播之星、世纪鼎点、深圳迪瑞等。很多产品已经有五年甚至十年的历史,它们对于开 展v o d 应用起到了一定的推动作用。然而,v o d 却迟迟没有普及,人们一直渴望的“随 时随地获得需要的任何视频信息 的梦想一直没有实现。最主要的原因是技术上的障碍, 视频数据具有占用存储空间大、传输带宽高、实时性强等特点,比如一个典型的v c d 质 量的影片需要占用1 2 g 字节的磁盘空间,传输带宽为1 5 m b p s ,而d v d 质量的影片高达 4 g 字节、2 5 m b p s 。这无疑对视频服务器的性能和传输网络的带宽提出了很高的要求,尽 管通过提升服务器性能、扩充网络带宽可以暂时使之得到缓解,但硬件设备上的投入是十 分巨大的,比如,一台可以提供1 0 0 个并发v c d 质量视频流的服务器造价高达8 0 万元 人民币。 现在,国内外许多研究机构正在研究超大规模的v o d 系统,通过将节目的点播与节 目存储调度等方面紧密结合在一起,来解决现有v o d 系统的弊端,为更多的用户提供高 2 西安工业人学硕士学位论文 质量的点播服务。v o d 系统长期以来面临的这一挑战,使其迟迟得不到普及。 1 2 视频压缩技术 1 2 1 视频压缩技术的发展 人们经常接触的信息主要有三大类:语音信息、文字信息和图像信息。据科学研究和 统计表明,人们所获取的信息中,大约7 0 以上是通过视觉获取的图像信息【7 】。与文字信 息和语音信息相比,图像信息直观性强、信息量大,但是,需要大的存储容量和宽的传输 信道,未经压缩的图像数据量十分巨大。例如,对于v h s ( v i d e oh o m es y s t e m ,家用录 像系统) 级别的彩色视频图像而言,其每帧图像的分辨率为3 5 2 x 2 8 8 像素,如果每个彩 色分量采用8 比特量化,帧率为每秒3 0 帧,则每秒数据量为:3 5 2 x 2 8 8 2 4 3 0 = 7 1 2 8 m b i t , 6 0 分钟视频的数据量高达2 5 0 g 。如果不进行数据的压缩,以现有网络的带宽以及存储介 质,传输和存储这些庞大的数据几乎是不可能的,因而视频压缩技术已成为解决多媒体通 信和存储问题的一个关键环节。 图像编码压缩技术的基本思想是去除图像数据中各种相关性所带来的冗余。一般视觉 数据存在以下几种冗余 7 1 :空间冗余、时间冗余、信息熵冗余、结构冗余、知识冗余、视 觉冗余等,根据编码技术针对的冗余类型不同,t o m e s 等人把图像编码分为第一代编码技 术和第二代编码技术两个阶段【引。第一代的编码技术仅考虑图像及图像序列中的空间冗 余、时间冗余和信息熵冗余。其编码方法主要以像素或像素块作为编码实体,没有或较少 考虑人类视觉系统。第一代编码方法主要有:预测编码、变换编码、信息熵编码、矢量编 码、小波编码等【引。因此在八十年代初产生的第二代编码技术,进一步考虑了视觉数据中 的结构冗余、知识冗余和视觉冗余,获得了更高的压缩效率和更好的视觉效果。具有代表 性的第二代编码方法主要有:基于分割的编码方法【1 0 1 、基于模型的编码方法【1 1 1 和分形编 码【1 2 】等。 第一代编码技术是目前编码标准中广泛使用的技术。但它是基于图像分块的编码技 术,与人类视觉系统的机理不一致,特别是在低码率时的效果很差。第二代图像编码方法 建立在图像分析和合成、计算机图形学、计算机视觉等基础上,其中许多新的编码技术还 有待于进一步的研究与探索。 1 2 2 视频压缩标准 国际上,主要有两个关于音视频压缩的国际标准化组织,即国际电联( f r o n 和国际 标准化组织( i s o ) 。相应的,视频编码标准有两个系列【1 3 】,表1 1 给出了各种视频压缩编 码标准的简要特征和应用领域。 1 ) 国际电联( r r o d 制定的应用于网络通讯行业的h 2 6 x 系列标准,如:用于 p 6 4 k b p s ( p = 1 , 2 ,3 0 ) 速率下的视频编解码标准h 2 6 1 1 1 4 1 ;而向甚低码率通信的视频编 码标准h 2 6 3 1 1 5 】;以及h 2 6 3 的后续版本h 2 6 3 + 1 1 6 1 、h 2 6 3 + + 1 1 7 1 ;以及最新的视频压缩标 3 两安t 业大学硕十学位论文 标准图像分辨率( 像素)主要性能和应用领域 a 、h 2 6 1 标准是为i s d n 设计,主要针对实时编码和解码设计,压缩和解压缩的信 号延时不超过1 5 0 m s ,码率p 6 4 k b p s ( p 一1 , 2 ,3 0 ) 。h 2 6 1 标准主要采用运动补偿的帧 间预测、d c t 变换、自适应量化、熵编码等压缩技术。只有i 帧( i n t r af r a m ep i c t u r e s , 帧内图像) 和p 帧( p r e d i c t e dp i c t r u e s ,前向预测图像) ,没有b 帧( b i d i r e c t i o n a lp r e d i c t i o n p i c t u r e s ,双向预测图像) ,运动估计精度只精确到像素级。支持两种图像扫描格式:q c i f 4 西安t 业大学硕士学位论文 ( q u a r t e rc o m m o ni n t e r m e d i a t ef o r m a t ) ( 分辨率为1 7 6x1 4 4 ) 和c i f ( c o m m o ni n t e r m e d i a t e f o r m a t ) ( 分辨率为3 5 2 x 2 8 8 ) 。 b 、h 2 6 3 标准是甚低码率的图像编码国际标准,它一方面以h 2 6 1 为基础,以混合 编码为核心,其基本原理和h 2 6 1 十分相似,原始数据和码流组织也相似;另一方面, h 2 6 3 也吸收了m p e g 等其它一些国际标准中有效、合理的部分,如:半像素精度的运动 估计、p 帧预测、b 帧预测等,使它性能优于h 2 6 1 。h 2 6 3 使用的码率可小于6 4 k b s , 且传输比特率可不固定( 变码率) 。h 2 6 3 支持多种分辨率:s q c i f ( 分辨率为1 2 8x9 6 ) 、 q c i f ( 分辨率为1 7 6 x1 4 4 ) 、c i f ( 分辨率为3 5 2 x 2 8 8 ) 、4 c i f ( 分辨率为7 0 4 x 5 7 6 ) 、 1 6 c i f ( 分辨率为1 4 0 8x1 1 5 2 ) 。 c 、h 2 6 4 集中了以往标准的优点,并吸收了以往标准制定中积累的经验,采用简洁设 计,使它比m p e g 4 更容易推广。h 2 6 4 创造性了多参考帧、多块类型、整数变换、帧内 预测等新的压缩技术,使用了更精细的分像素运动矢量( 1 4 、1 8 ) 和新一代的环路滤波器, 使得压缩性能大大提高,系统更加完善。h 2 6 4 主要有以下几大优点: 高效压缩:与h 2 6 3 + 相比,减小5 0 l 匕特率; 延时约束方面有很好的柔韧性; 容错能力; 编解码的复杂性可伸缩性; 解码全部细节:没有不匹配; 高质量应用; 网络友善。 2 ) 国际标准化组织( i s o ) 运动图像专家组( m p e g ) $ 1 j 定的应用于媒体业务的m p e g x 系列标准,如:应用于v c d 业务的m p e g l 1 s l ;应用于d v d 业务的m p e g 2 1 1 9 】;更高压 缩效率与应用范围的m p e g 4 1 2 0 1 ;以及多媒体描述标准m p e g 7 1 2 1 1 、多媒体框架标准 m p e g 2 11 2 2 】等。 a 、m p e g l 标准用于数字存储体上活动图像及其伴音的编码,其数码率为1 5 m b s 。 m p e g l 的视频原理和h 2 6 1 的相似。m p e g l 视频压缩策略:为了提高压缩比,帧内帧 问图像数据压缩技术必须同时使用。帧内压缩算法与j p e g 压缩算法大致相同,采用基于 d c t 的变换编码技术,用以减少空域冗余信息。帧间压缩算法,采用预测法和插补法。 预测误差可在通过d c t 变换编码处理,进一步压缩。帧间编码技术可减少时间轴方向的 冗余信息。m p e g l 视频压缩技术的特点如下: 随机存取; 快速正向逆向搜索; 逆向重播; 视听同步; 容错性; 5 两安t 业大学硕士学位论文 编解码延迟。 b 、m p e g 2 被称为“2 1 世纪的电视标准”,它在m p e g l 的基础上作了许多重要的扩展 和改进,但基本算法和m p e g l 相同。 c 、m p e g 4 标准并非是m p e g 2 的替代品,它着眼于不同的应用领域。m p e g 4 的制 定初衷主要针对视频会议、可视电话超低比特率压缩( 小于6 4 k b s ) 的需求。在制定过 程中,m p e g 组织深深感受到人们对媒体信息,特别是对视频信息的需求由播放型转向 基于内容的访问、检索和操作。m p e g 4 与前面提到的m p e g l 、m p e g 2 有很大的不同, 它为多媒体数据压缩编码提供了更为广阔的平台,它定义的是一种格式、一种框架,而不 是具体算法,它希望建立一种更自由的通信与开发环境。于是m p e g 4 新的目标就是定义 为:支持多种多媒体的应用,特别是多媒体信息基于内容的检索和访问,可根据不同的应 用需求,现场配置解码器。编码系统也是开放的,可随时加入新的有效的算法模块。应用 范围包括实时视听通信、多媒体通信、远地监n 监视、v o d 、家庭购物娱乐等。 实际上,许多标准是两大国际标准组织合作的产物,如图1 2 所示。 i - i 一1 i 八z u l i m p e g l 1 , i j h 2 6 2 l ,l p e g 2 山 i h 2 ,6 3 l ! 上 0 i r lh 2 6 3 + l i n 伊e g 4 + i h 2 6 3 + + i 上、r h 2 6 4 m p e g 4p a r t l 0 图1 2 国际标准化组织及其标准图 视频压缩标准在当前多媒体通信领域内得到了广泛的应用,如h 2 6 1 在i s d n 视频会 议,h 2 6 3 在可视电话、视频会议,m p e g l 在v c d ,m e p g 2 在d v d 中的应用等。其中 m p e g 2 是当前公认最成功的视频压缩标准,虽己历时十余年,但仍在d v d ,数字卫星广 播、数字机顶盒等领域得到广泛应用。m p e g 4 是一个在编码效率和编码质量上都较为优 秀的视频编码标准,但是由于专利收费的问题,没有得到业界的广泛支持。 1 3 课题研究的意义 v o d 与一般的数据业务不同,它是具有数据流特性的业务,数据量很大。例如: 1 ) 一个y u v 格式的c i f 序列图像,分辨率为3 5 2 x2 8 8 ,y u v 的采样频率比例为 6 1 ii i一 西安工业大学硕士学位论文 4 :2 :0 ,每一帧图像的数据量为:3 5 2 2 8 8 x 4 + 3 5 2 2 8 8 ) 2 - - 6 0 82 5 6 字节。播放一秒序 列图像的数据量为:( 3 5 2 2 8 8 4 + 3 5 2 x 2 8 8 2 ) x 3 0 = 1 82 4 76 8 0 字节。 i l y 1iy 2y 3iy 4 ii uv 图1 3y u v 的内存布局图 2 ) 数字电视图像中的n t s c ( 3 5 2 2 4 0 ) 制式4 :4 :4 采样,每帧的数据量为3 5 2 x2 4 0 ) ( 4 + 4 + 4 ) 8 1 0 2 4 = 7 9 2 0 k b ,每秒的数据流量可达2 3 2 m b ;p a l ( 3 5 2 2 8 8 ) 制式4 :4 :4 采样的彩色视频的数据流量可达2 7 8 4 m b p s 。 3 ) 一般电信提供的网络带宽是1 m b p s ,而一秒q c i f 序列图像( 分辨率为1 7 6 x1 4 4 ) 的数据是( 1 7 6 ) 1 4 4 ) 4 + 1 7 6 x1 4 4 ) 4 8 3 5 p s n r 4 8 2 9 t ,输出一个符号。解码器输入这个符号时,设x ( i ,j ) 一o 2 5 t 。 3 ) 副扫描。细化重要系数,为每个重要系数输出一位1 或o ,表示该系数处于区间 的上部或下部。解码器收到这一位后,把当前系数增加0 2 5 t 。 4 ) 令t t 2 ,如果需要更多迭代,转第2 ) 步。 对每一个给出的阈值王,每一遍扫描产生两个表,主表和副表。主表由4 个符号( p o s 、 n e g 、i z 或z t r ) 构成,副表由两个符号( 1 或0 ) 构成。 图4 1 0 给出了一个8 8 图像的三层小波分解系数值,并说明进行e z w 编码的简单 过程。 6 33 471 31 27 4 91 0 1 41 3 3 l2 33461 1 51 431 2 5- 739 9 7- 1 48 4 - 232 5914 746- 22 3o3232o 4 2- 3643 63 6 51 l56o3 4 4 由于x 一一6 3 ,取t o = 2 1 螂:6 3 j 一3 2 ,进行第一遍主扫描,产生第一次主表,即以t 0 为f 限的重要系数映射。若是正数( p o s ) 则主扫描重构值一+ t o + 1 ,若是负数( n e g ) 则主扫描重构值= 一t o + ) ,第一遍主扫描表见表4 2 所示。 接着进行副扫描,进行副扫描的目的是使重构系数更准确,对图像重建质量要求不高 的情况下,可以不进行副扫描。在主扫描时共发现4 个重要系数,依次为 6 3 ,一3 4 ,4 9 , 4 7 ,解码器确定它们的绝对值位于区间 3 2 ,6 4 ) ,因此用4 8 作为它们的重构值。本文在 这里介绍一下副扫描,因为本文的量化思想要用到副扫描。将主扫描量化区间分成上半区 4 8 , 6 4 ) 和下半区 3 2 ,4 8 ) ,如果这个数是正数( p o s ) 且处于上半区 4 8 ,6 4 ) ,则 副扫描重构值一+ ( i 主扫描重构值l + 兰竺_ 二坚掣1 ) ,如果这个数是负数c g ) 西安工业大学硕士学位论文 且处于上半区 4 8 , 6 4 ,则副扫描重构值= 一( i 主扫描重构值| + 兰竺二壁掣1 ) , 如果这个数是正数( p o s )且处于下半区 3 2 ,4 8 ) ,则 副扫描重构值一+ ( i 主扫描重构值| _ f 兰竺二壁掣1 ) ,如果这个数是负数c g , 且处于下半区 3 2 , 4 8 ,则副扫描重构值= 一( 1 主扫描重构值| - f 兰竺_ 二坚掣1 ) , 表4 2 第一遍主扫描表 在第二遍扫描时,令t 一1 6 ,此时小波系数矩阵中4 个幅度最大的系数已经被清为0 , 并在扫描时跳过。在每一遍扫描后,先后将主表和副表送入编码器进行熵编码,这个过程 4 0 西安t 业大学硕士学位论文 一直进行到结束。 表4 3 第一遍副扫描表 系数值重构值 6 3 3 4 4 9 4 7 5 6 4 0 5 6 4 0 4 3 2e z w 算法的优化 嵌入式零树小波编码算法是零树与逐次逼近量化技术的结合。在编码过程中要一遍一 遍的扫描图像矩阵寻找重要系数。如果图像分辨率高,那么这样扫描会占用很多时间,所 以在本系统中对其进行了改进。对图像的低频部分不在进行扫描而直接编码,对高频的不 同部分采用不同阈值的逐次量化方法,这就与嵌入式零树小波编码算法中的逐次逼近量化 思路一致,而本系统采用对最高分解层上三个不同方向的高频系数h k 、l h n 、h n n 分别 设置阈值,然后再进行逐次量化的方法,这样不仅缩小了扫描范围节约了时间,而且分别 设计量化阈值可以得到更准确的反量化矩阵达到更好的图像重构效果。 图4 1 1 本文的三层小波分频带逐级量化示意图 本文三层小波分频带逐级量化算法的思想如下: 1 ) 将低频l l 中的数据都看作是重要数据全部保留,然后分别对l h 3 、h l 8 和h h 3 取初始阈值t ol h 、t oh l 和t o。hh 2 ) 在l h 3 、h l 3 和h h 3 分别对应的下一层小波变换系数域l h 2 、h i - , 2 和h h 2 中进行 扫描,生成三个主表,将已发现的重要系数放入三个副表。 3 ) 细化重要系数过程,之后与e z w 算法思想一致。 用图4 1 0 给出的三层小波分解系数值做实验,经过e z w 算法两遍扫描的重构系数如 图4 1 2 所示,经过本文的量化思想两遍扫描的重构系数如图4 1 3 所示。这里所说的扫描, 每一遍都包括一遍主扫描和一遍副扫描。 由上述小波系数矩阵可以看出,在相同扫描次数的前提下,本文算法比e z w 算法重 4 1 西安工业人学硕十学位论文 建系数多。也就是说,e z w 算法要达到和重建和本文算法一样多的系数,就需要比本文 更多的扫描次数,自然要到达同样的效果时间就比本文需要的长。 5 0- 4 0 ooo o 5 6 0 o0 - 2 42 40000 o0oo o0o o o 0o0 0ooo oo0 4 0oo0o o0o o0o0 o o00 00 oo0 o 00 000oo 图4 1 2e z w 算法两遍扫描后重建的三层小波 变换系数矩阵图 6 33 45 6o 0o0o 3 l2 30 0 oooo 0oo 1 2o0oo 0o1 41 0 oooo oo04 057oo 0000o 005 o000o7o7 00000o 55 图4 1 3 本文算法两遍扫描后重建的三层小波 变换系数矩阵图 4 4 帧间的运动估计和补偿算法优化 4 4 1 基于块匹配的运动估计和补偿 帧间的运动补偿和估计算法的好坏直接影响着整个图像压缩算法的优劣。常用的帧间 运动补偿和估计算法是将当前帧分块,将当前帧的每一块在前一帧的搜索范围内寻找自己 最匹配的块。 块匹配准则是判断块相似程度的依据,因此匹配准则的好坏直接影响了运动估计的精 度。另一方而,匹配运算复杂度、数据读取复杂度和内存管理复杂度在很大程度上取决于 所采用的块匹配准则。降低块匹配准则的计算复杂度是提高运动估计算法速度的两条途径 之一,另一种提高运动估计算法的途径是减少搜索匹配的点数。常用的块匹配准则有以下 几种: 1 ) 平均绝对误差函数( m e a no f a b s o l u t ee r r o r ,m a e ) 3 6 l 脱4 e ( f ,j ) 2 丙一篇l v 篇i v ) 一 一- 似+ f ,刀+ j 】 ( 4 1 ) 帆,) - m u 即i n m a e ( i ,j ) l 。,t = u 其中,f ,分别为水平与垂直方向的偏移量;九似,1 ) 表示第k 帧图像在像素点锄,1 ) 处 的灰度值;无一。似+ f ,l + _ ) 为参考帧第k 一1 帧搜索窗口内相对于当前块偏移为g ,_ ) 的块; 块的运动矢量为帆,k ) ,d 表示搜索区域,g 表示当前块在的区域。 2 ) 互相关函数( c r o s sc o r r e l a t i o nf u n c t i o n ,c c f ) 1 3 7 4 2 西安工业大学硕士学位论文 c c f ( i ,j ) = 荟荟 b ,刀) 一- b “刀+ _ ) 帆,巧) | m a x c c f ( i ,j ) 3 ) 均方误差函数( m e a no fs q u a r ee r r o r ,m s e ) 【3 8 】 ( 4 2 ) m s e ( i ,j ) = 矿1 未n 荟n 阮b ,甩) 一 一。似+ 咖t + j 圩 ( 4 3 ) 帆,_ ) _ m u 剧i n m s e ( i ,j ) 4 ) 最大误差最小函数( m m e ) 1 3 9 l m m e ( i ,j ) ;黑鍪i 似,1 ) 一,七一tm + i ,栉+ 歹) i ( 4 4 ) 帆,_ ) _ m 即i n m m e ( i ,j ) 5 ) 绝对误差和( s u mo fa b s o l u t ed i f f e r e n c e ,s a d ) s a o ( ,j ) 。薹善l ,以) 一 4 似+ f ,厅+ 州 ( 4 5 ) 帆,巧) = m 叫i n s a d ( i ,j ) 6 ) 最大匹配像素数( m p c ) m l m p c ( i ,加磊荟z m )舶镯 其中,丁g ,- j ,聊,z ) = 乜 帆,巧) _ 一m i n m p c ( i ,歹) 当l f 2 ( m ,n ) - f l ( i + m ,+ 一l f 时 其它时候 ( 4 6 ) ,t 为阈值,是判断每个像素或归 入匹配像素的依据。 上述常用的块匹配准则计算复杂度比较如表4 4 所示。 表4 4 准则函数计算复杂度比较表 从上表4 4 可以看出,m m e 匹配函数过于简单,没有充分利用匹配块所包含的特征 4 3 西安工业大学硕十学位论文 信息,因此运动估计的精度不高;c c f 匹配函数的计算过于复杂,算法耗时太多。m s e 匹配函数运动估计的精度最高,匹配效果接近于人眼的觉察力;与m s e 相比较,m a e 匹配函数的计算量相对较小,效果接近于m s e ,试验表
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 大模型助力工科类专业跨学科融合教学模式研究
- xx园区污水处理及管网配套工程施工方案
- 会记基础试题及答案
- 税法基础试题及答案四
- 高强度铝合金制品生产制造项目经济效益和社会效益分析报告
- 焦化厂循环水系统改造工程实施方案
- 矿山合作协议及承包权转让与执行监督协议
- 食用菌种植加工项目可行性研究报告
- 社会保险停缴期间劳动者权益保障及再就业合同
- 社区绿化带租赁与景观维护管理合同
- GJB9001C质量保证大纲
- SYT 6680-2021 石油天然气钻采设备 钻机和修井机出厂验收规范-PDF解密
- 《遗传学》课程标准
- 蛋白质分离纯化及鉴定
- 2024年化粪池清理合同协议书范本
- 债权债务法律知识讲座
- 南京财经大学《812西方经济学(宏观经济学、微观经济学)》历年考研真题及详解
- 基于教育培训行业的客户关系营销研究
- 肉制品工艺学-香肠类制品-课件
- 超全QC管理流程图
- 2广告实务课程标准
评论
0/150
提交评论