




已阅读5页,还剩80页未读, 继续免费阅读
(通信与信息系统专业论文)视频系统的图像压缩技术实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
武汉理上大学硕士学位论文 摘要 随着信息社会的发展,人类希望无论何时何地都能方便、快捷地获得各种信 息。视频信息由于其直观、生动和形象的特性,对人类生活和工作的信息获取 具有非常重要的作用。视频传输更受到人们广泛的关注,是未来通信领域的热 点。与话音相比,视频信息数据量大,所需的传输频带较宽,这常常会大大增 加成本甚至于使传输根本无法实现,因此在保证一定通信质量的前提下,压缩 视频信息的数据量,从而压缩所需传输信道的带宽是实现视频传输的一个关键 问题。 在目前的视频编码系统中,由于采用视频编码算法的复杂度较高,运算量 较大,用软件方法一般都难以达到实时性能要求,因此,该类系统多考虑采用 硬件来实现。d s p 芯片能够实时地对大量数据进行数字技术处理,这种实时能力 使d s p 在象数字通信、图像处理、多媒体技术等不允许时间延迟的领域应用十 分理想。t i 公司推出的t m s d m 6 4 2 系列以其处理能力强、开发工具高度集成等特 点被大多数嵌入式图像压缩系统所采用。 由于m p e g 系统在帧内压缩部分有着很大的相关性,所以本文首先对m p e g 一2 视频压缩标准的特点和新技术进行了简单阐述。然后,详细介绍了m p e g 一2 图像 帧内编码中用到的关键算法:d c t 变换、量化、游程编码和h u f f m a n 编码,通 过分析提取出其中比较耗时的算法进行改进。并采用改进的l o e f f l e r 算法进行 一维d c t 快速变换,对m p e g 量化技术也进行了优化,构造出一个可以避免除法 运算的改进的帧内量化矩阵。将程序移植到t m s d m 6 4 2d s p 芯片上,针对d s p 硬 件结构,做进一步优化,并在c c s 集成开发环境下进行了仿真。 关键词:图像压缩,d s p ,m p e g ,l o e f f l e r 垫堡垄王查堂堡主堂焦堡苎- - - _ - _ _ _ _ _ _ _ - _ _ _ _ - _ _ _ _ _ _ _ - - _ _ - _ _ _ _ _ _ - - - _ _ _ _ _ _ _ - a b s t r a t w i t ht h ed e v e l o p m e n to fi n f o r m a t i o ns o c i e t y ,p e o p l ew i s ht og e t v a r i o u si n f o r m a t i o nc o n v e n i e n t l ya n dq u i c k l yi na n yp l a c e b e c a u s eo f i t si n t u i t i o n i s t i c ,v i v i da n dv i s u a lc h a r a c t e r i s t i c ,v i d e oi n f o r m a t i o n p l a ya ni m p o r t a n tr o l ei nh u m a nl i f ea n di n f o r m a t i o na c q u i s i t i o n ,m o r e p e o p l ep a ya t t e n t i o nt ov i d e ot r a n s m i s s i o nt h a ti sah o t s p o ti nf u t u r e c o r m u n i c a t i o nd o m a i n c o m p a r ew i t ha u d i o ,v i d e on e e dm o r et r a n s m i s s i o n b a n db e c a u s eo fi t sm o r ed a t a ,w h i c hw i l li n c r e a s ec o s t ,e v e nw h i c hm a k e t r a n s m i s s i o ni m p o s s i b l et ob er e a l i z e d u n d e rp r e m i s eo fc o m m u n i c a t i o n q u a l i t y ,i ti s ak e yq u e s t i o nt oc o m p r e s st h ev i d e oi n f o r m a t i o nd a t a q u a n t i t y ,t h e nc o m p r e s st r a n s m i s s i o nb a n d i nt h ec u r r e n ti m a g ec o d i n gs y s t e m ,t h ei m a g ec o d i n ga l g o r i t h m sa r e v e r yc o m p l e x ,a n di ti si m p o s s i b l et oi m p l e m e n tt h er e a lt i m ec o d i n gu s i n g t h es o f t w a r e ,s ot h i sk i n do fs y s t e ma r eu s u a l l yi m p l e m e n t e db yh a r d w a r e t h et m s d m 6 4 2o ft ic o m p a n yh a sb e e nu s e di nm a n yi m a g ec o m p r e s s i o ns y s t e m s f o ri t sg o o dp r o c e s s i n gc a p a c i t ya n dt h eh i g hi n t e g r a t i o n t h e r ea r em a n yc o r 曲l o f lp o i n t si ni n t e rf r a m eo fm p e gs y s t e m f i r s t l y , t h et h e s i st a k e sa no v e r v i e wo ft h es p e c i a l t i e sa n dn e wt e c h n o l o g i e so f m p e g 一2 s e c o n d l y t h ek e ye n c o d i n ga l g o r i t h m si nm p e g 一2 ,i n c l u d i n gd c t , q u a n t i z a t i o n ,r u n l e n g t he n c o d i n ga n dh u f f m a nc e d i n g ,a r ep r e s e n t e d ,a n d t h e nt h ea l g o r i t h m sw h i c hc o n s u m et o om u c ht i m ea r ei m p r o v e d t h i r d l y , t h el o e f f l e ra l g o r i t h mi si m p r o v e d ; i nq u a n t i z a t i o np a r t ,an e wm a t r i x a v o i d i n gd i v i s i o no p e r a t i o n i sc o n s t r u c t e d m o r e o v e r ,f i n a l l y ,t h e s o f t w a r es y s t e mi sb e e nt r a n s p l a n t e di n t ot m s d m 6 4 2d s pc h i p ,a n dt h e e n c o d e ri ss i m u l a t e di nc c s k e yw o r d s :i m a g ec o m p r e s s i o n ,d s p ,m p e g ,l o e f f l e r n 此页若属实请申请人及导师签名。 独创性声明 本人声明,所呈交的论文是我个人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢 的地方外,论文中不包含其他人已经发表或撰写过的研究成果, 也不包含为获得武汉理工大学或其它教育机构的学位或证书而使 用过的材料。与我一同工作的同志对本研究所做的任何贡献均已 在论文中作了明确的说明并表示了谢意。 研究生签名: 关于论文使用授权的说明 本人完全了解武汉理工大学有关保留、使用学位论文的规定, 即:学校有权保留送交论文的复印件,允许论文被查阅和借阕; 学校可以公布论文的全部内容,可以采用影印、缩印或其他复制 手段保存论文。 ( 保密的论文在解密后应遵守此规定) 研究生签名:韭新签名:叵复兰竺日期 注:请将此声明装订在论文的目录前。 如盯f f i ) 武汉理工大学硕士学位论文 第1 章绪论 1 1 研究的目的与意义 步入2 1 世纪之后,社会也进入数字化的时代,而随着多媒体应用技术的飞 速发展,人们越来越愿意在f l 常生活、工作和学习中使用数字化多媒体手段来 解决遇到的问题。目前,用于银行、商场监控,城市交通管理、酒店、大厦安 全保卫的视频监控系统的市场需求量上升幅度较大,市场上已出现了多种图像 采集和传输产品,国内的视频监控系统可必分为三代: 第一代是传统的模拟视频监控系统,模拟视频监控系统要用同轴电缆将摄像 机输出的视频信号送往录像机。当摄像机与监控中心的距离较远或监控点过多 时,就需要铺设大量的同轴电缆,这样就造成了升高了系统造价。传统的模拟 闭路电视监控系统有很多局限性:首先,有线模拟视频信号的传输对距离十分 敏感;其次,有线模拟视频监控无法联网,只能以点对点的方式监视现场,并 且使得布线工程量极大;另外,有线模拟视频信号数据的存储会耗费大量的存 储介质( 如录像带) 。查询取证时十分烦琐。 第二代是视频采集卡,将其与p c 机结合构成视频监控系统,这种类型的监 控系统终端都需要一台微机,成本非常昂贵。基于p c 机的远程图像监控系统由 p c 机插视频卡构成,在监控现场,有若干个摄像机,各种检测、报警探头与数 据设备,通过各自的传输线路,汇接到监控终端机上,该终端可以是一台p c 机, 也可以是专用的工业机箱。基于p c 的视频监控系统终端功能较强,便于现场 操作。但稳定性不好,视频前端( 如c c d 等视频信号的采集、压缩、通讯) 较为 复杂,可靠性不高,p c 机也需专人管理,特别是在环境或空间不适宜的监控点, 这种方式不理想。 第三代是基于网络的嵌入式视频监控系统。它结合通信、计算机、网络、图 像编码和自动化技术,基本满足了人们对视频监控的要求,可以称为远程智能 数字视频监控系统。基于嵌入式设备的监控系统的优点是:由于这种系统的硬 件是一个同处理器和操作系统捆绑较为紧密、功能专一、专门设计的独立的设 备,不像插卡系统那样受通用计算机系统中其它软件硬件的影响,因此性能上 武汉理1 大学硕士学位论文 更稳定,且便于安装、维护,易于实现系统的模块化设计,便于管理、维护。 但第三代嵌入式视频监控系统由于数据量太大。虽然网络速度已在持续地增 长,并且a t m 技术预计将使速度提高到1 0 0 兆位秒,但极大量的数据对象仍要 好儿秒种来传输。一个1 0 0 兆位秒的l a n 实际上可传输的速率不超过5 兆字节 秒。只有几秒钟的时间用来检索、传输和显示图像,因此提高数据对象的存储 和传输效率是对多媒体系统来说至关重要的。 为了有效地管理大型多媒体数据对象,这些数据对象需要被压缩,以减少用 于存储这些对象的文件容量。压缩算法力图消除数据模式中的冗余度。例如: 一个黑色象素之后是2 0 个白色象素,就不用存储全部2 0 个白色象素。可以使 用编码机理,这样就只存储白色象素的个数。一旦这些冗余度被去掉,数据对 象就需要较少的硬盘存储器空间来存储。容量变小了,在网上传输所需的时间 也减少了许多,随之而来的是明显减少存储和传输成本。在一些实际的应用中, 例如,无人值守的仓库、机房、变电所、新闻现场、事故现场等等,在这些场 合需要轻巧灵活、使用方便、成本低、图像清晰、可以利用电话线或无线对讲 机和数传机传输图像的设备。我们先将图像信号数字化后先进行 m p e g m p e g 一2 m p e g 一4 j p e g2 0 0 0 编码“2 “,再将压缩后的图像数据传输给计算 机,从而构成一个能实现远距离监控并且价格适当的一个完全数字化的图像监 控系统。为了有效的对数据进行压缩和处理,因为m p e g 系列的帧压缩部分非常 类似,所以我们利用t i 公司的数字信号处理芯片来完成m p e g 一2 的行业标准, 由于条件所限,我们只研究m p e g - 2 的帧内压缩部分。数字信号处理芯片采用 t m s 3 2 0 d m 6 4 2 。 本文的目的就是研究:如何利用t i 公司现在主推的d s p d m 6 4 2 构成一个能 在信源端对视频信号进行采集和压缩,并在该芯片上进行m p e g - 2 视频图像的解 压缩,并对其像素级压缩解压缩进行优化。 1 2 国内外研究现状 1 2 1 数字信号处理的发展 数字信号处理( 包括对信号进行采集、变换、滤波、估值、增强、压缩、识 别等) ,是2 0 世纪6 0 年代发展起来的并广泛应用于许多领域的新兴学科。进入 武汉理工大学硕士学位论文 7 0 年代以来,随着计算机、大规模集成电路和超大规模集成电路以及微处理器 技术的迅猛发展,数字信号处理成为目前发展最快的学科之一。 数字信号处理器( 以下简称d s p 芯片) 是一种专门用于数字信号处理的微 处理器,是继微处理器( m p u ) 、微控制器( m c u ) 之后出现的第三次飞速发展 的微电子技术的结晶,是高性能数字系统的核心。由于d s p 芯片可实现各种复 杂运算,因而具有高性能、高精度、高速度、高重复性和低功耗等优点。用它 完成的板卡和系统设备具有先进性、实用性、广泛性和经济性,从而掀起了信 息数字化的浪潮。d s p 芯片能够实时地对大量数据进行数字技术处理,这种实时 能力使d s p 在象数字通信、图像处理、多媒体技术等不允许时间延迟的领域应 用十分理想,成为全球百分之七十数字电话的心脏,同时d s p 芯片在网络领域 中也有广泛的应用。目前,d s p 芯片与可编程门阵列芯片和m c u 芯片融合,取长 补短,达到了系统实时处理的功能特征和完善的功能应用;另一方面基于d s p 内核与外围元件集成而构成的片上系统( s o c ,s y s t e mo nc h i p ) ,使功能更完 善,体积小型化,系统功耗和成本相对降低,更加适用于军用和民用中多任务 多功能的课题任务。 1 9 7 8 年微系统( m i c r o s y s t e m s ) 公司的k m i 子公司宣布了世界上第一块单 片d s p 芯片$ 2 8 1 1 研制成功。1 9 7 9 年美国i n t e l 公司发布了商用可编程器件 2 9 2 0 ,它是d s p 芯片的一个主要里程碑。但是这两种芯片内部都没有现代d s p 芯片所必需的单周期芯片。自1 9 8 0 年以来,d s p 芯片得到了突飞猛进的发展, d s p 芯片的应用也越来越广泛。从运算速度来看,m a c ( 一次乘法和一次加法) 时间己经从8 0 年代初的4 0 0 n s 降低到2 n s 以下,处理能力提高了几百倍。从存 储容量来看,片内r a m 从几百个单元到几十胁,增加了一个数量级以上。从制 造工艺来看,1 9 8 0 年采用的是4 u m 的n m o s 工艺,而现在则普遍采用亚微米c m o s 工艺。d s p 芯片的引脚数量从1 9 8 0 年的最多6 4 个增加到现在的5 0 0 个以上,所 需设计的外围电路越来越少,每m i p s 的成本、体积和功耗均有很大程度的下降。 引脚数量的增多使得芯片应用的灵活性增加,使外部存储器的扩展和各个处理 器问的通信更为方便。和早期的d s p 芯片相比,现在的d s p 芯片有浮点和定点 两种数据格式,浮点d s p 芯片能进行浮点运算,使运算精度极大提高。d s p 芯片 的成本、体积、工作电压、重量和功耗较早期的d s p 芯片有了很大程度的下降。 从内部结构看,现在的d s p 芯片广泛采用多总线,多处理单元和多级流水线结 构,加上完善的接口功能,使d s p 芯片的系统功能、数据处理能力以及与外部 武汉理工大学硕士学位论文 设备的通信功能大大增强。 在d s p 开发系统方面,软件和硬件开发工具不断完善。目前某些芯片具有 相应的集成玎发环境,它支持断点的设置和程序存储器、数据存储器和d m a 的 访问及程序的单部运行和跟踪等,并可以采用高级语言编程,有些厂家和一些 软件开发商为d s p 应用软件的开发准备了通用的函数库及各种算法子程序和各 种接口程序,这使得应用软件开发更为方便,开发时问大大缩短,因而提高了 产品开发的效率。 随着d s p 芯片性能的不断改善,用d s p 芯片构造数字信号处理系统作信号 的实时处理已成为当今和未来数字信号处理技术发展的一个热点。随着各个d s p 芯片生产厂家研制的投入,d s p 芯片的生产技术不断更新,产量增大,成本和售 价大幅度下降,这使得d s p 芯片应用的范围不断扩大,现在d s p 芯片的应用遍 及电子学及与其相关的各个领域。 在安全防范领域,数字化已成不可逆转之趋势关于这一点,业内人士基本 上达成了共识。在此种风潮下,新兴的以计算机技术为依托的o v r 系统大有一 举取代录像机加画面分割器的传统模拟电视监控之势。各厂商为了能抓住这难 得一见的机遇,纷纷使出浑身解数,倾全力推出各自的d v r 系统,以期能在激 烈的市场竞争中先人一步、抢占先机。d v r 系统的研发与推出速度极快,目前已 形成了一个多元化的布局。 1 2 。1 岬e g 一2 编码现状 m p e g - 2 制定于1 9 9 4 年,设计目标是高级工业标准的图象质量以及更高的传 输率。m p e g - 2 所能提供的传输率在3 - l o m b i t s s e c 问,其在n t s c 制式下的分辨 率可达7 2 0 4 8 6 ,m p e g - 2 也可提供并能够提供广播级的视像和c d 级的音质。 由于m p e g 一2 在设计时的巧妙处理,使得大多数m p e g 一2 解码器也可播放m p e g 一1 格式的数据,如v c o ,m p e g 一2 除了做为d v d 的指定标准外,m p e g 一2 还可用于为 广播,有线电视网,电缆网络以及卫星直播( d i r e c tb r o a d c a s ts a t e l l i r e ) 提 供广播级的数字视频。 m p e g 一2 的另一特点是,其可提供一个较广的范围改变压缩比,以适应不同 画面质量,存储容量,以及带宽的要求“”。 现在国内外的m p e g 一2 编码、解码实现方法有“: 武汉理工大学硕士学位论文 1 采用软件实现 开发基于p c 的图像处理软件来对图像文件进行压缩、解压。采用全软件的 丌发方法,不用理会硬件结构;采用软件的方法具有最好的灵活性,实现起来 也最容易,但不适于小型移动数码设备运用,由于不是采用专用的硬件设备, 处理速度也较慢。 2 用全硬件实现方法 采用自顶向下的方法,开发专用的a s i c 压缩、解压处理器;a s i c 结构中每 个功能都采用专用的v l s i 结构,通过一个系统控制器控制各部分的运行。a s i c 结构能有效地提高系统时钟频率,运算速度快,但是a s i c 实现起来对技术要求 较高,开发周期较长,开发成本也很高,而且适应性差,a s i c 实现起来灵活度 是最低的,当编解码算法需要修改时要重新设计,设计改动起来很复杂。 3 基于数字信号处理器( d s p ) 的实现方法 即采用d s p 核实现一些较复杂的运算,而用一些硬件来实现大吞吐量的控 制、操作。 利用可编程多媒体d s p 处理器,使用更加灵活。采用汇编语言或者高级语 言,例如c 来实现,能够非常方便的修改设计,并且设计具有很高的可移植性, 设计实现起来也相对简单一些。同时d s p 处理器具有高速处理能力,完善的开 发工具及较低的价格,是理想的m e p g 实现平台,应用前景非常好。 在d s p 平台上进行视频产品开发有以下优势: ( 1 ) 用户开发自由度更大,支持多种个性化开发,可满足市场不断提出的 新要求,在第一时间提升产品性能,增强产品的竞争能力; ( 2 ) d s p 处理能力强可以在一个d s p 上同时实现多路音视频信号的压缩处 理,还可提供很多视频专用功能,比如视频滤波、高分辨显示输出、o s d 功能等; ( 3 ) 外围接口丰富,开发周期短,可实现快速技术更新和产品换代; ( 4 ) 芯片功耗低,为提高产品的稳定性提供可靠保障。 早期多媒体d s p 处理器有p h i l i p s 公司的t r i - m e d i a 及e q u a t o r 公司的 b s p 一1 5 ;近期全球最大的d s p 制造商德州仪器( t i ) 推出了一款高性能多媒体处 理器t m s 3 2 0 d m 6 4 2 。数字多媒体处理器d m 6 4 2 属t i 公司c 6 0 0 0 系列,是一款新 型高性能d s p ,基于c 6 4 x 内核,扩展的高级甚长指令字( v e i o c i t i ) 体系结构, 具有6 4 个3 2 位通用寄存器,8 个独立计算功能单元( 2 个乘法器,6 个算术逻 辑单元) 可以并行运行,因此多条指令可同时执行。它可在6 0 0m h z 时钟速率工 武汉理工大学硕士学位论文 作,每个指令周期可并行8 条3 2 位指令,因此,可达到4 8 0 0m i p s 的峰值计算 速度。在上面可以实现m p e g 一2 同步编码没有任何问题。 1 3 论文主要工作及内容安排 1 3 1 主要工作 随着图像压缩技术的发展,佼经过压缩处理后的图像信号带宽大大压缩,可 以在一般通信系统中传输,例如现在的会议电视、可视电话等。现在有很多 m p e g 一4 的d v r 运用,但成本高,运算量大,多路输出能力不强,m p e g - 2 算法相 对简单,将其优化后可以做更多路数的输出。本论文就是基于这种需求研究了 一种基于1 ) m 6 4 2 的m p e g - 2 压缩系统,这种压缩系统具有嵌入式系统的特点,集 图像采集、图像压缩等功能于一身,体积小,操作简单,而且功能易扩展,核 心芯片采用t i 公司的t m s d m 6 4 2 芯片。 本文所做的工作: 1 研究t i 最新主推的芯片d m 6 4 2 ,研究其硬件结构及其在视频采集,视频 处理的软件编程; 2 研究m p e g - 2 编解码算法,深入研究了m e p g 系列帧内的编解码的程序及 优化的方法; 3 研究m p e 6 - 2 算法在d m 6 4 2 上的实现及优化的方法。其中主要优化了d c t 与量化编码等的算法。 1 ,3 2 本文内容安排 第一章从图像压缩的必要性和可能性出发,论述了本论文的研究背景及其意 义,然后简单的介绍了数字信号处理器的发展,并对本文所做主要工作以及每 一章的内容做了简要的介绍。 第二章简单的介绍了本文所用的部分专业基础知识,包括图像压缩编码方法 分类和常用的图像压缩方法以及图像压缩编码标准,并介绍系统的输出图像标 准m p e g 一2 算法的编码基础和m p e g - 2 算法的基本原理,最后介绍了m p e g - 2 算法 中使用离散余弦变换d c t 及其二维d c t 决速算法、系数量化、不等长编码及熵 编码等算法。 亟堡堡i :查堂堡主堂堡堡塞一 第三章研究了m p e g - 2 图像编码、解码的标准。 第四章详细介绍了包括t m sd m 6 4 2 芯片的结构及t m sd m 6 4 2 视频处理板的功 能与结构,并研究了1 ) h f 6 4 2 的视频硬件电路的扩展。 第五章深入研究m p e g 一2 图像编码、解码的标准,在此基础上优化了l o f f l e r 算法及a c ,d c 系数量化矩阵。 第六章在前面的内容基础上在d m 6 4 2 上对帧内编码部分进行了优化。 第七章对前面的内容进行总结,并提出了系统应该改进的方向与措施。 武汉理1 二大学硕士学位论文 第2 章图像压缩编码概述 2 1 图像压缩概述 2 1 1 图像压缩的目的 在过去的十年里,需要存储、传输和处理的信息的数量成指数级地增加。这 主要要归因于两项技术的发展。一是多媒体系统在众多领域广泛应用,过去计 算机只能处理数字和文本,现在却已代之以声音、图像、电影和虚拟现实:另 一项是i n t e r n e t 的大发展,它使信息可以被许多人共享。这两项进展综合作用 产生了所谓的w o r l dw i d ew e b ,一个交互的、多媒体的、基于超文本的信息网 络。 首先,硬件方面的革新使这些发展成为可能:c p u 、磁盘、传输信道的性能 都迅猛发展。但是,从下面的事实可以看出,压缩技术仍有一段路要走:存储 一幅中等大小的图像,比如说5 1 2 x 5 1 2 像素,2 4 位真彩色,需要0 7 5 m b 的空 间。那么一视频信号通常要每秒钟3 0 帧。一幅标准的分辨率为1 2 u m 的3 5 m m 的 数字照片需要1 8 y i b 的空间。一秒钟的n t s c 彩色视频需要2 3 m b 的空间。 由此可见,无论是从经济还是技术的角度,现在的情况是光靠硬件的支持 并不能满足人们的需要。如果我们能用一种压缩了的形式来表示信息,我们能 明显地体会如下好处: ( 1 ) 节省存储空间; ( 2 ) 节省c p u 时间; ( 3 ) 节省传输时间。 我们日常用到的大部分信息都具有高度的相关性,或者说,它们本身包含 着冗余,因此,没有信息丢失的压缩是可能的。压缩中最关键的问题是能够在 原始数据和压缩数据之间快速的切换。 2 1 2 图像压缩的基本理论 压缩机制通常可以分为两种一有损压缩和无损压缩。在无损压缩中,我们关 武汉理工大学硕十学位论文 心的是精确重建没有信息丢失的数据,无损压缩通常被用于文本文件的压缩中。 对于有损压缩,我们允许压缩后产生质量上的误差。有损压缩机制的优点是可 以得到比无损压缩高得多的压缩比,但是它只能用于可以用近似的数据代替原 始数据,而这种相近数据又是容易被压缩的情况。举例来说,一幅和原图像在 视觉上没有区别的图像可以看作是原图像的近似“1 。 任何压缩机制的根本思想都是除去数据中存在的相关性。所谓相关性出的 一部分数据来判断出其相邻的数据。 实际中存在着很多种数据相关性,这里给出常见的几种。 ( 1 ) 空问相关性:可以根据图像中某一点的像素值推断出其相邻点的像素 值; ( 2 ) 频率相关性:一个信号的傅立叶变换通常是光滑的,这意味着可以根 据某部分的频率来推断其相邻部分的频率: ( 3 ) 时问相关性:在数字视频中,在时间上相邻两帧图像的大部分像素的 值变化很小。 有损压缩的标准过程是变换编码。基本思想是用一个和原来不同的数学基 来表示数据,在这种新的表示下,数据的相关性能够显露出来或被拆开。在这 种新的基下,大部分的系数都接近零,可以忽略,于是可以将余下的信息存储 在一个较小的数据包中。压缩是通过数据变换,把域值以下的系数置零,对非 零的数据进行无损的编码来实现的“1 。 2 1 2 1 无损压缩 1 行程( r u n l e n g t h ) 编码技术 行程编码是相对简单的一种编码,是指在一行扫描的像素中,比较相邻像素 的幅度( 如亮度) 。当幅度有一个显著变化时,就说有一个行程存在。像素幅度 的连续长度和终点位鬟标记是其重要参数。随终点位置标记方法不同,行程编 码可分为两类: ( 1 ) 行程终点编码:行程的终点位置由扫描行的起始点算起至行程终点位置 时的像素数确定; ( 2 ) 行程长度编码:某行程的终点位置由它距前一终点的相对距离来确定。 行程终点编码又分为两种: ( 1 ) 线性码法( a 码) :根据不同行程长度赋予不同码字。大行程码字长,小 武汉理工大学硕士学位论文 行程码字短: ( 2 ) 对数码法( b 码) :它的码字长度与行程长度的对数成正比。 行程编码适用于二值图像。行程编码的编码效率不如t l u f f i n a n 编码方法高, 但它的码字结构相对简单,故在许多情况下也被采用。 2 h u f f m a n 编码压缩 无损压缩的编码方法中,h u f f m a n 编码方法是一种较有效的编码方法。h u f f m a n 编码是一种长度不均匀的、平均码率可以接近信息源熵值的一种编码。它的编 码基本思想是:对于出现概率大的信息采用短字长的码,对于出现概率小的信 号用长字长的码,以达到缩短平均码长,从而实现数据的压缩的目的。h u f r a m m 编码采用以下方法进行:首先将信源符号按其出现概率的大小顺序排列,然后 把出现概率最小的两个符号的概率值相加,得到个新的概率。第二步,把这 个新概率看成是一个新符号的概率,和其他符号再按概率大小排列,再把最后 两个概率相加。重复上述做法,直到最后只剩下两个符号的概率为止。完成以 上概率相加作顺序排列后,再反过来逐步向前进行编码,每步有两个分支各 赋予一个二进制码,可以对概率大的赋码元0 ,对概率小的赋码元1 ,亦可对概 率大的赋码元l ,对概率小的赋码元0 。h u f f m a n 在变字长编码方法中是最佳的, 其码字平均长度很接近信息符号的熵值。h u f f m a n 编码的最高压缩效率可以达到 8 :1 ,但是在一般实施过程中,很难达到这种压缩比例。若图像文件中存在某 个拥有长行程的字节值时,使用行程编码压缩算法可能更好。 3 字典压缩方法 目前广泛采用的字典压缩算法包括两种类型。一种是在数据压缩过程中, 寻找当前等待进行压缩处理的数据串中是否在已经处理过的数据串中出现过, 如果确实曾经出现过,则利用指向该已经进行处理数据串的指针代替当前等待 进行压缩的数据串,此时,字典是隐式的,它用曾经处理过的数据描述。这类 字典压缩算法都是基于a b r a h a m 与j a k o b z i v 于1 9 7 7 提出并发表的l z 7 7 算法, 该算法提出后,s t o r e r 与s z y m a n s k i 于1 9 8 2 年对其进行了改进,并提出相应的 l z s s 算法,l z s s 算法成为现在实践中广泛使用的该类算法的基础。 另外一种字典压缩算法是为输入数据创建一个短语字典,如果在当前等待 进行压缩的数据流中发现字典中已经存在相应的短语,则利用该短语在字典中 的相应索引值取代原始数据,这种类型的算法基于l a m p e l 与z i v 在1 9 7 8 年提 出并发表的l z 7 8 算法。后来该压缩算法由s p e r r y 公司的研究员w e l c h 于1 9 8 4 1 0 武汉理工大学硕士学位论文 年在硬件设计过程中改进并用于高性能磁盘控制器的设计,由l e r n p e l 和z i v 两 人在实际工作中实现,因此被命名为l z w 编码。l 2 殚压缩算法现在已经派生出几 种流行的算法格式,不仅可以用于文字数据的压缩,雨且也可以残功地用于某 些图像数据的压缩处理。现在,w i n z i p 、g z i p 、p k z t p 等压缩软件广泛使用l z 7 7 压缩算法进行数据压缩。 4 算术压缩方法 算术压缩方法与h u f f m a n 压缩方法相似。都是利用比较短的代码取代图像 数据中出现比较频繁的数据,而利用比较长的代码取代图像数据中使用频率比 较低的数据从而达到数据压缩的耳的。它同时又采用了l z w 压缩算法的思想, 不仅压缩数据值,而且压缩值序列,从而可以达到更加理想的压缩比例,尤其 适合于大多数数据由相同的重复序列组成的图像文件。但是算术压缩算法的实 现比较复杂,其基本思想是将每个不同的序列按照出现频率映像到0 和1 之间 的相应数字区域内,该区域表示成可以改变精度的二迸制小数,其中出现频率 越低的数据利用精度越高的小数进行表示。算术压缩算法中两个基本的要素为 源数据出现的频率以及其对应的编码区间。其中,源数据的出现频率决定该算 法的压缩效果,同时也决定编码过程中源数据对应的区间范围,而编码区间则 决定算术压缩算法避终的输出数据。 算术压缩算法可以大幅度地减小文件长度,甚至可以达到1 0 0 ;1 的压缩比 例,在j b i g 与j p e 6 等图像文件格式的数据压缩处理步骤中占有很重要的地位, 针对不同的图像文件,其压缩比例主要是与源文件的数据分布及其所采用标准 模式的精度有关,同时,阻碍算术压缩算法广泛推广的原因不仅是因为算法的 复杂性,还有另外一个重要原因是其受到几项i b m 的专利保护,从而导致了算 法许可证的不确定性。 2 1 2 2 有损压缩 1 预测编码方法 如果已知图像的一个像素离散值,利用其相邻像素的相关性,预测它的下一 个像素( 水平方向或垂直方向) 的可能值,求其两者差,再量化、编码。这种方 法称为预测编码方法,简称预测法( d p o j 法) 。 预测编码方法计算简单,若采用h u f f m a n 编码技术,压缩比从2 :1 到4 :1 仍有满意的效果。但本方法是基于差值信号的统计特性基础上发展起来的,它 武汉理工大学硕士学位论文 有如下缺点。 ( 1 ) 对黑白灰度有突变的点,会有较大的预测误差,使重建图像的边缘模糊, 分辨率降低。 ( 2 ) 对图像亮度值变化缓慢区域,其差值信号应为零,但因预测值偏大而使 重建图像产生噪音。 针对预测编码方法的缺点,其改进的方法是自适应预测编码方法。 2 正交变换编码 图像变换编码系统框图如图2 1 所示。 枞吐互 + 巨三忙互h j 母 臣 屯蔓 + 辕出 图2 - 1 图像变换编码系统框图 图像经过正交变换后能够实现图像数据压缩的物理本质在于:经过多维坐标 系中的适当的坐标旋转和变换,能够把散布在各个坐标轴上的原始图像数据, 在新的适当的坐标系中集中到少数坐标轴上,因而有可能用较少的编码比特数 来表示一幅子图像,实现图像的压缩编码。 从数学上来看,可用于图像压缩编码的正交变换的方法除f o u r i e r 变换、 w a l s h h a d a m a r d 变换外,还有正弦交换、余弦变换、斜变换、哈尔变换、k l 变换等。不同的变换有不同的压缩效果( 压缩比和重建图像质量) 。数学上已证 明,采用均方差最小准则,k l 变换( 即离散信号的h o t e l l i n g 变换) 具有最佳变 换性质,余弦变换次之。变换的效率还与孑图的大小有关,一般说来子图增大 能提高编码效率,但也会使计算量增大丽给实现带来困难。同时图像的相关性 一般局限在2 0 个邻近像素之内。因此,目前通常采用的子图像大小为8 8 或 1 6 1 6 。 3 会宇塔编码 由b u r t 和a d e l s o b 提出的金字塔算法把原图像分解成许多不同的分辨率的 子图像,并把高分辨率( 尺寸较大的) 的子图像放在下层,把低分辨率( 尺寸较小) 的子图像放在上层,从而构成了一个金字塔,借助于拉普拉斯金字塔算法,对 1 2 武汉理工大学硕士学位论文 图像的每一层分别量化、编码,并对视觉不敏感的层粗化,用较少的码字编码, 从而达到压缩的目的。 图像的金字塔表示方法也是计算机视觉中常用的一种多分辨率表示法,利用 金字塔表示法,能分析图像中不同大小的物体,例如高分辨率的下层可用于分 析细节,低分辨率的上层可用于分析较大的物体,同时,通过对低分辨率、尺 寸较小的上层进行分析所得到的信息还能用来指导对高分辨率、尺寸较大的下 层进行分析,从而人大简化了分析和计算。 图像的金字塔编码有其合理的一面,金字塔编码能大致上做到在对数频率上 以半倍频形式分解频段,并且金字塔编码本身符合逐级浮现的图像编码要求, 高层子图显示全图概貌,在解码过程中能由上到下,逐层添加细节,直到较低 层的子图满足要求。然而这种塔形分解并不理想,它使数据虽增大了,并且没 有体现方向性,因此,目前主要集中在性能更加优越的图像分解表达方法上, 如小波变换。但多分辨率表达利复原图像的思想已经体现在其他各种图像编码 的标准中。 4 予带编码 子带编码最早用于语音编码,w o o d 和0 n e i l 在1 9 8 6 年首先把子带编码应 用于图像编码。子带编码先将原图用若干数字滤波器( 分解滤波器) 分解成不同 频率成分的分量,再对这些分量进行亚抽样,形成子带图像,最后对不同的子 带图像分别用与其相匹配的方法进行编码,在接受端,将解码后的子带图像补 零、放大,井经合成滤波器的内插,将各子带信号相加,进行图像复原。 与d c t ( 离散余弦变换) 编码相比,子带编码的最大优点足复原图像无方块效 应,因此得到了广泛的研究,是一种有潜力的图像编码方法。 各子带图像的统计特性是以人眼对它们的敏感程度确定的,可以根据信息论 和入眼的视觉特性,用不同的方法对各予带编码,其要点可以归结为以下两条: ( 1 ) 低频分量最重要,应该较精确的编码,一般可用d p c m ,d c t 等方法,量化也 要精确一些: ( 2 ) 高频分量重要,性差一些,不适于用d c t 编码,由于用d p c m 不比p c m 好多 少,所以通常直接用p c m 编码,另外,为了降低码率及噪声的影响,高频分 量的量化在零附近有个死区。 5 矢量量化编码 矢量量化在图像编码中要优于标量量化,目前得到较为广泛的研究应川的 武汉理工大学硕士学位论文 有:空间域矢量量化、预测矢量量化、变量矢量量化、混合矢量量化,以及子 带矢量量化、神经网络矢量量化等技术。 6 图像压缩的国际标准 ( 1 ) j p e g j p e g ( j o i n tp h o t o g r a p h i ce x p e r t sg r o u p ) 是联合影像专家小组的缩写。 j p e g 是为静止的灰度( 色彩) 连续变化的图像编码压缩而制定的标准。j p e g 定义 了两种压缩算法,一种是离散余弦变换( d c t ) ,另一种足空间预测。d c t 算法偏 重于图像的视觉效果,用该算法得到输出图像的视觉效果相当好,它与原图像 的视觉效果几乎一样。空间预测采用了脉冲编码调制技术,它偏重于无失真编 码或基本无失真编码“1 。 ( 2 ) m p e g m p e g ( m o v i n gp i c t u r ee x p e r t sg r o u p ) 是活动图像专家组的缩写。是对活动 的视频图像压缩的国际标准的简称。 无论哪种压缩算法,其压缩率都与原始图像数据的分布特点密切相关,没有 哪一种压缩算法的效率针对任何图像数据而言,能够高于其他算法,而且一般 情况下,压缩效率比较高的算法,其具体的演算过程则相对要比较复杂,从而 需要更长的时间进行转换编码操作。这使得多种算法的并存成为可能和必要。 武汉理工大学硕+ 学位论文 第3 章m p e g 一2 视频压缩概述 3 1m p e g - 2 视频压缩标准 m p e g 专家组于1 9 9 5 年出台了m p e g 一2 ( i s o i e c l 3 8 1 8 ) ,它的目的是支持高的 图像分辨串,包括符合i t u rr e e 6 0 1 ( c c i r6 0 1 ) 格式的标准分辨率的数字电视 和更高分辨率的h d t v 。同时支持包括高速体育运动在内的活动图像。并且m p e c f 2 要求能够支持更广泛的应用范围,既包括存储媒体中的d v d ,广播电视中的数广 播电视和h d t v ,还可应用于交互式的视频点播( r o d ) 和准视频点描( n v o d ) ,此外, 还能够适配于a t m 这种新兴的宽带通信网。肝e g 一2 标准的一些关键技术利 m p e g - 1 标准相类似。 m p e g 一2 标准针对标准数字电视和高清晰度电视在各种应用下的压缩方案和 系统层进行了详细规定,编码码率的范围是a m b i t s l o o m h i t s ,标准的正式规 范在i s o i e c l 3 8 1 8 中。m p e g2 不是肝e g 一1 的简睢升级,m p e g 一2 在系统和传送 力而作了更加详细的规定和进一步的完善。m p e g - 2 特别适用于广插级晌数字电 视的编码和传送,被认定为s d t v 和h d t v 的编码标准。m p e g2 还专门规定了多 路节目的复分接方式。此外,m p e g 一2 还兼顾了与a 喇信元的适配问题”3 。 m p e c , - 2 的标准号为i s 0 i e c l 3 8 1 8 ,标准名称为“信息技术一电视图像和伴 音信息的通用编码( i n f o r m a t i o nt e c h n o l o g y g e n e r i cc o d i n go fm o v i n g p i c t u r e sa n da s s o c l u t e da u d i oi n f o r m a t i o n ) 。m p e g - 2 标准目前分为9 个部 分,统称为i s o i e c l 3 8 1 8 国际标准”。各部分的内容描述如下”“”1h l l i 第一部分( i s o i e c l 3 8 1 8 1 ) ,s y s t e m :系统,描述多个视频,音频和数据基 _ 奉码流合成传输码流和节目码流的方式。 这个标准主要是用来定义电视图像数据、声音数据和其他数据的组合,把这 些数据组合成一个或者多个适台于存储或者传输的基本数据流。数据流有两种 形式,一种称为程序数据流( p r o g r
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- T/CI 455-2024新能源汽车电池用液冷系统
- 2025年汽车制造业新能源汽车技术发展与市场前景研究报告
- 2025年智能家居市场前景及发展方向研究报告
- 2025年绿色环保产业发展前景研究报告
- 2025年智能家居行业可穿戴设备应用与前景展望报告
- 2025年机器人行业机器人服务市场前景研究报告
- 2025年生物科技行业生物医学工程在康复医学中的应用前景研究报告
- 2025年智能网联汽车行业自动驾驶技术发展与市场前景研究报告
- 2025年虚拟现实产业发展前景报告
- 商场冬季用电安全培训课件
- 电梯从业证考试试题及答案解析
- 第九讲 全面依法治国PPT习概论2023优化版教学课件
- 新媒体文案写作PPT完整全套教学课件
- 《细胞》PPT课件-完美版
- 托育园厨师安全工作责任书
- 《编程猫系列》第1课-Hello-编程猫(课件)
- GB 16899-2011自动扶梯和自动人行道的制造与安装安全规范
- 非典型骨折课件
- 封闭区倒塌围墙修复施工方案
- 户口本翻译样本-Word范文-Word范文
- 企业融资计划书2022
评论
0/150
提交评论