（通信与信息系统专业论文）视频系统的图像压缩技术实现.pdf

上传人：活*** IP属地：宁夏上传时间：2019-12-15 格式：PDF 页数：85 大小：2.41MB 积分：0 举报 版权申诉

已阅读5页，还剩80页未读，继续免费阅读

（通信与信息系统专业论文）视频系统的图像压缩技术实现.pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

武汉理上大学硕士学位论文摘要随着信息社会的发展，人类希望无论何时何地都能方便、快捷地获得各种信息。视频信息由于其直观、生动和形象的特性，对人类生活和工作的信息获取具有非常重要的作用。视频传输更受到人们广泛的关注，是未来通信领域的热点。与话音相比，视频信息数据量大，所需的传输频带较宽，这常常会大大增加成本甚至于使传输根本无法实现，因此在保证一定通信质量的前提下，压缩视频信息的数据量，从而压缩所需传输信道的带宽是实现视频传输的一个关键问题。在目前的视频编码系统中，由于采用视频编码算法的复杂度较高，运算量较大，用软件方法一般都难以达到实时性能要求，因此，该类系统多考虑采用硬件来实现。d s p 芯片能够实时地对大量数据进行数字技术处理，这种实时能力使d s p 在象数字通信、图像处理、多媒体技术等不允许时间延迟的领域应用十分理想。t i 公司推出的t m s d m 6 4 2 系列以其处理能力强、开发工具高度集成等特点被大多数嵌入式图像压缩系统所采用。由于m p e g 系统在帧内压缩部分有着很大的相关性，所以本文首先对m p e g 一2 视频压缩标准的特点和新技术进行了简单阐述。然后，详细介绍了m p e g 一2 图像帧内编码中用到的关键算法：d c t 变换、量化、游程编码和h u f f m a n 编码，通过分析提取出其中比较耗时的算法进行改进。并采用改进的l o e f f l e r 算法进行一维d c t 快速变换，对m p e g 量化技术也进行了优化，构造出一个可以避免除法运算的改进的帧内量化矩阵。将程序移植到t m s d m 6 4 2d s p 芯片上，针对d s p 硬件结构，做进一步优化，并在c c s 集成开发环境下进行了仿真。关键词：图像压缩，d s p ，m p e g ，l o e f f l e r 垫堡垄王查堂堡主堂焦堡苎- - - _ - _ _ _ _ _ _ _ - _ _ _ _ - _ _ _ _ _ _ _ - - _ _ - _ _ _ _ _ _ - - - _ _ _ _ _ _ _ - a b s t r a t w i t ht h ed e v e l o p m e n to fi n f o r m a t i o ns o c i e t y ，p e o p l ew i s ht og e t v a r i o u si n f o r m a t i o nc o n v e n i e n t l ya n dq u i c k l yi na n yp l a c e b e c a u s eo f i t si n t u i t i o n i s t i c ，v i v i da n dv i s u a lc h a r a c t e r i s t i c ，v i d e oi n f o r m a t i o n p l a ya ni m p o r t a n tr o l ei nh u m a nl i f ea n di n f o r m a t i o na c q u i s i t i o n ，m o r e p e o p l ep a ya t t e n t i o nt ov i d e ot r a n s m i s s i o nt h a ti sah o t s p o ti nf u t u r e c o r m u n i c a t i o nd o m a i n c o m p a r ew i t ha u d i o ，v i d e on e e dm o r et r a n s m i s s i o n b a n db e c a u s eo fi t sm o r ed a t a ，w h i c hw i l li n c r e a s ec o s t ，e v e nw h i c hm a k e t r a n s m i s s i o ni m p o s s i b l et ob er e a l i z e d u n d e rp r e m i s eo fc o m m u n i c a t i o n q u a l i t y ，i ti s ak e yq u e s t i o nt oc o m p r e s st h ev i d e oi n f o r m a t i o nd a t a q u a n t i t y ，t h e nc o m p r e s st r a n s m i s s i o nb a n d i nt h ec u r r e n ti m a g ec o d i n gs y s t e m ，t h ei m a g ec o d i n ga l g o r i t h m sa r e v e r yc o m p l e x ，a n di ti si m p o s s i b l et oi m p l e m e n tt h er e a lt i m ec o d i n gu s i n g t h es o f t w a r e ，s ot h i sk i n do fs y s t e ma r eu s u a l l yi m p l e m e n t e db yh a r d w a r e t h et m s d m 6 4 2o ft ic o m p a n yh a sb e e nu s e di nm a n yi m a g ec o m p r e s s i o ns y s t e m s f o ri t sg o o dp r o c e s s i n gc a p a c i t ya n dt h eh i g hi n t e g r a t i o n t h e r ea r em a n yc o r 曲l o f lp o i n t si ni n t e rf r a m eo fm p e gs y s t e m f i r s t l y ， t h et h e s i st a k e sa no v e r v i e wo ft h es p e c i a l t i e sa n dn e wt e c h n o l o g i e so f m p e g 一2 s e c o n d l y t h ek e ye n c o d i n ga l g o r i t h m si nm p e g 一2 ，i n c l u d i n gd c t ， q u a n t i z a t i o n ，r u n l e n g t he n c o d i n ga n dh u f f m a nc e d i n g ，a r ep r e s e n t e d ，a n d t h e nt h ea l g o r i t h m sw h i c hc o n s u m et o om u c ht i m ea r ei m p r o v e d t h i r d l y ， t h el o e f f l e ra l g o r i t h mi si m p r o v e d ； i nq u a n t i z a t i o np a r t ，an e wm a t r i x a v o i d i n gd i v i s i o no p e r a t i o n i sc o n s t r u c t e d m o r e o v e r ，f i n a l l y ，t h e s o f t w a r es y s t e mi sb e e nt r a n s p l a n t e di n t ot m s d m 6 4 2d s pc h i p ，a n dt h e e n c o d e ri ss i m u l a t e di nc c s k e yw o r d s ：i m a g ec o m p r e s s i o n ，d s p ，m p e g ，l o e f f l e r n 此页若属实请申请人及导师签名。独创性声明本人声明，所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。据我所知，除了文中特别加以标注和致谢的地方外，论文中不包含其他人已经发表或撰写过的研究成果，也不包含为获得武汉理工大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。研究生签名：关于论文使用授权的说明本人完全了解武汉理工大学有关保留、使用学位论文的规定，即：学校有权保留送交论文的复印件，允许论文被查阅和借阕；学校可以公布论文的全部内容，可以采用影印、缩印或其他复制手段保存论文。 ( 保密的论文在解密后应遵守此规定) 研究生签名：韭新签名：叵复兰竺日期注：请将此声明装订在论文的目录前。如盯f f i ) 武汉理工大学硕士学位论文第1 章绪论 1 1 研究的目的与意义步入2 1 世纪之后，社会也进入数字化的时代，而随着多媒体应用技术的飞速发展，人们越来越愿意在f l 常生活、工作和学习中使用数字化多媒体手段来解决遇到的问题。目前，用于银行、商场监控，城市交通管理、酒店、大厦安全保卫的视频监控系统的市场需求量上升幅度较大，市场上已出现了多种图像采集和传输产品，国内的视频监控系统可必分为三代：第一代是传统的模拟视频监控系统，模拟视频监控系统要用同轴电缆将摄像机输出的视频信号送往录像机。当摄像机与监控中心的距离较远或监控点过多时，就需要铺设大量的同轴电缆，这样就造成了升高了系统造价。传统的模拟闭路电视监控系统有很多局限性：首先，有线模拟视频信号的传输对距离十分敏感；其次，有线模拟视频监控无法联网，只能以点对点的方式监视现场，并且使得布线工程量极大；另外，有线模拟视频信号数据的存储会耗费大量的存储介质( 如录像带) 。查询取证时十分烦琐。第二代是视频采集卡，将其与p c 机结合构成视频监控系统，这种类型的监控系统终端都需要一台微机，成本非常昂贵。基于p c 机的远程图像监控系统由 p c 机插视频卡构成，在监控现场，有若干个摄像机，各种检测、报警探头与数据设备，通过各自的传输线路，汇接到监控终端机上，该终端可以是一台p c 机，也可以是专用的工业机箱。基于p c 的视频监控系统终端功能较强，便于现场操作。但稳定性不好，视频前端( 如c c d 等视频信号的采集、压缩、通讯) 较为复杂，可靠性不高，p c 机也需专人管理，特别是在环境或空间不适宜的监控点，这种方式不理想。第三代是基于网络的嵌入式视频监控系统。它结合通信、计算机、网络、图像编码和自动化技术，基本满足了人们对视频监控的要求，可以称为远程智能数字视频监控系统。基于嵌入式设备的监控系统的优点是：由于这种系统的硬件是一个同处理器和操作系统捆绑较为紧密、功能专一、专门设计的独立的设备，不像插卡系统那样受通用计算机系统中其它软件硬件的影响，因此性能上武汉理1 大学硕士学位论文更稳定，且便于安装、维护，易于实现系统的模块化设计，便于管理、维护。但第三代嵌入式视频监控系统由于数据量太大。虽然网络速度已在持续地增长，并且a t m 技术预计将使速度提高到1 0 0 兆位秒，但极大量的数据对象仍要好儿秒种来传输。一个1 0 0 兆位秒的l a n 实际上可传输的速率不超过5 兆字节秒。只有几秒钟的时间用来检索、传输和显示图像，因此提高数据对象的存储和传输效率是对多媒体系统来说至关重要的。为了有效地管理大型多媒体数据对象，这些数据对象需要被压缩，以减少用于存储这些对象的文件容量。压缩算法力图消除数据模式中的冗余度。例如：一个黑色象素之后是2 0 个白色象素，就不用存储全部2 0 个白色象素。可以使用编码机理，这样就只存储白色象素的个数。一旦这些冗余度被去掉，数据对象就需要较少的硬盘存储器空间来存储。容量变小了，在网上传输所需的时间也减少了许多，随之而来的是明显减少存储和传输成本。在一些实际的应用中，例如，无人值守的仓库、机房、变电所、新闻现场、事故现场等等，在这些场合需要轻巧灵活、使用方便、成本低、图像清晰、可以利用电话线或无线对讲机和数传机传输图像的设备。我们先将图像信号数字化后先进行 m p e g m p e g 一2 m p e g 一4 j p e g2 0 0 0 编码“2 “，再将压缩后的图像数据传输给计算机，从而构成一个能实现远距离监控并且价格适当的一个完全数字化的图像监控系统。为了有效的对数据进行压缩和处理，因为m p e g 系列的帧压缩部分非常类似，所以我们利用t i 公司的数字信号处理芯片来完成m p e g 一2 的行业标准，由于条件所限，我们只研究m p e g - 2 的帧内压缩部分。数字信号处理芯片采用 t m s 3 2 0 d m 6 4 2 。本文的目的就是研究：如何利用t i 公司现在主推的d s p d m 6 4 2 构成一个能在信源端对视频信号进行采集和压缩，并在该芯片上进行m p e g - 2 视频图像的解压缩，并对其像素级压缩解压缩进行优化。 1 2 国内外研究现状 1 2 1 数字信号处理的发展数字信号处理( 包括对信号进行采集、变换、滤波、估值、增强、压缩、识别等) ，是2 0 世纪6 0 年代发展起来的并广泛应用于许多领域的新兴学科。进入武汉理工大学硕士学位论文 7 0 年代以来，随着计算机、大规模集成电路和超大规模集成电路以及微处理器技术的迅猛发展，数字信号处理成为目前发展最快的学科之一。数字信号处理器( 以下简称d s p 芯片) 是一种专门用于数字信号处理的微处理器，是继微处理器( m p u ) 、微控制器( m c u ) 之后出现的第三次飞速发展的微电子技术的结晶，是高性能数字系统的核心。由于d s p 芯片可实现各种复杂运算，因而具有高性能、高精度、高速度、高重复性和低功耗等优点。用它完成的板卡和系统设备具有先进性、实用性、广泛性和经济性，从而掀起了信息数字化的浪潮。d s p 芯片能够实时地对大量数据进行数字技术处理，这种实时能力使d s p 在象数字通信、图像处理、多媒体技术等不允许时间延迟的领域应用十分理想，成为全球百分之七十数字电话的心脏，同时d s p 芯片在网络领域中也有广泛的应用。目前，d s p 芯片与可编程门阵列芯片和m c u 芯片融合，取长补短，达到了系统实时处理的功能特征和完善的功能应用；另一方面基于d s p 内核与外围元件集成而构成的片上系统( s o c ，s y s t e mo nc h i p ) ，使功能更完善，体积小型化，系统功耗和成本相对降低，更加适用于军用和民用中多任务多功能的课题任务。 1 9 7 8 年微系统( m i c r o s y s t e m s ) 公司的k m i 子公司宣布了世界上第一块单片d s p 芯片$ 2 8 1 1 研制成功。1 9 7 9 年美国i n t e l 公司发布了商用可编程器件 2 9 2 0 ，它是d s p 芯片的一个主要里程碑。但是这两种芯片内部都没有现代d s p 芯片所必需的单周期芯片。自1 9 8 0 年以来，d s p 芯片得到了突飞猛进的发展， d s p 芯片的应用也越来越广泛。从运算速度来看，m a c ( 一次乘法和一次加法) 时间己经从8 0 年代初的4 0 0 n s 降低到2 n s 以下，处理能力提高了几百倍。从存储容量来看，片内r a m 从几百个单元到几十胁，增加了一个数量级以上。从制造工艺来看，1 9 8 0 年采用的是4 u m 的n m o s 工艺，而现在则普遍采用亚微米c m o s 工艺。d s p 芯片的引脚数量从1 9 8 0 年的最多6 4 个增加到现在的5 0 0 个以上，所需设计的外围电路越来越少，每m i p s 的成本、体积和功耗均有很大程度的下降。引脚数量的增多使得芯片应用的灵活性增加，使外部存储器的扩展和各个处理器问的通信更为方便。和早期的d s p 芯片相比，现在的d s p 芯片有浮点和定点两种数据格式，浮点d s p 芯片能进行浮点运算，使运算精度极大提高。d s p 芯片的成本、体积、工作电压、重量和功耗较早期的d s p 芯片有了很大程度的下降。从内部结构看，现在的d s p 芯片广泛采用多总线，多处理单元和多级流水线结构，加上完善的接口功能，使d s p 芯片的系统功能、数据处理能力以及与外部武汉理工大学硕士学位论文设备的通信功能大大增强。在d s p 开发系统方面，软件和硬件开发工具不断完善。目前某些芯片具有相应的集成玎发环境，它支持断点的设置和程序存储器、数据存储器和d m a 的访问及程序的单部运行和跟踪等，并可以采用高级语言编程，有些厂家和一些软件开发商为d s p 应用软件的开发准备了通用的函数库及各种算法子程序和各种接口程序，这使得应用软件开发更为方便，开发时问大大缩短，因而提高了产品开发的效率。随着d s p 芯片性能的不断改善，用d s p 芯片构造数字信号处理系统作信号的实时处理已成为当今和未来数字信号处理技术发展的一个热点。随着各个d s p 芯片生产厂家研制的投入，d s p 芯片的生产技术不断更新，产量增大，成本和售价大幅度下降，这使得d s p 芯片应用的范围不断扩大，现在d s p 芯片的应用遍及电子学及与其相关的各个领域。在安全防范领域，数字化已成不可逆转之趋势关于这一点，业内人士基本上达成了共识。在此种风潮下，新兴的以计算机技术为依托的o v r 系统大有一举取代录像机加画面分割器的传统模拟电视监控之势。各厂商为了能抓住这难得一见的机遇，纷纷使出浑身解数，倾全力推出各自的d v r 系统，以期能在激烈的市场竞争中先人一步、抢占先机。d v r 系统的研发与推出速度极快，目前已形成了一个多元化的布局。 1 2 。1 岬e g 一2 编码现状 m p e g - 2 制定于1 9 9 4 年，设计目标是高级工业标准的图象质量以及更高的传输率。m p e g - 2 所能提供的传输率在3 - l o m b i t s s e c 问，其在n t s c 制式下的分辨率可达7 2 0 4 8 6 ，m p e g - 2 也可提供并能够提供广播级的视像和c d 级的音质。由于m p e g 一2 在设计时的巧妙处理，使得大多数m p e g 一2 解码器也可播放m p e g 一1 格式的数据，如v c o ，m p e g 一2 除了做为d v d 的指定标准外，m p e g 一2 还可用于为广播，有线电视网，电缆网络以及卫星直播( d i r e c tb r o a d c a s ts a t e l l i r e ) 提供广播级的数字视频。 m p e g 一2 的另一特点是，其可提供一个较广的范围改变压缩比，以适应不同画面质量，存储容量，以及带宽的要求“”。现在国内外的m p e g 一2 编码、解码实现方法有“：武汉理工大学硕士学位论文 1 采用软件实现开发基于p c 的图像处理软件来对图像文件进行压缩、解压。采用全软件的丌发方法，不用理会硬件结构；采用软件的方法具有最好的灵活性，实现起来也最容易，但不适于小型移动数码设备运用，由于不是采用专用的硬件设备，处理速度也较慢。 2 用全硬件实现方法采用自顶向下的方法，开发专用的a s i c 压缩、解压处理器；a s i c 结构中每个功能都采用专用的v l s i 结构，通过一个系统控制器控制各部分的运行。a s i c 结构能有效地提高系统时钟频率，运算速度快，但是a s i c 实现起来对技术要求较高，开发周期较长，开发成本也很高，而且适应性差，a s i c 实现起来灵活度是最低的，当编解码算法需要修改时要重新设计，设计改动起来很复杂。 3 基于数字信号处理器( d s p ) 的实现方法即采用d s p 核实现一些较复杂的运算，而用一些硬件来实现大吞吐量的控制、操作。利用可编程多媒体d s p 处理器，使用更加灵活。采用汇编语言或者高级语言，例如c 来实现，能够非常方便的修改设计，并且设计具有很高的可移植性，设计实现起来也相对简单一些。同时d s p 处理器具有高速处理能力，完善的开发工具及较低的价格，是理想的m e p g 实现平台，应用前景非常好。在d s p 平台上进行视频产品开发有以下优势： ( 1 ) 用户开发自由度更大，支持多种个性化开发，可满足市场不断提出的新要求，在第一时间提升产品性能，增强产品的竞争能力； ( 2 ) d s p 处理能力强可以在一个d s p 上同时实现多路音视频信号的压缩处理，还可提供很多视频专用功能，比如视频滤波、高分辨显示输出、o s d 功能等； ( 3 ) 外围接口丰富，开发周期短，可实现快速技术更新和产品换代； ( 4 ) 芯片功耗低，为提高产品的稳定性提供可靠保障。早期多媒体d s p 处理器有p h i l i p s 公司的t r i - m e d i a 及e q u a t o r 公司的 b s p 一1 5 ；近期全球最大的d s p 制造商德州仪器( t i ) 推出了一款高性能多媒体处理器t m s 3 2 0 d m 6 4 2 。数字多媒体处理器d m 6 4 2 属t i 公司c 6 0 0 0 系列，是一款新型高性能d s p ，基于c 6 4 x 内核，扩展的高级甚长指令字( v e i o c i t i ) 体系结构，具有6 4 个3 2 位通用寄存器，8 个独立计算功能单元( 2 个乘法器，6 个算术逻辑单元) 可以并行运行，因此多条指令可同时执行。它可在6 0 0m h z 时钟速率工武汉理工大学硕士学位论文作，每个指令周期可并行8 条3 2 位指令，因此，可达到4 8 0 0m i p s 的峰值计算速度。在上面可以实现m p e g 一2 同步编码没有任何问题。 1 3 论文主要工作及内容安排 1 3 1 主要工作随着图像压缩技术的发展，佼经过压缩处理后的图像信号带宽大大压缩，可以在一般通信系统中传输，例如现在的会议电视、可视电话等。现在有很多 m p e g 一4 的d v r 运用，但成本高，运算量大，多路输出能力不强，m p e g - 2 算法相对简单，将其优化后可以做更多路数的输出。本论文就是基于这种需求研究了一种基于1 ) m 6 4 2 的m p e g - 2 压缩系统，这种压缩系统具有嵌入式系统的特点，集图像采集、图像压缩等功能于一身，体积小，操作简单，而且功能易扩展，核心芯片采用t i 公司的t m s d m 6 4 2 芯片。本文所做的工作： 1 研究t i 最新主推的芯片d m 6 4 2 ，研究其硬件结构及其在视频采集，视频处理的软件编程； 2 研究m p e g - 2 编解码算法，深入研究了m e p g 系列帧内的编解码的程序及优化的方法； 3 研究m p e 6 - 2 算法在d m 6 4 2 上的实现及优化的方法。其中主要优化了d c t 与量化编码等的算法。 1 ，3 2 本文内容安排第一章从图像压缩的必要性和可能性出发，论述了本论文的研究背景及其意义，然后简单的介绍了数字信号处理器的发展，并对本文所做主要工作以及每一章的内容做了简要的介绍。第二章简单的介绍了本文所用的部分专业基础知识，包括图像压缩编码方法分类和常用的图像压缩方法以及图像压缩编码标准，并介绍系统的输出图像标准m p e g 一2 算法的编码基础和m p e g - 2 算法的基本原理，最后介绍了m p e g - 2 算法中使用离散余弦变换d c t 及其二维d c t 决速算法、系数量化、不等长编码及熵编码等算法。亟堡堡i ：查堂堡主堂堡堡塞一第三章研究了m p e g - 2 图像编码、解码的标准。第四章详细介绍了包括t m sd m 6 4 2 芯片的结构及t m sd m 6 4 2 视频处理板的功能与结构，并研究了1 ) h f 6 4 2 的视频硬件电路的扩展。第五章深入研究m p e g 一2 图像编码、解码的标准，在此基础上优化了l o f f l e r 算法及a c ，d c 系数量化矩阵。第六章在前面的内容基础上在d m 6 4 2 上对帧内编码部分进行了优化。第七章对前面的内容进行总结，并提出了系统应该改进的方向与措施。武汉理1 二大学硕士学位论文第2 章图像压缩编码概述 2 1 图像压缩概述 2 1 1 图像压缩的目的在过去的十年里，需要存储、传输和处理的信息的数量成指数级地增加。这主要要归因于两项技术的发展。一是多媒体系统在众多领域广泛应用，过去计算机只能处理数字和文本，现在却已代之以声音、图像、电影和虚拟现实：另一项是i n t e r n e t 的大发展，它使信息可以被许多人共享。这两项进展综合作用产生了所谓的w o r l dw i d ew e b ，一个交互的、多媒体的、基于超文本的信息网络。首先，硬件方面的革新使这些发展成为可能：c p u 、磁盘、传输信道的性能都迅猛发展。但是，从下面的事实可以看出，压缩技术仍有一段路要走：存储一幅中等大小的图像，比如说5 1 2 x 5 1 2 像素，2 4 位真彩色，需要0 7 5 m b 的空间。那么一视频信号通常要每秒钟3 0 帧。一幅标准的分辨率为1 2 u m 的3 5 m m 的数字照片需要1 8 y i b 的空间。一秒钟的n t s c 彩色视频需要2 3 m b 的空间。由此可见，无论是从经济还是技术的角度，现在的情况是光靠硬件的支持并不能满足人们的需要。如果我们能用一种压缩了的形式来表示信息，我们能明显地体会如下好处： ( 1 ) 节省存储空间； ( 2 ) 节省c p u 时间； ( 3 ) 节省传输时间。我们日常用到的大部分信息都具有高度的相关性，或者说，它们本身包含着冗余，因此，没有信息丢失的压缩是可能的。压缩中最关键的问题是能够在原始数据和压缩数据之间快速的切换。 2 1 2 图像压缩的基本理论压缩机制通常可以分为两种一有损压缩和无损压缩。在无损压缩中，我们关武汉理工大学硕十学位论文心的是精确重建没有信息丢失的数据，无损压缩通常被用于文本文件的压缩中。对于有损压缩，我们允许压缩后产生质量上的误差。有损压缩机制的优点是可以得到比无损压缩高得多的压缩比，但是它只能用于可以用近似的数据代替原始数据，而这种相近数据又是容易被压缩的情况。举例来说，一幅和原图像在视觉上没有区别的图像可以看作是原图像的近似“1 。任何压缩机制的根本思想都是除去数据中存在的相关性。所谓相关性出的一部分数据来判断出其相邻的数据。实际中存在着很多种数据相关性，这里给出常见的几种。 ( 1 ) 空问相关性：可以根据图像中某一点的像素值推断出其相邻点的像素值； ( 2 ) 频率相关性：一个信号的傅立叶变换通常是光滑的，这意味着可以根据某部分的频率来推断其相邻部分的频率： ( 3 ) 时问相关性：在数字视频中，在时间上相邻两帧图像的大部分像素的值变化很小。有损压缩的标准过程是变换编码。基本思想是用一个和原来不同的数学基来表示数据，在这种新的表示下，数据的相关性能够显露出来或被拆开。在这种新的基下，大部分的系数都接近零，可以忽略，于是可以将余下的信息存储在一个较小的数据包中。压缩是通过数据变换，把域值以下的系数置零，对非零的数据进行无损的编码来实现的“1 。 2 1 2 1 无损压缩 1 行程( r u n l e n g t h ) 编码技术行程编码是相对简单的一种编码，是指在一行扫描的像素中，比较相邻像素的幅度( 如亮度) 。当幅度有一个显著变化时，就说有一个行程存在。像素幅度的连续长度和终点位鬟标记是其重要参数。随终点位置标记方法不同，行程编码可分为两类： ( 1 ) 行程终点编码：行程的终点位置由扫描行的起始点算起至行程终点位置时的像素数确定； ( 2 ) 行程长度编码：某行程的终点位置由它距前一终点的相对距离来确定。行程终点编码又分为两种： ( 1 ) 线性码法( a 码) ：根据不同行程长度赋予不同码字。大行程码字长，小武汉理工大学硕士学位论文行程码字短： ( 2 ) 对数码法( b 码) ：它的码字长度与行程长度的对数成正比。行程编码适用于二值图像。行程编码的编码效率不如t l u f f i n a n 编码方法高，但它的码字结构相对简单，故在许多情况下也被采用。 2 h u f f m a n 编码压缩无损压缩的编码方法中，h u f f m a n 编码方法是一种较有效的编码方法。h u f f m a n 编码是一种长度不均匀的、平均码率可以接近信息源熵值的一种编码。它的编码基本思想是：对于出现概率大的信息采用短字长的码，对于出现概率小的信号用长字长的码，以达到缩短平均码长，从而实现数据的压缩的目的。h u f r a m m 编码采用以下方法进行：首先将信源符号按其出现概率的大小顺序排列，然后把出现概率最小的两个符号的概率值相加，得到个新的概率。第二步，把这个新概率看成是一个新符号的概率，和其他符号再按概率大小排列，再把最后两个概率相加。重复上述做法，直到最后只剩下两个符号的概率为止。完成以上概率相加作顺序排列后，再反过来逐步向前进行编码，每步有两个分支各赋予一个二进制码，可以对概率大的赋码元0 ，对概率小的赋码元1 ，亦可对概率大的赋码元l ，对概率小的赋码元0 。h u f f m a n 在变字长编码方法中是最佳的，其码字平均长度很接近信息符号的熵值。h u f f m a n 编码的最高压缩效率可以达到 8 ：1 ，但是在一般实施过程中，很难达到这种压缩比例。若图像文件中存在某个拥有长行程的字节值时，使用行程编码压缩算法可能更好。 3 字典压缩方法目前广泛采用的字典压缩算法包括两种类型。一种是在数据压缩过程中，寻找当前等待进行压缩处理的数据串中是否在已经处理过的数据串中出现过，如果确实曾经出现过，则利用指向该已经进行处理数据串的指针代替当前等待进行压缩的数据串，此时，字典是隐式的，它用曾经处理过的数据描述。这类字典压缩算法都是基于a b r a h a m 与j a k o b z i v 于1 9 7 7 提出并发表的l z 7 7 算法，该算法提出后，s t o r e r 与s z y m a n s k i 于1 9 8 2 年对其进行了改进，并提出相应的 l z s s 算法，l z s s 算法成为现在实践中广泛使用的该类算法的基础。另外一种字典压缩算法是为输入数据创建一个短语字典，如果在当前等待进行压缩的数据流中发现字典中已经存在相应的短语，则利用该短语在字典中的相应索引值取代原始数据，这种类型的算法基于l a m p e l 与z i v 在1 9 7 8 年提出并发表的l z 7 8 算法。后来该压缩算法由s p e r r y 公司的研究员w e l c h 于1 9 8 4 1 0 武汉理工大学硕士学位论文年在硬件设计过程中改进并用于高性能磁盘控制器的设计，由l e r n p e l 和z i v 两人在实际工作中实现，因此被命名为l z w 编码。l 2 殚压缩算法现在已经派生出几种流行的算法格式，不仅可以用于文字数据的压缩，雨且也可以残功地用于某些图像数据的压缩处理。现在，w i n z i p 、g z i p 、p k z t p 等压缩软件广泛使用l z 7 7 压缩算法进行数据压缩。 4 算术压缩方法算术压缩方法与h u f f m a n 压缩方法相似。都是利用比较短的代码取代图像数据中出现比较频繁的数据，而利用比较长的代码取代图像数据中使用频率比较低的数据从而达到数据压缩的耳的。它同时又采用了l z w 压缩算法的思想，不仅压缩数据值，而且压缩值序列，从而可以达到更加理想的压缩比例，尤其适合于大多数数据由相同的重复序列组成的图像文件。但是算术压缩算法的实现比较复杂，其基本思想是将每个不同的序列按照出现频率映像到0 和1 之间的相应数字区域内，该区域表示成可以改变精度的二迸制小数，其中出现频率越低的数据利用精度越高的小数进行表示。算术压缩算法中两个基本的要素为源数据出现的频率以及其对应的编码区间。其中，源数据的出现频率决定该算法的压缩效果，同时也决定编码过程中源数据对应的区间范围，而编码区间则决定算术压缩算法避终的输出数据。算术压缩算法可以大幅度地减小文件长度，甚至可以达到1 0 0 ；1 的压缩比例，在j b i g 与j p e 6 等图像文件格式的数据压缩处理步骤中占有很重要的地位，针对不同的图像文件，其压缩比例主要是与源文件的数据分布及其所采用标准模式的精度有关，同时，阻碍算术压缩算法广泛推广的原因不仅是因为算法的复杂性，还有另外一个重要原因是其受到几项i b m 的专利保护，从而导致了算法许可证的不确定性。 2 1 2 2 有损压缩 1 预测编码方法如果已知图像的一个像素离散值，利用其相邻像素的相关性，预测它的下一个像素( 水平方向或垂直方向) 的可能值，求其两者差，再量化、编码。这种方法称为预测编码方法，简称预测法( d p o j 法) 。预测编码方法计算简单，若采用h u f f m a n 编码技术，压缩比从2 ：1 到4 ：1 仍有满意的效果。但本方法是基于差值信号的统计特性基础上发展起来的，它武汉理工大学硕士学位论文有如下缺点。 ( 1 ) 对黑白灰度有突变的点，会有较大的预测误差，使重建图像的边缘模糊，分辨率降低。 ( 2 ) 对图像亮度值变化缓慢区域，其差值信号应为零，但因预测值偏大而使重建图像产生噪音。针对预测编码方法的缺点，其改进的方法是自适应预测编码方法。 2 正交变换编码图像变换编码系统框图如图2 1 所示。枞吐互 + 巨三忙互h j 母臣屯蔓 + 辕出图2 - 1 图像变换编码系统框图图像经过正交变换后能够实现图像数据压缩的物理本质在于：经过多维坐标系中的适当的坐标旋转和变换，能够把散布在各个坐标轴上的原始图像数据，在新的适当的坐标系中集中到少数坐标轴上，因而有可能用较少的编码比特数来表示一幅子图像，实现图像的压缩编码。从数学上来看，可用于图像压缩编码的正交变换的方法除f o u r i e r 变换、 w a l s h h a d a m a r d 变换外，还有正弦交换、余弦变换、斜变换、哈尔变换、k l 变换等。不同的变换有不同的压缩效果( 压缩比和重建图像质量) 。数学上已证明，采用均方差最小准则，k l 变换( 即离散信号的h o t e l l i n g 变换) 具有最佳变换性质，余弦变换次之。变换的效率还与孑图的大小有关，一般说来子图增大能提高编码效率，但也会使计算量增大丽给实现带来困难。同时图像的相关性一般局限在2 0 个邻近像素之内。因此，目前通常采用的子图像大小为8 8 或 1 6 1 6 。 3 会宇塔编码由b u r t 和a d e l s o b 提出的金字塔算法把原图像分解成许多不同的分辨率的子图像，并把高分辨率( 尺寸较大的) 的子图像放在下层，把低分辨率( 尺寸较小) 的子图像放在上层，从而构成了一个金字塔，借助于拉普拉斯金字塔算法，对 1 2 武汉理工大学硕士学位论文图像的每一层分别量化、编码，并对视觉不敏感的层粗化，用较少的码字编码，从而达到压缩的目的。图像的金字塔表示方法也是计算机视觉中常用的一种多分辨率表示法，利用金字塔表示法，能分析图像中不同大小的物体，例如高分辨率的下层可用于分析细节，低分辨率的上层可用于分析较大的物体，同时，通过对低分辨率、尺寸较小的上层进行分析所得到的信息还能用来指导对高分辨率、尺寸较大的下层进行分析，从而人大简化了分析和计算。图像的金字塔编码有其合理的一面，金字塔编码能大致上做到在对数频率上以半倍频形式分解频段，并且金字塔编码本身符合逐级浮现的图像编码要求，高层子图显示全图概貌，在解码过程中能由上到下，逐层添加细节，直到较低层的子图满足要求。然而这种塔形分解并不理想，它使数据虽增大了，并且没有体现方向性，因此，目前主要集中在性能更加优越的图像分解表达方法上，如小波变换。但多分辨率表达利复原图像的思想已经体现在其他各种图像编码的标准中。 4 予带编码子带编码最早用于语音编码，w o o d 和0 n e i l 在1 9 8 6 年首先把子带编码应用于图像编码。子带编码先将原图用若干数字滤波器( 分解滤波器) 分解成不同频率成分的分量，再对这些分量进行亚抽样，形成子带图像，最后对不同的子带图像分别用与其相匹配的方法进行编码，在接受端，将解码后的子带图像补零、放大，井经合成滤波器的内插，将各子带信号相加，进行图像复原。与d c t ( 离散余弦变换) 编码相比，子带编码的最大优点足复原图像无方块效应，因此得到了广泛的研究，是一种有潜力的图像编码方法。各子带图像的统计特性是以人眼对它们的敏感程度确定的，可以根据信息论和入眼的视觉特性，用不同的方法对各予带编码，其要点可以归结为以下两条： ( 1 ) 低频分量最重要，应该较精确的编码，一般可用d p c m ，d c t 等方法，量化也要精确一些： ( 2 ) 高频分量重要，性差一些，不适于用d c t 编码，由于用d p c m 不比p c m 好多少，所以通常直接用p c m 编码，另外，为了降低码率及噪声的影响，高频分量的量化在零附近有个死区。 5 矢量量化编码矢量量化在图像编码中要优于标量量化，目前得到较为广泛的研究应川的武汉理工大学硕士学位论文有：空间域矢量量化、预测矢量量化、变量矢量量化、混合矢量量化，以及子带矢量量化、神经网络矢量量化等技术。 6 图像压缩的国际标准 ( 1 ) j p e g j p e g ( j o i n tp h o t o g r a p h i ce x p e r t sg r o u p ) 是联合影像专家小组的缩写。 j p e g 是为静止的灰度( 色彩) 连续变化的图像编码压缩而制定的标准。j p e g 定义了两种压缩算法，一种是离散余弦变换( d c t ) ，另一种足空间预测。d c t 算法偏重于图像的视觉效果，用该算法得到输出图像的视觉效果相当好，它与原图像的视觉效果几乎一样。空间预测采用了脉冲编码调制技术，它偏重于无失真编码或基本无失真编码“1 。 ( 2 ) m p e g m p e g ( m o v i n gp i c t u r ee x p e r t sg r o u p ) 是活动图像专家组的缩写。是对活动的视频图像压缩的国际标准的简称。无论哪种压缩算法，其压缩率都与原始图像数据的分布特点密切相关，没有哪一种压缩算法的效率针对任何图像数据而言，能够高于其他算法，而且一般情况下，压缩效率比较高的算法，其具体的演算过程则相对要比较复杂，从而需要更长的时间进行转换编码操作。这使得多种算法的并存成为可能和必要。武汉理工大学硕+ 学位论文第3 章m p e g 一2 视频压缩概述 3 1m p e g - 2 视频压缩标准 m p e g 专家组于1 9 9 5 年出台了m p e g 一2 ( i s o i e c l 3 8 1 8 ) ，它的目的是支持高的图像分辨串，包括符合i t u rr e e 6 0 1 ( c c i r6 0 1 ) 格式的标准分辨率的数字电视和更高分辨率的h d t v 。同时支持包括高速体育运动在内的活动图像。并且m p e c f 2 要求能够支持更广泛的应用范围，既包括存储媒体中的d v d ，广播电视中的数广播电视和h d t v ，还可应用于交互式的视频点播( r o d ) 和准视频点描( n v o d ) ，此外，还能够适配于a t m 这种新兴的宽带通信网。肝e g 一2 标准的一些关键技术利 m p e g - 1 标准相类似。 m p e g 一2 标准针对标准数字电视和高清晰度电视在各种应用下的压缩方案和系统层进行了详细规定，编码码率的范围是a m b i t s l o o m h i t s ，标准的正式规范在i s o i e c l 3 8 1 8 中。m p e g2 不是肝e g 一1 的简睢升级，m p e g 一2 在系统和传送力而作了更加详细的规定和进一步的完善。m p e g - 2 特别适用于广插级晌数字电视的编码和传送，被认定为s d t v 和h d t v 的编码标准。m p e g2 还专门规定了多路节目的复分接方式。此外，m p e g 一2 还兼顾了与a 喇信元的适配问题”3 。 m p e c , - 2 的标准号为i s 0 i e c l 3 8 1 8 ，标准名称为“信息技术一电视图像和伴音信息的通用编码( i n f o r m a t i o nt e c h n o l o g y g e n e r i cc o d i n go fm o v i n g p i c t u r e sa n da s s o c l u t e da u d i oi n f o r m a t i o n ) 。m p e g - 2 标准目前分为9 个部分，统称为i s o i e c l 3 8 1 8 国际标准”。各部分的内容描述如下”“”1h l l i 第一部分( i s o i e c l 3 8 1 8 1 ) ，s y s t e m ：系统，描述多个视频，音频和数据基 _ 奉码流合成传输码流和节目码流的方式。这个标准主要是用来定义电视图像数据、声音数据和其他数据的组合，把这些数据组合成一个或者多个适台于存储或者传输的基本数据流。数据流有两种形式，一种称为程序数据流( p r o g r

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（通信与信息系统专业论文）视频系统的图像压缩技术实现.pdf

文档简介

温馨提示

最新文档

评论

（通信与信息系统专业论文）视频系统的图像压缩技术实现.pdf

文档简介

温馨提示

最新文档

评论

相关文档