(信号与信息处理专业论文)基于dm642的视频压缩算法研究与软件实现.pdf_第1页
(信号与信息处理专业论文)基于dm642的视频压缩算法研究与软件实现.pdf_第2页
(信号与信息处理专业论文)基于dm642的视频压缩算法研究与软件实现.pdf_第3页
(信号与信息处理专业论文)基于dm642的视频压缩算法研究与软件实现.pdf_第4页
(信号与信息处理专业论文)基于dm642的视频压缩算法研究与软件实现.pdf_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

硕士论文基于d m 6 4 2 的视频压缩算法研究与软件实现 摘要 如今,计算机和数字信号处理技术( d s p 技术) 的迅猛发展,不仅使得视频压缩 处理系统在日常生活、军事、工业和医疗等许多领域得到了广泛的应用,而且也给视 频压缩技术带来了更为广阔的发展空间。 本文系统介绍了在日常生活中应用非常广泛的一种视频压缩算法m p e g 2 的基 本原理和实现方法。首先,对视频压缩技术中的有损和无损压缩,图像的时间和空间 冗余的知识以及视频压缩编码标准进行了介绍;其次,较为系统的对与视频压缩技术 发展密切相关的d s p 技术知识进行了描述;接着,对m p e g - 2 视频压缩算法的基本 概念,编解码原理以及实现中采用的基本技术进行了较为详细的研究;然后,对 m p e g 2 视频压缩编码进行了软件实现,在d m 6 4 2 为核心的平台上对压缩算法进行 了移植和优化策略的关键点分析,并对比分析编码前后的图像以及不同码率下的编码 图像,得出相应的结论验证压缩算法的正确性。最后,对论文进行了简单总结,并对 以后的研究进行了展望。 关键词:视频压缩算法,m p e g - 2 ,d m 6 4 2 a b s t r a c t 刘。啪姐筘,r a p i dd e v e l o p m e n to ft h ec o m p u t e r t e c h n o l o g ya n d d i g i t a ls i g n a l p r o c e s s i n g ( d s pt e c h n o l o g y ) h a v e e n l a r g e dt h e a p p l i c a t i o nf i l e d so ft h ev i d e o u o m p r e s s l o np r o c e s s i n gs y s t e m ,s u c ha sd a i l yl i v e s 、m i l i t a r y 、i n d u s t r i a la n d m e d i c a l 觚d m a n yo t h e rf i e l d s ;a n da l s o b r o u g h tab r o a d e rd e v e l o p m e n ts p a c ef o rt 1 1 e v i d e o c o m p r e s s i o nt e c h n o l o g y 1 1 1t h i st h e s i s ,t h ep r i n c i p l e sa n dr e a l i z a t i o nm e t h o d so fm p e g 2 v i d e oc o m p r e s s i o n 砒g o r l t h m sh a v eb e e ns y s t e m a t i c a l l yi n t r o d u c e d f i r s t l y , d a m a g ea n dl o s s l e s sc o m p r e s s i o n o 士也e d e oc o m p r e s s i o n t e c h n o l o g y ,t i m ea n ds p a c er e d u n d a n c yo f i m a g ea n dt h ec o d i n g s t a i l d a r d so fv 1 d e oc o m p r e s s i o nh a v eb e e ni n t r o d u c e d ; s e c o n d l y , t h ek n o w l e d g eo fd s p t e c l l l l o l o g yw h i c hi sc l o s e l yr e l a t e dt ot h e d e v e l o p m e n to ft h ev i d e oc o m p r e s s i o n t e c h n o l o g yh a sb e e nd e s c r i p t e ds y s t e m l y ;t h i r d l y , t h eb a s i cc o n c e p t s ,t h ep 血c i p l e so f c o d m ga l l dd e c o d i n ga n dt h eb a s i ca c h i e v e m e n tt e c h n o l o g i e so ft h em p e g 2v i d e o c o m p r e s s l o na l g o r i t h m sh a sb e e ns t u d i e di n d e t a i l s ;a n dt h e n ,t h em p e g 2v i d e o c o m p r e s s l o na l g o d t h r n sh a sb e e nr e a l i z e di ns o f t w a r e ,i t h et r a n s p l a n tp r o g r a m m eo ft h e c o n 礁珊s m o na l g o r i t h ma n dt h ek e yp o i n t so ft h e o p t i m i z a t i o ns t r a t e g i e sh a v eb e e n d e s l g n e da n da n a l y s i s e di nt h ed m 6 4 2p l a t f o r m ,t h ec o r r e c t n e s so ft h e c o m p r e s s i o n 龇g o r i t h mh a sb e e nv e r i f i e dt h r o u g ht h ec o m p a r a t i v ea n a l y s i so ft h ei m a g e sb e f 断ea n d a f t 钌c o d i n ga n dt h ed i f f e r e n ti m a g e su n d e rd i f f e r e n tr a t eo f c o d i n g f i i l a l i y r e s e a r c h e so f t h ea r t i c l ea r ec o n c l u d e d ,a n ds o m ei d e a so f f u t u r es t u d ya r ep u t f o n a r d k e yw o r d :v i d e oc o m p r e s s i o na l g o r i t h m s ,m p e g 2 ,d m 6 4 2 声明 本学位论文是我在导师的指导下取得的研究成果,尽我所知,在本 学位论文中,除了加以标注和致谢的部分外,不包含其他人已经发表或 公布过的研究成果,也不包含我为获得任何教育机构的学位或学历而使 用过的材料。与我一同工作的同事对本学位论文做出的贡献均已在论文 中作了明确的说明。 研究生签名: 猩钆 a 蟠年6 月彩e t 学位论文使用授权声明 南京理工大学有权保存本学位论文的电子和纸质文档j 可以借阅或 上网公布本学位论文的部分或全部内容,可以向有关部门或机构送交并 授权其保存、借阅或上网公布本学位论文的部分或全部内容。对于保密 论文,按保密的有关规定和程序处理。, 研究生签名:童墅鱼力谬年6 月3 舌日 硕士论文 基于d m 6 4 2 的视频压缩算法研究与软件实现 1 绪论 1 1 课题的研究背景和目的 人类获取的信息中7 0 来自于视觉,视频信息在人类接受到的信息中占有重要 地位。在当今的日常生活中,数码相机、数码摄像机、视频手机等各种数字视频通信 设备蓬勃发展,越来越深入人们的日常生活。尤其是i n t e m e t 的迅猛发展和新一代的 移动通信网络的开发【1 1 ,使得传统的以电视广播的为主的视频服务发生了根本性的变 化。但是数字化了的视频信号的数据量之大是惊人的,在这种情况下,数据压缩就变 得非常必要了。 视频图像压缩技术的发展历史并不长,起源于2 0 世纪2 0 年代。当时,人们通过 b a r t l a n e 海底电缆图片传输系统,从伦敦纽约传输了一幅经过数字压缩后的照片,从 而把传输时间从一周多缩短至不到3 小时【2 1 。而促进了图像压缩算法飞速发展是由于 传真技术的发明和广泛使用。c c i t t ( 国际电报电话咨询委员会,是国际电信联盟i t u 下属的一个机构) 针对传真类应用建立了一系列图像压缩标准【3 j ,专用于压缩和传递 图像。这些标准大致包括2 0 世纪7 0 年代后期的c c i t tg r o u p1 和g r o u p 2 ,1 9 8 0 年的c c i t tg r o u p3 ,以及1 9 8 4 年的c c i t tg r o u p4 。今天,我们在办公室或家里收 发传真时,使用的大多是c c i t tg r o u p3 压缩标准,一些基于数字网络的传真设备和 存放图像的文件则使用了c c i t tg r o u p4 压缩标准。1 9 9 3 年,c c i t t 和i s o ( 国际 标准化组织) 共同成立的图像联合专家组( j o i n tb i 1 e v e li m a g ee x p e r t sg r o u p ,j b i g ) 又将图像的压缩进一步发展为更加通用的j b i g 标准。 但是,对于生活中更加常见的,像素值在空间上连续变化的灰度或彩色图像( 比 如数码照片) ,通用压缩算法的优势就不那么明显了。幸运的是,科学家们发现,如 果在压缩这一类图像数据时允许改变一些不太重要的像素值,或者说允许损失一些精 度( 在压缩通用数据时,我们绝不会容忍任何精度上的损失,但在压缩和显示一幅数 码照片时,如果一片树林里某些树叶的颜色稍微变深了一些,看照片的人通常是察觉 不到的) ,我们就有可能在压缩效果上获得突破性的进展。这一思想在数据压缩领域 具有革命性的地位:通过在用户的忍耐范围内损失一些精度,我们可以把图像( 也包 括视频) 压缩到原大小的十分之一、百分之一甚至千分之一,这远远超出了通用压缩 算法的能力极限。 在图像压缩领域,著名的j p e g 标准是有损压缩算法中的经典。j p e g 标准由静 态图像联合专家组( j o i n tp h o t o g r a p h i ce x p e r t sg r o u p ,j p e g ) 于1 9 8 6 年开始制定, 1 9 9 4 年后成为国际标准。j p e g 以离散余弦变换( d c t ) 为核心算法,通过调整质量 系数控制图像的精度和大小。对于照片等连续变化的灰度或彩色图像,j p e g 在保证 l 1 绪论硕士论文 图像质量的前提下,一般可以将图像压缩到原大小的十分之一到二十分之一。如果不 考虑图像质量,j p e g 甚至可以将图像压缩到“无限小 。 j p e g 标准中通过损失精度来换取压缩效果的设计思想直接影响了视频数据的压 缩技术。c c i t t 于1 9 8 8 年制定了电视电话和会议电视的h 2 6 1 建议草案。h 2 6 1 的 基本思路是使用类似j p e g 标准的算法压缩视频流中的每一帧图像,同时采用运动补 偿的帧间预测来消除视频流在时间维度上的冗余信息。在此基础上,1 9 9 3 年,i s o 通 过了动态图像专家组( m o v i n g p i c t u r ee x p e r t sg r o u p ,m p e g ) 提出的m p e g 1 标准。 m p e g 1 可以对普通质量的视频数据进行有效编码。我们现在看到的大多数v c d 影 碟,就是使用m p e g 1 标准来压缩视频数据的。 为了支持更清晰的视频图像,特别是支持数字电视等高端应用,i s o 于1 9 9 4 年 提出了新的m p e g - 2 标准( 相当于c c i t t 的h 2 6 2 标准) 。m p e g - 2 对图像质量作了 分级处理,可以适应普通电视节目、会议电视、高清晰数字电视等不同质量的视频应 用。在我们的生活中,可以提供高清晰画面的d v d 影碟所采用的正是m p e g - 2 标准。 在接下的几年里,m p e g 组织( m o v i n gp i c t u r ee x p e r t sg r o u p ) 与国际电信联盟 ( i n t e r n a t i o n a lt e l e c o m m u n i c a t i o nu n i o n ,i t u ) 又分别制定了m p e g - 4 ,h 2 6 3 ,h 2 6 4 等视频压缩标准。 如今,计算机和数字信号处理技术的迅猛发展( 数字化技术深刻地影响着人们的 日常生活,它以其良好的可编辑性能、更高的数据传输速度和效率等优点迅速替代原 有传统的模拟传输方式成为人类社会信息载体的首选) ,给视频压缩技术带来了更广 阔的发展空间,利用数字信号处理平台进行视频压缩研究已成为视频信号处理中的一 项核心技术,其目的就是在数字信号处理硬件平台上,针对给定的图像序列,在保证 一定重构视频质量的前提下,使用尽可能少的比特数对其加以描述,以利于在给定的 通信信道中进行传输,更好地为人类服务。 1 2 视频压缩的意义和优势【4 - 5 】 由于承载了海量信息,图像和视频中通常包含大量的数据,对通信传输带宽、数 据存储容量等都提出了更高的要求。多媒体通信中常见的c i f 图像格式为例,每幅 c i f 图像由2 8 8 行组成,每行又包括3 5 2 个像素点;如果对于每个像素的r 、g 、b 分量都使用8 b i t 数据进行表示,则当帧速率为2 5 f p s 时,每秒c i f 数字视频所占用的 比特数为2 8 8 3 5 2 3 8 x 2 5 = 5 9 4 m b i t 。对符合p a l 制式的标准电视信号,其ye , c 3 个分量所占用的比特数分别为7 9 1 0 m b i t ,1 9 7 8 m b i t ,1 9 7 8 m b i t ,每秒p a l 制式的视 频数据量为( 7 9 1 0 + 1 9 7 8 + 1 9 7 8 ) 2 = 2 3 7 3 2 m b i t 。而高清晰度电视h d t v 的数据量 则达到了1 2 g b p s 以上。 与此同时,用于传输通信的网络带宽和存储的媒质容量都非常有限,例如: 2 硕士论文 基于d m 6 4 2 的视频压缩算法研究与软件实现 ( 1 ) p s t n ( 公共交换电信网) :3 3 6 - 、- 5 6 k b p s : ( 2 ) i s d n ( 综合业务数字网) :( 2 b + d ) 1 4 4 k b p s : ( 3 ) a d s l x d s l ( 非对称数字用户环路数字用户环路) :1 1 一5 m b p s : ( 4 ) l a n ( 局域网) :1 0 1 0 0 m b p s ; ( 5 ) g s m c d m a ( 全球移动通信系统通用无线分组业务码分多址) :9 6 - - 一1 4 4 k b p s ; ( 6 ) c d r o m - 7 5 0 m b : ( 7 ) d v d - r o m - 4 7 g b 。 可以看出,如果直接在d v d r o m 中保存p a l 制式的原始视频数据,则只能保 存不到半分钟的内容。即使对于传输速率较高的l a n ,也无法进行连续的视频信息 实时传输。视频数据的这种海量性给存储器的存储容量、通信信道的传输带宽,以及 计算机的处理速度都增加了极大的压力。 虽然表示图像和视频信息需要占用海量的数据,但是数据并不完全等价于信息。 数据是信息的载体,同样的信息可以由不同长度的数据进行描述。数字视频具有自身 的独特特点,即视频数据具有多种相关性。如果能够去除由相关性所造成的各种冗余, 便能够实现对原始视频信号的有效压缩。 因为无论是存储、传输还是处理,数字视频都必须经过有效压缩才能具有实际使 用价值,这就使得视频压缩编码技术成为面向通信的视频信号处理技术中的关键所 在。此外,视频压缩编码还能带来如下优势: n ) 对于给定信道,能够更快地传输视频信息,降低对信道的占用时间; ( 2 ) 对于固定带宽的信道而言,能够开通更多的并行业务( 如电视电话、传真等) : ( 3 ) 降低硬件设备的发射功率; ( 4 ) 压缩视频数据容量,节省存储费用。 1 3 数字信号处理技术简介 自从2 0 世纪7 0 年代末第一片数字信号处理器芯片( d i g i t a ls i g n a lp r o c e s s o r s , d s p s ) 问世以来,d s p s 就以数字器件特有的稳定性、可重复性、可大规模集成,特 别是可编程性高和易于实现自适应处理等特点,给数字信号处理( d i g i t a ls i g n a l p r o c e s s i n g ) 的发展带来了巨大机遇,并使信号处理手段更灵活,功能更复杂。近年 来,随着半导体制造工艺的发展和计算机体系结构等方面的改进,d s p s 芯片的功能 越来越强大,芯片的存储容量和运算速度都得到成倍提高,成为语音处理,图像硬件 处理技术的基础,并使信号处理系统的研究重点又重新回到软件算法上,而不再像过 去那样过多地考虑硬件可实现性 6 1 。 d s p s 的结构特点在很大程度上体现了d s p 算法的需求。下面介绍d s p s 在结构 上的主要特点: 1 绪论硕士论文 ( 1 ) d s p 芯片采用改进的哈佛结构( h a v a r ds t r u c t u r e ) ,如图1 1 所示。其主要特 点是程序和数据具有独立的存储空间,有着各自独立的程序总线和数据总线,由于可 以同时对数据和程序进行寻址,大大地提高了数据处理能力,非常适合于实时的数字 信号处理。t i 公司的d s p 芯片结构是基本哈佛结构的改进类型。改进之处是在数据 总线和程序总线之间进行局部的交叉连接。这一改进允许数据存放在程序存储器中, 并被算术运算指令直接使用,增强了芯片的灵活性。只要调度好两个独立的总线就可 使处理能力达到最高,以实现全速运行。改进的哈佛结构还可使指令存储在高速缓存 器中( c a c h e ) ,省去了从存储器中读取指令的时间,大大提高了运行速度。 数据总线 图1 1改进型的哈佛结构 ( 2 ) d s p 指令系统是流水线操作。在流水线操作中,一个任务被分解为若干个子 任务,各个任务可以在执行时相互重叠。d s p 指令系统的流水线操作是与哈佛结构相 配合的,增加了处理器的处理能力,把指令周期减d , n 最小值,同时也就增加了信号 处理器的吞吐量。以t i 公司的t m s 3 2 0 系列产品为例,第一代t m s 3 2 0 处理器( 例如 t m s 3 2 0 c 1 0 ) 采用了二级流水线操作;第二代产品( 例如t m s 3 2 0 c 2 5 ) 采用了三级流水 线操作;第三代d s p 芯片( 例如t m s 3 2 0 c 3 0 ) 采用了四级流水线操作。在流水线操作 中,d s p 处理器可以同时并行处理2 - - - , 4 条指令,每条指令处于其执行过程中的不同 状态。 时钟厂j j 1 _ 厂 _ 卜叩 i! l i il 指令li 取指冬译列执香 : : iiiii 指令2 ll 取指曹译刊执每 l 指令3取指令译码执行 图1 2流水线示意图 ( 3 ) 采用独立的硬件乘法器。在一般的计算机上,算术逻辑单元( a l u ) 只能完成两 个操作数的加、减及逻辑运算,而乘法( 或除法) 则由加法和移位来实现。因此,在这 样的计算机的汇编语言中虽然有乘法指令,但在机器内部,实际上还是由加法和移位 来实现的,因此它们实现乘法运算就比较慢。与一般的计算机不同的是,d s p 都有独 4 硕士论文 基于d m 6 4 2 的视频压缩算法研究与软件实现 立的硬件乘法器,使乘法运算可以在一个指令周期内完成。如在t m s 3 2 0 c 3 x 系列 d s p 芯片中,有一个硬件乘法器,在t m s 3 2 0 c 6 0 0 0 系列中则有两个硬件乘法器。 ( 4 ) 独立的d m a 总线和控制器。这是和通用的c p u 很不相同,其目的是在进行 数据传输时完全不影响c p u 及其相关总线的工作。 ( 5 ) d s p 芯片一般都配有中断处理器、定时器、片内存储器和锁相环( p l l ) 等片内 集成外设,可以方便地实现一个嵌入式自封闭控制的处理系统。 由于d s p 的优越性,它自2 0 世纪7 0 年代以来,迅速得到广泛的应用。d s p 应 用几乎遍及整个电子领域,典型应用有通信、语音处理、图形图像处理、自动控制、 仪器仪表及医学电子等。随着人们对实时信号处理要求的不断提高和大规模集成电路 技术的迅速发展,d s p 的黄金时代正在来临。 1 4 本文主要任务及内容 本文主要对m p e g - 2 视频压缩编码进行了算法研究与改进,在d m 6 4 2 为核心的 平台上对压缩算法进行了移植和优化策略的关键点分析,并对比分析编码前后的图 像,以及不同码率下的编码图像,得出相应的结论验证压缩算法的正确性。 章节安排如下: 第l 章阐述了视频压缩编码的发展背景和目的、意义和优势,并对与其有密切联 系的数字信号处理技术进行简介。并概述了论文的主要任务和内容。 第2 章叙述视频压缩技术的基本原理和编码标准。 第3 章对系统硬件与开发环境进行介绍。介绍了t i 公司c 6 0 0 0 系列中的d m 6 4 2 的结构和特性,并对d s p 的软件开发环境也进行了描述。 第4 章详细介绍了m p e g - 2 算法标准。说明了m p e g 2 档次与等级,编码方式 与层次,编码的原理以及编码所用到的基本技术。 第5 章描述了m p e g 一2 视频编码器的实现过程。分别对视频编码器的软件实现、 编码的图像、算法的移植和优化等有关问题进行了叙述。 第6 章对论文进行了简单总结,并对以后的研究进行了展望。 2 视频压缩技术硕士论文 2 视频压缩技术 2 1 视频压缩技术基本原理 2 1 1 有损和无损压缩【7 l 视频压缩技术是视频处理技术的重要组成部分,目的是通过有损或无损的方式实 现数据量的有效压缩。 有损压缩编码是根据人眼视觉特性,在允许图像产生一定失真的情况下( 这种失 真不为人眼所觉察) ,利用图像信源在空间和时间上具有较大的相关性这一特点,通 过某种信号变换来消除信源的相关性,达到压缩编码的目的。压缩过程中损失一定的 信息,虽然不能完全恢复原始数据,但是所损失的部分对理解原始图像的影响较小, 却换来了大得多的压缩比。有损压缩广泛应用于语音、图像和视频数据的压缩。常用 的有损编码方法主要有预测编码、变换编码和矢量量化编码以及运动检测和运动补偿 技术。 无损压缩编码利用图像信源概率分布的不均匀性,通过变长编码来减少信源数据 冗余,使编码后的图像数据接近其信息熵而不产生失真,因而也常称为熵编码。但压 缩率受到数据统计冗余度的理论限制,一般为2 :1 到5 :1 。这类方法广泛用于文本数 据、程序和特殊应用场合的图像数据( 如指纹图像、医学图像等) 的压缩。由于压缩比 的限制,仅使用无损压缩方法不可能解决图像和数字视频的存储和传输问题。常用的 无失真编码的主要有h u f f r n a n 编码、算术编码和游程编码。 在实际的应用中,往往是综合利用上述各种编码方式以求达到最佳压缩编码效 果。在视频通信应用中,编码方法的选择不但要考虑到压缩比、信噪比,还要考虑到 算法的复杂性。太复杂的编码算法可能会产生较高的压缩比,但也会带来较大的计算 开销。在某些应用场合,如嵌入式消费类电子产品,芯片的选型受到产品尺寸,功耗 等条件的制约,这也要求设计者选择合适的视频压缩算法,因为硬件的计算能力可能 无法承受过于复杂的算法。 2 1 2 空间和时间冗余 由于视频数据具有多种相关性,如果能够去除由相关性所造成的各种冗余,便能 够实现对原始视频信号的有效压缩。一般而言,数字视频信号中的冗余可以归为如下 几类【8 】: ( 1 ) 空间冗余。作为视频基本元素的数字图像是对模拟视频信号空间采样得到的, 因而构成图像的相邻像素之间具有较强的相关性,即这些相邻像素之间的像素值通常 相差不会太大。各像素的数值可以由其邻近像素的数值预测出来,每个独立的像素所 6 l * # j :d m 6 4 2 的颤】t 镕算r 虻# # * 窑驻 携带的信息相对较少,这种像紊间的兀余就称为空间冗余,如图2l 所示 1 i 田2 1 空间冗余说明 观察c 区图片,根据色块分布大概可分为四个区域。我们可以把b 区的三个色 块放到a 区,将图片补充完整,b 区同一色块中的所有点的光强和色彩以及饱和度 都具有较强的相关性,数据具有很大的空间冗余。 ( 2 ) 时问冗余。由于视频信号本质上是一系列连续的图像,为了达到连续的视觉 效果,视频帧与帧之间的采样间隔很小,对于2 5 邱的视频信号,其间隔时间仅为 00 4 s 。因此相邻两幅图像之间也存在很强的相关性。对于静止不动的场景,当前帧 和前一帧的图像内容是完全相同的:对于场景中的运动目标,如果知道其运动规律, 也可以很容易地从前一帧图像推算出它在当前帧中的大致位置;这就是视频序列中的 时间冗余,如图2 2 所示。 2 槐顺性埽挫术 顺| 谤史 我们看 _ 后一帧a 据与前一桢的;据有许多共届1 的 地方相邻帧 e 录r 相邻时 _ 的月场量日3 之就 是时间咒余, 图2 2 时间冗余说明 演示“流星”动画,我们看到动画前后帧背景是不变的,相邻图像之间有较大的 相关性,这种叫做时间冗余。在编码过程中可以充分利用这种相关性,采用相应的编 码策略。 2 2 视频压缩国际标准 标准化是产业化活动的前提,近年来一系列国际视频压缩编码标准的制定,极 大的促进了视频编码技术和多媒体通信技术的发展9 i 。视频压缩编码标准主要包括由 国际电信联盟( i m e m a t i o n a l t e l e c o m m u n i c a t i o n u n i o n ,m j ) 所制定的h 2 6 x 系列 标准,以及由国际标准化组织( i n t e r n a t i o n a ls t a n d a r d i z a t i o n o r g a n i z a t i o n ,i s o ) 和 i e c ( i n t e r n a t i o n a le l e c t r o t e c h n i c a lc o m m i s s i o n ,国际电工委员会) 的共同委员会的 m p e g 组织( m o v i n gp i c t u r ee x p e l sg r o u p ) 所制定的m p e g x 系列标准。这些视频编 码标准都是根据人们在不同领域中对数字音,视频数据的要求所制定的,图2 3 按照制 定时间顺序大致描述了现有国际视频编码标准的发展历程。 t 论i 基于d m 6 4 2 的视颏缩算法研究与软件宴现 m p e g m p 6 1 m p e ga s t a n d a r d s i 刚i g l t 啪倚加l 蛳1 8 i m1 鞠8 如加2 22 1 1 d 4 图2 3 视频编码国际标准的发展 2 2 1h 2 6 x 标准 ( 1 ) h2 6 1 标准: h 2 6 1 全称为p 6 4 k b p s 的音,视频服务的编t 犀码,其中p 是1 到3 0 的可变参数, 它最初是针对在i s d n 上实现电信会泌应用特别是面对面的可视电西和视频会议而设 计的。实际的编码算法类似于m p e g 算法,但不能与后者兼容。h2 6 1 在实时编码时 比m p e g 所占用的c p u 运算量少得多,此算法为了优化带宽占用量,引进了在图像 质量与运动幅度之间的平衡折中机制,也就是说,剧烈运动的图像比相对静止的图像 质量要差。因此这种方法是属于恒定码流可变质量编码而非恒定质量可变码流编码。 ( 2 ) h2 6 3 标准 1 l l : h 2 6 3 全称为低比特率通信的视频编码,是n u ,t 为低于6 4 k b s 的窄带通信信 道制定的视频编码标准。它是在h 2 6j 基础上发展起来舶,其标准输人图像格式可阱 是s - q c i f 、q c i f 、c i f 、4 c 1 f 或者1 6 c i f 的彩色4 :2 :0 亚取样图像。h2 6 3 与 h 2 6 1 相比采用了半象素的运动补偿,并增加了4 种有效的压缩编码模式。随后出 现的第二版( h2 6 3 + ) 及h2 6 3 + + 增加了许多选项,使其具有更广泛的适用性,主要应 用于远程视频监控,可视电晤,可视会议等方面。 ( 3 ) h2 6 4 标准: l 2 6 4 是由i s o t i e c 与i t u - t 组成的联合视频组o v t ) 制定的新一代视频压缩编 码标准。1 9 9 6 年制定h2 6 3 标准后,1 1 u - t 的视频编码专家组( v c e g ) 开始了两个方 面的研究:一个是短期研究计划,在h 2 6 3 基础上增加选项( 之后产生了h2 6 3 + 与 h2 6 3 h ;另一个是长期研究计划,制定一种新标准以支持低码率的视频通信。长期 9 2 视频压缩技术硕士论文 研究计划产生了h 2 6 l 标准草案,其目标是研制出新的压缩标准,与以前的任何标 准相比,效率要提高一倍,同时具有简单、直观的视频编码技术,网络友好的视频描 述,适合交互和非交互式应用( 广播、存储、流媒体) 。 2 2 2m p e g 系列标准 ( 1 ) m p e g 1 标准 x 3 1 : m p e g 。1 其标题为“码率约为1 5 m b p s 用于数字存贮媒体活动图像及其伴音的编 码j p j p 0m p e g 1 制定于1 9 9 2 年,为工业级标准而设计,可适用于不同带宽的设备,如 c d r o m 、v i d e o c d 。 但) m p e g - 4 标准p s : m p e g 4 全称为音视频对象的通用编码。这个标准主要应用于视像电话、视像 电子邮件等,对传输速率要求较低,在4 8 0 0 6 4 0 0 b i t s s 之间,分辨率为1 7 6 1 4 4 。 m p e g 4 利用很窄的带宽,通过帧重建技术、数据压缩,以求用最少的数据获得最佳 的图像质量。利用m p e g - 4 的高压缩率和高的图像还原质量可以把d v d 里面的 m p e g 2 视频文件转换为体积更小的视频文件。经过这样处理,图像的视频质量下降一 不大但体积却可缩小几倍,可以很方便地用c d r o m 来保存d v d 上面的节目。另 外,m p e g - 4 在家庭摄影录像、网络实时影像播放也大有用武之地。元素将支持尽 可能多的各种应用。 ( 3 ) m p e g 一2 标准: m p e g - 2 全称为运动图像及其伴音信息的通用编码,m p e g 2 按压缩比大小的不 同分成五个档次( p r o f i l e ) ,每一个档次又按图像清晰度的不同分成四种图像格式,或 称为级另l j ( 1 e v e l ) 。五个档次四种级别共有2 0 种组合,但实际应用中有些组合不太可能 出现,较常用的是1 1 种组合。这1 1 种组合分别应用在不同的场合,如m p m l ( 主 档次与主级别) 用在具有演播室质量标准清晰度电视中,美国高清晰度电视( h - d t v ) 大 联盟采用m p h l ( 主档次及高级别) 。m p e g 2 制定于1 9 9 4 年,设计目标是高级工业 标准的图象质量以及更高的传输率。m p e g 2 所能提供的传输率在4 - - - 1 0 0 m b p s 间,其 在n t s c 制式下的分辨率可达7 2 0 x 4 8 6 ,m p e g - 2 也可提供并能够提供广播级的视 像和c d 级的音质。由于m p e g 2 在设计时的巧妙处理,使得大多数m p e g 2 解码器 也可播放m p e g 1 格式的数据,如v c d 。同时,由于m p e g 2 的出色性能表现,已 能适用于高清晰度电视( h d t v ) ,使得原打算为高清晰度电视( h g t v ) 设计m p e g 3 , 还没出世就被抛弃了。( m p e g 3 要求传输速2 0 m b p s 4 0 m b p s 间,但这将使画面有轻 度扭曲) 。除了作为d v d 的指定标准外,m p e g 2 还可用于为广播,有线电视网,电 缆网络以及卫星直播( b b s ) 提供广播级的数字视频。m p e g 2 的另一特点是,其可 提供一个较广的范围改变压缩比,以适应不同画面质量,存储容量,以及带宽的要求。 1 0 硕士论文 基于d m 6 4 2 的视频压缩算法研究与软件实现 2 3 本章小结 视频压缩技术是视频处理技术的重要组成部分,本章先对视频压缩技术中的有损 和无损压缩进行了概述,而后阐述了关于图像的时间和空间相关冗余的知识,最后对 视频压缩编码制定的标准进行了介绍。 3 系统硬件与开发环境 硕士论文 3 系统硬件与开发环境 3 1t i 公司的c 6 0 0 0 系列d s p 概述 t m s 3 2 0 c 6 0 0 0 系列是t i 公司从1 9 9 7 年开始推出的最新d s p 系列,该系列的第 一款芯片是c 6 2 0 1 ,在2 0 0 0 年以后又推出了c 6 4 x ,整个c 6 0 0 0 系列现在已经推出了 c 6 2 x c 6 4 x c 6 7 x 等3 个子系列。本系统采用的硬件平台d m 6 4 2 就是c 6 4 x 系列中拥 有较高性能的定点数字信号处理器。 3 1 1 硬件结构 i c p u 方面: ( 1 ) 寄存器组 c 6 0 0 0 的数据通道里,有2 个通用寄存器组( a ,b ) 。对于c 6 2 x c 6 7 x ,这两个寄 存器组分别包含有1 6 个3 2 位的寄存器( a 0 a 1 5 ,b 0 - b 1 5 ) ,这些通用寄存器可 以用于存放数据、地址指针或作为条件寄存器( a 1 ,a 2 ,b 0 ,b 1 ,b 2 ) 。c 6 4 x 则把 这些寄存器的数目增加了一倍( a 0 , - - - , a 3 1 ,b 0 - - b 3 1 ) 。c 6 4 x 的b 0 也可以用作条件 寄存器【1 6 1 。所有c 6 0 0 0 处理器的a 4 - a 7 ,b 4 , - 一b 7 都可以用于循环寻址i 。 ( 2 ) 功能单元 c 6 0 0 0 数据通道里的8 个功能单元分为2 组,每组4 个。一个数据通道里的每个 功能单元,和另外一个数据通道里相应的功能单元是相同的。c 6 4 x 与c 6 2 x 代码兼容。 除可以执行所有的c 6 2 x 代码以外,c 6 4 x 的指令集里还有许多8 位和1 6 位的指令。 ( 3 ) 寄存器组通道 每个功能单元在自己的数据通道内直接读写寄存器。c p u 里的大多数数据线支 持3 2 位运算,有些支持长字( 4 0 位) 和双字( 6 4 位) 运算。每个功能单元都有自己 的写出口和2 个3 2 位读入口。 4 个功能单元( l 1 ,l 2 ,s 1 和s 2 ) 有一个额外的8 位口,用于4 0 位长字的读写。 因为c 6 4 x 的乘法器都可以返回6 4 位的结果,所以又增加了一个从乘法器到寄存器 组的写入口 1 7 1 。每个寄存器组都通过跨接通道,和另外一个功能单元相连接。功能 单元可以通过这个跨接通道访问另外一组寄存器【1 8 】。 ( 4 ) c 6 4 x 独有的特性 c 6 4 x 在c 6 2 x c 6 7 x 基础上提供了寄存器组的增强和数据通道的扩展。另外还具 有一些独有特性,包括:打包数据的处理、增加的功能单元硬件和增加的正交性等【1 9 】。 在芯片级的性能上: ( 1 ) 两层c a c h e 结构 c p u 可以直接与第一层程序c a c h e ( l 1 p ) 及数据c a c h e ( l 1 d ) 接口。这些c a c h e 硕士论文 基于d m 6 4 2 的视频压缩算法研究与软件实现 可以使c p u 全速运行。第二层的l 2 程序数据存储器,提供了灵活的存储方式,可 以通过相应的寄存器配置。 ( 2 ) 强化的d m a 控制器( e d m a ) e d m a 提供2 g b y t e s 的片外带宽,支持由独立事件触发的6 4 个通道。总共有8 5 个参数可以用来设置连接。在c p u 初始配置后,就可以由连接来连续地自动初始化 d m a 的操作。 ( 3 ) 3 组片外总线 支持3 组并行的片外总线:2 组片外存储器接口( e m i f ) 和1 组主机接口( 船i ) 。 e m i f 中一组( e m i f a ) 的宽度为6 4 位,用来和高速同步存储器直接相接。另外一 组宽度为1 6 位的e m i f b ,用来和f i f o 及并行数据转换器等片外外设接口。3 2 位 h p i 提供和各种工业标准主机处理器以及p c i 桥接芯片的连接。h p i 可以工作在3 2 或1 6 位模式下。 ( 4 ) 灵活的串口连接 3 个多通道缓冲串口( m c b s p ) 可以和各种标准接口。每个m c b s p 都支持在任 何时间,对1 2 8 个通道作独立的通道选择。 ( 5 ) 通用g p i o 引脚 为通用i o 外设提供专门的,可以配置为输入或输出。当配置为输出时,可以控 制输出引脚的状态驱动;当配置为输入时,可以检测输入状态,它是一个内部寄存器 的映射,共有1 6 个。 3 1 2 寻址模式 c 6 0 0 0 的寻址模式包括线性寻址和循环寻址,由寻址模式寄存器( a m r ) 来决 定。所有的寄存器都可以线性寻址,但只有8 个寄存器可以作循环寻址,即d 1 单元 使用a 4 , - 一a 7 ,d 2 单元使用b 4 b 7 。 对于可以作循环寻址的8 个寄存器( a 4 a 7 ,b 4 b 7 ) ,a m r 用来指定寻址模 式。每一个a m r 都有一个2 位的域相对应,选择其地址修改模式:线性( 缺省) 或 循环。如果是循环模式,还要决定循环缓冲器的大小。c 6 0 0 0 的c p u 具有装入存储 结构,也就是说,只有用装入存储指令,才能访问存储器里的数据。 3 1 3 流水线和中断 ,现代微处理器是用结构的复杂性来换取速度提高的。它把指令的处理分成几个子 操作j 每个子操作在微处理器内部需要由不同的部件来完成。t m s 3 2 0 c 6 0 0 0 的特殊 结构可使多个指令包( 每包最多可达8 条指令) 交迭在不同的部件内处理,大大提高 了微处理器的处理速度。t m s 3 2 0 c 6 0 0 0 中所有指令均按照取指、译码和执行3 级流 水线运行,每一级又包含若干节拍。所有指令取指级有4 个节拍,译码级有2 个节拍。 1 3 3 系统硬件与开发环境 硕士论文 执行级对不同类型的指令有着不同数目的节拍。c 6 2 x c 6 4 x 流水线如图3 1 所示。 卜一墩攒+ 译弼q - 一执纷叫 图3 1c 6 4 x 定点流水线各个节拍 取指级4 个节拍:p g 程序地址产生;p s 程序地址发送:p w 程序访问等待;p r 程序取指包接收。译码级2 个节拍:d p 指令分配;d c 指令译码。定点流水线的执 行级最多有5 个节拍( e 1 e 5 ) 。中断是为使c p u 能够具有对外界异步事件的处理 能力而设置的。通常d s p 工作在包含多个外界异步事件环境中,当事件发生时,d s p 应及时执行这些事件所要求的任务。中断就是要求c p u 暂停当前的工作,转而去处 理这些事件,处理完以后,再回到原来被中断的地方继续原来的工作。t m s 3 2 0 c 6 0 0 0 有8 个寄存器管理中断服务。 3 2t m s 3 2 0 d m 6 4 2 简介 t m s 3 2 0 d m 6 4 2 t 2 0 】数字媒体处理器是美国德州仪器公司( t i ) 推出的一款面向数 字多媒体应用的3 2 位定点d s p ,其工作主频高达7 2 0 m h z ,处理性能可达5 7 6 0 m i p s , 可实时实现多路数字视频音频的编码运算。它在t i 的c 6 4 xd s p 内核基础上进一步 集成了完备的视频音频输入输出接口、以太网接口、p c i 6 6 总线等片上外设,非常 适用于v o i p 、数字视频服务器、多通道数字视频录像机( d v r ) 、多通道数字视频监 控等应用,提供高质量的视频编解码解决方案。踟s 3 2 0 d m 6 4 2 的系统功能框图如 图3 2 所示。 1 4 硕士论文 基于d m 6 4 2 的视频压缩算法研究与软件实现 。静:巍- 溉= p l 裟舐扣j 簧鍪零妻,。,一: 如t 融i 品蠢i 绣 l ! 叫l t ? 魄龇婶繇y t c s+ 1 i 嘲甜翌滋l t e 姚粥pc o r e 雠 | 磁媳洲蝴掬鑫 乳喀t 油知油 c 袖; 蝣 爹 ;- p 譬l l 明乍 蓄 参妇钙;端o i 硼强绷_ 锄i n 雾 孙麟tp 籀吨t

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论