版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、武汉大学硕士学位论文基于MPEG-4标准实时视频编解码系统的研究与设计姓名:沈文光申请学位级别:硕士专业:电力电子及传动指导教师:殷小贡20030401竞扶夫学磺毒学位论文基于瓣一檬准赛辩撩藏编赫码系统辫研究与注计摘要筚胃丽际运动匿像专寨组()正式推穗了全新的标准。与黻前的视频臌缩标准相比,该标准第一次引入了基于对象编码的氍念,更多的强调了多媒体遴信静交互性秽灵活毪,因两窀将在数字电褫、互联瓣、实辩多媒体蕴控、移动多媒体通信、上的视频流与可视游戏等交互多媒体艘用中大显身手。目前图表辩骞谗多公雹秘蟹究惑浆都在簸摹斑露莲拳瓣磺交及褪音壤产鑫熊费袭。零课题的研究目的就是针对轻轨工程远程监控应用的需要
2、,研制并开发出套基于撼陛豹实黪援羰缡鬓玛系统。本人鞭过对视频编解码算法韵仔细研究,及当前税频压缩编解码臻统各种最诗方案的分析耧扰较,决定采建基于麓逮豹实现方案,井选择公司的懑性能媒体处理器作为本系统的处理核心。在本论文中,详细说明了以为核心的丈时视频编解码系统的硬件组成和软件实现,赘重斓述了为盘荜决本系统的实时毪阎题,谯软件蜜瑗过稷中所摄薛一种蒂怒点颈潞魏分类运动铸计算法,和撮罐系统的硬件厦编译系统特点,遥甩各种方法对编解码程序代码进行忧纯瓣技巧。最后,给窭了系统弱滔试绩莱,迂醴零系统簌符合级稀灌翁蕊础上,达剽了实时编解码的设计要求。奉濠磁浚诗嚣发的实瓣税额绫解羁裘统,巴娥珐透过蘧试,帮将投入
3、菜枣较孰工程实际运行。关键词;桃频压缩、标准、运动储计算法、代礴优化武汉大学硕士学位论文基于蛐标准实时税频编解码系统的研究与设计(),血,口一,鹤,:;掣,:,一,武汉大学电气工程学院学位论文原创性声明本人郑重声明:所呈交的申请墅兰学位的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究作出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。日期:年月如日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文大规定,同意学校保留并向国家
4、有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权武汉大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。保密口,在年解密后适用本授权书。本学位论文属于不保密口。(请在以上相应方框内打“”)作者签名:皴菽:屯导师签名:日期:年了月日日期:年月日式汉太学硬士擘毽论文基于赫一挺准赛鞋攘装赣解祷系统瓣研究与设计第一章绪论本章阐述了数字视频压缩的意义,介绍了视频压缩编码技术的发展,说明了本课题研究韵目的、意义及所做的工作,最后对论文匏内容安排作了总体介绍。§引言当今世界已跨入信息时代,信息的形式也从单纯的语音
5、发展至包括数据、文字、视频慰像的多媒体信息。其中视频信息班直观性强,信息量大及便于理解等特点占有举足辍重的地位。入蹙接受的信息约来自视觉,在人眼视网膜上的映像是人类最有效和最重要的交流方妓。信息时代的重簧特征就是倍感的数字化,数字视频也就成了必然的发展趋势。然而,将模拟视频简单地转化为不经过压缩的数字视频,其数据量之大是非常惊人的。例如,一幅中分辨率的彩色图像(比特,象索),其数据量钓为。船以每秒帧的速度播放,则需要传输豹数码率为;若用的光盘存储该视频信意,仅仅耱搓敷移锌。髭然,遽样庞大的数据薰对瑗寄的存储帮传输技术帮楚无法接受的,必须对视频信息进行大幅度的压缩。视频压缩就是在保证图像质量的前
6、提下,去掉巍橡中较多的冗余信息,用尽可憩少的比特数采表示图像,班霞于图像的存储鞠传输。视频数据的压缩是多媒体领域的关键技术,也成为了当今研究的热点,各种各样的銎攮压袭舞陵应运嚣生。营嚣土舞据准让缀缓辗攘多年来绕壤压缩方面静研究袋栗禹寇出了一系列相应的图际标准。随着大规模集成电路(),计算机和通信技术的迅速发袋和结合,大大键进了视频压缨技术的进步秽广泛应用,从曩孬迎来了视频鹜像的黄金时代。其具体应用如,商清晰度电视(),可视电话,数字视频会议和图像浆控等,已灌濒地走进入稻鲍爨零生淫。§视频压缩编码技术的发展历史及现状视频压缩技术的发展源于数字电子图像技术的发展。其实早谯年提出电视信号数
7、字化后,就同时搿始了对图像臌缒编码的研究工作。霹年提出了第一个编码理论一脉冲编码调翩()理论,完成了模拟图像向数字图像的转化,值它没有除去原始储号中的冗余。当年的经典论文“通信的数学原理”提出并建立了信息率失真概念。为信息编码奠定了理论纂础。此后,图像压缩编码理论和方法有了裰大的发展。年对比分析了和编码,并提出了用于电视的实验数据。予年送行了线往预测编码的窑际实验磁。年筹入提出用二雅离散傅虚叶变换进行变换编码,到后来相继出现的离散余弦变换(),正交变换,变换,耩变换等,采翅变换编码有效惑除去了图像在空阐上的冗余群。年第页武汉大学硕士学位论文基于一标准实时视频编解码系统的研究与设计代初开始对连续
8、图像的运动估计和补偿进行研究,它利用了运动图像在时间上的连续性,因此极大地提高了视频压缩效率】。在年代中期开始了第二代视频压缩编码方法的研究与前者相比,它充分考虑了人限的视觉特性,力图发现人眼是根据哪些关键特征来识别图像的,然后根据这些特征来构造图像模型,依据这些模型进行编码。第二代视频压缩编码方法真正代表了视频编码的方向,是目前视频编码研究中最活跃的领域。年通过了了的标准,是图像编码年研究成果的结晶,标志着视频编码技术在走向实用化的道路上迈出了重要的一步。进入年代后又相继提出了一系列图像压缩标准,如年由(联合图片专家组)提出的用于静止图像压缩的标准,年间国际标准化组织()下设的国际运动图像编
9、码专家组()提出了著名的和标准,年又为甚低码率而制定的,到年小组又推出了全新的标准。这些标准融合了各种性能优良的图像编码方法,它们的制定极大地推动了视频图像编码技术的实用化和产业化。另一方面,图像编码技术产业化进程也反过来推动了视频图像技术以更快的速度发展。目前在视频图像编码领域的研究工作主要分两个方向【】:、研制出集成度更高,性能更好,成本更低的图像处理芯片,来更好地实现现有的图像编码国际标准。、不断深入研究、探索视频图像编码的理论和方法,找到一种码率更低,效果更好的压缩编码方法。可以预计在不久的将来随着视频图像压缩编码技术不断成熟及硬件水平的不断提高,以视频图像为主的多媒体通信产品将走进千
10、家万户。§本课题的研究背景和意义随着计算机网络技术的发展,视频信息通过、等网络传输越来越引起了人们的重视,视频传输的应用系统方兴未艾,已经对社会、企业信息化产生了巨大的影响。监控系统作为视频技术应用的一个很重要的领域,正逐渐地从昂贵的模拟系统向廉价的数字系统发展。远程图像监控系统是新近崛起的以计算机技术及图像视频压缩为核心的新型数字视频监控系统【日。任何远程监控系统都需要有足够带宽的媒介来传输视频信号,目前常用两种解决办法,一是租用电信服务商提供的网络资源,二是建立自己的专用通信网。第一种方案不需要自己铺设线路,很快就可以建起监控系统,但其可靠性和保密性不能得到很好的保证,不适合安全
11、性和保密性要求高的场合:在地铁轻轨工程、电力系统远程监控中,通常都采用第二种办法,即利用自己已经建有的基于的专用光纤传输网络,以满足各站点间话音、音频、数据、视频、等多种业务的接入、交换和传输。在这些系统中,视频监控业务占有极其重要的地位,且对传输可靠性和图像质量都有较高的要求。基于光纤传输网络的监控系统结构如图,所示。第页盏故丈学硬士学整论灾基于雏一标准窭鞋援攘赣攥鹞蓉统辩霹究与设诗图中,每个从站有台摄像头,每个摄像头采集的原始图像经过视频编码板,按照某种视频压缩标准来压缩编褊成规定格式静视频流,再将姥码流直接逶过映射到帧结构中,然后就可通过光纤环网传输到主监控站,该硝流再由解码板经相反过程
12、瓣玛还廉蛰豫,在蓝跫嚣上显忝出来。丧逮铁,辍鞔工聪耪电力蓑统的远程监控系统中,从站的数目是相当多的,而且每个从站需要监控的点也有多个,这就意味着在环网上传输鹩视频信息量是常太的。虽然基于的竞野环网目前最大传输窭量可这,但避远程监控中话音、音频、数据、等业务要占据相当多的带宽资源,留给视频的带蹙并不缀太。按照摭准,铡式模拟拽频信号数字化嚣数据速率约为要实时传输数据速率如此之高的数字信号,既不现实又不经济,因此必须对数字视频进行压缩女理,以提高视频豹传输效率。 闰一基于光纤传输耐络的监控系统结构本研究谋题最我国某大城市较轨工程通信系统设计开发项目的一个部分。在全长的轻辘线路沿线,共有通德站点个,瓣
13、像监褪摄像头台,光纾蒌:鼹带宽。系统对闰像待输质量和实时性能要求禳高,主站端必须能灵活切换嫩示各监视点的实时场景,且能多画面、单葱面及局部放大显示。我们通过对视频压缩理论的深入研究及目前各种压缩标准的眈较,设计了一套蕊于标准的视频实时编解码系统,并为了解决其裳时性的问题提出了一种新的运动估计算法,采用“带起点预测分类搜索法”,谴搜索鹃计算薰大为藏少,误差也得到了有效的控箭:同时撮撼系统硬件特点。深入探索了进行程膨代码优化的方法。该视频编解码系统可单独作为一个视频编解码模决攒入光纤环弼的每个网元,在绦证监控图像质鬃的同时大大减少了传输视频信息需要第噩囊荻太学硬士擘住论支萋子一嚣准妾鞋键装蓑辩霹系
14、统舔辑襄与设谨的带宽,使利用宥限的带宽资源尽量传送多路视频信号成为了可能。经实际运用表明,本研究成果获得了较理想的运行效果。在其它远辍视频监控颁戴也具有广阕躲藏用前景。§。本课题的研究工作和内容安排本论文的研究工作本论文在充分理解视频图像压缩原理的基础上,结合本课题的具体蕞求,为最终实现视频实时编解羁,完或了如下研究工撵:、通过广泛戡阅国内外相关文献资料,深入地研究了各种视频图像压缩技术。、对目前流褥豹视频压缩标准作了深入磷究秘详细比较,结合本误题鹩实鞴需要及未来视频压缩的发展趋势,选择了由国际运动图像编码专家组年制定的标准。、根据标准和视频传输的特点,设计了以公司薪近推出的芯片为核
15、心的实时视频编解妈系统,实现了视频信息的实对编解码。、重点研究、解决了视频实时编解码实现串的两个关键技术:一是通过对运动图像相荚性及现有运动估计算法的仔细分析研究,提出了一种新的带起点预测分类运动估计算法;二怒舒对蓉统硬件特点,深入探索了进行程序代码优仡的方法,从而大大减少了图像处理过程中的计算盈,明显提高了代码执行效率。本课题的开发研究具有较大静学术价值和实际意义,取得了缀好的应用教聚。本论文备章节安排本章主要介绍了视频压缩编码技术的发展及现状,本课题研究的背景和意义,及所佟懿研究工作;蔡二章讲述了褫豢躅像压缩编舀翡基奉原理,势通过对目前各种压缩标准的各自特点比较,决定了本系统中采用的压缩标
16、准:第三章概述了标准,着重分辑了箕基于对象编弼艟鸷熹;第图章奔绍基予标礁叠孽撬颏察鞋编解码系统的总体设计方案,及器件选型;接下来的第五章,介绍的结构殿性能,和它用于图像处理鹘优点:第六章是本文的重点,溺述了以为核心的裁频编解码系统的实现,具体分析了实时软件实现中的两个关键技术:算法改进和代码优化,并绘出了测试结果;鼹舞一鬻,对本文取得的续果馓了总继,势对应用兹最避萼亍了震望。攀更武汉大学硕士学位论文基于一标准实时视频编解码垂统的研究与设计第二章视频图像压缩的基本原理视频图像压缩技术的研究已有几十年,从其基本原理来看,可将压缩技术分为两大类。第一类是以速率失真理论【”为依据,将基于空间和时间上像
17、素采样的原始视频图像序列采用一般信号分析的方法来消除视频数据中的冗余,最终使得用来表示图像的数据是互不相关的。此类方法不关心图像的具体内容,仅考虑信源的统计特性,被称为基于像素的压缩方法,也就是第一代视频图像压缩编码方法。该类方法己趋于成熟,许多视频压缩标准(,等)都采用第一代技术。第二类方法,即第二代视频图像压缩编码方法,是根据视觉对物体的轮廓比对物体的内部细节更敏感的特点,将整个图像分割成若干个对象,基于这些对象进行编码。显然,基于对象编码比上述的基于像素的编码方式更加有效但是这种技术尚未成熟。本章先分析视频数据压缩的原理,再分别介绍这两类压缩技术,最后将目前常用的视频压缩标准进行比较,以
18、选择最适合本课题的标准。§视频数据压缩的理论依据在讨论视频数据压缩原理时就要涉及到现代科学的一个重要分支信息论。所创立的信息论对视频数据压缩有着极其重要的指导意义,它一方面给出了数据压缩的理论极限,另一方面又指明了数据压缩的技术途径。下面我们就来看看信息论告诉了我们些什么。在日常生活中,我们从收到的书信、电报、电话或看到的图像中得到消息,在这些消息里包含了对我们有用的信息。我们把消息的出处称作信源用表示,假设消息的集合是由多个信号单元构成(,)那每个包含多大的信息量,或者说多少有用信息呢?信息论定义了一种度量信息量的方法为:()一。尸(),(一)其中,()是信源发出的先验概率。“)的
19、含义是信源发出这个消息(随机事件)后,接收到信息量的度量,或者说可能收到信源发出的是那个随机事件的不确定性。显然。当随机事件氇发生的概率(。)大时,由式一计算出的()就小,即这个事件发生的可能性大,事件一旦真得发生后提供的信息量也少。必然事件的()等于,()等于,所以对必然事件的消息报导。不含任何信息量。比如“太阳从东方升起”这个人所共知的事实,就毫无信息价值。但是一件人们没估计到的事件()极小)发生了,相对的(,)很大,说明包含的信息量很大。所以随机事件的先验概率与事件发生后产生的信息量有很密切的关系。(;)就表示了发生后的自信息量。信源发出的(,),共个随机事件的自信息量统计平均(求数学期
20、望),有第页武最犬学硪士学位论文基于赫瑟一椽堆赛鞋端壤黎爨鹤系统蟓研;呈兰塑造日(爿),)()()一户()十。(,)()胃。“。()在售崽论串称为信灞静“煞”(),箕害义失信源发基经意一个随机变量的平均信息量。在图像编码中式虽的。取,()的单位就为比特(),壤缓就爱来簿量燕嚣最娃编码。蓉渡裘示缡秘嚣输凄鹦字戆串均羁长,翅当”()时,有冗余,不是最佳编码;露()不可齄;当()(耩犬予()时,是最佳编码。视频数据压缩就是通过排除输入视频信号豹棚关性,使编码器输出的尽擞接近箕璃德霹。我们对图像以一个个像素方式聚样编码时,没有考虑劐相邻像素点之间存在酶相关性,因此数据量是庞大的,也就是说有大量的冗余信
21、息。越也为利用图像像素点之淹鹩裙关馥进行襁额图像糕缩援供了可辘。我们可以看至遂常一副匿豫像素意谯空域中的获度值和色差信号值,除了在毅界轮廓外,都是缓慢变化的,相邻像素的灰发和色麓整比较接避,具毒强夔窆翔耱关链,子是减少空域冗衾成为程鞭图像嚣鳐必然瓣一个方向。另外,视频图像是沿时间轴方向的一帧帧序列,其帧间图像的相关性也很强,减少图像黠壤熬茏衾壤息是进程援颧强像歪缭熬重要簪段。莲我喜簪就魏秘湾豫燕像麴空间辅时间冗余的一魑具体视频压缩技术作较详细的描述。§图像数据翡交换编码前面我们已讨论过原始的图像信号在空域上有大量的冗余。变换编码豹目的就是把空域图像信号映射嶷换到瓣个溉交矢量空闯(变换
22、域,或频域),产生一咤,变换系数,然膝对这黢变换系数进行擞化编码处理【】”。由于转换使用的变换域其有正瓮矢量特性,楣应褥蠲静交换系数毽镀瑟独立,因藏匿豫穰号转换捌交换躐后其籀关往大大下酶,即数据冗余度减少。同时考虑到接收端恢复的图像最终燧供人暇观看,剿用人暇的视激特瞧怼器像毫叛缨节举鹱惑懿特点,羝频系数进行壤耋纯,舞颤系数只褪鬃佳,整恢复的图像与原始豳像之间的误熬所产生的图像失真,人眼难以察觉,即图像失真不致酶甄主理绦囊度。这撵纛娥鳇图像经过垂交变换,量毒:,续强一系裂过程簸出,获褥了很好空域冗余度的压缩,接收端辫经过解鹤,反馒化。逆变换即可恢复出空域豳像。正变交换的弛类寅很多,如傅立时()变
23、换,变换,沃尔行()变换。离散余弦变换(),离散小渡变换()等磐。理论上,变换怒最优的正交变换它能完全消除予像块内像素间的线性相关性;但变换基是不固定的,且每编码对象鹃统计特洼有荧,这种不确定往往褥乙变换健溺起来菲常不方德。衙戳第页武汉大学嚷士学位论文蓥予一话准实醇链装箍簿鹋磊统瓣研究与竣诗变换一般只是作为理论上的比较,实际上根据图像压缩的特点最常用的是,它靛性能最接近变换,并且毫恹速算法。便于实现实时视颠瘸像压缩。嚣礴矗时变换和沃尔什变换相对要差一些。离散小波变换在时域和频域同时鼹有良好的局部化特性,近来受到广泛关注,但虫予其计冀豹复杂瘦托要太,毽嚣掇兹还不适会安鞋应用场合。离散余弦变换()
24、编码的过程可分为以下四步:变换,系数量化,系数重摊,熵编码。()变换变换矩降懿大小碍疆敏去相关穗度秘实现难荔等方磊柬综合考癌。经过多年豳像压缩的研究,通常被认为是一种较好的选择。在编码器输入端,原始图像被分成×韵像素块,势把亮度和色度翁采样值移证戮,】范围的有符号整数,是采样精度,以此作为离散余弦正褒换()的输入。二维变换公式为:脚,半喜砉舷归竽簧竽弘。,”箕嘲珐斗鬣朝可以看作为一个谐波分析仪,每个×二维源图像采样数据块,实际上是点离;骞号,该信号是童阕缝参数翻静嫡数。撼这些髅号接魏辕入,然后把它分解成个正交基信号,缚个正交基信号对应于个独立二维()空间频率中的一个,这些空
25、闻频率是由输入馈号的频谱缀成。的输如就是个正交基信号的桶值,它是二维频域变羹和的函数,对应予的系数,称作赢流分量,即系数其余个系数称作交流分爨,即系数。因为通常一副图像中像素之问的巍度帮色差值交纯缓慢。所鞋滤泣离散余弦正变换()处理螽,在空阍频率低频范围内集中了数值大的系数,远离直流系数的商频交流系数大多数为零或趋于零。虽然变换的辘斑仍然是个,数据量并未躐多,但它使褥鹜像信号的能量分布发生了变化。数值大的系数都集中在发上角,即低频范围内,这就后面的压缩编码提供了豢搏。()系数量化为了达到压绩数据的耳的,对系数(,)需作量化始理。量化处理是个多判的映射,它将会造成经变换图像信息的损失。但人眼的视
26、觉灵敏度也悬有限的,如采用合适的量化矩阵,就不会产生主理失真。骶默对系数可以摄援人类的生理秘心瑗特点分掰作不间策略的量化处理,如对低频系数细量化,对高频系数粗量化,使褥大部分幅值较小的系数在量化后变为零,然后只剩下一小部分系数需要存储,从而大大匿壤了数据量。第夏耋蕊盔兰堡生兰堡望塞茎至!二!整堡塞壁娄篓茎鳌篓墨鉴墼登壅主璧塑表给出了一个根据心理视觉加权函数得出的亮度分量魑化矩阵。从该淡中可以看§低赣系数靛量傀步长骏小,蔫颚系数验量善乏莎长较大。袋亮度越化表¨。¨()漂数重排经过量艺蠢枣系数遴掌会蹴瑗较多艇零毽,使褥剽耀游纛长度缡瓣裁大大教善缡码效率。为了增加连续零
27、臻数的个数,可以采用袈所出示的“字形路校对系数进亍扫撼,从嚣迸一步提裹游程壤秘瓣效率。表“”字形扫描顺序()熵编码建了进一步达到视频数据压缡躲基弱,震对簸纯,秘游程缡码嚣静系数帮系数进行基于统计特性的熵编码,又称统计编码。通常使用两种熵编码方法:哈夫熙(目妇)编玛翱自适应进制撵术编鹂()。后蕊将详细介绥。利用变换进行图像压缩,可以在压缩比:的情况下恢复出较好质量的图像,雨嚣交换编鹳算法耩对篱革并容荔实瑶,衡敬被广泛使用在、等国际压缩标准中。第夏武汉大学硕士学位论文基于一标准实时视频编解码系统的研究与设计§统计编码(”】哈夫曼()编码哈夫曼()编码的理论依据是变码长编码()理论。在变码
28、长编码中,编码器的编码输出码字是字长不等的码字,按编码输入信息符号出现的统计概率,给输出码字分配以不同的字长,出现概率大的信息符号赋以短字长的输出码字,反之,出现概率小的信息符号赋以长的输出码字。可以证明,按照概率出现大小的顺序,对输出码字分配不同码字长度的变码长编码方法,其输出码字的平均码长最短,与信息熵值接近。哈夫曼编码的具体步骤如下:()统计出各个信息符号(假设有个)出现的概率,并按概率大小排序;()将这个概率中,最后两个小概率相加,概率个数减为;()将个概率,再按大小重新排序:()反复重复()、()步次,直到只剩下两个概率;()以二进制码元(,)分别表示其值,构成哈夫曼码字,一轮编码结
29、束。可以看到整个哈夫曼码字过程要对信源的所有信息进行统计,重复地排序,合并,显然是非常麻烦的。不过在视频压缩标准中已提供好了一些哈夫曼码表。这些码表是经过无数图像测试的平均结果,对绝大多数图像来说,利用码表压缩和重新统计再压缩相比,二者之间压缩比例的差异平均值不会超过。可见采用哈夫曼码表进行压缩是十分方便有效的。算术编码算术编码是另一种能够趋近与熵极限的最佳编码方式,它与哈夫曼编码一样,也是对出现概率较大的符号采用短码字,对概率较小的符号采用长码字,但它的编码原理却与哈夫曼编码不相同。它克服了哈夫曼编码中非使用整数码字的缺点。例如如果一个符号的出现概率是,根据信息论其最佳比特长度应是,但计算机
30、中的最小数据单位是位,用哈夫曼编码方式最少只能赋予它比特,是最佳码长的倍,显然这样降低了整个哈夫曼编码效率。而算术编码方法是将被编码的信息表示成实数和之间的一个间隔,信息越长,编码表示它的间隔就越小,表示这一间隔所需的二进制位就越多。算术编码方法虽较哈夫曼编码复杂,但它不寻要传送哈夫曼码表,同时还具有自适应能力,所以它是实现高效数据压缩中很有前途的编码方法。在最新的,标准中,对视频对象的形状信息就采用了算术编码。游程长度编码游程长度编码,也称行程长度编码,是一种无失真压缩编码方法。它最早用于二值图像的压缩编码。我们知道二值图像的每一扫描行总是由若干段连着的白像素和黑像素组成,即所谓的自长和黑长
31、,把这一段段连续重复的数据可用一个简单结构来表示即用其中一个重复的数据再加上其重复的次数来表示,这种编码方法就称之为游程长度编第页武汉大学硕士学位涪交萋于一辖准赛砖锶颓藕解礴系统薛研究与霉弦码。实际上,该方法已广泛应用与视频压缩编码中,比如前面讨论过的变换中,通常鹃变换系数经过燕他后会出现摄多零系数,再褥”字形蹶序扫描,使褥零系数的分布更加集中了,此时采用游程长度编码将取得很好的效果。§圈像预测编码预测编码也称为差分脉冲编码调制(),是利用二维凰镶中相邻像素溺存在很强的相关性,用前丽已知的像素值来预测当前像素值。这些已知的像素可以是前几行的。也可以是前凡帧的,即可程帧图像内进行帧内预
32、测编码,也可在时间上相邻的多帧图像内迸幸亍帧阉预测编码。鞭涮编码的关键是信号的最佳预穗和最佳量纯。帧内预测编码幅图像中,相邻像索点(除了物体边缘轮廓外)一般亮度值和色度值很接近,有攫强熬空蕊提关性。露魏墨藏像素毽霹鞋舞兹耍墨翘熬穗镯德素来颈测,然嚣只拜将实际德和预测值间的攫值进行量化编码。由于这些麓值往往分布在零值附近,与原值相比,差假的绝对值小了徽多,所以可敬用较短的码长来编码,从而达到压缩数据鲍疆的。例如程标准中进行帧内编码时,对经髓换后的系数和部分系数就采用帧内预测编码方法。帧内预测编码的优点是方去简单。骞易实现。但是对信道噪声及诿码穰敏感,会产嫩误码扩散,从而导致黼像质鬣明显下降。所以
33、在视频圈像聪缩中帧内预测编码般与其它方法结合起来使用。帧间预测编码犊阕颈溺编羁纭据静燕撬频臻弩辐邻梭闰存在鹣稷强靛时闻穗关往。我舔都知道对视频信号来说,相邻帧之间的时间间隔很小,如每秒帧的电视信号,其帧间间隔时间只裔秒。这搜得相邻帧闻羲缩节变化很少,铡如电视电话中两顿平均像素变化。广播电视两帧平均像素变化也只有。利用这种极强的时间相关性进行帧间预测编码,可以获褥比帧内预测编码离得多的联缩比。实验谣明,与梭内预测超毙,犊闻预测一般可获得左右的增益。但要注意的是,对于不掏运动特性的髅像采用帧问预测编码效果相差较大,在活动缓慢的区域,其帧阐预测性能较好;而在快速活动区域,其梭瀚预测性能较麓。如何提高
34、预测精度,保证编码效率是现在褫频压缩重点研究的问题。藏然,整接蘑琰溺国去鞭涮当翦图效粜是不镶斡。翔在进行赖闯预测时,加上运动估计和运动补偿,可以明显减少预测误差。提高雕缩效率,改进运动图像质量,已成为国酝旎频压缩标澧孛普遍采用鲍窘法。运动估计和补偿我们从鸯观上就可以很容易理解运动估计和补偿技术的有效性。例如图表示,第帧中有一个正向右方滚动的球,到了帻球相对前一帧澄轴方向位移了)矗个像素。如果将当前预测值的位置沿球移动方向也错汗。个像素稃进行预测,虽然可明第页武汉大学硕士学位论文基于标准实时视频编解码系统的研究与设计显提高帧间预测的正确度。第帧图连续的两帧球运动图像运动补偿是根据运动估计得到的物
35、体运动矢量来补偿的,所以运动补偿的效果直接由运动估计决定,也就是说运动估计是其中的关键。运动估计技术通过对两帧图像比较,找出当前被预测图像中像素相对参考图像中的位移,即运动矢量。运动估计技术主要分成两大类:像素递归法()和块匹配法()【”。前者是对每一个像素的位移都进行了递归估计,可以想象得出其计算量是非常大的,因此从实时性的要求来考虑通常采用块匹配法。块匹配法是先将图像划分成矩形子块(块的大小一般选择×,或),并假定位于同一子块内的所有像素具有相同位移,如图所示,当需要对当前帧中的子块(绝对坐标为(,)进行运动补偿预测时,就在其参考帧中以(,)坐标为中心开辟一个大小为的搜索区域,在
36、该搜索区内根据匹配准则搜寻子块的最优匹配块。那么最优匹配块与当前块的相对坐标(,)即为当前块的运动矢量。参者帧图块匹配法常用的匹配准则有归一化互相关函数(),绝对误差和()和均方误差等。其中绝对误差和()准则因计算量小,精确度较高,便于硬件实现,而用得较多。计算绝对误差和()的公式为(,)一(,工,)()第页,”以跗文淡太学磺圣学位论文基于赫怒一褥准实辞榄壤编簿蹲差堕壁簸楚设诗其中丘表永第帧的亮度值,为水平和垂赢方向的相对偏移量。鑫薪罨撬最优篷配交静搜索方法存禳多,最篱革可纛静是垒搜索潦:§对攘索医域内的每一点都计算其值,得到的最小值对应的图像予块就是缀优匹配块。众届搜索法最大豹毯点
37、是毖爨证全盛最饶,阉酵援索算法缓篱萃,毽缺点是嚣算餐太夫,找剥一个最优匹配块需要计算次值,当,的值取得较大时,难于实时妣理。于是,后来人们陆续提出了缀多快速攫索算法,掘兰步搜索法()”,交叉搜索法()!,新兰步搜索法()口”,四步搜索法()口,还有一种基于菱形的搜索法()瞰)等等。这些快速算法虽都能减少计算燮,但容易陷入局部最优,正确估计精度与全搜索法有较大的差躐,扶丽使得梭阀预攒误差增大。运动估计采阁何种搜索算法将对视频压缩的实时处理能力产生至关重要的影响。为此,我通过对以上搜索算法翡往映意静深入磷究,撵出了一种耨懿基于对象静带怒熹预测分类搜索法,并用实骏证明了该搜索算法在性能上较上述算法有
38、明显改进。这是本论文为了解决视频犏解码系统麴实露缝获提出鳇嚣令露效解决方案之一,在繁六章中姆终游继薛撼述。在运动估计得到图像予块的运动矢量后,由避动补偿根据避动矢量从参考帧中找出匹醚块,只嚣对当瓤块与糕配块乏趣的差馐编码,所以最后输出豹已不是被预溯顿匏究整编码了,而是“运动矢鬣编码十误差图像编码”。§第二代视频压缩编码技术前面我们讨论的变换编码,统计编码和预测编码都属予第一代视频压缩编码方法。遮类方法是基手像素的,是嚣了解僚滚鲍统计特醺,而不关心圈像本身静其律肉褰,也不考虑或较少考虑人的视觉特性,当需要进行极低码率的图像数据压缩和交互性强的多媒体应用露,第一载技术就不能达裂入稍的甏求
39、了。笼魏,年幸琶串鬻第二代税颧压缩缡码方法开始出现。与前面的技术不同,第代技术在很大程度上依赖于对人类视觉特性鲍礤宠,其核心思想是杰攒发现入黢是撮据舜些奖键特鬣来识列强豫或瓣豫痔残豹,然后椴据这些特征来构造图像模型阱。例如,根据人眼对物体的轮廓比对物体的内部细节更敏感的特点,按边缘售惠将整个图像分割戒若干个视觉对象黪集会,藤不是像素的集合再对备个视觉对象分剐进行鹰缩编码。这种新的图像描述方式比像素描述方式更贴近人类豹视赏系统。僵视觉对象的圈像描述方式带有明显的人为褫觉语义,如何飙目前基于像素的图像采集技术中得到基于对象的图像描述昵?方法是通过图像分割,从原始图像中分割出视觉对象来。鬻像分害技术
40、镌藏了窦现第二代技术貔关键之。霹篱己寄了多种方法,存的怒要人工参与的手动分割,有的是计算机进行自动分割。第二我嫒颏压缝技术除了鼹固像有效豹描述,获褥麓篷藜毙箨,还辩采一个缀努的副产品,即视频的交互功能。交互性是多媒体魅力的燕键所在。正因如此,新一代的多媒体压缎拣准就是采躅第二戴援摄编鹳技术麴,基予慰象鳇援叛压镶标准。§目前常用的视频压缩标准褫频压缩技术蔡憨在计算机应用、视獭通信鞠电视广播等镬域得到广泛盼鹿带,必第贾武汉大学硕士学位论文基于一标准实时税频编解码系统的研究与设计须实现国际标准化,这样才能带动有关视频集成电路的大量生产,大幅度降低成本,并解决不同厂家设备的通用性问题。认识到
41、视频标准的发展需求,一些国际标准化组织,如国际标准化组织(),国际电信联盟()以及国际电子与电气工程师协会(),已经联合制定了一系列应用于不同场合的视频图像压缩标准。下面对目前常用的几个视频压缩标准作简要的介绍和比较。()标准霉是由的第研究组推出的最早的一个视频标准,主要为了在窄带综合业务数字网()上开展视频电话会议而制定。规定的码率为×,的取值范围是。当取时,的码率正好是一路信道的容量。只能处理和两种图像格式,球和的亮度信号分辨率分别为×和×,色差信号的水平和垂直分辨率均为亮度信号的一半。压缩编码算法由具有运动补偿的帧间预测,块和霍夫曼编码组成。由于该标准用于实
42、时视频业务,希望编码时延尽可能小,所以只利用前一帧作参考帧进行前向预测,运动估计也只精确到整像素。除初始帧为帧外,后续帧一般为帧。为了防止信道误码产生的差错经预测编码而累积,在每帧内,每个位置上的宏块至少要进行一次帧内编码,即逐步刷新。编码延时要求限制在以内,以支持双向交谈。图像帧率最高为帧秒,在信道速率降低时,帧率可降至帧,秒左右。为了减少信道误码,采用了的纠错编码方式。()标准近年来,人们对可视电话需求越来越离。为此,。在年推出了一个甚低比特率的视频压缩标准一!,将视频图像序列压缩到非常低的码率(如左右),使之能在公用电话网()或移动信道上传输。标准可以说是的升级版本,增强了部分内容,其中
43、最重要的是增加了帧。帧中的宏块编码采用了双向预测模式,既可以前向预测,也可以后向预测。为了降低延时,采用了帧和帧作为一个单元来处理的方式,即将帧和由该帧与上一个帧所共同预测的帧一起编码。这就形成了帧。另外,运动估计可精确到半个像素,采用重叠运动补偿。()标准该标准为速率的数字声像信息的存储而制定,共分为图像编码,声音编码和声像同步与复用个部分田。主要针对标准交换格式()标准分辨率甜制为:制为×)的图像进行压缩,每秒可播放帧画面,具备录像图像质量()和激光唱盘()音质。它的目标是把的图像压缩到,压缩率为:。使用的压缩算法,可以将一部分钟长的电影压缩到左右,因此它被广泛地应用于制作和一些
44、视频片段的下载,目前以上的都是用一格式压缩的。由于应用目标不同,与之间有显著不同。例如一针对数字存储的应用而制定,因此它的编解码器不对称,位于存储方的编码器比位于用户方的解码器要复杂得多。此外,考虑到多媒体应用中需对存储在数字介质上的已编码流进行随机存取,在中将图像序列分成图像组(),这样图像组的起始锁为巾贞鼢解码第页囊演走掌硕士学位埝文基于一标准实酵禚藏编解辑蒜统羲姘茏专设计无鬻先前帧。可以作为随机存取的入口。靛主袋餐簇臻码蒋谴畜:基于宏块以及片()编解码;支持懑组():视觉加权量化矩阵;采用对分量的藏值编码;运动偿预测是基予像素块豹算法,支持插补双向预测,运动估计精度可到半像素,运动矢爨的
45、范围有种可供选择,对运动矢懿的差假进行编码。()巾。不能满足日蕊增长的多媒体技术、数字电视技术对分辨率和传输攀等方耐豹技术要求。为苑,国际运动翟椽编羁专家组窝翔墨瓣第研究蕴予举联台攘出了的视频标准。”。一可以提供一个较广的粥率范围()供敬变基缎毙,戳遥应不嗣基嚣壤量、存铑容最秘荣宠麴要求。它在与兼容的基础上实现了低码率和多声道扩展。可以将一部分钟长的电影匿缀到,它提供的是我嚣遥常所说的鼹质。一的压缩编码原理与一基本类似,增加了对夔商的色取样支掩,可伸缩的视频编码方式及窖错性保护等方面的功能,一的视频编码特性有:支持各种隔行,逐行敬图像椿式:翔:;、:、;:;定义了框架和级别。框架悬。标准中定义的语法的子集。级别是标准攘蓬静卞特定框檠牵静参鼗所取篷襻集台。绝稻菸闻提供了一种定文麓范的语法和语义子嶷的手段,为不同的应用领域间的数据交换掇供了便利和可行性;避了一些骚瓣运动罄场鞭覆模式,戳馁有效她慰场强像和穰强像撩馘绫羁,如为了支持隔行视频的场图像的场间预测、帧图像的场间预测、用于帧的双基预测和舅予场匿缘羽预测等镑黠骧嚣羟接黼豫熬要霄效臻溺编码模式;对系数采用新的袭;基予帧场的以及两荦巾系数扫描蹶序;提供了可扩腱性:橇频码流分割(个比特流被分为多个层),德括空躐扩展编码,扩展编码,以适应可变比特率:建议错诿保护及多簸服务。对更广范围的分图像辨率和码流比特率的支持,使
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 宠物生日营销活动方案
- 新产品试制流程管控制度细则
- 道路扩建项目投标商务策划方案
- 阿姨技能评级复评操作规范
- 安徽省合肥市2026届高三下学期第二次教学质量检测历史+答案
- 热处理流程冷却速率调控规范
- 车辆维修保养申报审批方案
- 以现实挫折唤醒内驱力用南墙教育破除躺平心态-高中生励志赋能与成长挫折教育实施方案
- 2026年办公室工作总结及工作计划(3篇)
- 2023年3月青少年软件编程(图形化)等级考试三级真题(含答案和解析-在末尾)
- 绿色食品山楂生产技术操作规程
- 近五年重庆中考英语试题及答案2023
- 采血健康知识讲座
- 2022年北京海淀初一(下)期中英语试卷(教师版)
- 很好用的融资租赁测算表(可编辑版)
- 桥梁定期检查-桥梁经常检查与定期检查概论
- 2023年机动车检测站管理评审资料
- 加工中心编程精解
- 企业所得税政策(西部大开发+地方税收优惠)课件
- 六维力传感器的原理与设计演示文稿
- 驾驶员从业资格证电子版
评论
0/150
提交评论