（通信与信息系统专业论文）基于avs的视频监控系统及图像质量评价.pdf

上传人：伐*** IP属地：宁夏上传时间：2019-12-11 格式：PDF 页数：53 大小：4.36MB 积分：0 举报 版权申诉

（通信与信息系统专业论文）基于avs的视频监控系统及图像质量评价.pdf_第2页

（通信与信息系统专业论文）基于avs的视频监控系统及图像质量评价.pdf_第3页

（通信与信息系统专业论文）基于avs的视频监控系统及图像质量评价.pdf_第4页

（通信与信息系统专业论文）基于avs的视频监控系统及图像质量评价.pdf_第5页

已阅读5页，还剩48页未读，继续免费阅读

（通信与信息系统专业论文）基于avs的视频监控系统及图像质量评价.pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

基于a v s 的视频监控系统及图像质量评价摘要随着数字技术的快速发展和应用领域的扩展，视频监控系统也走上数字化的道路，而数字视频编解码技术就成为了其中的关键技术之一。作为第二代信源编码标准之一，a v s 标准与国际标准h 2 6 4 标准、 m p e g 4 标准代表了目前最先进的视频编解码技术。而a v s 标准与后两者相比，更是有算法复杂度低和自主知识产权等优点。这对a v s 标准在我国多媒体技术领域的应用和推广有十分重要的意义。本文研究了a v s 在视频监控系统中的应用，在充分研究了a v s 标准的解码流程基础上，实现了采用a v s 解码技术的视频监控服务器软件。软件在a v s 参考软件r m 的基础上开发，采用多线程技术实现多路视频并行解码，能够从网络接收a v s 码流进行四路c i f 格式码流的实时解码显示。在完成a v s 解码的视频监控服务器软件的基础上，本文根据数字电影图像的特点，在d c i 数字电影编码系统项目的背景下，研究了图像质量评价的客观方法。本文提出了以峰值信噪比为基础，结合结构相似度和基于人眼视觉系统的数字电影图像质量客观评价方法。在符合全球第一个数字电影工业规范( d c i 规范) 的数字电影编码系统中实现了算法，并给出了评价结果，提出了评价其图像质量的解决方案。关键词a v s 视频监控解码d c i 数字电影图像质量评价 v i d e om o n i t o rs y s t e mb a s e do na v sa n di m a g e q u a l i t ya s s e s s m e n t a b s t r a c t w i t ht h er a p i dd e v e l o p m e n to fd i g i t a lt e c h n o l o g ya n dt h ee x p a n s i o n o fi t sa p p l i c a t i o n ，t h ed i g i t a lv i d e om o n i t o rs y s t e md e v e l o p e dg r a d u a l l y a n dd i g i t a lv i d e oc o d e ct e c h n o l o g yb e c o m e si t sk e yc o m p o n e n t a so n e o ft h es e c o n dg e n e r a t i o ns o u r c ec o d i n gs t a n d a r d s ，a v sa sw e l la sh 2 6 4 a n dm p e g - 4s t a n d sf o rt h em o s ta d v a n c e dv i d e oc o d i n gt e c h n o l o g ya t p r e s e n t c o m p a r e dt oh 2 6 4a n dm p e g - 4 ，a v si sp r e d o m i n a n tb e c a u s e o fl o w e r a l g o r i t h mc o m p l e x i t y a n dh a v i n g p r o p r i e t a r y i n t e l l e c t u a l p r o p e r t yr i g h t s t h e s er e a s o n sa r eo fg r e a ts i g n i f i c a n c et ot h e a p p l i c a t i o n a n d p r o m o t i o no fa v s s t a n d a r d si nm u l t i m e d i at e c h n o l o g ya r e ai nc h i n a t h e a p p l i c a t i o no fa v s i nv i d e om o n i t o rs y s t e mi sr e s e a r c h e di nt h i st h e s i s a f t e ra d e q u a t er e s e a r c ho fd e c o d i n gp r o c e s si na v ss t a n d a r d ，av i d e o m o n i t o rs e r v e rs o f t w a r ei s i m p l e m e n t e d b a s e do na v sd e c o d i n g t e c h n o l o g y t h i sp r o j e c ti sd e v e l o p e do nt h eb a s eo fa v sr e f e r e n c e s o f t w a r er ma n ds o l v e dt h ep a r a l l e ld e c o d i n gp r o b l e mo fm u l t i p l e x i n g v i d e ou s i n gm u l t i t h r e a dt e c h n o l o g y a n di tc a nr e c e i v ea v ss t r e a mf r o m n e t w o r k sa n dd e c o d ea n ds h o wf o u rc i fs t r e a m s s i m u l t a n e o u s l y b e s i d e s ，a c c o r d i n gt ot h ec h a r a c t e r i s t i co fd i g i t a lf i l mi m a g e ，t h e o b j e c t i v ed i g i t a lf i l mi m a g eq u a l i t ya s s e s s m e n ti sr e s e a r c h e da g a i n s tt h e b a c k g r o u n do ft h ep r o j e c to fd c id i g i t a lc i n e m ap a c k a g ep r o d u c t i o n s y s t e m i m a g eq u a l i t ya s s e s s m e n tb a s e do np e a ks i g n a lt on o i s er a t i o ， t o g e t h e rw i t hs t r u c t u r a ls i m i l a r i t ya n dh u m a nv i s i o ns y s t e mi sp r o p o s e d i nt h et h e s i s t h ea l g o r i t h mi sr e a l i z e di nt h ed i g i t a lc i n e m ac o d i n g s y s t e mw h i c hc o n f o r m st ot h ef i r s td i g i t a lf i l mi n d u s t r ys p e c i f i c a t i o ni n t h ew o r l d ( d c is p e c i f i c a t i o n ) a n dt h ee x p e r i m e n t a lr e s u l t sa r ep r o v i d e d v k e yw o r d s ：a v sv i d e om o n i t o r d e c o d i n g d c i d i g i t a lf i l m i m a g eq u a l i t ya s s e s s m e n t 独创性( 或创新性) 声明本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知，除了文中特别加以标注和致谢中所罗列的内容以外，论文中不包含其他人已经发表或撰写过的研究成果，也不包含为获得北京邮电大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。申请学位论文与资料若有不实之处，本人承担一切相关责任。本人签名：毫! 堡起同期：幽：兰：! ! 关于论文使用授权的说明学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定，即：研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘，允许学位论文被查阅和借阅；学校可以公布学位论文的全部或部分内容，可以允许采用影印、缩印或其它复制手段保存、汇编学位论文。( 保密的学位论文在解密后遵守此规定) 保密论文注释：本学位论文属于保密在一年解密后适用本授权书。非保密论文注释：本人签导师签适用本授权书。同期：型；兰：! 翌 r 期：忽址北京邮i 乜人学硕1 ：研究生学位论文基于a v s 的视频j l 在拄系统及图像质量评价 1 1研究背景第一章绪论随着信源编码技术标准的发展，多媒体技术的应用越来越广泛。数字化是当今多媒技术发展的主流和趋势，视频监控作为多媒体技术的应用之一，也经历了从模拟视频监控到数字视频监控的发展过程。自上世纪九十年代未，随着视频压缩编码技术、网络通讯技术的发展，数字视频监控系统迅速崛起。视频压缩编码技术作为数字视频监控系统的关键技术之一，其研究对数字视频监控系统的发展有重要而深远的意义。 1 1 1 基于a 、，s 的视频监控系统纵观视频编解码技术的发展历程，以h 2 6 1 、h 2 6 3 、m p e g 1 和m p e g 2 为代表的第一代信源编码技术标准，与以h 2 6 4 和m p e g 4 ，a v s 为代表的第二代信源编码技术标准相比i l j ，新一代视频编码标准在视频压缩性能以及网络应用等方面较第一代信源编码技术标准有了长足的进步。a v s 标准是中国数字音视频编解码技术标准工作组( a v s 工作组) 制定的数字音视频编码标准。a v s 工作组成立于2 0 0 2 年，任务是面向我国的信息产业需求，组织制定行业和国家信源编码技术标准。 a v s 标准在视频编码方面与h 2 6 4 l 1 , 较接近，性能高，复杂度低，实现成本低，且专利授权模式简单。作为我国自主知识产权的音视频编解码标准，a v s 的制定和推广都得到了政府的大力支持。2 0 0 7 年a v s 被国际电联列为国际标准后，其产业化迅速推进。中国电信、中国网通、信息产业部电信研究院、华为、中兴、海信等1 8 家企业和单位于2 0 0 8 年初共同发起成立中国互动媒体产业联盟，大力支持a v s ，产业化前景乐观。目前，a v s 在地面电视、手机电视、直播卫星、高清视盘机和视频监控系统等领域均有产业化的目标。为适应我国信息产业的需求而制定的a v s 标准，由于技术优势以及低廉的专利费用，使其产业化迅速发展起来。目前，i p t v 已经开始应用a v s ，其他领域如地面电视，手机电视等也都将对a v s 的支持纳入计划。视频监控作为数字视频通信领域的一个重要应用，有广泛的应用自订景和潜在的经济价值。由于a v s 自身的特点和优势，它在视频监控领域中的应用将是重要的发展方向。北京i i $ , e 人学顾i ：研究生学位论文幕十a v s 的说频l 瞌挖系统及图像质量计价 1 1 2 图像质量评价由于图像携带的信息量大，对传输与存储都是巨大的挑战，因此压缩图像以适应网络带宽或减少存储空间就显得十分必要了。然而对图像的压缩，有两个要求。其一是要有足够的压缩比，即是必须压缩到可以应用的程度，例如在一定的带宽内，或者达到一定的存储空间范围内。其二是图像经过压缩以后，经过恢复应保持一定的图像质量，即失真应在允许的范围内。图像质量评价即是对图像的失真进行衡量的过程。图像质量评价在各种图像处理技术的应用中扮演了重要的角色。对于图像质量的评价，除了对系统进行客观的数值测试外，还应考虑入的视觉心理等主观因素。图像质量评价方法分为主观评价和客观评价两类。前者是让观察者根据一些事先规定的评价尺度或经验对测试图像按视觉效果给出质量分数后，对所有观察者给出的分数进行加权平均后得到评价结果。由于图像的最终信宿是人，因此让人作为评价者是最直接的图像质量评价方法。但这种方法操作要求过于复杂，且存在不确定性，如评价结果受人的心情、疲劳程度等心理因素的影响，往往因人因时而异。而客观评价的方法是通过建立数学模型来进行的，依据模型给出的量化指标或参数衡量图像质量，其结果具有数值性、易操作性和可重复性等特点，较主观评价更容易应用在工程中。 1 2 本人课题任务本实验室j 下是在这样一个大背景下，进行了“基于a v s 的视频监控系统”课题的研究。课题的目标是搭建基于a v s 解码的视频监控平台，软件实现解码监控系统，能够进行四路c i f 格式视频流的实时解码。本人的研究工作是实现一个对四路c i f 格式视频流采用a v s 实时解码的视频监控服务器软件。完成这一课题后，还针对与北京电影学院合作丌展的“数字电影发行包制作方法研究与系统开发”项目，进行了数字电影图像质量评价客观方法的研究。我的工作是根据数字电影图像的特点，提出了以峰值信噪比为基础，结合结构相似度和基于人眼视觉系统的数字电影图像质量客观评价方法。并在符合全球第一个数字电影工业规范( d c i 规范) 的数字电影编码系统中实现了上述算法。 1 3 论文结构本文余下的章节安排如下：第二章简要介绍了目前数字视频标准的发展情况，分析了a v s 标准的背景和北京邮i u 人学硕i ：研究生学位论文綦十a v s 的视频雌挖系统及幽像质量评价关键技术，与当前其他主流的视频标准进行比较，分析了其应用优势。第三章针对课题的具体情况，对视频监控系统进行分析，设计了监控系统服务器软件的各功能模块结构，实现了基于a v s 解码的视频监控服务器软件。软件支持四路c i f 格式视频的实时解码。第四章在d c i 数字电影编解码系统的背景下，针对数字电影的特点，研究了图像质量评价的方法，针对各算法特点，提出了用于数字电影图像评价的方案。第五章对已完成的工作进行了总结，分析了课题中需要改进和进一步发展的地方，并指出了后续的研究方向。北京邮i u 人学颀l ：研究生学位论文幕十a v s 的视频脆控系统及图像质量评价第二章先进音视频编码标准a v s 视频监控经历了从模拟视频监控到数字视频监控的发展过程。早期由模拟视频技术产生的闭路视频监控系统是我国第一代视频监控产品。模拟视频监控系统的技术发展已经非常成熟、性能稳定，在实际工程已得到广泛应用1 2 j 。然而，数字化是以信息技术为核心的电子技术发展的必然趋势。到二十世纪九十年代未，随着多媒体技术、视频压缩编码技术、网络通讯技术的发展，数字视频监控系统迅速崛起。数字化表明系统中的视频、音频和控制等信息流均为数字状念。信息流数字化、编码压缩和开放式的协议，有利于构建统一的操作平台来管理和控制，实现系统集成。对于一个数字化的视频监控系统，视频解码技术是其关键技术。众所周知，视频包含的数据量非常大，因此在实时传输中必须经过压缩编码。而压缩编码因采用的算法不同，效果有很大的差异。压缩方法多样化的一个必然要求就是视频压缩的标准化。因此，视频编解码采用的标准是关注的焦点之一。两大视频编码标准的组织i t u t 和i s o i e c 和j 定了一系列信源编码技术标准，中国数字音视频编解码技术标准工作组( a v s 工作组) 也针对我国的信息产业需求，制定了a v s 标准。这些标准为视频通信提供了适合的编解码技术规范。 2 1a v s 标准 a v s 标准是信息技术先进音视频编码系列标准的简称，包括系统、视频、音频、数字版权管理等四个主要技术标准和一致性测试等支撑标准i l j 。其中第2 部分视频( 简称a v s 视频) 于2 0 0 6 年2 月颁布，3 月实施。视频标准部分主要面向高清晰度和高质量数字电视广播、数字存储媒体和其他相关应用。它是国内第一个拥有自主知识产权的数字音视频编解码标准，因此研究a v s 标准，对推动我国的多媒体产业的发展具有重要的意义。 2 1 1 国际视频编码技术标准回顾自上个世纪九十年代以来，两大视频编码标准的组织l t u t 和i s o i e c 匍j 定的一系列信源编码技术标准极大地促进了多媒体技术的发展，加快了其实用化和产业化的步伐。其中，i t u t 制定了主要应用于多媒体通信领域的h 2 6 x 系列， m p e g 系列标准则是由i s o m c - n 定，它对数字电视、视听消费电子产品、多媒体通信等信息产业的重要产品产生了深远影响。北京邮i u 人学硕i j 研究生学位论文基于a v s 的视频脆挡系统及图像质量计价根据视频编码标准的发展过程，h 2 6 1 、h 2 6 3 、m p e g 1 和m p e g 2 称为第一代信源编码技术标准。本世纪以来，第二代信源编码技术标准相继出台，h 。2 6 4 和m p e g 一4 作为新一代视频编码标准，在视频压缩性能以及网络应用等方面较第一代信源编码技术标准有了长足的进步。 2 1 1 1 h 2 6 x 标准由l t u t 制定的h 2 6 x 系列标准，包括了h 2 6 1 、h 2 6 3 以及h 2 6 4 。由于这些标准编码效率高和比特率低的优点，广泛应用于视频通信的各个领域。 1 h 2 6 1 该标准是为在综合业务数字网( i s d n ) 以p x 6 4 k b i t s ( p = l ，3 0 ) 的速率丌展视频会议和可视电话业务而制定的，要求图像必须和语音密切配合，即具有强实时性和同步性。h 2 6 1 标准用于电视电话时，p = i 或2 ，用于会议电视视，p = 6 。 h 2 6 1 是最早的运动图像压缩标准。 2 h 2 6 3 h 2 6 3 是为了以速率低至2 0 2 4 k b i t s 传送视频流而开发的。与h 2 6 1 相比， h 2 6 3 标准进一步降低了码率并提高了编码质量。目前，h 2 6 3 编码是i p 视频通信采用最多的一种编码方法。l t u t t 作组根据不同的需要，对h 2 6 3 标准增加了许多新的高级功能附加项，对标准制定了新的版本。1 9 9 8 年u t 推出的h 2 6 3 + 是 h 2 6 3 建议的第二版，它提供了1 2 个新的可协商模式和其他特征，进一步提高了压缩编码性能。 3 h 2 6 4 为了进一步提高视频图像的压缩效率和增强网络友好性，由运动图像专家组 ( m p e g ) 与视频编码专家组( v c e g ) 共同制定了新一代图像压缩标准i t uh 2 6 4 ，也称作i s o i e cm p e g 4 伊a r t l 0 a v c 。 h 2 6 4 代表了当前业界最先进的视频压缩技术，具有码率低，图像质量高，网络适应性强，容错能力强等特点。与以往的视频编码标准相比，压缩率显著提高，而其视频的质量有所提高。在相同的重建图像质量下，h 2 6 4 l i , h 2 6 3 节约5 0 左右的码率。 h 2 6 4 的主要优点如下：在相同的重建图像质量下，h 2 6 4 比h 2 6 3 + 并覃i m p e g 4 ( s p ) 减小5 0 码率。对信道时延的适应性较强，既可工作于低时延模式以满足实时业务，如会议电视等：又可工作于无时延限制的场合，如视频存储等。提高网络适应性，采用“网络友好”的结构和语法，加强对误码和丢包的处理，提高解码器的差错恢复能力。北京邮l u 人学硕f ：研究生学位论义皋十a v s 的视频监控系统及幽像质量订价在编解码器中采用复杂度可分级设计，在图像质量和编码处理之间可分级，以适应不同复杂度的应用。 h 2 6 4 的应用范围是非常广阔的，因其更高的压缩比、更好的i p 和无线网络信道的适应性，在数字视频通信和存储领域得到越来越广泛的应用。h 2 6 4 标准由于其能提供稳定的图像质量，具有较强的差错控制处理能力，被更多的应用于 l p t v 、流媒体、移动接收等领域。但是，我们也应注意到，h 2 6 4 获得优越性能的代价是计算复杂度增加。据估计，编码的计算复杂度大约相当于h 2 6 3 的3 倍，解码复杂度大约相当于h 2 6 3 的2 倍。由于其对解码芯片的要求很高，因此在数字电视领域的应用不会超过 m p e g 2 。 2 1 1 2m p e g 系列标准 m p e g 是国际标准化组织和国际电工委员会第一联合技术组( i s o i e c j t c l ) 于1 9 8 8 年成立的运动图像专家组( m o v i n gp i c t u r ee x p e r tg r o u p ) 的简称，全称为i s o i e cj t c l 第2 9 分委会第1 1 工作组( i s o i e cj t c l s c 2 9 w g l l ) ，负责数字视频、音频和其他媒体的压缩、解压缩、处理和表示等国际技术标准的制定工作。一 m p e g 1 i s o 于1 9 9 1 年提出了“用于数字存储媒体的活动图像及其伴音约1 5m b s 的编码”方案，也就是m p e g 1 标准，标准编号为i s o i e c1 1 1 7 2 ，它广泛应用于视频的数字存储领域，标准最常用的有四个部分： 1 ) 系统，编号i s o i e c1 1 1 7 2 1 ，阐述视频和音频数据的复用和同步 2 ) 视频，编号i s o i e c1 1 1 7 2 2 ，阐述活动图像的压缩编码方法 3 ) 音频，编号i s o i e c1 1 1 7 2 3 ，阐述伴音的压缩编码方法 4 ) 一致性测试，编号i s 0 1 1 1 7 2 4 近年来流行的v c d 光盘采用的就是m p e g 1 压缩标准。m p e g 1 对可以处理的图像格式没有严格的规定，但是一般认为，对于s i f ( s o u r c ei n p u tf o r m a t ) 格式的图像，m p e g 1 算法的效率最高。此时视频信号压缩后的码率约为1 2m b s 。再加上压缩以后、具有c d 质量的双声道立体声伴音，总码率约为1 4m b s 。 m p e g 1 和h 2 6 1 有共同的数据结构、编码工具和语法元素，然而两者并非完全后向兼容，m p e g 1 可看作是h 2 6 1 的扩展集，在数字存储介质中实现对活动图像和声音的压缩编码。 m p e g 2 北京邮l 乜人学硕l ：研究生学位论文幕十a v s 的说频临控系统及l 整i 像质量计价 m p e g 2 是由i s o 的活动图像专家组和i t u - t 的第1 5 研究组共同制定的，于 1 9 9 3 年提出“活动图像及其伴音的通用编码”标准，标准编号为i s o i e c1 3 8 1 8 ：在1 1 r u t 的协议系列中，被称为h 2 6 2 。1 9 9 3 年，美国的“大联盟”( g r e a t a l l i a n c e ) 和欧洲的d v b 先后决定采用m p e g 2 用于h d t v 广播。其后标准不断扩充，到 1 9 9 5 年底，i s 伽e c1 3 8 1 8m p e g 2 标准共达到9 项，涉及到了系统( 1 s 伽e c 1 3 8 1 8 1 ) 、视频( i s o i e c1 3 8 1 8 2 ) 、音频( i s o i e c1 3 8 1 8 3 ) 、一致性测试等方面的内容。制定m p e g 2 的初衷是为得到一个针对广播电视质量的视频信号的压缩编码标准，但实际上最后得到的是一个通用的标准，它能在很宽范围内对不同分辨率和不同输出比特率的图像信号有效地进行编码。它支持恒定比特率、可变比特率、随机操作、信道跳接、可伸缩解码、位流编辑、及快进、快退、常速倒放、慢放等功能。该标准与m p e g 1 兼容，并与h d t v 、s d t v 兼容。与m p e g 1 相比，m p e g 2 主要增加了下述几项功能： 1 ) 增加了场图像的场问预测、帧图像的场问预测、用于p 帧的双基预测和用于场图像的1 6 x 8 预测等四种对隔行扫描图像更为有效的预测模式； 2 ) 除m p e g 1 支持的4 ：2 ：0 的色信号取样模式外，还支持4 ：2 ：2 ，4 ：4 ：4 模式。前者色信号的样点数在垂直方向上与亮度信号相同，只在水平方向上是亮度信号的一半；后者色信号的样点数与亮度信号则完全相同。 3 ) 增加了可伸缩的视频编码方式。所谓可伸缩的视频编码是指编码所产生的码流具有下述特征：对码流的一部分解码和对码流的全部进行解码能够分别获得不同质量的重建图像。m p e g 2 所支持的可伸缩编码方式有空问可伸缩性、时间可伸缩性、信噪比可伸缩性和数据分割四种。 m p e g 2 标准是国际公认的d v d 、d v b 和a t s c 的信源编码标准，是针对标准数字电视和高清电视在各种应用下的压缩方案和系统层的详细规定。它可被看作是m p e g 1 的扩展集，但不是m p e g 1 的简单升级，m p e g 一2 在系统和传送方面作了更加详细的规定和进一步的完善，因此特别适合于广播级数字电视的编码和传送。一 m p e g 4 m p e g 4 的视频部分建立在m p e g 2 和h 2 6 3 的基础上，但它不只是具体的压缩算法，而是针对数字电视、交互式绘图应用、交互式多媒体等整合及压缩技术的需求而制定的国际标准。 m p e g 4 采用了新一代视频编码技术，它在视频编码发展史上第一次把编码对象从图像帧拓展到具有实际意义的任意形状视频对象，从而实现了从基于像素的传统编码向基于对象和内容的现代编码的转变，因而引领了新一代智能图像编北京邮i u 人学硕i ：研究生学位论义皋十a v s 的视频! 瞻挖系统及图像质量评价码的发展潮流。 m p e g 4 代表的是基于模型对象的第二代压缩编码技术，它充分利用了人眼视觉特性，抓住了图像信息传输的本质，从轮廓、纹理思路出发，支持基于视觉内容的交互功能。这些特点适应了多媒体信息的应用由播放型转向基于内容的访问、检索及操作的发展趋势。 a v 对象( a v o ，a u d i ov i s u a lo b j e c t ) 是m p e g 4 为支持基于内容编码而提出的重要概念。在m p e g 4 中所见的视音频已不再是过去m p e g 一1 、m p e g 2 中图像帧的概念，而是一个个视听场景( a v 场景) ，这些不同的a v 场景由不同的a v 对象组成。m p e g 4 标准就是围绕a v 对象的编码、存储、传输和组合制定削引。 a v 对象的提出，使多媒体通信具有高度交互及高效编码的能力，a v 对象编码就是m p e g - 4 的核心编码技术。综上所述，h 2 6 x 和m p e g 系列各标准有其各自的特点，但两个体系的标准相互也有交叉。从应用领域来看，h 2 6 3 和h 2 6 4 主要在实时通信领域，其中h 2 6 4 在i p t v 和移动接收等方面有广阔的前景。而m p e g 2 发展最为成熟，已经被大规模应用，是电视广播领域的事实标准。m p e g 4 主要应用于多媒体视频和流媒体等方面。 2 1 2 国内视频编码标准现况在过去的二十年中，国内多媒体技术的应用有了显著的发展，而对信源编码技术标准的依赖，主要是i t u t 和i s o i e c 韦i j 定的h 2 6 x 和m p e g 系列标准。这两个系列的标准极大地影响了中国的多媒体技术的产业化。然而，国际标准的专利收费繁多，对国内相关行业的繁荣也产生了一些负面影响。 a v s 工作组就是为了面向我国的信息产业需求，组织制定行业和国家信源编码技术标准，于2 0 0 2 年成立的。成员包括国内外从事数字音视频编码技术和产品研究丌发的机构和企业。a v s t 作组颁布的a v s 标准是我国具备自主知识产权的第二代信源编码技术标准系列。 a v s 标准是中国数字音视频编解码技术标准工作组( a v s t 作组) 制定的数字音视频编码标准。a v s 标准是信息技术先进音视频编码系列标准的简称，包括系统、视频、音频、数字版权管理等四个主要技术标准和一致性测试等支撑标准。 a v s 标准包括九个部分i 引，各部分如下： 1 ) 系统2 ) 视频3 ) 音频4 ) 音频5 ) 参考软件6 ) 数字媒体版权管理 7 ) 移动视频8 ) 在i p 网上传输a v s9 ) a v s 文件格式北京邮l 乜人学颂i ：研究生学位论文皋十a v s 的说频脆控系统及幽像质量评价其中第2 部分视频( 简称a v s 视频) 于2 0 0 6 年2 月颁布，3 月实施，主要面向高清晰度和高质量数字电视广播、数字存储媒体和其他相关应用。这一部分标准是本文研究的重点。 a v s 标准在视频编码方面与h 2 6 4 ：k , 较接近，它具有以下特点：( 1 ) 性能高，编码效率比m p e g 2 高两倍以上，与h 2 6 4 的编码效率相当：( 2 ) 复杂度低，算法复杂度i r i s h 2 6 4 低；( 3 ) 实现成本低，软硬件实现成本都低于h 2 6 4 ；( 4 ) 专利授权模式简单，费用明显低于同类标准1 5 1 。 a v s 作为我国自主知识产权的音视频编解码标准，制定和推广都得到了政府的大力支持。2 0 0 7 年a v s 被国际电联列为国际标准后，其产业化迅速推进。中国电信、中国网通、信息产业部电信研究院、华为、中兴、海信等1 8 家企业和单位于2 0 0 8 年初共同发起成立中国互动媒体产业联盟，大力支持a v s ，产业化前景乐观。目前，a v s 在地面电视、手机电视、直播卫星、高清视盘机和视频监控系统等领域均有产业化的目标。 2 1 3a v s 标准的优势和前景视频编码技术作为视频监控的关键技术，采用的标准是关注的焦点之一。目前视频监控系统主要采用的图像压缩标准是h 2 6 1 和m p e g 1 ，这两者在应用中具有适应性和用户交互性差的局限。而m p e g 2 、m p e g 4 、h 2 6 3 和h 2 6 4 等视频编码标准提供了更高的数据压缩性能，尤其是h 2 6 4 以其高质量、低码率和适应性强的特点越来越广泛地被应用到视频监控系统中。 2 1 3 1技术优势 a v s 视频的主要特点是应用目标明确，因此技术有针对性。在高分辨率应用中，其压缩效率明显比现在数字电视、光存储媒体中常用的m p e g 一2 视频提高一个层次。而在压缩效率相当的前提下，又较m p e g 4a v c h 2 6 4 的m a i n p r o f i l e 的实现复杂度大为降低。此外，在a v s 标准的发展过程中，已将视频监控作为需求考虑进去，因而此标准能够适应这一应用的特殊需求。例如a v s 编码技术具有可伸缩性，可以适应不同的网络环境。另外，a v s 的编码技术易于实现视频对象的分割，有利于监控系统的预警功能实现。 2 1 3 2 应用优势然而技术的应用程度与其标准在专利池收费、知识产权和技术实现复杂度等北京邮i b 人学顺i ：研究生学位论义螭十a v s 的视频仆在控系统及图像质量评价方面都有密切的联系。相较于h 2 6 4 高昂的专利费，a v s 性能与和h 2 6 4 性能相当，而其专利池授权模式简单，费用明显低于h 2 6 4 。并且，a v s 的算法复杂度和软硬件成本都较h 2 6 4 低。因此，a v s 作为我国自主知识产权的标准，在视频监控领域的应用有很大的优势。 2 2a v s 视频关键技术 2 2 1 编码标准的技术框架信息技术先进音视频编码( g b 厂r2 0 0 9 0 ) 规定了数字音视频的压缩、解压缩、处理和表示的技术方案，其中第2 部分视频标准规定了对多种比特率、分辨率和质量的视频压缩方法，并规定了解码过程。 2 2 1 1 编码框架 a v s 采用与h 2 6 4 相同的混合编码体系，如图2 1 所示，包括变换、量化、熵编码、帧内预测、帧间预测和环路滤波等技术模块，这也是目前主流的编码体系。输入视频的帧或场以宏块为单位被编码器处理。图2 1a v s 编码框裂6 与h 2 6 4 类似，a v s 视频标准也定义了i 帧、p 帧和b 帧三种不同类型的图像。图中s o 是预测模式选择丌关。对于i 帧中的宏块，只进行帧内预测，而p 帧和b 帧的宏块则需要进行帧内预测或帧问预测。经过预测之后的残差图像进行8 x 8 整数变换( i c t ) 和量化，然后对量化系数进行z i g z a g 扫描( 隔行编码块使用另一种扫描方式) ，得到一维排列的量化系数，最后对量化系数进行熵编码，得到输出的比特流。为支持多种视频业务，a v s 标准定义了档次( p r o f i l e ) 和级别( 1 e v e l ) 。档次北京邮i 乜人学硕f j 研究生学位论文基于a v s 的说频舱挖系统及图像质量评价是a v s 定义的语法、语义及算法的子集；级别是在某一档次下对语法元素和语法元素参数值的限定集合。为了满足高清晰度标准清晰度数字电视广播、数字存储媒体等业务的需要，a v s 视频标准定义了基准档次( j i z h u np r o f i l e ) 和4 个级别 ( 4 0 、4 2 、6 0 和6 2 ) ，支持的最大图像分辨率从7 2 0 x 5 7 6 至l j l 9 2 0 x 1 0 8 0 ，最大比特率从1 0m b i t s 至l j 3 0m b i 讹。 a v s 视频标准采用环路滤波器对重建图像进行滤波，一方面可以消除方块效应，改善重建图像的主观质量；另一方面能够提高编码效率。滤波强度可以自适应调整。纵观视频编码技术的发展，从框架上来说，a v s 和h 2 6 4 以及以前标准中的编解码功能块的组成并无太大区别，均是采用变换和预测的混合编码法，主要的不同在于各个功能块的细节。a v s 与h 2 6 4 的区别也难是体现在这些细节上。a v s 的主要创新在于提出了一批具体的优化技术，在较低的复杂度下实现了与国际标准相当的技术性能，但并未使用国际标准背后大量复杂的专利。 2 2 1 2 解码框架解码过程是编码的逆过程，解码流程如图2 2 所示。编码器输出一个a v s 压缩码流，码流经过网络传输或存储后作为解码器的输入。a v s 压缩比特流经过熵解码得到量化扫描后的变换系数，重新排列，再反量化、反变换，得到残差图像。只进行帧内预测的图像帧直接进行坏路滤波，重新构建恢复图像。而进行过帧间预测的图像帧，需要将残差与预测块相加，再经过滤波，重构图像。帧h j 预测：参，考帧，一一一一帧内预测 a v s 码流一一一一，；，。一- + 熵解玛? 重捧序? ，反量化：，反变换! ，+ 一i ，环路滤波，重构帧图2 2a v s 解码框架在视频编码标准中，p 帧为前向预测帧，b 帧为双向预测帧。p 帧和b 帧编码需要进行帧间预测，而解码的时候也依赖于参考帧。在传统的视频编码标准中， p 帧的参考帧为一帧，b 帧参考帧为两帧。而h 2 6 4 采用了多参考帧技术，允许p 帧和b 帧有多个参考帧。鉴于a v s 标准的目标是要以较低复杂度实现视频编解码，故采用的参考帧为两帧。北京邮i 乜人学硕l ：研究生学位论文綦于a v s 的说频舱控系统及图像质量订价 2 2 2 核心技术解析 2 2 2 1 编码 a v s 视频编码当中具有特征性的核心技术包括：8 x 8 整数变换、量化、帧内预测、1 4 精度像素插值、特殊的帧问预测运动补偿、二维熵编码、去块效应环路滤波等。变换、量化 h 2 6 4 标准为了避免正变换和逆变换不匹配的问题，采用4 x 4 整数变换。而此之前的标准均采用8 x 8d c t 变换。a v s 从编码性能和实现复杂度等多个角度考虑，选择8 x 8 整数变换，并将变换和量化结合在一起进行考虑，以减少变换和量化过程中取整的误差。a v s 标准采用正向和反向缩放都在编码器上实现，因此解码器效率更高。帧内预测 a v s 标准规定了i 帧、p 帧和b 帧三种类型的图像。i 帧只进行帧内预测编码，而p 帧和b 帧需要进行帧内或帧l 日j 预测编码。a v s 的帧内预测技术沿袭了m p e g 4 a v c h 2 6 4 帧内预测的思路，用相邻块的像素预测当前块，采用代表空间域纹理方向的多种预测模式。但a v s 亮度和色度帧内预测都是以8 x 8 块为单位的，5 种亮度预测模式，4 种色度预测模式。在编码质量相当的前提下，a v s 采用较少的预测模式，使方案更加简洁、实现的复杂度大为降低。帧间预测帧间运动补偿编码是混合编码技术框架中最重要的部分之一。a v s 标准采用了1 6 x 1 6 、1 6 x 8 、8 x 1 6 和8 x 8 的块模式进行运动补偿，而去除了m p e g 4 a 、，c h 2 6 4 标准中的8 x 4 、4 x 8 、4 x 4 的块模式。实验表明，对于高分辨率视频，a v s 选用的块模式已经能足够精细地表达物体的运动。较少的块模式，能降低运动矢量和块模式传输的丌销，降低编解码实现的复杂度。 a v s 和h 2 6 4 都采用了1 4 像素精度的运动补偿技术。h 2 6 4 采用6 抽头滤波器进行半像素插值并采用双线性滤波器进行1 4 像素插值。而a v s 采用了的4 抽头滤波器进行半像素插值和1 4 像素插值，在不降低性能的情况下减少插值所需要的参考像素点，减小了数据存取带宽需求，这在高分辨率视频压缩应用中是非常有意义的。在传统的视频编码标准中，双向预测帧b 帧都只有一个前向参考帧与一个后向参考帧，而前向预测帧p 帧则只有一个前向参考帧。而h 2 6 4 充分地利用图片之北京邮l 乜人学硕i ：研究生学位论文皋十a v s 的说频监控系统及幽像质量评价间的时域相关性，允许p 帧和b 帧有多个参考帧，最多可以有3 1 个参考帧。多帧参考技术在提高压缩效率的同时也将极大地增加存储空间与数据存取的开销。 a v s 规定参考帧为两帧，其参考帧存储空问与数据存取的开销并不比传统视频编码的标准大，而恰恰充分利用了必须预留的资源。 a v s 标准中b 帧的双向预测使用了直接模式( d i r e c tm o d e ) 、对称模式 ( s y m m e t r i cm o d e ) 和跳过模式( s k i pm o d e ) 。使用对称模式时，码流只需要传送前向运动矢量，后向运动矢量可由i j i 向运动矢量导出，从而节省后向运动矢量的编码开销。对于直接模式，当前块的前、后向运动矢量都是由后向参考图像相应位置块的运动矢量导出，无需传输运动矢量，因此也可以节省运动矢量的编码丌销。跳过模式的运动矢量的导出方法和直接模式的相同。跳过模式编码的块其运动补偿的残差也均为零，即该模式下宏块只需要传输模式信号，而不需要传输运动矢量、补偿残差等附加信息。熵编码对预测残差的块变换系数，经扫描形成( 1 e v e l 、r u n ) 对串，采用二维联合编码，并根据当i j i f l e v e l 、r u n 的不同概率分布趋势，自适应改变指数哥伦靠码的阶数。 a v s 视频目前定义了一个档次( p r o f i l e ) ，即基准档次，又分为6 个级另l j ( 1 e v e l ) ，分别对应高清晰度、标准清晰度与c i f ( 1 4 标清，相当于v h s 或v c d 质量) 应用。与 h 2 6 4 的b a s e l i n ep r o f i l e 相比，a v s 视频增加了b 帧、i n t e r l a c e 等技术，因此其压缩效率明显提高，而与h 2 6 4 的m a i np r o f i l e 相比，又减少了c a b a c 等实现难度大的技术，从而增强了可实现性。 2 2 2 2 解码 a v s 标准定义了编码后的比特流结构。码流分为视频序列，图像，条带，宏块和8 x 8 块这五种句法元素，下面介绍各句法元素的含义以及解码过程。句法元素视频序列是比特流的最高层语法结构。视频序列由序列头开始，后面跟着一个或多个编码图像，每帧图像之前有图像头。编码图像在比特流中按比特流顺序排列，比特流顺序应与解码顺序相同。解码顺序可与显示顺序不相同。序列结束码表明了一个视频序列的结束。一幅图像即是一帧，其编码数据由图像起始码丌始，到序列起始码、序列结束码或下一个图像起始码结束。在比特流中，隔行扫描图像的两场编码数据可依次出现，也可交融出现。两场数据的解码和显示顺序在图像头中规定。图像的北京

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（通信与信息系统专业论文）基于avs的视频监控系统及图像质量评价.pdf

文档简介

温馨提示

最新文档

评论

（通信与信息系统专业论文）基于avs的视频监控系统及图像质量评价.pdf

文档简介

温馨提示

最新文档

评论

相关文档