




已阅读5页,还剩130页未读, 继续免费阅读
(通信与信息系统专业论文)dct域视频转码技术研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
独创性( 或创新性) 声明 本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究 成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不 包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他 教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任 何贡献均已在论文中作了明确的说明并表示了谢意。 申请学位论文与资料若有不实之处 本人签名 本人承担一切相关责任。 日期:趔i ,! :i 关于论文使用授权的说明 学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即: 研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保 留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借 阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它 复制手段保存、汇编学位论文。( 保密的学位论文在解密后遵守此规定) 保密论文注释:本学位论文属于保密在一年解密后适用本授权书。非保密论 文注释:本学位 本人签名: 导师签名: 适用本授权书。 日期:塑:! ! :翌 日期 。手扯 蚍 挫 一 摘要 在许多网络视频应用中,人们常常期望进行转码运算。用于不同目的将某种 编码格式的压缩码流转换为另一种编码格式的压缩码流称为视频转码( v i d e o n a n s c o d i n g ,v t ) ,这里,编码格式指比特率、帧率、分辨率、编码句法及视频 内容等。v t 已成为当前的研究热点。v t 可以在像素域上进行,也可在d c t 域上 实现。直接在d c t 域上进行各种率的转换,不需要费时的运动估计、d c t 及逆d c t 运算,计算复杂性较低,且能较好地保持图像质量,因此受到人们的普遍欢迎。 数字水印( d 省t a l w a t e m a n d n g ) 是一种隐藏在数字化图像、视频和音频等 多媒体中的( 可见或不可见) 版权信息,已成为多媒体信息安全的研究热点。视 频转码水印问题就是希望在变换域上无论是对带有水印的视频进行转码、还是对 转码后的视频嵌入水印,均能使其抵抗各种视频转码运算,尤其是对下采样具有 鲁棒性。: m p e g 2 是基于块的混合编码方案,也是第一个能以标准电视和h d t v 分 辨率编码隔行视频的标准。它主要应用于大约4 m p b s 速率的t v 广播以及1 5 m b p s 的高质量视频方面。 本文重点讨论d c t 域上m p e g 2 到m p e g 1 减少空间分辨率的视频转码问 题,其关键技术包括运动向量的再使用、宏块类型确定、码率控制、视频水印转 码技术、d c t 域运动补偿方法及下采样技术。因为提出的方法并不限制于特定的 编码结构,它不仅适用于m p e g 2 到m p e g 一2 的同质转码,也适用于m p e g 2 到m p e g 4 的异质转码。 本文的贡献主要有五点:提出了一种新的2 :1 下采样算法,称为准卷积 下采样方法,该方法比目前文献中传统的算法有更好的图像质量,并有较块的运 行速度。同时已将准卷积下采样思想推广到任意比率下采样上去。我们在基于 最大最小距离准则的运动向量再使用基础之上,提出了一种相关算法以减小再量 化误差,这也是我们的转码系统优于其他转码系统最重要的方面。我们根据 d c t 域w 砒s o n 模型提出了一种抵抗下采样攻击的不可感知水印模型。用d c t 域准卷积下采样方法得到图像的下采样版本,利用亮度特征和图像感知失真限制 自适应确定被嵌入水印序列的区域、长度和强度,以使上采样水印图像具有良好 的视觉效果和鲁棒性。提出了一种新的基于d c t 视频转码的可见水印嵌入方 案:选择非零d c t 系数最少的编码块为嵌入区域,并且嵌入强度的选择同时考 虑到宿主图像和水印图像的d c t 系数的特征。提出了一种低复杂性率失真优 化转码方案:有效地利用输入视频流的相关参数( 如帧率、编码复杂性、视频特 征、运动向量及宏块类型等) 进行相应的率伸缩变换,在小范围内通过试错法来 选择最佳的量化参数及宏块模式。 总之,在压缩域上如何根据信道条件、终端类型及用户对转码的质量、有效 性和安全性的不同需求,确定是独立使用启发式方法( 充分利用输入码流中的运 动向量、宏块类型及量化参数等信息,快速确定输出码流相应参数的方法) 、还 是联合使用率失真( r d ) 方法来优化:使转码的视频质量最好( 用峰值信噪比 评价) 、转码的计算复杂性最低,同时使嵌入的视频水印和抗误码信息的容量最 大、鲁棒性最强,仍然面临极大的挑战。 关键词:视频转码;d c t 域;率失真;数字水印;快速算法;峰值信噪比。 4 t r a n s c o d i n gi nt h ed c td o m a i n a b s t r a c t i h 玎s c o 出n gi sm g 瑚yd e s i r a b l ei nm a n yn 咖r k e dv i d c oa p p l i c a t i o n s t r a l l s c o d i n g ,w h i c hi sm eo p e r a t i o no fc o n v e 而n gav i d e o 矗o mo n ef o m m t 谳oa n o t h e rf b r m a tf o r d i 丘色r e n tp 唧o s e s , l a sb e e ne x t e n s i v e l ys t u d i e di nr e c e n ty e a r s af o m a ti sd e f m e d b ys u c hc h 础屺t e r i s t i c sa s 恤e b i tr a t e ,舾m er a t e ,s p a t i a lr e s o l 而0 n ,c o d i n gs y l l t a ) ( ,a n d c o m e n te t c g e n e r a l l 弘e x i s t i n g 雠m s c o d i l l gs c h o m e sc a nb ec l a s s i :f i e di 1 1 t o 似oc a t e g o r - i e s :p i x e ld o m a i n 仃a n s c o d i l l ga n d d i s c r e t ec o s i n et r a i l s f o r i n ( d c t ) d o m a i nt r a n s c o d i n g , w h i c hm el a t t e ri sp r c f e r r e dd u et ok e e p i n gh i g h q u a l i t yp e r f b 彻a n c ea n di t s1 0 w c o m p u t a t i o n a lc o r n p l e x i 移:d c t ,i 1 1 v e r s ed c t a n dm 6 t i o ne s 血n a t i o na r es 蜮p p e di n d c t b a s e dm e m o d s t h cw a t e 咖a r k i n gt e c l l n i q u e ,w h i c he 埘【b e d sav i s i b l eo ri n v i s i b l ew a t e r n l a r ki m o t h ev i d e os 订e a mf o rc o 州g h tp r o t e c t i o i l ,h a sr e c e n u yb e c o m eav e r ya c t i v e 孤e ao f 也em l l l t i m e d i as e c 谢铒i no r d e rt ob ec o m p a t i b l e 谢mm i sv i d e o 吣c o d i n gm e t h o d , an e ww a t e r m a r k 血ga l g o r i 也m ,w h i c hc a ns u r 、,i v ed c td o m a i nt 珀n s c o d i n go rb e a d d e dt o 也e 拄a n s c o d e dd a t a ,i st 1 1 e r e f o r cr e q l l i r e d m p e g 。2w a st l eb l o c k - b a s e dh y 缸dd c te n c o d i n gs c | 蝴n ea n d 也ef i r s t s t a n d a r dt 1 a tw a sa b l et oc o d ei r l t c r l a c e dv i d e oa t 如ut va n dh d t vr e s o l u t i o n i t s m a i na p p l i c a t i o n sa r eht vb r o a d c 碰n ga tr a 士e sa r o u n d4m b p s ,a n dl5m b p sf o r h i 曲- q u a l 咄 i n “sm e s i s ,w ec o n c e n t r 犯o n 也ep r o b l e mo f r e d u c e ds p a t i a lr e s o l u t i o nt r a i l s c o d i n g 仔o mm p e g 一2t o 眦慢g - li n 1 ed c td o m a i n t h e 州m a r yf o c u so nm i sp r o b i e mc o n s i s to f m o t i o nv e c t or e u s 血g ,m a c r o b l o c kt y p es e k c t i o 玛r a t ec o l l r o l ,t r a n s c o d i n g w a t e r n l a 出n g ,d c t _ d o m a i nd o w n s 锄p 1 吨龇dd c t - d o m a i nm o t i o nc o m p e n s a t i o n s - i n c et h ep r o p o s e dm e m o di sn o tr c s t r i c t e dt oas p e c i f i cc o d m gs t r u c t u r e ,i tc a nb e a p p l i e dn o to n l yt oh o m o g e n e o u s 订趾s c o d h 培o fm p e 0 2t om p e g - 2 ,b u tm s ot o 5 h e t e r o g e n e o u st r a n s c o d i n go f m p e g 一2t o 女江p e g 4 o u rm a j o rc o n t r i b u t i o n sa r el i s t c da sf o l l o w s w ef h s tp r o p o s ean e wf a s tm e t h o d o fi 搬a g eq u a s i - c o n v o l u t e dd o w n s a h 攀l i n gb yaf 矗c t o ro ft w o ,姚i c hp e r 舷翟姐sb e 靛e f s u b j e o t i v eq u a l i t ya i l df a s t e rc o m p u t e rs p e e d 也a 1 1 订a d i t i o n a la l g o r i t 蛔s e c o n d ly jw e 攀e s e 瓣蠡s t 氆嫩i o 挂v e e t o f l 溉建gf o rv 重& od o 黼s a 氆誉i 魏ga c c o 难迅gt o 搬a x i 撤i 焱珏g a 1 1 dm i n i m i s i n gd i s t a n c ot oi m p r 0 v ep e 哺) n n a l l c co f q u a n t i z a t i o ne r r 0 l t m r d d c b a - s e d 坤晤s o n si 越辨黯e 毫主v ew a t 锄甜撼n gm o d e lr e s i 蹴dd o 黼s a 堇n p 量洫g 鑫t 辩ki s p r e s e n t e d t h ed o w n s a m p l i i l gi i n a g ei 8o b t a j n e db yq u a s i c o n v o l l l t e dd o w n s a m p l i n g a n dt b er e 誊o n ,镪el 瓤g 醢la n dt h es 虹e n g 盘o fw a t e r m a f ks e q u e n c ei sa 斑巾t i v e 匆 e m b o d d e di n 戗l od o w n s a m p l i n gi m a g eb ye ) 叩1 0 i t i l l gt 圭l el u m 血粼oc 娜t e r i s t i ca n d ap e r c e p t u a ld i s t o r t i o nc o n s 订a h l t ,w h i c h 掣e a t l yi m p r o v e s 也ep e r c e p t 【l a lq u a l i t ya r l d 筠k s t 娃e s s 。f 坤s 啦p l 遮w a 咖妇建溉a g e f 湖堍a 静c t d o 擞8 i n v 幽l e w a t e 黼一 a r k i n gs c h e m eb a s e do n 也el n j n a 工1 c ea n dt c x n l r ef 色a t u r e so ft h eo r i 萄n a li m a g ea n d w a t e 湖珏矗i m a 秘秘瞒滋珏gd c 强鑫3 a e e 耋 1 0 i e 珏据毽啦a 砖蠢薹l i 弘矗谢斑t r 臻s e o d i n g 厅o mm p e g 一2t om p e o 一1i sp r o p o s e d l o c a t i o no ft h ev i s i b l ew a t e n n 剐ki s c 圭1 0 s e na tt h eb l o c l ( 稍氇m i 嫩m 诳nn u 撤b 日o fn o 赶臻 d c t e 蕊c i e n t si n 氆e i - 矗a i r i e s 。f i 触,al o w - m p l e x 姆r a t c d i s t o r t i o 椎o p t i m a l 仃a i l s c o d i n ga l g o n 也mf r o m m p e g 一2t om p e g 一1i nd c t d o m a 试w h e r es 扣触i a lr e s o 】砸o nr e d u c t i o ni si r l v o l v e d , w e 捌n 垃yo 辫越z e 佻璐e o d i 扭gp a r 搬e t e r s 协s e l e c ti 嬲强锄d 喇晦a 擞瓣_ o b l o c k t y p e ,r e u s e dm o t i o nv e c t o ra i l dq u 舭t i z 撕o np a r a i r l e t e rf o re a c hi n d i v i d u a lm bi na 蠡缒l e 谤e x p b 瓣n gc o r r e l 越e 煞b 鞋镩e 。珏董融i 絮毽a 琏d 镄建p 落v l 纛豫纛糟a 睦塔u s e o f t 妒a n d - e r r o rs e a r c hm e t l l o d 确e 馥蠡l e n g eo f 镪e 糟s e 瓤铺铀缸鑫n s c o d i n gi s 氆e 蚰o wt oi n t 越l i g e n 耄j y 蕊l 谊e 氇e c o d i n gs t a t i s t i c s 柚dp a r a m e t c r se x t r a c t c d 丘d mm ei n p u tt oa c h j e v e 也eb e s tp o s s i b l e v 碡e oq u a l i 毋( p e r f o m l a n c ee v a i l 】a t b nu s 诳gp e a ks i g n a lt on o i s 。r a t i o ) ,缸1 el o w e s t p 0 - s s i b 王ec o m p u t a t i o n a le o m p l e 矗甥也el a 鹅e s tc 箍p a c i 夸a n d 氆es 辑o n g e s tr o b u s 执e s so f w a t e 】1 m a r kj n s e n i o n k e yw o r d s :v i d e on a i l s c o d i n gi i ld c t d o m a i n ;r a t 即d i s t o m o n ;d i g i t a l w 骧e r 挠鑫瘐巍餐蠡s t8 l 耐墩撤;p 髓曼s i 弘越稔越o i s e 璐暾) 6 第一章视频转码概述 在全球范围内实时或非实时地高质量传播视频信息将很大程度依赖于数字 视频压缩及其标准。由国际标准化组织国际运动图象编码专家组i s o 小心e g ( i i l t e m a t i o m lo r g a l l i z a t i o nf o rs t a i l d a r d i z a t i o n m o t i o np i c t u r ee x p e ng r o u p ) 和国 际电信联盟电信标准化部门( h l t e m a t i o n a lt e l e c o i n m u n i c a t i o nu n i o n t e l e c o 衄u n i c a t i o ns t a l l d a r d i z a t i o ns e c t o r ,i t u t ) 制定的多个国际标准为不同的 厂家和视频提供者奠定了一个共同的工作基础。随着数字视频技术在我国国民经 济和社会信息化建设中的广泛应用( 如手机电视、视频点播、视频会议、数字图 书馆、远程教育、电子商务、家庭娱乐及三维模型等) ,随着互联互通的电信网、 计算机网和电视网等网络资源的无缝融合,实现各种视频编码格式之间的转码要 求越来越迫切,对数字产品的版权保护和内容认证也迫在眉睫。视频转码主要包 括再量化减少比特率、下采样减少空间分辨率及丢弃b 帧减少帧率。目前,版 权保护主要有两种方法:一是密码技术,其缺点是解密后的数据不再受到保护; 二是数字水印( d i 百t a lw 矗c c 胁a 出n g ) 技术,其主要特点是不可感性、安全性和 鲁棒性。1 1 节主要介绍了视频转码的关键技术。1 2 节简单介绍了m p e g 一1 2 国 际压缩标准。1 3 节阐述了论文的组织和贡献。1 4 节给出了本章小结。 1 1 视频转码概述 将与通信网络相结合的多媒体技术称为多媒体通信技术。与一般的通信技术 不同,多媒体通信技术应该同时具备如下特征【1 】: ( 1 ) 在内容上相关联的多种媒体信息的处理和传递,如声音、活动图像、 文本、图形、动画等; ( 2 ) 交互式工作,而不是简单的信号单向或双向的传输或广播; ( 3 ) 网络联结,即各种媒体的信息是通过网络传输的,而不是借助于只读 光盘存储器( c o m p a c td i s c r c a do i l l ym e m o r y ,c d _ r o m ) 等存储载体来传递的。 在过去2 0 年左右的时间里,在多媒体表示和通信领域取得了惊人的进展。 首先,已经很清楚的是媒体的所有方面正在“进入数字化”:从表示到传输,从 处理到检索,从演播室到家庭。其次,数字多媒体的压缩和通信都取得了显著的 进步,这使得在目前的网络中以相对低的码率传输高质量的视频成为可能。第三, 超大规模集成电路技术的发展可以经济有效地实现复杂的软件。第四,由 i s o ,m p e g 和i t u t 制定的多个国际标准为不同的厂家和视频提供者奠定了一 个共同的工作基础。同时,无线、多媒体和网络的融合将彻底改变人们进行商务 活动和彼此间通信的方式。未来的计算和通信结构将具有实际上的无限带宽、全 连接性、高移动性、充裕的多媒体容量、高安全性和可靠性。 随着多媒体的逐步渗透,视频、图形、计算机视觉、多媒体数据库和计算机 网络之间的界限开始变得模糊了,使视频处理成为多学科的激动人心的领域。视 频处理已处于多媒体的核心地位。 视频压缩是最具挑战的编码问题,它有大量的商业应用,基本目标是为了在 给定的码率下达到最优的解码质量。视频压缩方法依据所用信源模型的不同可以 分为两类:一类是基于波形的视频压缩,比如像m p e g 和h 2 6 x 视频压缩技术 都采用了基于块的混合编码方法;它综合了减少时域冗余的预测编码、运动补偿、 减少空域冗余的离散余弦变换( d i s c r e t ec o s i n et r a n s f o r i n ,d c t ) 编码和提高压 缩比的熵编码等技术;另一类则是基于内容的视频压缩。最好的图像压缩算法是 用余弦基或小波基的变换编码,这种基的效率来源于它们能用很少几个非零系数 构造精确非线性图像逼近的能力。用少于1 比特“象素,可重构视觉上近乎完美 的图像。以至少o 2 5 比特像素,图像仍保持较好质量。d c t 是一种次最优的特 征向量变换( k a r h l l i l e n - l o e v et r a n s f o n n ,k l t ) ,具有能量集中特性、去空间相 关特性、熵不变特性以及类似于小波多分辨率图像分解之特性叫,且多数d c t 的计算较小波变换简单,例如,时域信号的卷积对应于d c t 域的真接乘积。1 , 而小波变换则无此计算之简单性。因此,本文重点讨论d c t 域上m p e g 2 到 m p e g 一1 减少空间分辨率的视频转码问题,其关键技术包括运动向量的再使用、 宏块类型确定、码率控制、视频水印转码技术、d c t 域运动补偿方法及下采样 技术。因为提出的方法并不限制于特定的编码结构,它不仅适用于m p e g 。2 到 m p e g 一2 的同质转码,也适用于m p e g 2 到m p e g 4 的异质转码,其关键技术的 研究适用于任何基于块的转码方法。 当不同用户个人数字助理( p e r s o n a ld i 醇a l a s s i s t a n t s ,p d a s ) 、电视机顶盒 ( s e tt 0 pb o x ,s t b ) 、智能手机( s m a r tc e l l u l a rp h o n e ,s c p ) 等) 试图通过不 同的通信链路( 综合业务数字网、数字用户线、无线网及拨号等) 访问相同的视 频,常常期望能对该视频进行视频转码。视频转码的思想起源于视频编码的可分 级性,即通过仅解码一部分压缩的比特流物理地恢复有意义的视频信息的能力。 可分级编码一般是通过提供一个视频的多种版本实现的,这些版本是就幅度分辨 率、空间分辨率、时间分辨率、频率分辨率( 数据分割) 或这些选项的组合而言 的,其最大的缺点是复杂度较高同时功能也很有限。 图1 1 基于l p 网的视频转码 将某种编码格式的压缩码流转换为另一种编码格式的压缩码流称为视频转 码( t r a i l s c o d m g ) 。非实时视频转码就是在转码代理服务器中保存一个质量足够 好的压缩视频流,当需要降低输出码率时,服务器只需进行部分的解码和编码就 可以实现,而实时视频转码则需要根据信道条件( 带宽、错误比特率及包丢失率 等) 和用户要求( 计算资源、显示能力及保密程度等) 按某种准则( 如率一失真 模型等) 选择适当的转码方法,从而提供最好的转码质量。视频转码主要包括再 量化减尘! 唆奎! 下采样减少空间分辨率及丢弃b 嗨域坐颇章视短毯碍分为 同质转换和异质转换两类,前者是在同一编码标准中进行转换,如将m p e g - 2 变为m p e g 1 ,而后者是在不同视频编码标准中进行转换,如将m p e g 2 转为 m p e g 一4 。典型转码结构也有两种h j :一是基于像素域的级联转码,它由三部分 组成:译码、下采样和再编码,三部分相互独立,转码很灵活,但计算复杂性很 高;二是基于d c t 域的级联转码,即直接在d c t 域上进行各种率的转换,不需 要费时的运动估计、d c t 及逆d c t 运算,计算复杂性较低,且能较好地保持图 像质量。因此,d c t 域的级联转码普遍受到人们的欢迎。 d c t 域视频转码关键技术的研究现状简要分析如下: 运动向量的再使用( m v r ) :按照某种规则从几个输入宏块的运动向 量( m v ) 中求出一个输出宏块m v 的技术。由于块的运动估计( m e ) 占整个 编码时间的6 0 以上【6 】,所以视频转码中,m v r 受到欢迎。目前m v r 的方法 主要有三个:加权方法【7 、主m v 方法,即从几个输入宏块m v 中,按照某种准 则挑选出其中一个做为下采样m v ( 称为主m v ) 及主m v 精细方法( m v r m ) 罔,即在主m v 和其余输入m v 的简单平均所构成的搜索窗内,求最小m s e 所 对应的m v 。传统的m e 方法只注意使运动补偿预测误差最小化,而率失真( r - d ) 最佳化还应考虑产生的m v 以预测方式编码所需的码率,目前研究的不多。 d c t 域运动补偿技术( d c tm c ) :约占整个转码时间的3 0 9 】。d c tm c 快速算法“”的基本思想是利用d c t 的稀疏性、叠加性以及对称性。虽然人们已 经研究了量化技术与d c t 方法的融合以及在下采样技术与m c 技术的融合旧 方案中找最优的m c 方案u ”,但m c 与下采样及量化的快速融合算法,还没有 理想的结果。 下采样技术:时域下采样是通过在码流中丢弃b 帧来实现的。b 帧使用 与它在时间上最近邻的前后两个i 帧或p 帧来预测,而自己并不作为任何其它帧 的参考图像,因此,在传输中丢弃b 帧“4 3 并不影响其它帧的质量,而仅仅会降 低帧率及比特率。 典型的d c t 域2 :1 下采样方法主要有三个( 基本思想是将四个块变为一个 块) :m e r h a v 提出的抗混叠虑波器( 又称为双线性滤波器) “、d u g a d 等人提出 的从每一个8 8 块上截取4 x 4 低频率子块的方法“”及我们提出的能较好保持高 频能量的准卷积下采样技术【】。但对于任意比率下采样仍缺乏高效快速的算法。 码率控制:通常是依据缓存器的充满程度及块的活动性来调整帧率及选 择宏块式和量化参数q 【1 7 1 8 】,在尽可能保证图像质量稳定的条件下,使转码码 率r 适应恒定信道的要求。建立d c t 系数的准确数学模型,直接影响利用率 失真( r a t e d i s t o n i o n ,r d ) 优化技术进行码率控制的效率。l a l l l 认为视频图像 d c t 系数近似服从拉普拉斯分布 。如果图像方差为一个值,则由中心极限定 理,视频图像d c t 系数近似服从高斯分布。但是对于大多数视频图像来说,视 频图像块之间的方差是变化的,已经证明,压缩视频数据可由所谓的一般高斯分 布的r - d 较好地建模1 :r ( d ) :。1 0 9 :,d ) ,其串a ,b 均为模型参数。但基于 模型的率控制计算较复杂。目前,如何在计算复杂性及转码质量受限的情况下, 有效地利用输入视频流的相关参数信息进行相应的率伸缩变换,选择最佳的量化 参数及宏块模式常常是我们所期望的,目前还没有满意的答案。 信息保护主要有两种方法:一是用密码技术。密码学【2 i 】( c r y p t o g r a p h y ) 是 信息安全技术的核心。主要由密码编码技术和密码分析技术两个分支组成。密码 编码技术的主要任务是寻求产生安全性高的有效密码算法和协议,以满足对消息 进行加密或认证的要求。密码分析技术的主要任务是破坏密码或伪造认证信息, 实现窃取机密信息或进行诈骗破坏活动。这两个分支既相互对立又相互依存,正 是由于这种对立统一的关系,才推动了密码学自身的发展。密文容易引起攻击者 注意及解密后的数据不再受到保护是密码技术的主要缺点。二是用数字水印 ( d i g i t a lw 缸e r i l l a r l ( i n g ) 技术。数字水印i 捌是信息安全技术的一个重要方面,是 一种在开放的网络环境中多媒体数据保护的有效方法,对它的研究具有重要的学 术和经济价值。数字水印是一种隐藏在数字化图像、视频和音频等多媒体中的版 权信息,其基本原理是利用了人类感官系统对多媒体数据( 图像、音频、视频、 三维模型等) 某些细节的不敏感性,对其载体做微小的变动,而不会引起观察者 的怀疑。数字水印的主要特点是不可感知性、安全性和鲁棒性。与加密技术不同, 数字水印技术并不能阻止盗版活动的发生,但它可以判别对象是否受到保护,监 视被保护数据的传播、真伪鉴别和非法拷贝,解决版权纠纷并为法庭提供证据。 1 4 为了给攻击者增加去除水印的难度,目前多数水印制作方案都采用密码学中的加 密体系来加强,在水印的生成、嵌入及提取时联合使用传统密钥和水印密钥。 绝大多数水印的应用也可以用其他技术来完成,然而水印相对于其他技术有 三种优势:首先,水印是不可感知的;第二,水印与其嵌入的作品密不可分,当 作品被显示或转化为其他文件格式时水印不会消失;最后,水印将经历和作品完 全相同的变换。 根据给定水印系统的以下特性来判断此系统是否适用于给定应用:嵌入有效 性、保真度、盲检测或含辅助信息的检测、虚警概率、鲁棒性、安全性、密码和 水印密钥、修改或多水印及成本。 视频水印是最有应用前景的水印技术。视频水印方法主要有两种:空间域 2 3 】【2 4 1 方法和变换域! 卜【2 7 1 方法。与空间域方法相比,变换域尤其是d c t 域上的 一一一、一 水印方法主要有以下优点:一是在变换域中可有效地利用人类视觉系统的某些特 一一一一。 征,在高频分量嵌入数据,以增强水印的鲁棒性( 水印嵌入强度) ;二是也可选 择低频分量嵌入数据以使能量扩散到空间域所有像素上,提高水印图像质量( 不 可感知性) ;三是可与国际数据压缩标准如m p e g 等兼容,同时在d c t 域实现的水 印算法,计算复杂性也往往较低。视频水印转码技术要求视频水印对视频转码有 较好的鲁棒性( 如能抵抗再量化及下采样攻击等) ,常常是我们所期望的。 视频转码水印技术潜在的应用领域非常广阔,如数字视频点播( v o d ) 、d v d 版权保护和卫星数字视频传输等等。视频转码水印问题就是希望在变换域上无论 是对带有水印的视频进行转码时、还是对转码后的视频嵌入水印,均能使其抵抗 各种视频转码运算,尤其是对下采样具有鲁棒性。另外还要求不使用原始下采样 图像,就能进行水印的相关检测。如何根据视频的不同应用情况、视频的边缘及 纹理特征等而选择最佳的视频转码水印方法,目前尚未得到充分的研究。 综上所述,在压缩域上如何根据信道条件、终端类型及用户对转码的质量、 有效性和安全性的不同需求,确定是独立使用启发式方法( 充分利用输入码流中 的运动向量,宏块类型及量化参数等信息,快速确定输出码流相应参数的方法) 、 还是联合使用率失真( r - d ) 方法来优化:使转码的视频质量最好、转码的计算 复杂性最低,同时使嵌入的视频水印和抗误码信息的容量最大、鲁棒性最强,仍 然面临极大的挑战。 1 。2 视频压缩标准概述 世界正迈进数字化、网络化、全球一体化的信息时代。人类的生活也将在 这个变为“地球村”的星球上进入更高品质的“数字化时代”。视觉信息作为人 类最“赏心说目”的信息将大放异彩。而在全球范围内实时或非实时地高质量传 播视频信息将很大程度依赖于数字视频压缩及其标准。 众所周知,人类对微观世界的认识己触及基本粒子的结构,对宏观世界的探 索已超出银河系,对生命本身的研究也达到了d n a 分子水平,而对视觉的研究 也几乎接近“色即是空”的境界。视频图象无论是“急流飞瀑”,还是“行云流 水”,都可看作在视觉时间灵敏度范围内对视频信号进行时间采样的一幅幅静止 图象组成。而一幅静止图象无论是“闭月嫠花”,还是“沉鱼落雁”,都可看作在 视觉空间灵敏度范围内对图象进行空间采样的一个个象素组成。然而一帧 1 0 2 4 7 6 8 个象素的原始图象,如果每个象素平均用1 2 比特( 亮度8 比特,色度 4 比特) 来表示,则总共需9 mb i t 。按3 0 帧秒的视频速率,则在一秒钟内数 字视频的数据量是2 7 0 m b i t 。1 分钟之内的电视电影数据就将占满现有高档 p c 的所有硬盘和内存。如果不用压缩技术而用现有媒质和信道传播实用的视频 图象序列,纵有“倒拔杨柳”的力气和“还看今朝”的气魄也要发出“蜀道难” 的叹惜。因此图象视频信号的压缩是视觉信息传播的至关重要的技术。 一般而言,静止图象具有空间连续性,运动图象( 视频信号) 除具有空间连 续性外( 帧内) ,还具有时间连续性( 帧间) 。例如一段“落霞与孤骛齐飞,秋水 共长天一色”的视频信号,其中的“落霞”、“秋水”、“长天”在图象的大部分面 积( 空间) 内是相似的或连续相关的,而“孤骛”是从前一帧图象中“飞”过来 的,其本身和背景都具有时间连续性。图象视频压缩即是在时域、空域及频域 ( 变换域) 描述图象的连续性( 相关性) 并根据人类视觉特点去掉空间相关性和 时间相关性( 信息冗余) ,使大部分数据都变为0 ,从而用较少的有值数据有效 地表示图象视频,进而利用信息编码理论( 熵编码) 对这些有值数据进行数据 压缩。其逆过程( 解压缩) 可以将图象重建。现代高速高数据吞吐率的数字计算 技术支持了这些压缩与解压缩处理,使得一幅诸如“波光里的艳影”的高清晰度 的图象视频可以在片刻间“揉碎”和“重现”,使之“轻轻的走”又“轻轻的 来”。 近年来,由于视频市场的大力牵引和电子技术的飞速发展,各种各样图象压 缩和数据压缩的算法应运而生,层出不穷。为了视频信息及其产品可在全球交流 和使用,有必要对这些算法及视频数据格式进行统一并制定相应的国际标准。各 国和各大有关跨国公司都极其重视这些标准的制定并都试图使自己的技术专利 在国际标准中占一席之地。而众多的技术专利要经过国际专家组进行会议评比和 筛选。尽管各国视频界的精英们在制定标准的过程中各竞风流,但每次评选无异 是国际视频界的一次“奥林匹克”赛。竞争是残酷的,入围者可坐吃专利后福无 边;淘汰者前功尽弃,不知何处是岸。但由于大家都遵从相同游戏规则”,在“公 开、公平、公正”的基础上竞争,赛前没有“高低贵贱”之分,也没有“舍我其 谁”的豪气。赛后的胜利者自然令人“刮目相看”,“敬如上宾”。选择虽然有国 际专家组人为的因素,但同样是“物竟天择”的结果。 m p e g 成立于1 9 8 8 年,是i s o 组织的一个专家组,专门制定包含视频和伴 音的多媒体应用的有关标准。i s o 已经制定4 套标准,每一套针对不同的应用领 域,均描述了视频和音频压缩,以及二者复用的方法。这4 套标准分别简述如下: m p e g 一1 ,视频及其伴音存储标准( i s 0 i e c1 1 1 7 2 ) 。m p e g 1 的标准 名称为“信息技术一用于数据速率大约高达1 5m b s 的数字存储媒体的电视图像 和伴音编码( i 廊m a t i o nt e c h n o l o g y - c o d i n go f m o v i n gp i c t l l r ea n da s s o c i a t e da u d i o f o rd i g i t a ls t o r a g em e d i aa tu pt oa b o u t1 5 m b ,s ) 。该标准是为在c d r o m 上以 1 5 m b i t s 码率存储v h s 录象质量级的节目而制定的; m p e g 一2 ,数字电视标准( i s o i e c1 3 8 1 8 ) ,其码率可达到1 0 0 m b s 。 m p e g 一2 的标准名称为“信息技术一电视图像和伴音编码的通用标准”f i n f o n n a t i o nt e c h n o l o g y g e n e r i cc o d i n go f m o v i n gp i c t t l r ea n da s s o c i a t e da u d i oi n f o h n a t i o n ) 。 该标准主要是为了记录和传输演播质量级的视频和音频信号而制定的。 这2 个标准的关键技术都采用了运动补偿( 去时间相关性) 、d c t 变换( 去 空间相关性) 和h u 眈a n 编码( 去数据相关性) 。不过m p e g - 2 是在m p e g 1 的 基础上增加了隔行扫描、伸缩编码、抗错能力和更高的色信号的取样模式等功能。 i n t e m e t 网上的大部分视音频数据是用m p e g 1 方式存储的。而m p e g 2 对于模 拟电视到数字电视的转换起到了举足轻重的作用。新一代的高清晰度电视也将基 于m p e g 2 标准。无论是卫星广播或电缆广播,成千上万的m p e g 一2 解码机顶 盒都在最近3 年内“飞入寻常百姓家”。 m p e g 一4 视频标准集近年来图象分析,图象压缩,视频压缩,计算机视 觉,信号处理等领域的最新研究成果的大成( 参加竞争的各种技术方案来自并不 局限于m p e g 的遍布世界各地的各种企业和国家的研究机构) ,在推出”音视频 元”概念的基础上提出基于内容( c o m e n t - b a s e d ) 的视觉编码标准。在开发低码 率( 5 6 4 勋打h ) 编码标准的同时,将重点放在人们更感兴趣的图象具体目标 的交互性和可操作上,并对多媒体多应用领域的编码进行兼容并包。它不仅包括 运动目标的编码,还包括静止目标和计算机人工合成目标的编码。它不但是第一 个让用户在接收端对画面可进行操作和交互式访问的标准,而且由于其低码率, 高度灵活性,兼容性,可伸屈性,强抗错性和可扩展性,也将是第一个解决信息 产业中电视、通信、计算机这三大支柱产业的所谓”数字汇聚”问题的标准。 h 2 6 4 a v e 视频编码国际标准是由i t u t 和i s 0 】e cm p e g 共同制定的, 继承了h 2 6 3 和m p e g l 2 4 视频编码协议的优秀之处,在保留补偿和变换编码技 术的基础上,加入了如下新技术:( 1 ) 帧内编码采用了空域像素预测技术;( 2 ) 帧间编码采用了多模式的块匹配运动估计技术,估计精度为l 4 像素;( 3 ) 变换 编码采用了4 4 整数变换技术,与8 8 d c t 变换相比,具有块效应小、易于实 现和可以避免数据失配等优点;( 4 ) 熵编码采用了基于上下文自适应的可变长度 编码( c o m e x t - a d a 面v ev a d a b l el e n g mc o d i n g ,c a l v c ) 、基于上下文自适应的 算术编码( c o m e x t a d a p t i v eb i n a r y 崩t h m e t i cc o d i n g ,c a b a c ) 技术,提高了 以往采用的2 d ( m n 1 e v e l ) v l c 的编码效率。与上述的标准相比,在相同编码 质量时,h 2 6 4 a 、,c 可以节省5 0 的码率。但其编码效率的提高是以增加编码算 法复杂度为代价的,其复杂度大约是h 2 6 3 的4 5 倍。 以上4 个标准都是和多媒体编码有关的。m p e g 7 是一个全新的标准,目的 和功能都与前几个标准不同。m p e g 7 的正式名称:多媒体内容描述接口 ( m u n i m e d i ac o r l t e n td e s c r i 砸o ni h t e 血c e ,m c d i ) ,用来定义上述标准所产生的 多媒体压缩数据的结构和特征的,由此而得到的描述信息可以在搜索引擎中使 用,用来定位那些具体所定义的特征内容。m p e g 标准将不对编码方法作出规定, 就是说只规定最后的数据格式,而不管用何种方法获得这些数据格式,在设计和 1 8 实现编解褐时仍然有缀大的自由度。 1 2 1 数字声像存储压缩编码标准m p e g - l “邛” 由o l i v c r 等人在1 9 s 2 年把线性预测方法应用予圈象编码。1 9 5 8 年g r a l l a m 用计算机横拟方法研究了静止图象的前值预、狈4 麓分脉冲编码调制( d i 仃e r e n t i a l p u l s ec o d om o d m a 矗o n ,d p c m ) ,并取得了3 4 b 彬像素图象质爨的优良结果,这 大大地激教了研究人员研究图象压缩技术的积掇羧,在短短的5 0 多年时蔺璺,相 继出现了
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年南平市供电服务有限公司招聘52人模拟试卷及完整答案详解1套
- 2025年桦甸市产业发展有限公司招聘模拟试卷及一套完整答案详解
- 2025年甘肃省武威市事业单位招聘628人【教育岗48人】模拟试卷(含答案详解)
- 2025年4月广东广州市天河区智谷第二幼儿园招聘编外教辅人员1人模拟试卷及参考答案详解
- 2025年社会治安综合治理与社会稳定风险评估报告
- 2025年工业互联网平台网络切片技术在智能家居领域的应用探索与实践报告
- 2025年绥化市中医医院招聘考前自测高频考点模拟试题及1套完整答案详解
- 2025年工业互联网平台IPv6技术升级与工业互联网平台投资机会分析报告
- 2025年智能建筑系统集成与节能降耗技术专利申请趋势报告
- 2025年旅游地产项目生态规划与可持续发展策略研究分析报告
- 科普:农药毒性分类
- 陈阅增普通生物学第1篇3细胞结构与细胞通讯教学课件
- 练习使用显微镜 全国公开课一等奖
- 【执业药师考试】执业药师历年真题
- 2023年高考地理(上海卷)-含答案
- 比重式精选机的使用与维护
- FZ/T 81004-2022连衣裙、裙套
- GB/T 34875-2017离心泵和转子泵用轴封系统
- 细胞培养技术培训课件
- 故障录波器课件
- 管片质量问题原因分析及控制措施
评论
0/150
提交评论