




已阅读5页,还剩52页未读, 继续免费阅读
(计算机软件与理论专业论文)同步音频水印算法的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 随着网络技术与多媒体技术的飞速发展,互联网已成为传播各种 知识和信息的重要途径,但随之而来的盗版问题和版权纷争已成为一 个迫切需要解决的社会问题。数字水印技术目前被公认为是解决版权 问题的一种有效方式,并已经成为国际学术界研究的一个热点。 本文首先介绍了数字音频和数字水印的一些基本知识,接着介绍 了一些常见的数字水印算法,并分别对其优缺点进行了分析,最后通 过分析发现目前大部分水印算法抵抗同步攻击能力和敏感性较弱,本 文给出了一种基于小波变换的同步水印改进算法,并加以分析。该算 法是一种盲检测算法,检测时不需要原始音频信号,利用了音频载体 自身特点和时域水印技术嵌入同步信息。水印是一幅二值图像,为了 保证搜索效率,将同步码嵌入到音频时域信号中。根据同步码嵌入位 置,来确认水印嵌入位置,从而对抗音频在时间轴上可能受到的攻击, 如裁剪、网络传输中的丢包等,即使丢失工部分音频信号,仍然可以 利用同步码检测出水印图像,同时将水印嵌入n 4 , 波的高频分量,以 增加水印的敏感性。 实验结果表明,该算法产生的水印在对抗加性g a u s s i a n 噪声、 m p 3 压缩、剪切等方面具有良好的稳健性和敏感性,可用于数字音频 产品的版权保护。 关键词数字水印,数字音频,小波变换,同步 a b s t r a c t w i t ht h e r a p i dd e v e l o p m e n to ft h en e t w o r ka n dm u l t i m e d i a t e c h n o l o g y , i n t e r n e th a sb e c o m eav e r yi m p o r t a n tw a yt ot r a n s m i tv a r i o u s k n o w l e d g ea n di n f o r m a t i o n b u ti tw a st h ep r e l u d et og e n e r a las e r i e so f s o c i a lp r o b l e mt h a tn e e dt os o l v e ,s u c ha sp i r a t ec o p ya n dc o p y r i g h t d i s p u t e d i g i t a lw a t e r m a r ki sa na c c e p t e de f f e c t i v ew a yt os o l v et h e p r o b l e m ,a n di ti sah o t p o i n tt or e s e a r c h i n gi nt h ei n t e r n a t i o n a la c a d e m i a w o r l da tt h ep r e s e n tt i m e t h i sp a p e ri n t r o d u c e dt h eb a s i ck n o w l e d g eo fd i g i t a lm e d i aa n d d i g i t a lw a t e r m a r ka tf i r s t a n dt h e ni n t r o d u c e ds o m ec o m m o nd i g i t a l w a t e r m a r k a l g o r i t h m a n d a n a l y z e d a b o u tt h e i r a d v a n t a g e a n d d i s a d v a n t a g e f i n a l l y , aw a v e l e tt r a n s f o r m b a s e ds y n c h r o n o u sw a t e r m a r k i m p r o v e da l g o r i t h mw a sp r e s e n t e da n da n a l y z e d ,b e c a u s et h em o s to ft h e w a t e r m a r ka l g o r i t h m s s y n c h r o n o u sa t t a c k sc a p a b i l i t ya n d s e n s i t i v i t ya r e v e r yw e a k t h i sa l g o r i t h mi sak i n do fb l i n d d e t e c ta l g o r i t h m ,i tn e e d n t o r i g i n a lm e d i as i g n a lw h e nd e t e c t i n g t h i sa l g o r i t h mi su s e dt h eo w n c h a r a c t e ro ft h em e d i ac a r t i e r , t h ew a t e r m a r k i n gw a sab i n a r yi m a g e ,a n d t h es y n c h r o n o u si n f o r m a t i o ni se m b e d d e di nt h et i m ed o m a i ni no r d e rt o g u a r a n t e et h es e a r c h i n ge f f i c i e n c y , i tw a st h ew a t e r m a r k se m b e d d e d p o s i t i o nw h i l et h es y n c h r o n o u sc o d ew a sf o u n d e d ,t h e r e b yi m p r o v et h e r e s i s t a n c eo fs o m ep o s s i b l ea t t a c ka l o n gt h et i m ea x i s ,s u c ha sc u t t i n g ,t h e t r a n s m i s s i o nn e t w o r kp a c k e tl o s s ,e t c i ts t i l lc a nd e t e c tt h ew a t e r m a r k p i c t u r eu s et h es y n c h r o n o u sc o d e ,e v e nt h o u g hl o s ep a r to ft h em e d i a s i g n a l ,t h ew a t e r m a r kp i c t u r ew a se m b e d d e di nt h eh i g hf r e q u e n c ya r e ai n o r d e rt oi m p r o v es e n s i t i v i t ya tt h es a m et i m e t h ee x p e r i m e n tr e s u l t ss h o wt h a tt h ea l g o r i t h mh a sg o o dr o b u s t n e s s a n ds e n s i t i v i t yi nt h ew a t e r m a r kc o n f r o n t a t i o na d d i t i v eg a u s s i a nn o i s e , m p 3c o m p r e s s i o n ,c u ta n do t h e ra s p e c t s ,a n di tc a nb eu s e df o rd i g i t a l a u d i op r o d u c t sc o p y r i g h tp r o t e c t i o n k e yw o r d sd i g i t a lw a t e r m a r k ,d i g i t a lm e d i a ,w a v e l e tt r a n s f o r m , s y n c h r o n i z a t i o n l l 原创性声明 本人声明,所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。尽我所知,除了论文中特别加以标注和致谢的 地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包 含为获得中南大学或其他单位的学位或证书而使用过的材料。与我共 同工作的同志对本研究所作的贡献均已在论文中作了明确的说明。 作者签名:主丝虱垫:日期:j 巫堕年月卫日 学位论文版权使用授权书 本人了解中南大学有关保留、使用学位论文的规定,即:学校有 权保留学位论文并根据国家或湖南省有关部门规定送交学位论文,允 许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内 容,可以采用复印、缩印或其它手段保存学位论文。同时授权中国科 学技术信息研究所将本学位论文收录到中国学位论文全文数据库, 并通过网络向社会公众提供信息服务。 盈吼磅 硕士学位论文 第一章绪论 1 1 课题研究背景 第一章绪论 随着数字化多媒体产品的大量制作和发行,人们不但可以通过互联网和 c d r o m 方便快捷地获得多媒体信息,还可以得到与原始数据完全相同的复制品, 由此引发的盗版问题和版权纷争已成为日益严重的社会问题。因此,如何有效 地对数字产品进行版权保护己成为产业乔与学术界共同关注的话题。为了解决 这一难题,近几年国际上提出了一种新的有效的数字信息产品版权保护和数据 安全维护的技术一水印技术n 1 ( d i g i t a lw a t e r m a r k i n g ) ,可以实现拷贝限制、使 用跟踪、盗版确认等功能,有利于解决版权纠纷,保护数字产权合法拥有者的 利益,从而确认数字产品真j 下的版权人。 数字水印技术被认为是解决版权问题的一种有效方式,它作为信息隐藏技 术研究领域的重要分支,是实现数字产品版权保护和版权归属晗1 的有效办法,因 此数字水印的概念提出以后,除了一开始它要解决的数字作品的知识产权侵犯 的问题外,还要解决软件或文档的非法拷贝n 1 、电子商务中的非法盗用和篡改、 以及网络中信息的非法截取和查看n 山1 等问题。所谓数字水印技术是指用信号处 理的方法在数字化的多媒体数据中嵌入隐蔽的标记,这种标记通常是不可见的, 只有通过专用的检测器或阅读器才能提取。数字水印技术是目前信息安全技术 领域的一个崭新方向,是一种可在开放的网络环境下实现信息隐藏与跟踪的新 型技术。自1 9 9 3 年以来,国内外开始并尝试一种新的关于信息安全的技术,即 将机密资料隐藏到一般的文件中,然后再通过网络来传递。由于非法拦截者从 网络上拦截下来的是伪装后的资料,它们看起来与一般非机密资料没有两样, 因而十分容易逃过拦截者的破解。其道理如同生物学上的保护色,巧妙地将自 己伪装隐藏于环境中,免于被天敌发现而遭受攻击,这一点是常规加、解密系 统所欠缺的,也是信息伪装最基本的概念。该技术已引起工业界及军方的浓厚 兴趣,并成为国际上非常活跃的研究领域。 1 2 数字水印技术的国内外研究现状和研究方向及发展背景 1 2 1 数字水印技术的国内外研究现状 尽管在一千多年前,我国就发明了造纸术,但是纸水印直到1 2 8 2 年才在意 大利出现1 。这些水印是通过在纸模中加细线模板制造出来的,纸在有细线的区 硕士学位论文 第一章绪论 域会略薄一些,这样也会更透明一些。 到了1 8 世纪,在欧洲和美国制造的产品中,纸水印已经变得相当实用了。 大约也是在这个时期,水印开始用于纸币和其他文件的防伪措施。到了1 8 世纪 末期,“水印 这个术语似乎已经形成,它可能起源于德国词汇w a s s e r m a r k e 。 这个术语其实是一个误称,因为在水印制造过程中,水并不是特别重要。可能 是因为水印有类似于水在纸上的效果,就形成了这个词。 在1 9 5 4 年,m u z a k 公司的埃米利希姆布鲁克为带有水印的音乐作品申请 了一项专利。在此例中,通过间歇地应用中心频率为l k h z 的窄带陷波滤波器, 认证码就被插入到音乐中。该频率上能量的缺失表征使用了陷波滤波器,而缺 失的持续时间通常被编码为点或长划,此认证码使用了莫尔斯电码。1 9 6 1 年美 国专利局这样描述了该项发明h 1 : “此发明使对音乐原作进行确证成为可能,从而制定出了一个防止盗版的 有效途径,这也可以比做纸币中的水印。 从此以后,人们对数字水印的兴趣猛增。1 9 9 6 年5 月3 0 日至6 月1r 在英国剑桥大学第一次j 下式召开了“国际信息隐藏学术研讨会 ( i n t e r n a t i o n a l i n f o r m a t i o nh i d i n gw o r k s h o p ) 隅1 ,标志着数字水印技术得到了全世界的公认与 瞩目,该会学术研讨会至今已经召开了多届。数字水印技术的研究得到了迅速 发展,许多大学、研究机构和公司已纷纷开展了这方面的研究,数字水印已成 为国际学术界的一个研究热点。 随着数字水印技术研究的不断深入,数字水印从研究对象涉及图像水印、 音频水印、文本水印、视频水印等方面,以图形、三维动画、数据库、软件等 为嵌入对象的水印技术也已有报道。 , 对音频水印技术的研究最早见于1 9 9 6 年,b e n d e r 等在文献阳1 中提出了 l s b 编码、回声编码、扩频编码和相位编码等四种算法;b o n e y 等将c o x 方案 应用到数字音频水印中,取得了很好的实验结果n 引。 与此同时,信息隐藏技术的理论和算法研究已引起了众多知名研究机构如 麻省理工学院的多媒体实验室、剑桥大学的多媒体实验室、i b m 数字实验室等的 极大重视。而实用化研究也已在进行之中,已有多家公司相继推出了在数字化 图像、音频和视频作品中嵌入鲁棒水印以进行版权保护的软件产品,如 b l u e s p i k e 公司的“g i o v a n n i 数字水印系统”,c o g n i c i t y 公司的“a u d i o k e y m p 3 水印系统 ,s i g n u mt e c h n o l o g i e s 公司的“s u r e s i g n 水印一等等1 。 随着技术信息交流的加快和水印技术的迅速发展,国内一些研究单位也已 逐步从技术跟踪转向深入系统研究,各大研究所和高校纷纷投入数字水印的研 究,其中比较有代表性的有哈尔滨工业大学的孙圣和、牛夏牧、陆哲明等,天 2 硕士学位论文 第一章绪论 津大学的张春田、苏育挺等,北京邮电大学的杨义先、钮心忻等,中国科学院 自动化研究所的刘瑞祯、谭铁牛等,他们是国内较早投入水印技术研究且取得 较好成绩的科研单位。我国于1 9 9 9 年1 2 月1 1 日,由北京电子技术应用研究所 组织,召开了第一届信息隐藏学术研讨会( c i h w ) ,至今已成功的举办了六届, 很大程度地推进了国内水印技术的研究与发展。同时,国家对信息安全产业的 健康发展也非常的重视,在2 0 0 3 年的科技型中小企业技术创新基金若干重点 项目指南中,明确指出了对于“数字产品产权保护( 基于数字水印、信息隐 藏、或者网络认证等先进技术) 和“个性化产品( 证件) 的防伪( 基于水印、 编码、或挑战应答等技术) 等多项防盗版和防伪技术予以重点支持。目前国内 学术界有一批有实力的科研机构己投入到这一领域的研究中来。现在国内已经 出现了一些生产水印产品的公司,其中比较有代表性的是由中科院自动化研究 所的刘瑞祯、谭铁牛等人于2 0 0 2 年在上海创办了的一家专门从事数字水印、多 媒体信息和网络安全、防伪技术等软硬件开发的公司一上海阿须数码技术有限公 司,公司现从事数字证件、数字印章、p d f 文本、分块离散图像、视频、网络安 全等多方面数字水印技术的研究,现在这家公司已申请了一项国际和三项国家 数字水印技术专利。虽然数字水印在国内的应用还处于初级阶段,但水印公司 的创办使得数字水印技术在国内不仅仅只停留在理论研究的层面上,而是从此 走上了实用化和商业化的道路,这样会更加推动国内水印技术的蓬勃发展,为 国内的信息安全产业提供有效的、安全的保障。 1 2 2 数字音频水印技术的研究方向 虽然国内外对音频水印的研究比较多,但大多数都处于算法设计和试验分 析的状态,设计的算法也存在或多或少的问题。目前这些算法的主要问题在于: l 、缺乏有效的同步技术,以至于嵌入的水印无法抵抗裁剪等攻击; 2 、嵌入信息量较低; 3 、一些算法不能达到盲检验; 4 、一些算法不能检测出音频信号是否被版权保护和篡改。 当前研究的音频水印大多是健壮的数字水印,而脆弱性数字水印是解决数 字媒体产品被盗版和篡改的一种有效的技术,可以进行深入的研究。对于实际 网络环境下的数字水印的应用,重点研究数字水印的网络快速自动验证技术, 这需要结合计算机网络技术和认证技术,减少音频水印的提取复杂性。寻找与 新一代压缩标准m p 3 、m p e g 、a c 一3 相适应的数字音频水印算法,使其具有满意 的数据嵌入量和鲁棒性,与此同时提高水印的抗同步攻击能力,这些对音频水 3 硕十学位论文第一章绪论 印技术的广泛应用具有重要的意义。 1 2 3 数字音频水印技术的发展前景 互联网的飞速发展和音频压缩技术的成熟使得对数字音频水印技术的需求 越来越迫切。虽然对有关静态图像水印及活动图像水印( 尤其是静态图像水印) 的研究取得了很大进展射,而有关数字音频水印的研究却显得相对滞后,其根 本原因在于人类听觉系统( h a s ) 比人类视觉系统( h v s ) 更加敏感“3 3 ,应该说当 前数字音频水印技术尚处于比较初级的阶段,还有许多技术层和协议层的问题 需要进一步解决。时域水印技术相对容易实现且计算量较小,但抵抗攻击的能 力较差。频域水印技术通常利用音频掩蔽效应和扩频技术的思想,具有较强抵 抗攻击的能力,但实现较复杂。基于内容的水印技术更加强调将水印信息嵌入 到音频信号的重要特征上,其与h a s 相结合代表了今后水印技术的发展方向。 对一维的音频信号来说,同步攻击引起的后果是极其严重的,需要给予特别的 注意。总而言之,到目前为止,还没有一种音频水印算法是完美和真正实用的。 虽然数字水印技术已取得诸多进展,但仍有许多挑战性的研究难题等待解决, 例如水印嵌入和检测的数学模型、可靠的水印恢复、水印容量估计、最佳水印 检测、信道编码在数字水印中的应用、错误概率的界限、攻击模型及反攻击、 大规模实验测试和比较、新的统计和感知模型、数字水印的新型应用、水印系 统安全性、时间空间域的同步问题等等。水印技术必须与密码学、多媒体技术、 通信理论、编码理论、心理声学、信号处理、模式识别等多个学科有效结合, 才能产生新的思路并实现可实际应用的水印系统。 1 3 研究内容与论文结构 数字水印技术的研究特点在于它横跨多媒体技术、模式识别、密码学、通 信等多个领域。与密码学类似,数字水印也是一个对抗性的研究领域。正因为 有水印攻击的存在,才有水印研究的不断深入。另外,为了实现数字水印的标 准化,必须对各种水印算法进行安全性测试。水印测试者既要熟悉水印算法也 要熟悉水印攻击算法,而且还要从水印算法的理论入手进行水印信息量和鲁棒 性的定量分析。 本文的结构如下: 第一章介绍了课题研究背景、数字音频水印的国内外研究现状、研究方向 以及发展前景; 第二章介绍了数字音频水印的一些基本知识,包括人耳听觉系统和声音信 4 硕士学位论文第一章绪论 号数字化以及数字水印的特性和要求、分类、原理、通用模型、评估标准和面 临的攻击; 第三章介绍了几种常见的时域和变换域音频水印算法:如最不重要算法、 离散余弦变换域算法、小波变换算法及其优缺点; 第四章给出了一种改进的基于小波变换的同步的数字音频水印的算法,将 同步信息嵌入到音频信号的时域,将水印信号嵌入到变换域,进行小波变换时, 修改小波的高频分量,以提高该算法的敏感性。 第五章通过实验分析了该改进算法的透明性、鲁棒性和敏感性,并与第三 章的小波算法和原始算法的实验结果进行了对比分析; 第六章是全文工作的总结以及下一步需要丌展的工作。 5 硕十学位论文 第二章数字音频水印技术 第二章数字音频水印技术 2 1 人耳听觉系统( h a s ) 人类的听觉能力,既有高能力的一面,也有无能为力的一面。所谓高能力 的一面是指,即使众多人以各种声音、方言、语调同时讲话,甚至其中一些人 讲话含糊不清,我们都能准确地听懂所要听的声音,这是人工智能无法模仿的, 而无能为力的一面是指,人耳对频率相近的声音无法区别,对时间间隔太短的 声音无法区别,对隐藏在强音后面的弱音无法区别。 下面从人类听觉系统和语音感知角度介绍一些主要概念n 钉: 人的听觉范围:正常人的听觉系统是极为灵敏的,正常人可听声音的频率 范围为0 0 1 6 1 6 k 1 4 z ,年轻人可听到2 0k h z 声音,而老年人可听到的最高频率 为1 0k h z 左右。正常人对频率固定的声音所能辨别的最小强度差值称为强度差 阈,一般用d b 表示。它与测量方法有关,也与测量频率有关。一般来说,人类 在正常频率范围内可感知的声音幅度大约在o 到1 2 0 d b 之间。 音调:人类分辨声音高低时,用音调来描述。对于频率低的声音,听起来 感觉它的音调“低”,而频率高的声音,昕起来感觉它的音调“高”。但是音调 与声音频率并不构成严格的正比关系,它还与声音的强度与波形有关。 掩蔽效应:当入耳听到两个强度不同的声音时,强的声音的频率成分会影 响人耳对弱的声音的频率成分的收听,这种现象叫做掩蔽效应。通常低音容易 掩蔽高音,而高音掩蔽低音较难。这种特性称为频域掩蔽,也称同时掩蔽。图2 一l 就是一个声强为6 0 d b 、频率为1 0 0 0 h z 纯音的掩蔽效应图。一个声强为6 0 d b 、 频率为1 0 0 0 h z 的纯音,另外还有一个1 l o o h z 的纯音,前者比后者高1 8 d b , 在这种情况下我们的听觉就只能感知到那个1 0 0 0 h z 的强音。如果有一个 1 0 0 0 h z 的纯音和一个声强比它低1 8 d b 的2 0 0 0 h 的纯音,那么我们的耳朵将 会同时听到这两个声音。要想让2 0 0 0 h 的纯音也听不到,则需要把它降到比 1 0 0 0 h z 的纯音低4 5 d b 。一般来说,弱纯音距离强纯音越近就越容易被掩蔽。另 一种掩蔽是噪音对单音的掩蔽。一个单音可以被以它为中心频率,具有一定频 带宽度的连续噪音所掩蔽。如果在这一频带内噪声功率等于该纯音的功率,这 时纯音处于刚能被听到的临界状态,即称这一带宽为临界带宽“引。 6 硕十学位论文 第二章数字音频水印技术 频率 图2 - 1 声强为6 0 d b 、频率为1 0 0 0 h z 纯音的掩蔽效应 2 2 声音信号数字化 声音进入计算机的第一步就是数字化,数字化实际上就是采样和量化。如 前所述,连续时间的离散化通过采样来实现,就是每隔相等的- d , 段时间采样 一次,这种采样称为均匀采样( u n i f o r ms a m p li n g ) ;连续幅度的离散化通过量 化( q u a n t i z a t i o n ) 来实现,就是把信号的强度划分成- - d , 段- - d , 段,如果幅度 的划分是等间隔的,就称为线性量化,否则就称为非线性量化。图2 2 表示了 声音数字化的概念。 图2 - 2 声音的采样和量化 声音信号的两个基本参数是频率和幅度n7 1 ,由于声音是连续性信号,不仅 时间上连续,而且幅度上也是连续的,而计算机只能处理时间上和幅度上都有 限的信号,也就是数字信号,这就要求必须对声音信号进行数字化:数字化实 际上就是采样和量化。在某些特定的时刻对信号进行测量叫做采样( s a m p l i n g ) 。 采样频率是指每秒钟需要采集多少个声音样本,采样频率的高低是根据奈奎斯 特理论和声音信号本身的最高频率决定的。奈奎斯特理论指出,采样频率不应 低于声音信号最高频率的两倍,这样就能把以数字表达的声音还原成原来的声 7 毗明u m 毗毗m n 毗 叭毗呻帅帅加加加n u 硕+ 学位论文 第二章数字音频水印技术 音,这叫做无损数字化( 1 0 s s l e s sd i g i t i z a t i o n ) 。采样定律用公式表示为: z 2 厶或者乃正;。2( 2 1 ) 其中,五为采样频率、名。为被采样信号的最高频率、无为采样周期、死。为 最小采样周期。可以这样来理解奈奎斯特理论:声音信号可以看成由许许多多 正弦波组成的,一个振幅为a 、频率为厂的正弦波至少需要两个采样样本表示, 因此,如果一个信号中的最高频率为名,采样频率最低要选择2 乙。 量化位数又称为量化精度,量化分辨率,采样后进行a d 转化时的参数, 它是用每个声音样本的位数b i t s ( 即b p s ) 表示的,它反映度量声音波形幅度的 精度。例如,每个声音样本用1 6 位( 2 字节) 表示,测得的声音样本值是在o 6 5 5 3 6 的范围内,它的精度就是输入信号的1 6 5 5 3 6 。样本位数的大小影响到声 音的质量,位数越多,声音的质量越高,而需要的存储空间也越多;位数越少, 声音的质量越低,需要的存储空问越少。 2 3 数字音频水印概述 数字音频水印是指通过一定的算法嵌入到数字音频产品中的、用于版权保 护或内容检验的一些标志性信息。这些信息可以是作者的序列号、公司标志或 有特殊意义的文本等,它可以用来识别音频产品的原作者、发行者以及合法使 用者对数字音频产品的所有权。它不会影响原始音频产品的使用价值,并且不 会被人感知。由于水印信息与音频数据紧密结合在一起,并且隐藏在其中,所 以经得起一些破坏而保存下来。r 由于数字音频信号在人们生活中的普遍性,特别是近年来m p 3 应用的同益 广泛,使得工业界对音频作品的版权保护有越来越迫切的需要,研究音频水印 的重要性也不言而喻。用水印技术实现知识产权的保护,包括所有权的证明、 访问控制、追踪非法拷贝等。表2 一l 就是不同应用对水印系统的要求引。 表2 - 1 不同应用对于水印系统的要求 特性数据传输广播法律证据访问控制 声音质量必须高必须高应当高 嵌入域比特流p c 矗比特流r c i比特留;乏r l 1 健壮性 可以适中必须高应当高 嵌入器复杂度 可以高 应当低 可以高 提取器复杂度 应当低 可以高可以低 水印数据率应当适中或高必须低必须低 检测模式盲检测非盲检测盲检测 8 硕+ 学位论文 第二章数字音频水印技术 2 3 1 音频水印的特性 与图像水印技术相比,在数字音频信号中嵌入水印的技术难度较大,这主 要是因为人类听觉系统与视觉系统相比,具有更高的灵敏度。在音频文件中嵌 入水印的各种方法一般都要利用人类听觉系统的某些特性,即人的听觉生理一心 理特性钉。音频水印的主要特性如下: ( 1 ) 音频信号在每个时间间隔内采样的点数要少得多,这意味着音频信号 中可嵌入的信息量要比可视媒体少得多; ( 2 ) 人耳听觉系统( h a s ) 要比人眼视觉系统( h v s ) 灵敏得多,因此听觉 上的不可感知性实现起来要比视觉上困难得多,同时也必须充分利用h a s 特性, 对于水印的预处理也相对复杂; ( 3 ) 音频信号的持续时间一般都比较长,在许多情况下,无法像图像水印 那样得到完整的图像后再进行水印的嵌入和检测。此外由于语音信号是时间轴 上的函数,剪裁等攻击会引起同步错误,因此,嵌入的水印应该具有较高的可 保持性; ( 4 ) 由于音频信号一般都比较大,所以提取时不能需要原始音频信号; ( 5 ) 音频信号有特殊的攻击,如回声、时间缩放等。 由于音频水印有以上特性,所以对数字音频水印系统的要求主要包括感知 透明性、鲁棒性、安全性以及对载荷容量、复杂度、误码率等方面的要求泌矧, 其主要要求如下: ( 1 ) 感知上透明、听不见 对于音频信号而言,水印就是一种额外的噪声。在数字音频水印系统中, 最重要的一点是水印的感知透明性,就是嵌入的水印不能明显地改变声音信号 的质量。当然,这里所说的听不见与目标声音的质量、特定的应用密切相关。 对调幅广播声音“听不见的要求就比对声音“听不见 的要求低一些,后者 要求即使很灵敏的耳朵也感觉不到水印的存在。在设计数字音频水印系统时, 必须考虑人耳听觉系统和掩蔽效应的影响。 ( 2 ) 鲁棒性、抗御损害的能力 在许多应用中,鲁棒性也极为重要。这里所说的鲁棒性是指水印不受包括 有损压缩、滤波、重采样、重量化、加性噪声、削波、按比例缩放、数模和模 数转换等常用信号处理技术的影响,未经授权的人很难除去或者根本去不掉水 印。换言之,盗版者在去掉水印的同时将严重损害声音信号的质量。对同一音 频内容的多个拷贝进行的任何组合操作,不能破坏水印或者产生另一个与原先 水印不同的第三方有效水印。水印的检测结果必须能够明确地识别音频内容的 9 硕十学位论文 第二章数字音频水印技术 所有权,对于水印的检测,音频信号相当于一个干扰源。 ( 3 ) 水印的数据率 所谓数据率是指每秒位( b i t ) 数,它与信息在计算机中实时传输的过程有直 接关系,而其总数据量又与计算机的存储空间有直接关系。因此,数据率是计 算机处理时要掌握的基本技术参数。水印引起的额外比特开销必须足够小,当 然这是相对于应用本身的比特率而言的。水印的数据率取决于具体的实现技术、 参数的选择,在某种程度上也取决于作为水印载体的音频素材的类型。 ( 4 ) 处理域 水印系统的应用非常广泛,在不同应用中,输入和输出信号的格式是不同 的,可能是压缩的,也可能是未压缩的。 ( 5 ) 互操作性 出于一致性的考虑,通常要求不管嵌入时采用哪种水印方案,都要确保采 用统一的水印提取器检索嵌入的水印信息。为了实现互操作性,不同方案的水 印信号表示方式必须相同。 ( 6 ) 复杂度 在实际应用中,通常对水印嵌入和提取过程的复杂度比较关心,要求能够 实时实现。复杂度与具体的应用密切相关,在水印的复杂度与其它系统要求之 间存在着不同的权衡。比如,在水印嵌入过程中存在着复杂度与可觉察性之间 的权衡,在水印提取过程中存在着复杂度与可靠性之间的权衡。 ( 7 ) 盲水印检测 所谓盲水印检测是指不依赖于未嵌入水印的原始音频信号的帮助,从嵌入 水印的音频信号中直接恢复水印信号。音频信号的干扰作用,通常会增加检测 的难度。如果能够同时得到嵌入水印的音频信号和原始音频信号,必然可以极 大地提高检测算法的性能。 ( 8 ) 多重水印 在某些应用中,应当允许在信号中加入多重水印。允许多重水印共存,使 得流通过程中的每一个环节都可以嵌入自己的授权信息,方便了对音频内容使 用情况的跟踪。 。 在所有这些要求中,最突出的问题是听觉上的不可感知性、鲁棒性和数据 率之间的矛盾。三者之间构成一个三角权衡关系。如图2 3 所示,举例来说, 在提高水印系统数据率的同时通常会损害鲁棒性,而鲁棒性的降低往往又会降 低声音质量的不可感知性。类似地,一个完全不可觉察的数字音频水印系统永 远也达不到一个感知上能觉察水印存在的数字音数字声频水印系统所能达到的 鲁棒性。每一个具体的应用都必须在三角形中找到一个恰当的切入点。一个好 1 0 硕+ 学位论文 第二章数字音频水印技术 的数字音频水印系统总是能够最大限度地协调这些彼此互相矛盾的要求。 镑籍蚀 数榭攀不霹感知饺 图2 - 3 听觉上的不可感知性、鲁棒性和数据率之间的权衡 2 3 2 音频数字水印的分类 目前,数字音频水印的分类方法多种多样。 根据含水印音频信号中的水印是否可感知,可把水印分为可感知水印和不 可感知水印两大类。目前国内外学者的研究焦点都集中在不可感知数字水印技 术方面。 , 根据水印音频信号的抗攻击能力即鲁棒性,可分为脆弱性水印和鲁棒性水 印乜引,其中脆弱性水印又分为易碎水印和半易碎水印。易碎水印对任何处理都 非常敏感;易碎水印对特定的处理方法有鲁棒性而对其他的处理方法无鲁棒性; 鲁棒水印对常见的信号处理方法都具有鲁棒性。 根据水印检测和提取是否需要原始音频信号的参与,可分为私有水印和公 有水印( 也称盲水印) 。私有水印的检测需要原始信号的参与,而公有水印的检 测则不需要原始信号的参与。 根据水印载体类型,可以把语音水印分为基于原始音频和基于压缩音频两 种。基于原始音频方法是在未经过编码压缩的音频信号中直接嵌入水印;基于 压缩音频方法,又称比特流水印,是把水印嵌在经压缩编码的音频信号中,输 出的是含水印的压缩音频编码的音频信号。其优点是无需进行输入比特流的解 码和再编码过程,对音频信号的影响较小。 根据水印加载方式的不同,音频数字水印可以分为两类:时间域数字水印和 变换域数字水印。大多数时间域水印算法可以提供简捷有效的水印嵌入方案, 且具有较大的信息嵌入量,但对语音信号处理的鲁棒性较低;变换域水印算法 则是具有较强的抵抗信号处理和恶意攻击的能力,但其嵌入与提取过程相对复 杂。 硕十学位论文第二章数字音频水印技术 2 3 3 数字音频水印算法的通用模型 数字音频水印技术就是在不影响原始音频质量的条件下向其中嵌入具有特 定意义且易于提取的信息的过程。根据应用目的不同,被嵌入的信息可以是版 权标识符、作品序列号、文字( 如艺术家和歌曲的名字) ,甚至是一个小的图像 或一小段音频等。水印与原始音频数据紧密结合并隐藏在其中通常是不可听到 的,而且能够抵抗一般音频信号处理和盗版者的某些恶意攻击。它主要利用了 音频数据的冗余信息和人耳的听觉特性来实现水印的嵌入和检测。 通常的数字音频水印算法包含两方面的内容:水印的嵌入和水印的提取。在 图2 4 中给出了一般的数字音频水印处理系统基本框架的示意图。其各部分表 示的内容如下: ( 1 ) x 为原始音频信号,是水印的嵌入载体; ( 2 ) 形为要嵌入在音频信号中、为音频信号提供版权保护的数字水印; ( 3 ) 瓦表示将水印嵌入到音频信号中的嵌入算法: k = e ,缈) ( 2 2 ) j 。代表含水印音频信号; ( 4 ) 4 表示对含水印音频信号置,的攻击算法: = 4 ( x ,) ( 2 3 ) e 表示受攻击后的含水印音频信号; ( 5 ) 表示水印提取算法: w = 巨( x :) ( 2 - 4 ) 7 为提取的水印。 加水印的过程是将含有版权或其它相关信息的水印以某种方式嵌入原始 音频文件x ,并且原始音频及水印可以被提取出来。从图2 - 4 可看到,原始音 频与水印相结合,产生加入水印的音频文件。提取时分非盲水印和盲水印的提 取过程,即水印的提取是否需要用到原始音频文件。非盲水印提取是通过加了 水印的音频文件和原始音频文件相比较,提取到数字水印形,从而与原始水印 矽相比较。盲水印是不需要原始音频文件,直接将含有水印的音频文件通过水 印提取算法,从而得到水印。一般说来,非盲水印的稳健性较强,但由于非 盲水印、半盲水印需要原始音频数据、原始水印等来提取水印,所以在用途、 性能上会有一定的限制。目前,学术界研究的水印大多是半盲水印或者盲水印。 理论上,一个成功的数字音频水印算法需要具备以下一些性质瞳引: ( 1 ) 水印必须嵌入到宿主音频数据中,而不能存储于文件头或单独的文件, 否则可以很轻易地被除去或改变。 1 2 硕士学位论文第二章数字音频水印技术 ( a ) 水印嵌入过程 l 受攻击后含水印 一水器算 - 叫7 9 e p w l 音频信号x 霄 ( b ) 水印提取过程 ” 图2 - 4 数字音频水印处理系统框架 ( 2 ) 水印不应对原始音频的声音质量产生可听到的失真,即应具有透明性。 ( 3 ) 水印必须具有一定的稳健性,能抵抗宿主音频信号上的压缩、滤波、 重采样、重量化、剪切、加噪声等一般信号处理。 ( 4 ) 水印应易于提取,嵌入和检测的计算量要低,以方便其集成到一般电 子产品中。 ( 5 ) 水印算法必须具备某种同步机制,以对抗时间域上的同步攻击。 ( 6 ) 原则上水印的检测不应需要原始音频,即盲检测,因为寻找原始音频 是十分困难的。 ( 7 ) 水印算法应该公开,安全性最好依赖于密钥而不是算法的秘密性。 设计一个音频水印系统要使以上所有目标都达到最优很困难,有些性质如 鲁棒性、透明性之间就是互相冲突的。水印系统试图平衡这些要求,尽量使每 一个都得到足够的满足。 2 3 4 音频水印系统的评估标准 语音水印性能的评价指标主要有鲁棒性和透明性。在算法中如果将嵌入强 度无限下降,当然可以获得非常好的透明性,但这些做的结果往往是降低了系 统的鲁棒性,以至于在接收端无法正常解码。因此,必须在透明性和鲁棒性之 间寻找适当的平衡点。 1 3 硕士学位论文第二章数字音频水印技术 ( 1 ) 人耳的主观评价测试 向听音者提供三个信号:第一个是作为参照的原始信号,听音者知道它是 原始信号,余下两个可能是原始信号,也可能是受攻击信号,对听音者是盲的。 听音者对余下两个信号进行打分,分值为1 0 5 0 ,分别代表从非常差到感知 不到改变的音质,这种方法称为主观平均判分法( m e a no o i n i o ns c o r e ,m o s ) 所得的分数称为m o s 值汹1 ,由于该测试因受人的主观因素影响较大,适合于作 定性分析的场合。 ( 2 ) 信噪比( s n r ) 评价水印嵌入后原始音频信号的被影响程度,除了利用人耳定性的评价以 外,还可采用定量的评价标准。对含水印的音频信号进行定量评价的标准 信噪比( s n r ) 嚣1 定义:设为音频数据段长度,毛为原始音频采样数据,毫为 嵌入水印后的音频采样数据,则 i s n r = 1 0 l g ( 2 - 5 ) d l n - i 1 n - 1 1 n - ! 其中一2 专委( x i - ) 2 ,孑5 专委毛,d 2 专善( _ 一毫d 此外,还有水印算法采用峰值信噪比( p s n r ,p o w e rs i g n a l t o - n o i s e r a t i o n ) 对信号失真量进行定量评价嘲。 ( 3 ) 归一化相关系数 如果在音频信号中嵌入的水印为图像,则为定量的评价提取的水印与原始 水印的相似性,采用归一化相关系数( n c ) 作为评价标准啪棚1 ,其定义为 n c ( w ,w ) = m 、m , 毡 艺w ( f ,) ( ) f = lj = i 式中,形为原始水印,为提取的水印,大小为m 。x m :。 ( 4 ) 相似度 相似度在音频水印中也被应用于水印评价嘲棚1 。相似度的定义如下: 彬形 一 m w ,们2 莎i 丽i么一”f , i ( 5 ) 误码率 误码率( b e r ,b i te r r o rr a t e ) 在水印评价中也有应用阳崩1 , 1 4 ( 2 - 6 ) ( 2 - 7 ) 其定义如下: 硕十学位论文 第二章数字音频水印技术 脚= 鬻圳。 8 , ( 6 ) 音频处理软件 在数字音频水印中,有些音频处理软件也可用于水印的评价、检测,如c o o l e d i tp r o ,不但可以同时直观地观察嵌入水印前后音频信号的波形对比,还可 以对指定采样点的波形进行放大、缩小以及添加白噪声、蓝噪声等。 在评价水印系统时,如果是对水印的一些特殊应用感兴趣,那么所使用的 评价标准还必须基于这些应用。通常对于一个实用的数字音频水印系统,最主 要的评价指标首先就是重建声音信号的质量和水印数据的误码率,其次才是水 印数据的比特率和所增加的计算量m 埘1 。 2 3 5 语音水印的攻击 水印系统对安全性的要求在很多应用中有着很大的不同,在一些应用中, 因为根本没有必要去篡改或阻止水印实现其预期目标,所以也就不需要水印具 有安全对抗任何形式的恶意攻击的能力,尽管它对于一般性的常规处理仍然需 要具有鲁棒性。 通常,对安全性没有要求的那些应用必须要抵御一些完全不同种类的攻击。 有些时候,要求的安全性类型甚至由于同一应用的实现不同而不同。例如,拷 贝控制系统可以使用水印来鉴别那些不允许被拷贝的版权产品,这样的水印应 能够安全对抗未经授权的去除。 任何可能减弱水印性能的操作都被称为“攻击”。一般而言,数字音频水印 系统的攻击分为:水印去除攻击、去同步攻击、嵌入攻击和检测攻击四类啪1 。语 音水印系统可能会遇到的攻击方式主要有如下几种嘲: ( 1 ) 噪声攻击 噪声攻击是很多语音水印系统需要面对的攻击方式,绝大多数系统中的噪 声都可以简化为高斯白噪声。抵抗噪声的性能是语音水印系统鲁棒性的最基本 要求。 ( 2 ) 滤波攻击 滤波操作是音频信号处理中常见的操作。例如,音频信号在进行a d 转换之 前往往需要经过一个滤波操作,滤波带除去没有用的信号干扰。因此,抵抗滤 波攻击也是语音水印算法必要的特性。通常的滤波操作有低通道滤波、带通滤 波和高通滤波。滤波器类型包括有限冲击响应滤波器( f i r ) 和无限冲击滤波器 ( i i r ) 两种,前者的相位是线性的,后者的相位是非线性的。 1 5 硕士学位论文第二章数字音频水印技术 ( 3 ) 中值滤波 中值滤波是语音处理中常见的操作,用来消除语音信号中的毛刺。常见的 有三点中值滤波操作,即每三个采样点做一次处理,方法为将中间采样点的赋 值为前后两个点的中值。 ( 4 ) 频率翻转 这种攻击是指将音频信号的频谱做翻转。 ( 5 ) 重采样和重量化攻击 重采样攻击是指对语音信号的采样率进行变换攻击,典型的操作是将音频 信号的采样率从4 4 1 k h z 下变频到2 2 0 5 k h z 等操作。对音频信号进行实际a d 变换也是重采样攻击的一种方式。重量化攻击是指改变语音信号采样精度的攻 击,如从每样点1 6 b i t 改为8 b i t 。 ( 6 ) 音频编码攻击 在携带语音的传输过程中,可能会遇到各种音频压缩处理。如在通过g s m 信道即会遇到r p e l t p 编码,在v o i p 上传输会遇到6 7 2 3 编码,编码方式多种 多样,有的是波形编码,有的是线性预测编码,其特性也不相同,很难设计
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 泸州市重点中学2026届高三化学第一学期期末达标检测试题含解析
- 情景交际公开课课件
- 人教版 2024 版历史八年级上册第二单元《早期现代化的初步探索和民族危机加剧》测试卷(附答案)
- 学校常态化疫情防控方案
- 恒丰银行反洗钱培训课件
- 小学语文第一单元的复习方案
- 2026届安徽省滁州西城区中学高一化学第一学期期末经典试题含解析
- 宣化叉车实操考试试题及答案
- 新安化工考试试题及答案
- 无领导面试题及答案
- 双方签定协议书
- 2024-2025学年八年级数学下册期末培优卷(北师大版)含答案
- 2025福建福州市鼓楼区国有资产投资发展集团有限公司副总经理公开招聘1人笔试参考题库附带答案详解(10套)
- 2025年12345热线考试题库
- 多余物控制管理办法
- 2025年卫生健康行业经济管理领军人才试题
- 河南省洛阳市2024-2025学年高一下学期期末质量检测物理试卷
- 雅思介绍课件
- 《电商直播运营》教案-任务1 直播平台与岗位认知
- 反邪教宣讲课件
- 2025年重庆市高考物理试卷(含答案解析)
评论
0/150
提交评论