已阅读5页,还剩53页未读, 继续免费阅读
(计算机应用技术专业论文)基于对象传播神经网络的音频水印算法研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及 取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论 文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得重庭 整电太堂或其他教育机构的学位或证书而使用过的材料。与我一同工作 的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢 意。 学位论文作者签名 载红为 签字日期: 渊印 1 年箩月仇日 学位论文版权使用授权书 本学位论文作者完全了解重鏖邮电太堂有关保留、使用学位论 文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘, 允许论文被查阅和借阅。本人授权重庞邮电太堂可以将学位论文的 全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等 复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名 导师签名:争知 签字日期一伪气私? 川签字日期i1 ”胪咱 重庆邮电大学硕士论文 摘要 摘要 随着计算机网络和多媒体技术的飞速发展,多媒体数据逐渐成为人们 获取信息的重要来源,并成为人们生活的重要组成部分。然而当前数字信 号处理和计算机网络传输技术的迅猛发展却使数据的版权保护面临严峻 的挑战。因而,如何在开放的网路环境下对数字作品实施有效的版权保护 己成为国际上研究的热门话题。数字水印技术是解决数字媒体版权保护问 题的有效办法,它的基本思想是在数字图像、音频或视频中嵌入信息,以 便保护数字产品的版权、证明产品的真实可靠性、跟踪盗版行为或者提供 产品相关信息。近年来,图像水印发展很快,相关算法也较成熟,而针对 音频水印的算法还不是很多,音频数字水印技术正逐渐成为数字水印的研 究热点之一。 随机剪切( r a n d o mc r o p p i n g ) 、抖动攻击( j i t t e r i n g ) 、保持音调不变的时 间缩放( t i m es c a l em o d i f i c a t i o n ,t s m ) 是数字音频水印技术中十分典型的 几种时间域同步攻击方法。与m p 3 音频压缩、低通滤波等常规的音频信号 处理攻击相比,同步攻击更加难以抵抗,已经成为研究界的一个公开难题。 在本论文中我们提出了一种基于对象传播神经网络( c o u n t e rp r o p a g a t i o n n e u r a ln e t w o r k c p n ) 的音频水印算法,其主要目的是对各种同步攻击进 行高强度的抵抗。算法基于恒定水印的思想,在离散小波域寻找在各种音 频信号处理和同步攻击下都能保持基本稳定的物理量用于水印的嵌入和 检测。利用c p n 容错性、自适应学习和非线性逼近等优点,将具有较强稳 定性的小波低频系数方差作为其输入,利用其学习算法,建立音频特征和 水印信号的对应关系,水印在不需要修改音频信号情况下被“嵌入 到原 始音频信号中,具有很高的不可感知性。通过自适应的改变分段长度,减 小小波低频系数方差由于t s m 攻击等同步攻击而产生的误差。仿真实验 结果表明,算法对常规音频信号处理和t s m 等同步攻击具有很强的鲁棒 性。 关键词:数字音频水印,恒定水印,对象传播神经网络,离散小波变换,时 间缩放,小波低频系数方差 重庆邮电大学硕士论文abs的ct a b s t r a c t t h ed i g i t a lm e d i ah a sb e c o m eam a i nw a yf o ri n f o n n a t i o nc o m m u n i c a t i o n a l o n g w i t ht h er a p i dd e v e l o p m e n to fd i g i t a lt e c h n o l o g ya n dc o m p u t e r n e t w o r k s h o w e v e r t h e c u r r e n t l yr a p i dd e v e l o p m e n to fd i g i t a ls i g n a l p r o c e s s i n ga n di n t e r n e tt r a n s m i s s i o nt e c h n i q u e sh a st h r e a t e n e dt h ec o p y r i g h t o fd i g i t a ld a t as e v e r e l y t h e r e f o r eh o wt oe f f e c t i v e l yp r o t e c tt h ec o p y r i g h to f d i g i t a lp r o d u c t si na no p e nn e t w o r ke n v i r o n m e n tb e c o m e s a na t t r a c t i v et o p i c d i g i t a lw a t e r m a r k i n gt e c h n i q u e i st h em o s te f f e c t i v em e t h o dt os o l v e c o p y r i 曲to w n e r s h i p ,i 够b a s i ci d e ai s e m b e di n f o m a t i o ni n t ot h ed i g i t a l i m a g e s ,a u d i oo rv i d e o ,i no r d e rt op r o t e c tt h ec o p y r i g h to fd i g i t a lp r o d u c t s a n dp r o v et h a tt h et r u er e l i a l b i l i t yo fp r o d u c t s ,t r a c k i n gp i r a c yo rt h ep r o v i s i o n o fp r o d u c t r e l a t e di n f o m a t i o n i nr e c e n t y e a r s ,i m a g ew a t e r m a r k i n gh a s d e v e l o p e dv e r yr a p i d l y ;m o r es o p h i s t i c a t e da l g o r i t h m s , a n da l g o r i t h m sf o r a u d i ow a t e m a r k i n gi sn o tm u c h ,肌d i od i g i t a lw a t e m a r k i n gt e c h n o l o g yi s g r a d u a l l yb e c o m i n go n eo ft h er e s e a r c hh o t s p o t so nd i g i t a lw a t e r m a r k i n g r a n d o mc r o p p i n g ( i n c l u d i n gj i t t e r i n g ) a n dt i m e - s c a l em o d i f i c a t i o n ( t s m ) a r e v e r yt y p i c a l a n d c h a l l e n g i n gs y n c h r o n i z a t i o n a t t a c k st oa u d i o w a t e m a r k i n gt e c h n i q u e s c o m p a r e dw i t hc o m m o na u d i os i g n a lp r o c e s s i n g a t t a c k ss u c ha sm p 3c o m p r e s s i o n ,l o w - p a s sf i l t e r i n ge t c ,t h e ya r em o r e d i f n c u l tt om a n a g e t os o l v et h e s eo p e np r o b l e m s ,an o v e lc p n b a s e da u d i o w a t e m a r k i n ga l g o r i t h mi sp r o p o s e d t h ea l g o r i t h mi sa i m i n ga tf i n d i n gs o m e p h y s i c a lv a l u e s o nt h ed i s c r e t ew a v e l e tt r a n s f o r m a t i o nd o m a i na c t i n g a s “i n v a r i a n tw a t e m a r k ”,w h i c hs h o u l db er a t h e rs t a b l eu n d e fc o m m o na u d i o s i g n a lp r o c e s s i n ga n ds y n c h r o n i z a t i o na t t a c k s u t i l i z i n gt h e c p n sa d v a n t a g e s o ff a u l tt o l e r a n c e ,s e l f - a d a p t i v el e a r n i n ga n dn o n l i n e a ra p p r o x i m a t i o n ,t h e r e l a t i o n s h i pb e t w e e nt h ei m p o r t a n tc h a r a c t e r so fa u d i 0s i g n a l sa n de m b e d d e d w a t e m a r kw a sl e a r n e db yu s i n gt h ev a r i a n c eo fl o wf r e q u e n c yw a v e l e t c o e m c i e n t sw i t hs t r o n gs t a b i l i t ya st h ei n p u to fc p n ,a n dw a t e r m a r kw a s e m b e d d e di n t oo r i g i n a la u d i os i g n a l sw i t h o u tm o d i f y i n gt h ed a t ao fa u d i o ,s o t h ea u d i oh a sh i g hi m p e r c e p t i b i l i t y t h r o u g ha d a p t i v ec h a n g et h el e n g t ho f s e g m e n tt or e d u c et h ee r r o ro fv a r i a n c eo fl o wf r e q u e n c yw a v e l e tc o e f f i c i e n t s w h i c hh a se n g e n d e rb yt s ma t t a c k e x p e r i m e n t a lr e s u l t ss h o wt h a tt h e i i 重庆邮电大学硕士论文 a b s t 聪l c t a l g o r i t h m i s v e r y r o b u s tt oc o n l m o na u d i o s i g n a lp r o c e s s i n g a n d s y n c h r o n i z a t i o na t t a c k s ,s u c ha st s m k e yw o r d s :d i g i t a l a u d i ow a t e m a r k i n g ,i n v a r i a n t w a t e r m a r k , c o u n t e r p r o p a g a t i o n n e u r a l n e t w o r k , d i s c r e t ew a v e l e t t r a n s f o m , t i m es c a l e m o d i f i c a t i o n ,v a r i a n c eo fl o wf r e q u e n c yw a v e l e tc o e m c i e n t s i i i 重庆邮电大学硕士论文目录 目录 摘要i a b s t r a c t i i 第一章绪论o 1 1 1 选题背景1 1 2 研究现状2 1 3 主要研究工作一4 1 4 论文结构5 第二章数字音频水印技术6 2 1 数字音频水印技术的基本原理6 2 2 人类听觉特性8 2 3 数字音频水印算法概述9 2 4 数字音频水印算法的评价标准1 3 2 5 数字音频水印的攻击及对策1 6 2 5 1 数字音频水印的常见攻击一1 6 2 5 2 同步攻击的解决方案:1 7 2 6 小结18 第三章基于对象传播神经网络的抗t s m 音频水印算法l9 3 1 基于小波域统计特征的稳定水印1 9 3 1 1 离散小波变换1 9 3 1 2 小波域统计特征的提取2 0 3 1 3 恒定水印2 0 3 2c p n 算法2 1 3 3t s m 攻击及对策2 4 3 4 水印的嵌入和检测一2 5 3 4 1 嵌入算法2 6 3 4 2 盲水印检测2 7 3 5 小结2 7 第四章仿真实验与数据分析2 9 4 1 实验环境与数据准备2 9 4 2 特征提取实验结果2 9 4 3 鲁棒性测试31 4 4 小结3 8 重庆邮电大学硕士论文目录 第五章总结及未来工作3 9 5 1 结论3 9 5 2 进一步的工作3 9 附录as t i m a r kf o ra u d i o 文档:4 1 致谢4 6 攻读硕士学位期间发表及录用的论文4 7 参考文献4 8 v 重庆邮电大学硕十论文第一章绪论 1 1 选题背景 第一章绪论 多媒体技术与i n t e r n e t 技术的飞速发展,使彼此间的距离无形中大大地 缩短了,随着网络的日益普及,多媒体信息的交流达到了前所未有的深度 和广度,其发布形式愈加丰富了。各种形式的多媒体作品包括音频、视频、 动画、图像等等纷纷以网络的形式发布甚至个人也可以借助普通的个人计 算机,通过电话线路和网络,就可以方便、迅速地将自己丰富多彩的多媒 体数字作品放在网络上,供全世界欣赏。传统的图书馆和博物馆同样可以 经过数字化等工作把书籍、艺术品等以多媒体数字作品的形式传达到世界 的每一个角落。国际互联网逐渐普及的副作用也十分明显:作品侵权更加容 易、篡改更加方便。任何人都可以借助一台普通的个人计算机和一根电话 线,通过网络轻易取得他人的原创作品,尤其是数字化图像、音乐、电影 等等,甚至不经过作者的同意而任意复制、修改,从而侵害了创作者的著 作权。因此多媒体信息版权保护问题成了一项重要而紧迫的研究课题【l 】。 现有的一些先进技术已被用于防止非法盗版,例如密码技术,但仅靠密码 技术并不能完全解决这一问题,因为密钥加密只能在数据的传输过程中对 数据进行保护,一旦数据被接收并进行解密后,产品将不再受到保护【2 】。 数字水印技术被认为是解决版权问题的有效方式【3 】,也是多媒体信息 安全研究领域中的重要分支。它充分利用人类视觉和听觉系统的冗余,嵌 入与版权所有者相关的秘密信息,以证实信息的版权归属。从应用范围上, 可把水印分为静态图像水印、图像序列水印和音频水印【4 】。当前,对静态 图像水印和图像序列水印( 尤其是静态图像水印) 的研究很多,而对于音频 水印的研究却鲜有报道。但随着m p 3 、m p e g 、a c 3 等新一代压缩标准的 广泛应用,对音频数据产品的保护就显得越来越重要。 随着音频素材在互联网上的指数级增加,数字音频水印技术有着广泛 的应用前景。一方面,可以用音频水印技术实现数字音频作品版权的保护 和认证,这是水印技术最主要的应用【5 】。它的目的是通过嵌入数据的来源 信息以及比较有代表性的版权所有者信息,从而防止其它团体对该数据宣 称拥有版权。这样水印就可以用来公正地解决所有权问题:另一方面可以 用于音频作品的盗版跟踪,它的目的是传输合法接收者的信息而不是数据 重庆邮电大学硕士论文第一章绪论 来源者的信息,主要用来识别数据的单个发行拷贝。这一类应用在发行的 每个拷贝中嵌入不同的水印,通常称之为“数字指纹 ;还可以用于拷贝 保护,这就要求在音频作品发行体系中存在一个拷贝保护机制,即它不允 许未授权的媒体拷贝。在开放系统中很难实现拷贝保护,然而在封闭或私 有系统中,可以用水印来说明数据的拷贝情况,因此拷贝保护是可行的。 另外,在广播领域中可以用水印技术执行自动的任务,比如广播站或节目 类型的标识、广告效果的统计分析、广播覆盖范围的分析研究等:在国防 和军事领域中可以用于隐蔽通信,以实现秘密信息的传递。因此,对数字 音频水印处理算法的研究,不仅具有现实的学术意义,而且具有长远的经 济效益和社会效益。 1 2 研究现状 数字水印技术是近几年在学术界兴起的一个前沿研究领域,因其自己 自身在数字信号处理及应用领域的优势,受到了广泛的关注并得到了蓬勃 的发展。从公开发表的文献看,国际上在数字水印方面的研究刚开始不久, 但由于有大公司的介入和美国军方及财政部的支持,该技术研究的发展速 度非常快。1 9 9 8 年以来,许多国际重要期刊都组织了数字水印的技术专刊 或专题新闻报告。 数字水印技术作为信息隐藏学的重要分支【6 】,吸引了大量研究人员的 注意力。学术界和工业界对水印技术的关注程度都很高。在1 9 9 4 年的i e e e 国际图像处理会议( i c i p 9 4 ) ,r g v a ns c h y n d e l 等人第一次明确提出了“数 字水印”的概念,从此掀起了现代信息隐藏技术研究的高潮。仅仅过了两 年,在i c i p 9 6 上,已经出现了以信息隐藏领域中的水印技术、版权保护 ( c o p y r i 曲tp r o t e c t i o n ) 和多媒体服务的存取控制( a c c e s sc o n t r o l o f m u l t i m e d i as e r v i c e s ) 为主要内容的研讨专题同年在英国剑桥召开了第一 届信息隐藏国际研讨会( f i r s ti n t e m a t i o n a lw o r k s h o po ni n f o r m a t i o n h i d i n g ) ,内容涉及数据隐藏、保密通信、密码学等相关学科领域。在美国, 许多著名大学和大公司的研究机构,如麻省理工学院的多媒体实验室、明 尼苏达大学、普林斯顿吉林大学博士学位论文大学、南加州大学等,以及 n e c 研究所、i b m 研究所等,都一直在致力于信息隐藏技术方面的研究, 并已取得了大量研究成果。与此同时,大量的数字水印应用软件也应运而 生,美国d i 百m a r c 公司于1 9 9 5 年就推出了有专利权的水印制作技术,是 2 重庆邮电大学硕士论文 第一章绪论 世界上唯一一家拥有这一技术的公司,并在p h o t o s h o p 4 o 和c o r e d r a w 7 o 中得到了应用,但是用其做出来的水印尚不够健壮。1 9 9 7 年1 月该公司又 推出独立的水印阅读软件r e a d m a r c ,利用它可以发现图像中是否含有水印 及其内容,但效果仍不太理想,此外英国、日本等也相继在9 0 年代初期 开始了对这项技术的研究,虽然也没有完美的产品问世,但对数字水印技 术的发展还是起到了巨大的推动作用。欧洲共同体资助的几个研究计划以 开发实用的数字水印技术为目标来开展研究活动。t a l i s m a n 打算提供欧 洲联合服务,它用一个标准的版权机制来保护数字产品,使其避免大规模 的商业盗版和非法拷贝。t a l i s m a n 所期望的成果是得到一个通过数字标 记和数字水印来保护视频序列的系统。o c t a l i s 是t a l i s m a n 和o k a p i 的后续计划,它的主要目标是得到一个用于公平条件访问和版权保护的全 球性方法,并通过在互联网和e b u ( 欧洲广播联盟) 网络上大规模的试验认 证它的有效性。国际标准化组织对水印技术也很感兴趣。比如,新出现的 视频压缩标准m p e g 4 提供了一个易于将密码和数字水印结合起来的体 制。d v d 工业标准也包含拷贝控制和版权保护机制,该机制使用数字水印 来标明多媒体数据的可拷贝状态,比如“一次拷贝”或者“禁止拷贝 标 记。 我国的数字水印的研究起步稍晚,但已引起了信息安全领域研究人员 的普遍关注。国内一些研究所和高校纷纷投入数字水印的研究,其中比较 有代表性的有哈尔滨工业大学的孙圣和、牛夏牧、陆哲明【7 0 0 】等,天津大 学的苏育挺、张春田【l 卜1 2 】等,中国科学院自动化研究所的宋玉洁、谭铁牛 【”。1 5 】等,他们是国内较早投入水印技术研究且取得较好成绩的科研单位。 我国于l9 9 9 年1 2 月1 1 日,由北京电子技术应用研究所组织,召开了第 一届信息隐藏学术研讨会( c i h w ) ,至今已成功的举办了五届,很大程度地 推进了国内水印技术的研究与发展。同时,国家对信息安全产业的健康发 展也非常的重视,在2 0 0 3 年的科技型中小企业技术创新基金若干重点 项目指南中,明确指出了对于“数字产品产权保护( 基于数字水印、信息 隐藏、或者网络认证等先进技术) 和“个性化产品( 证件) 的防伪( 基于水印、 编码、或挑战应答等技术) 等多项防盗版和防伪技术予以重点支持。现在 国内已经出现了一些生产水印产品的公司,其中比较有代表性的是由中科 院自动化研究所的刘瑞祯、谭铁牛等人于2 0 0 2 年在上海创办了的一家专 门从事数字水印、多媒体信息和网络安全、防伪技术等软硬件开发的公司 一上海阿须数码技术有限公司,公司现从事数字证件、数字印章、p d f 文 本、分块离散图像、视频、网络安全等多方面数字水印技术的研究,现在 3 重庆邮电大学硕士论文第一章绪论 这家公司已申请了一项国际和三项国家数字水印技术专利。虽然数字水印 在国内的应用还处于初级阶段,但水印公司的创办使得数字水印技术在国 内不仅仅只停留在理论研究的层面上,而是从此走上了实用化和商业化的 道路,这样会更加推动国内水印技术的蓬勃发展,为国内的信息安全产业 提供有效的、安全的保障。 近年来音频信息隐藏技术的研究工作发展速度很快,尤其在变换域音 频信息的数据嵌入技术【i6 1 ,由于其能将信息嵌入到载体的敏感区域,使得 研究更具有实用性。但是目前更多的文献是讨论如何设计数字水印方案或 如何攻击数字水印,各种方案或产品还都有着这样或那样的问题,尚缺乏 有关数字水印的理论【1 7 】。如今还有许多未触及的研究课题,现有技术也需 要改进和提高。但总的来说,由于数字水印的研究要以计算机科学、生理 学、密码学、通信理论、算法设计和信号处理等领域的思想和概念为基础, 一个数字水印方案一般总是综合利用这些领域的最新进展,但也无法避免 这些领域固有的一些缺点。并且,数字水印的多学科性导致数字水印技术 研究的难度和复杂性。从理论和实际成果两方面来看,国内在数字水印方 面的研究工作还处于刚起步阶段。可以说数字水印技术还是处于其发展初 期阶段,从理论到实际都有许多问题有待解决【l8 1 。 1 3 主要研究工作 目前大多数算法在抵抗一些常见的音频信号处理和攻击已经得到很 好的解决,如m p 3 压缩、重采样、重量化和一定程度的叠加噪声等,然而 却很少提到对保持音调不变的时间缩放( t i m es c a l em o d m c a t i o n ,t s m ) 等 同步攻击的鲁棒性。因此,本文将对如何提高在t s m 等同步攻击下的鲁棒 性这一问题进行研究: 针对同步问题,本文基于稳定水印( i n v a r i a n tw a t e m a r k ) 的思想去 寻找一种对各种攻击不敏感的物理量来直接嵌入水印。 利用c p n 自学习、自适应和容错性的特征,提高水印的鲁棒性; 并通过c p n 的学习,建立音频特征与水印信号的对应关系,达到在不需要 修改音频信号情况下把水印“嵌入”到原始音频信号中,使算法具有较高 的不可感知性。 4 重庆邮电大学硕士论文第一章绪论 1 4 论文结构 本论文分为五章,各章的内容安排如下: 第一章绪论。本章概括介绍了选题的背景、数字音频水印的国内外究 现状以及本文的主要研究内容。 第二章主要介绍了数字音频水印的基本原理,听觉系统的特性,数字 音频水印算法概述和评价标准,以及对数字音频水印的攻击和常见的解决 方案。 第三章基于恒定水印的思想,提出了一种基于c p n 的抗t s m 攻击音 频水印算法。首先介绍了离散小波变换,并在小波域中提取的具有“稳定 水印”特征的小波低频系数方差;然后介绍了本文采用的一种c p n 方法; 最后阐述了基于c p n 的抗t s m 攻击音频水印算法的嵌入和提取步骤。 第四章仿真实验与数据分析。在m a t l a b 7 o 中对本文提出的方法进 行了仿真实验,验证了所选用特征的稳定性和算法的鲁棒性,并与相关算 法进行了比较。 第五章结论及展望。本章总结了本文所做的工作,给出了总体结论, 并指出下一步的研究内容。 5 重庆邮电大学硕士论文第二章数字音频水印技术 第二章数字音频水印技术 随着计算机网络和多媒体信息处理技术的发展,使得方便快捷地制 作、编辑、复制和传输各种无失真的数字化产品成为可能,如数字化的图 像、视频、音频、软件、图形、动画和文本等。这给人们带来很大便利, 也同时带来了许多严重的安全问题。例如,数字媒体产品的版权保护、软 件产品的盗版、数字文档的非法拷贝、各种数字信息的篡改等。 数字水印就是指嵌入到被保护对象( 如静止图像、视频、音频等) 中的 某些能够证明其版权归属的数字信息,可以是作者的姓名、序列号、公司 标志等等【1 9 】。现在数字水印己成为用来解决数字多媒体中版权问题和内容 认证的主要工具。其最为广泛的应用之一莫过于作为钞票的防伪标志,在 新版的一百元人民币的正面,对光观察可以看到人民币左边浮现出毛泽东 的肖像,这也是人们辨别人民币真伪的一个重要标志。与大多数水印一样, 人民币上的水印包含了水印的两个一般特性:第一,正常使用中水印是不 可见的( 不可感知性) ;第二,通过对光检查等方法能够感知水印( 鲁棒性) 。 数字水印是携带所有者版权信息的一组辨别数据。数字水印被永久地 嵌入到多媒体数据中用于版权保护并检查数据是否被破坏。通常我们讨论 的水印系统由水印嵌入系统和水印检测系统组成,其中嵌入系统有两个输 入,一个是所要嵌入的水印信息,另一个是要嵌入水印的载体作品,输出 为嵌入水印的水印作品。水印检测系统则检测出作品中是否嵌有水印或嵌 入何种水印。 2 1 数字音频水印技术的基本原理 数字音频水印是利用数字音频信号中的冗余信息,在不影响音频信号 质量的前提下,把额外的水印信息隐藏于其中的技术。与图像水印和视频 水印一样,数字音频水印是一门新兴的学科,它集音频信号处理、密码学、 通信理论、编码理论、信号压缩和人类听觉系统理论于一体,是多学科交 汇的技术。 从数字通信的角度看,水印嵌入可理解为在一个宽带信道( 载体音频 信号) 上用扩频通信技术传输一个窄带信号( 水印信号) 。尽管水印信号 6 重庆邮电大学硕士论文第二章数字音频水印技术 具有一定的能量,但分布到信道中每个频率上的能量却是难以检测到的。 水印的检测则是一个有噪信道中弱信号的检测问题。从音频处理的角度 看,嵌入水印信号可以视为在强音频信号下迭加一个弱信号,只要迭加的 水印信号强度低于人耳听觉系统( h a s ) 的噪音掩蔽门限,人耳将感觉不到 该信号的存在。噪音掩蔽门限受听觉系统的时间和频率特性的影响因此, 可以通过对原始音频信号作一定的调整,在不改变听觉效果的情况下嵌入 一些信息。 一般数字水印系统的通用模型包括嵌入和检测( 提取) 两个阶段。数字 水印的嵌入阶段,嵌入算法的嵌入目标是使数字水印在不可见性和鲁棒性 之间找到一个较好的折衷。检测( 提取) 阶段主要是设计一个相应于嵌入过 程的检测( 提取) 算法。检测算法一般是以基于统计原理的检验结果来判断 水印存在与否,它的目标是使错判与漏判的概率尽量小。提取算法通过提 取出水印( 如字符串或图标等) 并与原始水印进行比较以判断水印是否存 在。 数字音频水印算法主要包括水印的嵌入过程与检测过程,其基本模型 如图2 1 所示【2 0 】: g 叫攻击信道 _ - 臣至卜 d kk li 豳2 1 数字音频水印系统的基本模型 图2 1 给出了数字水印的框架结构,它由水印的嵌入和提取两部分组成。水 印提取的输出结果可以是有意义的信息,也可以是判断水印是否存在的结 果,这取决于水印提取算法。设f 和f ,分别代表原始音频和嵌入水印后的 音频,形与形为原始水印和提取得到的水印,k 和k 分别表示嵌入和提取 时所需的参数( 如密钥、边信息等) 。又设g 为水印的嵌入算法,则水印的嵌 入过程可以表示为: f - g ( f 尸p ( f ) ,k ,纡) p ( 形) ) ( 2 1 ) ( 2 1 ) 式中,即p 和胛p 分别表示对f 和形的预处理操作,可以是任何一种变 换操作( 如d w t 、d c t 或d f t 等) ,也可以是空操作。水印的检测方法可 以分为两类。一类在检测时不需要原始数据f 与原始水印形,称之为盲检测 算法。另一类是非盲检测算法,在检测时需要原始数据碱原始水印作为 参考才能提取出水印。设水印检测操作为d , 为受到干扰后的音频,则 7 重庆邮电大学硕士论文第二章数字音频水印技术 水印的盲检测过程可表示为: 形t d ( f 即( f ”) ,k ) ( 2 2 ) 相应地,非盲检测过程可表示为: 形= d ( 用叩( f ,f ) ,k ) 。矿( 形,形) 丁,则判断有水印嵌入。 上式中,为形和形t 的相似度,通常用误码率作为度量标准。当超过给定 阈值r 时,则认为音频中嵌入了水印;反之,说明音频中没有嵌入水印。 事实上,数字水印系统可以看成是一个通信系统的基本模型,参考图 2 2 。 编码器信道解码器 图2 2 水印系统的基本通信模型 在通信模型中,水印就是要传送的信息,多媒体载体相当于载波或传送信 道,只不过这种特殊的载波( 原始音频、图像等) 只能做相当有限的改变。 因此,通信中的一些技术如匹配滤波、扩频通信、量化调制和纠错编码等 都可以并已经用于设计数字水印系统,一些信道分析方法也可以被应用到 水印系统中。借助于通信系统模型,有助于分析数字水印中的各种问题。 2 2 人类听觉特性 在音频文件中嵌入数据的方法利用了人类听觉系统的特性。人类听觉 系统对音频文件中附加的随机噪声敏感,并能觉察出微小扰动。人耳听觉 系统具有复杂的特性,涉及到有关心理声学和生理声学方面的问题,通常 需用非线性模型表示。心理声学的一个重要特性就是入耳的掩蔽效应,声 音信号在人的听觉系统中会经过非线性加工,掩蔽效应正是由于这种听觉 的非线性引起的常见心理声学现象。 首先,人的听觉具有掩蔽效应。掩蔽效应是指一个较弱但可以听到的 声音由于另外一个较强的声音的出现而变得无法听到的现象【2 1 1 。掩蔽的效 果依赖于掩蔽音和被掩蔽音的时域和频域特性。 频域掩蔽指在频域发生的掩蔽现象。如果在一定频率范用内,同时存 在能量相差一定程度的一强一弱二个音频信号时,弱音不被人耳察觉,即 被强音“掩蔽掉,则较强的音称为掩蔽音,弱音称为被掩蔽音。把一个 重庆邮电大学硕士论文第二章数字音频水印技术 纯音词作为目标,如果它的声压级低于绝对阀值( 安静时的听阀值 ,它是 听不见的,由于一个较强信号的存在,听觉阀值不同于安静时阀值,在接 近较强信号频率的频率处,听觉阀值被提高,新阀值称为掩蔽阀值,当信 号的声压级低于掩蔽阀值时,它被掩蔽。一个掩蔽音的掩蔽阀值依赖于频 率、声压级,以及掩蔽和被掩蔽信号的纯音或噪音特性。用一个宽带的噪 音掩蔽一个纯音比用一个纯音掩蔽一个宽带的噪音要容易。而且,信号频 率愈高就愈易被掩蔽。 时域掩蔽包括向前掩蔽和向后掩蔽。向前掩蔽是指较强的掩蔽音出现 之前较弱的被掩蔽音无法听到,向后掩蔽是指较强的掩蔽音消失后较弱的 被掩蔽音无法听到。一般,向前掩蔽发生在掩蔽音出现前5 2 0 m s ,向后掩 蔽发生在掩蔽音消失后5 0 2 0 0 m s 。 频域和时域掩蔽效应有各自的特性及局限,频率掩蔽效应局限在频率 域而时域掩蔽效应则局限在时间域。 其次,人耳对声音信号的绝对相位不敏感,而只对其相对相位敏感。 第三,人耳对不同频段声音的敏感程度不同,通常人耳可以听见 2 0 h z 2 0 k h z 的信号,但对2 k h z 4 k h z 范围内的信号最为敏感,幅度很低 的信号也能被听见,而在低频区和高频区,能被人耳听见的信号幅度要高 的多。即使对同样声压级的声音,人耳实际感觉到的音量也是随频率而变 化的。为了提高水印信号的隐蔽性,可将水印信号加载在不太受人注意的 高频部分,而更理想的办法是充分利用人耳的掩蔽效应,根据载体信号特 征将信号自适应地嵌入到载体数据中。 2 3 数字音频水印算法概述 早期的音水印算法一般都是基于时域的。时域水印算法直接在时间域 上将水印嵌入到数字音频信号中,与频域水印算法相比相对容易实现且需 要较少的计算资源,但对一般信号处理如音频压缩和滤波等的抵抗能力较 差。相对于时域嵌入,变换域嵌入是目前研究的热点。这主要是因为变换 域嵌入可以把水印能量扩散到多个样本信息上,改善了水印的稳健性和不 可感知性。此外,在变换域嵌入具有更大的灵活性。通过选取适当的变换 域,可以提取出代表音频本质特征的系数,如可以在音频的低频系数上嵌 入达到提高稳健性的目的,可以在中频系数上嵌入达到半脆弱水印的目 的,也可以在高频系数上嵌入达到脆弱水印的目的。而时域上的嵌入只能 9 重庆邮电大学硕士论文第二章数字音频水印技术 通过改变嵌入强度来达到稳健性和不可感知性的目的。也有一些基于音频 压缩域( 如m p 3 域) 的算法研究,但由于在压缩域已经滤掉了音频信号的 大部分冗余信息,且水印编码与解码系统过于复杂,所以这方面的研究进 展并不是太大。 目前的大部分音频水印算法是在变换域中实现的,常用的变换有离散 余弦变换( d c t ) 【2 2 1 、离散傅利叶变换( d f t ) 【2 3 1 、改进离散余弦变换( m d c t ) 、 离散小波变换( d w t ) 【2 4 。2 9 】。目前对d c t 、d f t 、m d c t 等变换域的研究 已经比较深入,而小波变换作为一种新颖而有效的时频分析工具也得到了 广泛的应用。 除了将音频水印算法归类为时域算法、变换域算法、压缩域算法外, 根据嵌入方案的不同,可以把近年来数字音频水印的研究成果分为五大类 【3 0 】:量化水印方案、扩频水印方案、利用样本或系数之间的关系来嵌入的 集合关系水印方案、自我复制水印、不变水印等。基于量化音频水印方案 通过量化器量化音频样本或变换域系数来嵌入信息,扩频水印通过计算水 印音频和伪随机序列之间的相关性来检测水印,集合关系水印通过两个或 多个样本集或变换系数集之间的相互关系来嵌入信息,自我复制水印的基 本思想是通过利用原始音频自己来构成水印,而不变水印则利用对特定攻 击的一些不变特征来嵌入。 量化水印方案 量化方法【3 卜3 4 】是嵌入水印的一种有效手段。与叠加方法不同,量化水 印方法不是将水印信号简单地加在原始信号上,而是根据不同的水印信息 用不同的量化器去量化原始信号。提取数据时,根据待检数据与不同量化 结果的距离恢复出嵌入的信息。量化水印方法具有许多优点:1 ) 在水印检 测时多为盲检测,不需要知道原始的音频信息;2 ) 载体不影响水印的检测 性能,在无噪声干扰的情况下可以完全恢复出嵌入的信息。因此,量化嵌 入成为了新流行的水印方法。经过近几年的研究,已形成较完整的理论体 系。根据信息嵌入位置的不同,基于量化方法的音频水印可分为两类:时 域算法和频域算法。时域算法是通过在音频信号的时域( 空域) 直接修改样 本的幅值来嵌入水印,而频域技术是通过改变音频信号的频域系数( 如 d f t ,d c t ,d w t 系数) 来隐藏水印。由于可以把水印信号分散到所有或 部分信号样本上,所以频域算法隐藏性好、鲁棒性较强。 1 0 重庆邮电大学硕士论文第二章数字音频水印技术 妇一1 ) s 和一争- s 刀s ( 玎+ 争s ( 川) s 图2 3 量化调制系数改变示意图 图2 3 为量化调制示意图,量化水印方案可以用下面的公式来进行说明: y = j g ( x ,s ) + 3 s 4 矿肛1 ( 2 3 ) 。 l g ( x ,s ) + s 4矿w = o 、7 公式( 2 3 ) 中,s 是量化步长,w 是待隐藏的水印比特,x 是被量化值,y 是 量化后的值。在音频水印中,如果在时域上嵌入,则x 为音频样本,如果 在频域上嵌入,则x 为变换域系数。量化函数q ( x ) 可表示如下: g ( x ,s ) = lx sl s ( 2 4 ) ( 2 4 ) 式中,ixi 表示对x 向下取整。 水印检测过程是水印嵌入的逆过程,通过计算待检测数据和不同量化 结果之间的距离来恢复出水印信息,可以用如下的公式来描述: w :j j 矿y 。g 伍印 耽 ( 2 5 ) w = ( z 5 l 【d 矿y g 伍印 o ( 2 9 ) w21 一一 【2 9 ) 【o圹e ( 口一6 ) o p a t c h w o r k 方法有一个主要的不足,那就是被选定的两个样本集的均 值差在实际中常常并不为o ,这将影响到水印的性能。在不可感知性的限 制下,常量d 用来控制水印的强度。p a t c h w o r k 方法最早用于嵌入信息在 图像的空域( 相当于音频的时域) 。考虑到在时域嵌入水印的鲁棒性不是很 好,研究者将基于变换域p a t c h w o r k 方法引入了音频水印,以提供水印的 鲁棒性。 基于分段能量关系的水印嵌入方法也属于集合关系方案。这种方法基 本思想是通过改变两段、三段或多段音频样本的能量来嵌入水印。 自我复制方案 音频信号本身也可以设计为一种音频水印,我们称之为自我复制方 案。回声隐藏便是一个很好的例子。复制调制( r e p l i c am o d u l a t i o n ) 【3 6 】也是 通过嵌入信号的一部分在频域来作为水印。这种方法有一个明显的优点, 对同步攻击不敏感。 回声隐藏利用了人耳的人类听觉系统( h a s ) 特性之一即时域掩蔽特 性,通过在时间域引入一个回声来嵌入信息,表示为:y ( 聍) = x ( 刀) + 口x 仰一d ) 。 不同的延时d 来代表不同的信息。算法通过倒频谱的自相关性进行水印的 提取。 不变水印方案 同其它水印框架相比,不变水印方法具有一些显著的优点。首先,这 种水印方法基于严格的数学理论,具有令人信服的水印性能。而其它的大 多数水印方法常常通过实验结果来进行说明。此外,由于不变水印有严格 的数学理论支持,可以用来设计那些对可靠性要求较高的水印系统。不变 水印目前主要分为不变图像水印和不变音频水印,主要是针对一定的失真 来进行说明,如基于z e m i k e 矩的r s t 不变图像水
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 艺顶装饰合同
- 征收土地合同
- 2026国网宁夏电力公司高校毕业生提前批招聘(约450人)笔试备考题库浓缩500题及答案详解(名校卷)
- 儿科应聘专业题库及答案
- 中山招聘笔试题目及答案
- 2025-2030民办学校运营成本控制与效率提升策略
- 校长在提高教学质量工作会上发言严作风抓落实
- 2025-2030民办学校政策套利机会与合规边界分析
- 2025-2030民办基础教育下沉市场开拓策略与风险预警
- 2025-2030民办围棋象棋培训市场消费群体与营销策略研究
- 行测5000题电子版2025
- 2025年中国菊花行业市场调查研究及投资前景预测报告
- 多元智能与个性化学习路径设计
- 《接触网的维修管理》课件
- 化工厂冬季四防安全知识培训
- 高中学校三年发展规划
- 2024年个人信息保护合规评估合同
- 云南省2024-2025学年高二上学期11月期中考试数学试题含答案
- 前列腺癌内分泌治疗
- 历史常识单选题100道及答案解析
- 《中医基础理论》课程教案
评论
0/150
提交评论