(计算机应用技术专业论文)数字音频水印理论与方法研究.pdf_第1页
(计算机应用技术专业论文)数字音频水印理论与方法研究.pdf_第2页
(计算机应用技术专业论文)数字音频水印理论与方法研究.pdf_第3页
(计算机应用技术专业论文)数字音频水印理论与方法研究.pdf_第4页
(计算机应用技术专业论文)数字音频水印理论与方法研究.pdf_第5页
已阅读5页,还剩49页未读 继续免费阅读

(计算机应用技术专业论文)数字音频水印理论与方法研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

墼兰童鉴查翌堡垒皇耋堡堡塞一 箍椠 近年来,m p 3 音乐风靡垒球鼠深受入们喜爱,然而,随蒋网络技术与多媒体信息处理 技本瓣迅猛发展,m p 3 音乐摄易被无瞪制任意编辑、复蹦与数布,献 掰导致m p 3 音乐静骧 创糟蒙受巨大经济损失,m p 3 啬乐的知识产权保护已经成为一个追切甓要缎决救关键闫题。 传统加密技术只能提供小范围保护,且具有安全性不足和流j 媛性较差等弱点。数字水印技 术作为一种潜在的解决方案受猁了广泛关注,并成为国簖学术界研究的个热点a 本论文主要强绕饕数字音频术窭】雾法送行了深入醑究,主要起容巍括: ( 1 ) 改进了一种混合域数字啻频盲水印算法。该算法充分剥甩辫教小波变换的多分辨攀 特性和离散余弦变换的能量压缩能力,并根据局部音频相关特性臼适应的确定髓化步睦实 现求印嵌入,侵永印其有随好静鲁棒性。 ( 2 镑黠鼹蘸m p 3 压缀攻壹对啻频熬影确提爨一静用予m p 3 音乐捧蘸敝投绦护静数字承 印嵌入算法。该算法实现丁数字音频的自适应分段,有效克服了m p 3 压鲮薅攻穗所繁来螅 水印提取失效问题;并结局部音频特性及m p 3 压缩对原始酱频的影响,给出了基于音频 载体海容瀚韶适应量仡步长,增强了算法抵抗m p 3 压缩等攻击的能力。 ( 3 ) 竣进了一秘可抵抗去嗣步攻寿熬数字音鼗畜求窜算法,该算法遥过修改多个采祥德 的统计均值嵌入瞬步娼,鳃决了空域嵌入同步码的不稳寇性闻题。安验结象表姨,该冀法 可有效抵抗常规信号攻击,尤其对去同步攻击有较好的鲁棒性。 关键谪数字青频永印,m p 3 ,同步,自适赢量他。 歉字音频琳印理论写方法研究 第一睾绩论 。 论文螅选黻背景鞠意义 信息媒体的数字化及计算机网络的发展为信息的存取提供了快速、高效和方便的途径, 信息的传播和获取,从来没有像今天这样抉捷秘方便。人黜可以偌聚扫描饺、数字樱规寂 谲制解调器等龟子设备将数字信息传送刹瞧界的备个角落,蹰而使电子萄书馆、在线服务 和电予商务等先进的多媒体服务有了十分广阔的前景。然懈,新的技术必然公带来一嫂新 的翔麟,特别楚售患安全方垂舞阚露。数字媒体,尤其是数字强像、音乐、瞧彰等等,校 容易被非法复制或者在传输过稷中遭受第三方的蓄意篡改。如何能既充分利用网络的便利 性,叉能有效地保护数字媒体的版权和佑息的安垒存储、传输等,遮一问题融变得越米越 重要了。蠢霓,鲡俘实施弼终环境下鹩麓权保护翻信悫安全。已成为数字通信中垂待解决 的问颥之一。 数字水印技术被认为是解决版权阀越的毒。效办藏”1 。它蹇分裂用人类视觉秘睚堂系统戆 冗余,嵌入与版权所有蠢相关的秘密信息,毁证实倍息的敝权 = l 属”。从应用范围上,可把 水印分为静态图像水印、图像序歹0 水印和齿频水印。当前,对静态圈像水印和图像序列水 印( 茏菸是静态舞像本印) 弱研究缀多,瑟黯于音攘农窜戆磺宠颦鲜蠢掇遘。攥隧羞g 辩、 m p e g 、a c 一3 等新一代压缩标准韵广泛应用,对音频数据产晶的保护就显得越_ 米越重要。 数字音频水印是信息隐藏技沭的一个分支,僚息隐藏技术是一个新的研究方向。该技 术与襄玛技拳之不蘑熹在于:嚣蠢隐藏绩悫静“内容”嚣盛赣隐藏僖患的“存在牲”。该技 术的出现,无疑会给网络化多媒体信息的寂全保存和传送开辟一条全新的途径。近年来音 频信息隐藏技术的研究工作发展遮度非常炔,尤其在变换域啻频信患静数据嵌入技术,麦 子其能褥僖惠瑕入到载体豹敏惑区域,使褥研究甏热有使糟性。 1 2 数窜水印的历史、现状及发展情璇 一般认为,数字永印起源予古老的水印技术,1 2 8 2 年柱意大利出现了纸水印“。这些 水印怒通过在纸模中加细线模板制造出来的。纸在存在细线的区域会略薄一些,这样也会 更透绢一些。到了1 8 毯纪。在获溯帮美圜潮造煞产撼中,纸承窜已经变得裾警实用了。承 印被并j 做商标,记录纸张的生产日期,显承原始纸片的尺寸。大约也是这个时期,水即开 始用于钱和其它文诈的防伪措藏。 第一个与数字方法蒸钕靛技术窭铡是,在1 9 5 4 年,瓤z 8 k 公司的埃米利希姆布锝克 为带有水印的静乐作品申请了一项专利。在此例中,通过间歇地应用中心频率为i k h z 的窄 带赡波滤波器,论证玛就救搔入熟啻乐中。该频率土缝量豹嫒失表链傻矮了黧渡滤波瓣, 而缺失的持续时间通常被编码为点或长划,此论证码使用了葜尔斯电码。1 9 6 1 年美国专利 局这样描述了该项发明”3 : 撼发明使瓣啻象燕佟遗行确诞成菇可能,鼠蔼锱定壅了一个跨丘盗舨静糟效途径,这 也可烈比做纸币中的水印。 2 数字音频水印理论与方法研究 此系统被m u z “公司延用到了1 9 8 4 年前后。 2 0 世纪7 0 年代网络的兴起正是掀起现代密码学研究热潮的主要推动力,并使之发展成 为- - f 7 相对成熟的学科。1 9 7 9 年,s z e p a n s k i ”1 描述了一种机械探测模式,它可以用在文件 上起到防伪效果。九年后h o l t ”1 等人阐述了一种在音频信号中嵌入论证码。 随着2 0 世纪9 0 年代i n t e r n e t 的发展,多媒体技术的逐渐成熟和电子商务的兴起,网 上多媒体信息急剧增加,这就迫切需要有效地全面提高对数字产品版权的保护,这种需要 正是数字水印技术研究的推动力。第篇关于图像数字水印的文章发表于1 9 9 0 年。1 9 9 5 年 以后,数字水印技术获得了广泛的关注并且得到了的发展。在过去几年中,从事信息隐藏 技术的研究人员和组织不断增加,第一届信息隐藏学术讨论会( i w ) ”1 于1 9 9 6 年在英国召 开,这次会议把数字水印作为它的主要议题之一。1 9 9 8 年在波兰和1 9 9 9 年在德国又先后召 开了两次信息隐藏学术会议。一些信息处理领域的国际会议上也都有关于信息隐藏技术的 专题。p r o c e e d i n go fi e e e 于1 9 9 9 年7 月出版了关于多媒体信息隐藏的专辑。1 9 9 9 年底, 第一届全国信息隐藏学术研讨会( c i h w ) 在北京电子技术应用研究所召开,从第一届会议以 来,在中国电子学会通信学分会及北京电子技术应用研究所的组织和有关高校及科研机构 的大力支持f ,c i h w 研讨活动至今已成功举行了五届全国会议。c i b 已成为国内最具代表 性的信息隐藏学术交流活动。与此同时,一些组织开始考虑包含不同标准的水印技术。拷 贝保护技术工作组( c p r w 6 ) 。出于保护d v d 碟中视频的目的测试了水印系统。安全数字音乐 主创( s d m i ) ”将水印做成他们的音乐保护系统的核心技术。 在2 0 世纪9 0 年代末期一些公司开始正式地销售水印产品。v e r a n c e 企业的技术采用了 第一阶段的s o m i ,此技术同时被诸如l i q u i da u d i o 等的国际互联网音乐发行人使用。在图 像水印方面d i g i m a r e 公司“”把水印的嵌入器和检测器与a d o b e 公司的p h o t o s h o p 捆绑在 一起。 1 3 数字水印的应用领域 尽管数字水印技术研究起步比较晚,但其在军事通信、国家信息安全、数字化网络、 多媒体及印刷出版等领域都具有十分广阔的应用前景。数字水印的应用研究成为了国内外 公司和学术界的研究焦点。大部分的工作致力于寻求同时满足保真度、鲁棒性、嵌入容量 和经济约束的平衡点。针对儿何时间上失真的研究,也有稳步进展。山现了大量不同变换 域的实验结果,如在频域内出现了d c t “”,f f t “”,d w t “”和f o u r i e r - m e l l i n 等算法,还有大量 的算法在m p e g i ”。2 ”和j p e g l 2 ”编码中进行,因为这样可以节省昂贵的水印解码负荷,有利于 大批量的应用,如b v d 拷贝控制应用等。 目前数字水印的应用主要集中在以下几个方面: 1 版权保护”“ 版权保护水印是目前研究最多的一类数字水印。由于数字作品的拷贝、修改非常容易, 而且可以做到与原作品完全相同,所以原创者不得不采用一些严重损害作品质量的办法来 加上版权标志,而这种明显可见的标志很容易被篡改。为此,数字作品的所有者可利用密 钥产生一个水印,并将其嵌入到原始数据,然后公开发布其含水印版本作品。当该作品被 j ; 版或出现版权纠纷时,所有者即可从盗版作品或含水印版作品中获取水印信号作为依据, 从而保护所有者的权益。 数字音烦水印理论与方法研究 目前用,版权保护的数字水印技术已经进入了初步实用化阶段,i 酬公司在其“数字图 二1 5 馆”软件中就提供了数字水印功能,而a d o b e 公司也在其著名的p h o t o s h o p 软件中集成 了d i g i m a r c 公司的数字水印插件。 2 票据防伪“ 随着高质量图像输入输出设备的发展,特别是高精度彩色喷墨、激光打印机和高精度 彩色复印机的山现,使得货币、支票以及其他票据的伪造变得更加容易。 据报道,美国、日本以及荷兰都己开始研究用于票据防伪的数字水印技术。麻省理工 学院媒体实验室受美国财政部委托,已经开始研究在彩色打印机、复印机输出的每幅图像 中加入唯一的、不可见的数字水印,在需要时可以实时地从扫描的票据中判断水印的有无, 快速辨识真伪。 此外,在电子商务中会出现大量过渡性的电子文件,如各种纸质票据的扫描图像等。 即使在网络安全技术成熟以后,各种电子票据也还需要一些非密码的认证方式。数字水印 技术可以为并种票据提供不可见的认证标志,从而大大增加了伪造的难度。 3 标题与注释i ”1 1 即将作品的标题、注释等内容( 如照片的拍摄时间和地点等) 以水印形式嵌入到作晶 中,这种隐式注释不需要额外的带宽,且不易丢失。 4 篡改检测”“”。 由于现有的数字信号拼接和镶嵌技术可以做到移花接木而不为人知,而基于数字水印 的篡改检测是解决这一问题的理想技术途径,通过隐藏水印的状态可以判断声像信号是否 被篡改。为实现该目的,通常可将原始图像分成多个独立块,再将每个块加入不同的水印。 同时可通过检测每个数据块中的水印信号来确定作品的完整性。与其他水印不同的 是,这类水印必须是脆弱( 或半脆弱) 的,并且检测水印信号时,不需要原始数据。 5 设备控制 这种应用的一个典型的例子是d v d 防拷贝系统,即将数字水印信息加入d v d 数据中, 这样,d v d 播放机即可通过检测d v d 数据中的水印信息来判断其合法性和可拷贝性,从而保 护了制造商的商业利茄。 6 媒体标记与信息隐藏”2 媒体标记和信息隐藏都是在媒体的内容中隐藏不可感知的某种信息,用以标记媒体( 可 用于媒体的检索、管理等) 或是传递秘密信息。它对水印没有鲁棒性的要求。 7 隐蔽通信及其对抗 数字水印所依赖的信息隐藏技术不仅提供了非密码的安全途径,而且可以实现网络情 报战的革命。网络情报战是信息战的重要组成部分,其核心内容是利用公用网络进行保密 数据传送。由于经过加密的文件往往是混乱无序的,容易引起攻击者的注意。网络多媒体 技术的广泛应用使得利用公用网络进行保密通信有了新的思路,利用数字化声像信号相对 于人的视觉、听觉冗余,可以进行各种信息隐藏,从而实现隐蔽通信。 数字水印的应用领域也在不断扩展。除以上经典的应用之外,数字水印技术还应用在 电子商务”,数字娱乐”1 ,软件保护”“,视频错误隐藏、检测”“,电子学习 4 1 o 4 数字音频水印理论与方法研究 1 4 数字水印的分类 数字水印的分类方法有很多种,分类的出发点不同导致了分类的不同,它们之间既有 联系又有区别。最常见的分类方法包括以下几种: 1 按水印所附载的媒体划分 按照数字水印所附载的媒体可以将数字水印划分为图像水印”2 “、音频水印“、视 频水印”“4 5 “”、文本水印“”以及用于三维网格模型的网格水印1 等。随着数字技术的 发展,会有更多种类的数字媒体出现,同时也会产生相应的水印技术。 2 按检测过程划分 根据水印检测过程是否需要原始载体,可以将数字水印划分为非盲水印、盲水印及半 盲水印。其中,非盲水印的检测过程需要原始信号的参与,而盲水印的检测过程则不需要 原始载体信号的参与。一般来讲,非盲水印的鲁棒性比盲水印要好,但其实用价值没有盲 水印好。半盲水印的检测无需原作,但是需要某些与原作有关的信息。这些信息可能是原 作嵌入水印时的某些参量,也可能是表征原作某些特征的信息。 3 按水印内容划分 按照数字水印的内容,可以将数字水印划分为有意义水印和无意义水印。有意义水印 是指水印本身也是某个数字图像( 如商标图像) 或数字音频片段的编码;而无意义水印则 只对应于一个序列号。有意义水印的优势在于,如果由于受到攻击或其他原因致使解码后 的水印破损,人们仍然可以通过视觉观察确认是否有水印。但对于无意义水印来说,如果 解码后的水印序列有若干码元错误,则只能通过统计决策来确定信号中是否含有水印。 4 按水印外观( 可感知性) 划分 根据数字水印的外观( 可感知性) ,可以将数字水印划分为可见水印”“”。( 可感知水 印) 和不可见水印”3 “1 ( 不可感知水印) 。目前,国内外学者的研究焦点都集中在不可见水 印( 对于音频来说是不可感知数字水印) 技术方面。 5 按用途划分 不同的应用需求造就了不同的水印技术。按照数字水印的不同用途,可以将数字水印 划分为票据防伪水印、版权保护水印、篡改检测水印和隐蔽标识水印。 票据防伪水印是一类比较特殊的水印,主要用于打印票据和电子票据的防伪。一般来 说伪币的制造者不可能对票据图像进行过多的修改。所以,诸如尺度变换等信号处理操 作是不用考虑的。但另一方面,人们必须考虑票据破损、图案模糊等情形,而且考虑到快 速检测的要求,用于票据防伪的数字水印算法不能太复杂。 版权标识水印是目前研究最多的一类数字水印。数字作品既是商品又是知识作品,这 种双重性决定了版权标识水印主要强调隐蔽性和鲁棒性而对数据量的要求相对较小。 篡改检测水印是一种脆弱水印,其目的是标识宿主信号的完整性和真实性。 隐蔽标识水印的目的是将待保密数据的重要标识隐藏起来,以限制非法用户对保密数 据的使用。 6 按数字水印隐藏位置划分 根据数字水印的隐藏位置,可以将其划分为空间域( 时间域) 数字水印和变换域( 频 域) 数字水印。其中,所谓空间域数字水印,就是通过直接在空间域内修改多媒体数据来 数字音频水印理论与方法研究 嵌入水印信息。再通过记录提取这些信息来检测水印。而所谓变换域数字水印,是指首先 对多媒体数据进行适当变换,继而将水印信息嵌入到变换域选定的系数上最后再通过相 应的反变换恢复出含水印信息的多媒体信号。 7 按特性划分 根据数字水印的不同特性,可将其划分为鲁棒水印、半脆弱水印和脆弱水印三类。 其中,脆弱水印用于数字产品的内容认证。我们可以简单的认为脆弱水印是一种当作 品发生任何形式的改变后变得不可测的标志。它的最主要的特征就是不可昕性( 嵌入的水 印不会引起听觉上的任何差别) 和敏感性( 嵌入的水印对数字音频信号的变化敏感) 。引起 数字音频信号变化的因素有非线性滤波、有损压缩、d a _ a d 转换、叠加噪声、重新采样等。 数字音频信号的任何轻微的变化都会引起抽取的水印发生畸变,根据抽取水印的畸变程度 可以确定音频信号是否被篡改或破坏。最典型的脆弱水印算法如最低有效位算法、量化系 数嵌入水印。 鲁棒数字水印主要用于数字作品的知识版权保护,和脆弱水印相反,鲁棒水印其有很 强的鲁棒性,它要求所嵌入的水印信息能够有效抵抗各种常见的信号处理,大多数的水印 方法都属于这一类。 半脆弱水印是其鲁棒性介于鲁棒水印与脆弱水印之间的一类水印。也是数字水印研究 的一个重要分支其是一种能承受合理失真,但会被不合理失真损坏的数字水印。它提供 了一个完成选择认证的机理。 1 5 本文的主要内容 电子水印的历史可以追溯到1 9 5 4 年,m a z a e 公司的e m i lh e m b r o o k e 发明了一种在模 拟音频信号中嵌入识别码的方法【5 ”,但电子水印井未受到太多人的关注。直到二十世纪九 十年代中期,数字水印技术的提出开辟了水印研究的新天地。具有各种研究背景的学者们 纷纷加入其中,至今为止,数字水印技术的研究得到了很大进展,很多经典的算法被提出。 本学位论文对数字音频这种载体上的永印算法展开了深入的研究,提出t z 个有效的 算法,本文组织如下: 第一至三章是基础理论研究部分,系统地论述了水印的研究进展情况对水印的基本 概念要求,基本框架等进行了阐述。 第四章是数字同步技术及音频中的同步问题。第五、六章是目前常用的数字音频水印 算法及数字水印的攻击和评测。 第七章提出了一种混台域自适应数字音频水印算法其基本思想是充分利用小波变换 的时频分析特性及d c t 变换的聚能效应,自适应的确定量化步睦实现水印嵌入。 第八章针对目前m p 3 压缩攻击对音频的影响提出一种用于m p 3 音乐作品版权保护的数 字水印嵌入算法,做到量化步长的完全自适应,具有一定的实用价值。 第九章利用改进的时域水印技术嵌入同步信息以抵抗音频在时间轴上可能受到的同步 攻击,通过修改多个采样值的统计平均值来嵌入同步码以保证不可感知性和鲁棒性。是一 种可抵抗去同步攻击的数字音频盲水印算法。 最后在第十章中,我们对全文工作进行总结,并指出了进一步研究和探索的问题与方 向。 6 数字音频水印理论与方法研究 第二章数字音频信号 2 1 数字音频的基本概念 声音是人类传递信息的主要媒体之一。而所谓声音,就是通过空气传播的一种连续的 波,也称为声波。声音的强弱体现在声波压力的大小上,音调的高低体现在声音的频率上。 声音用电表示时,声音信号在时间和幅度上都是连续的模拟信号。声波具有普通波所具有 的特性,例如反射、折射和衍射等。 音频信号是典型的连续信号,不仅在时间上是连续的,而且在幅度上也是连续的。在 时间上“连续”是指在一个指定的时间范围里声音信号的幅值有无穷多个,在幅度上“连 续”是指幅度的数值有无穷多个。习惯上,把在时间和幅度上都是连续的信号称为模拟信 号。 在某些特定的时刻对这种模拟信号进行测量叫做采样( s a m p l i n g ) ,由这些特定时刻采 样得到的信号称为离散时间信号。采样得到的幅值是无穷多个实数值中的一个,因此幅度 还是连续的。如果把信号幅度取值的数日加以限定,这种由有限个数值组成的信号就称为 离散幅度信号。我们把时间和幅度都用离散的数字表示的信号就称为数字信号,丽把时间 和幅度都用离散的数字表示的音频信号称为数字音频。 音频信号转换为数字音频的第一步就是数字化,数字化实际上就是采样和量化 ( q u a n t i z a t i o n ) 。连续时间的离散化通过采样来实现,就是每隔相等的一小段时间采样一 次,这种采样称为均匀采样;连续幅度的离散化通过量化来实现,就是把信号的强度划分 成一小段一小段,如果幅度的划分是等间隔的,就称为线性量化,否则就称为非线性量化。 图2 1 表示了声音数字化的概念。 n 一1 ,l j rli ,l 、 aii il1n ,i 、,l 、 t j r| - i ,1ll ,、州ii ,、lr i ii , 、i , | v i il ,、- , q , v 图2 1 声音的采样和量化 音频信号数字化需要回答两个问题:每秒钟需要采集多少个卢音样本,也就是采样 频率是多少;每个声音样本的位数应该是多少,也就是量化精度。 7 l 0 l b l 0 l 0 l 0 l咖呲眦呲咖咖mmm啪m 数字音频水印理论与方法研究 2 2 人类听觉模型( h a s h u m a na u djos y s t e m ) 音频与视频数据相比音频信号的数据量就很小了。这意味着嵌入的水印信息量、水 印的鲁棒性都会比视觉媒体水印算法要小得多。另外一个问题是由于人类听觉系统( h u m a n a u d i os y s t e m ,h a s ) 对声音变化的灵敏度要高于人类视觉系统( h u m a nv i s u a ls y s t e m ,h v s ) 对图像变化的灵敏度,冈而在音频信号中嵌入水印相对较难。因此要获得兼具高度隐蔽性 和良好的鲁棒性的水印必须在水印嵌入方法上与心理声学的听觉掩蔽效应相结合。 掩蔽效应:一个较弱的声音( 称为“被掩蔽音”) 的听觉感受被另一个较强的声音( 称为 “掩敝音”) 影响的现在称为人耳的掩蔽效应。被掩蔽音单独存在时的听阈分贝值称为绝对 闻阚。在8 0 0 h z 1 5 0 0 h z 范围内闻闽随频率变化最不显著。掩蔽类型可分为频域掩蔽和时 域掩蔽。 频域掩蔽是指掩蔽声与被掩蔽声同时作用时发生掩蔽效应,又称同时掩蔽。通常,频 域中的一个强音会掩蔽与之同时发声的附近的弱音,弱音离强音越近,一般越容易被掩蔽: 反之,离强音较远的弱音不容易被掩蔽。一般来说低频的音容易掩蔽高频的音:在距离 强音较远处,绝对闻阈比该强音所引起的掩蔽闽值高,这时,噪声的掩蔽闽值应取绝对闻 阈。 时域掩蔽是指掩蔽效应发生在掩蔽声与被掩蔽声不同时出现时,又称异时掩蔽。异时 掩蔽又分为导前掩蔽和滞后掩蔽。若掩蔽声音出现之前的一段时间内发生掩蔽效应,则称 为导前掩蔽否则称为滞后掩蔽。产生时域掩蔽的主要原因是人的大脑处理信息需要花费一 定的时间,异时掩蔽也随着时问的推移很快会衰减,是一种弱掩蔽效应。一般情况下,导 前掩蔽只有3 m s 2 0 m s ,而滞后掩蔽却可以持续5 0 m s l o o m s 。表2 1 给出掩蔽效应的分类 及效果”。 表2 1 掩蔽效应的分类及效果 其次,人耳对声音信号的绝对相位不敏感而只对其相对相位敏感。 第三,人耳对不同频段声音的敏感程度不同,通常人耳可以听见2 0 h z 2 0 k h z 的信号, 但对2 k h z 4 k l l z 范围内的信号最为敏感,幅度很低的信号也能被听见,而在低频区和高频 区,能被人耳听到的信号幅度要高的多目口使对同样声压级的声音,人耳实际感觉到的音 量也是随频率而变化的。 8 数字音摄拳姆理论与方法研党 第三章数字音频水印技术 3 1 音频永印的基本要求 对黹频水印系统的要求与其他水印系统类似,主要包括静棒性、感知透明性、安全性 以及对栽荷f 释量) 、计算复杂健、检颡4 器错误率的要求8 。 ( 1 ) 感知透明性感知透明牲要求在裹黯矮酱乐糕晶版权保护中是必霉翡,它要求含承 印诲乐制晶与原始音乐制品之间不存在感知上的差舆,并且二者经过期同的信号处理操作 后也不成该存在感知差异。 2 ) 鲁棒性禽永拜j 音乐辅t 话在分发和传递过程中会不可避免地受到备种信号处理操 作。鲁撼性麴含义是:除 信号处理操作黟重降羝t 载体膏叛季# 鼓熬晶震,否粼经过僖号 处理操作后,水印检测器应该仍能检测出载体传品中是帮含水印。常见蛉信号处理操作包 括添加噪声、线性和非线性滤波、有损压缩、时间轴缩放、d a a d 转换等。 鲁棒注闷题对永印雨吉极为重要。耍尽量僳证隐藏了信息之衙的宿主信息在经历可能 的处理期攻痰居,愿不导数数隐藏的售患丢失黪戆力。一个数字承颦盛该黥够承受大量静、 不同的物理和几何失真,包括有意的( 如恶意攻击) 或无意的( 如音频的压缨、滤波、噪 声污染等等) 。照然在经过这些操作后,鲁棒的水印算法应仍能从水印宿主中提取出嵌入 静永窜簸蘑e 鞠永印的存在。鲡果不掌握承印的所有有关知识,数据产晶的版权傈护标志应 该缀难被傍造。装攻遗考试图删除呔印烈将导致多媒体产熬熬襁残破坏。 数字水印的根本目标是通过一种不引起被保护作品感知上退化,叉难以被来授权用户 删除的方法向一个数字作品中嵌入一个标记。关于这方面鲁棒性的第一次定义可以从留声 枫l :韭嚣际联疆( i f p i ) 征求音频标记技术的提案中我蓟。遍一褥案的目的是碍求一种能 够生成反盗舨季- 为的诞据、跟踪广援者鄹其娃人慰音频媒俸憨傻翔跌及控剿音频记蒙复翻 的标记方案。i f p i 的鲁棒性要求主要有如下3 条: 标记信息可以在宽频带进行滤波和处理操作之后被恢复,包括两次相继的模数和 数模转换,稳态蹑缩标记或扩张1 0 ( 匿缩技术鲡静e g 和多颓带i # 续性掇幅压缩) ,引入 加法或乘法噪声。使煳统一系绫热入一秒镑魄披嵌入信号,低音、中毒拳 离音疲翔中攘率 能够响应1 5 分贝的失真、组延迟失真和陷波滤波器; 在不g f 起音频质量大幅度退化的情况下,不成该存在其它方法来删除或改变嵌入信 惠倥荚凳羧; 如果信噪比为2 0 分贝戴老更裹,被嵌入数据催遴癍其有每秒2 0 比特憋鬻宽,西每 信号电平和信号类型( 如古典诲乐、流行音乐或语音) 等无关。 理论上,对于任何永印。攻击者在获得足够的信息后都可以将其擦除。但实际上由干 瑷禹者辟得到的傣崽袋者袭毒卷计算梳能力f f 搴阪稍,擦酴承印石可能蔬以避免对原始数据 的严重破坏。 ( 3 ) 安全性同其他媒体水印技术样,音频水印系统必须考虑其应用环境中可能受到 的攻击。当水印技术瑚于版权保护时,一个蘑要的问题是如何确定版权所有者,特别是当 9 数字音频水印理论与方法研究 音频作品中禽宵多个水印,各方都声称典有作品版权时,如何解决遮种“死锁”问题等。 ( 4 ) 载荷不同应用环境对载荷的要求不同。在版权保护应用中。往往只需要把序列号 番| 终者麴辨谈鼹重复蟪鞋入到鼗体终燕中,这静愤提下慰载蘩鳇要袋不褰。森使擐承帮技 术进行隐密通信应用中,对信息载荷的要求一般很高。 ( 5 ) 计算复杂性计葵复杂蚀的要求也是随着鹿用环境的不同丽不同,一般两言,要求 裣溺器懿复杂性要低予嵌入嚣酌复杂性。在诸翔广告蓝控蒋痘用中,要求算法痘其有较祗 的复杂性,从而有利于实时实现。使用心理感知模型往往会增加复杂性,这是由于不仅在 永印嵌入阶段瓤且在承霹检测阶段也需要使用心蘧声学计爨模型。 卿错误宰在版权保护赢蹋中,为了增加证据的说服力,一般溪求水印检测器其有较 低的墩警率,特别是在将检测结果作为法律纠纷中法庭的证据时,这种情况f 往往使用错 误章终先设谤牾拣来决定其缝参数熬选取;铡妇使矮瘟警搴决定穗荧捡涮瓣捻测篾毽瓣选 取。 ( 7 ) 盲,非窝水印检测所谓寓水印检测是指不依赖于来嵌入水印的原始费频信号中直 接後复承霹】售弩。这一健麓将彰晌方案鹣用途窝靛辘。 由上述的讨论可知,对音频水印系统的要求随着应用环境的不同而不同各个要求之 间可以互相辑申,所淡水印设计蠹不应该对水印攀统提出不切实际螅要求,疆应根掇实际 鹿角环境寻找台理的要求。在所有这些要求中,躐突出的问题是昕觉上的誉可感知性,鲁 棒性和数据奉之间的矛盾。三者之间构成一个三帑权衡关系如图3 1 所示,举例来说。在 捷裹零印系缝数据率鹣窝时逶豢会撰害磐捧瞧,瓣普捧槛瓣降低经徒叉会挺薅声音穗弩静 质量。类似地,一个完全不可觉察的数字音频水印系统永斌也达不剿一个感知上能觉察水 印存柱的数字齿频水印罨统所能达到的替棒性。每一个具体的应用部必须在三角形中找到 一个俭当豹煮。一个葑鹣数字裔颏窳印系统慧是撩够最大敝度静协调这些彼就互相矛看的 要求。通常对予一个实用的数字膏频水印系统,最主要的评价指标酋选就是照建声音信号 的质凝和水印数据的误璐率。其次孝是水爨l 数据的 砖率和所增加敕计算量。 数摄率 鲁棒性 ! 不可惑螽髓 圈3 i 晰觉上的不可感知性。鲁棒性和数据率之间的权襁 3 ,2 音频永卸藜统的纂本模鹫 个数字水印方寰一般包括三个基本方厦:水印的生成、求印的嵌入和水印的提取或 检溺。数字永印技术实辩上是递进对承印簸体媒攒靛分析、嵌入信息的颈照耀、信惠嵌入 点的蠛择、嵌入方式的设计、嵌入调制的控制等几个相关技术环节谶行合理优化寻求满 足不可感知性、安全霹嚣性、蛰禧性等读条 譬终窳下鳇最饯诧设诗逡蘧。纛俸必求印壤患 的重要缀成部分密稠,则跫每个设计方案的个重要特色所在。往往可以在信息预处 l o :墼主童塑查塑堡垒皇查查堡壅一 一 理、嵌入点的选择和调制控制等不同环节入手完成密钥的嵌入。 数字水印一般过程基本框架示意图如图3 2 和图3 3 所示。 图3 2 水印嵌入的一般过程基本框架 图3 2 展示了水印的嵌入过程。该系统的输入是水印信息矿、原始载体数据,和一个 可选的私钥公钥k 。其中水印信息可以是任何形式的数据,如随机序列或伪随机序列;二 值图像、灰度图像等等。水印生成算法g 应保证水印的唯一性、有效性、不可逆性等属性。 水印信息可由伪随机数发生器生成,另外基于混沌的水印生成方法也具有很好的保密特 性。密钥k 可用来加强安全性,以避免未授权的恢复和修复水印。所有的实用系统必须使 用一个密钥。有的甚至使用几个密钥的组合。 水印的嵌入算法很多。从总的来看可以分为空问域算法和变换域算法。具体算法我将 在后面详细介绍。由图3 2 可以定义水印嵌入过程的通用公式: f 。= e ( i 。w ,x 、 ” l i 其中石表示嵌入水印后的数据( 即水印载体数据) 。,表示原始载体数据,表示水 印集合,x 表示密钥集合。这里密钥x 是可选项,一般用于水印信号的再生。 囤3 3 水印检测的一般过程基本框架 图3 3 是水印的检测过程。由图3 ,3 可以定义水印检测过程的通用公式为 有原始载体数据,时: 有原始水印矿时: 没有原始信息时: w = d ( 如,x ) w = j d ( ,w ,置) 1 l ( 2 ) ( 3 ) 墼兰童塑煎壁堡堡鱼童堕壁塞 矿= 联,五) ( 4 ) 熟中,舻波示估计水印,d 为水印检测算法,0 表示在传输进程中受到攻击后的水 印载体数据。检测零邵的手段可班分为鹾穗:一筵在有蒙始信惫黪债况下,谭氍徽嵌入信 号的提取或相必性验证;二是谯没有原始信息情况下,必须对嵌入倍息做全搜索或分布假 设检验等。如暴售号为隧掇信号或伪睫楗信号,诞明检测镶号是本印镶号靛方法一般裁是 做相似度检验。水印相似度检验的通用公式为: s i m :氅竖或s i m :些紧 ( 5 ) 4 w w 4 r v + w 4 扩w 其中旷表示估计水印,矽表示原始水印,s i m 表水不同信母的相似度。 3 。3 誊凝术露戆特焘凝与嵌入楣关戆参数 由于人的视觉和听觉的特性箍别比较大,因此,相对于图像水印,音频水印有自已的 一些特点。 ( 1 ) 图像怒二维的信号,而声音是一维信号。= 者的带宽不同。 ( 2 ) 人类l ! l q 视觉模型和听觉模型很不一样,人灏对声音的感知是声音的强弱( 声强) 和音 调静旋低f 藏攀) ,人类对蓬像戆戆知是图像静竞豹蹇度及不麓酌凝色。久耳霹睹看佟一个滤 波器组,即直接感知声啬的频率。人类听微系统的一些感知特点可以用心理声学模型描述。 ( 3 ) 对于图像来说,把图像变换到频域,人类对图像的棚位的感知根敏感。恧对声鹰来 说,把声音交换到频域人耳熊傲短时酌频率分析,入耳辩信号的桶辩性即鹰调感知狠敏 感,但对声音的相位的感知不敏感。这一点说明了视觉和昕觉感知的很大不同。 站相对予入眼对颜色的感知,人耳瓣不露频搴黪敏感程度差裂缀大,冀中对2 炼z 4 k h z 范丽的信号最为敏感,而在低频区和高频区,能被人耳昕到的信号幅度簧高的多,相 差能超过1 0 7 倍”1 。 ( 辩相 l 静正蓬像,啻频黪数蕹量簧大豹多,弱诧,缀多静算法溪分块娃疆,这榉必须 考虑块与块之间的一些问题。另外,声音是一种非平稳的信号在对声音进行分块的变换 时,濡要考虑信号的时变特性。 裔凝永印系统中鹣参数影孵朔限制承印系统静性能,弹多参数强为正眈或反比的笑系, 互相制约。下面列出了数字音频水印系绒的一些重鼹参数及对系统性能影响的一般分析: ( 1 ) 水印僚患:水印霹由多种模型梅袋,如伪隧规序列、数字标识、文本鞋及图像餐。 ( 2 ) 嵌入铯置:这包括两方面的内容。一方面怒指水印怒嵌入在原始音频信号的时域还 是频域;另一方面是指水印嵌入在时域或频域的什么位置。如频域的高频系数还是低频系 数。 ( 3 ) 内嵌强度:对私有水印而亩,如果疆增强水印抵抗攻击的能力。就要增大内嵌强度; 但与此同时,原音频债母的质量会随之下降;因此必须将蛰棒性和举可感知性综合考虑, 恰当滚取肉嵌强发。 ( 4 ) 量化系数;这是表征公脊水印系统水印嵌入强度的个重要参量;同样,如果鬻增 强本印抵抗攻糖盼能力,靛要增大量他系数;但骘逝建时,也会导致藏音频镶号斡暖爨睫 之下降。 墼! 童塑查! 矍堡皇查鲞翌鉴 第四章数字同步技术 4 1 帧同步 4 1 i 数字传输系统的帧同步 1 帧同步原理 实现帧同步的方法一般可以分为两类:第一类是在发送数字信号序列中插入帧同步脉 冲或帧同步码作为帧的起始标志,这种方法称为外同步法i 另一类方法是利用数字信号序 列本身的特性来恢复帧同步信号,例如,某些具有纠错能力的抗干扰编码就具有这种特性, 这种方法称为自同步法。 帧同步问题实质上是一个对帧同步标志进行检测的问题。 2 对帧同步系统的要求 ( 1 ) 建立正确同步的概率大,错误同步的概率小。( 2 ) 捕获时间要短。( 3 ) 稳定地保持同 步。( 4 ) 在满足帧同步性能要求的条件下,帧同步码的长度应尽可能短些,这样提高有效信 息的传输率。 3 帧同步码的插入方法 在许多采用同步传输的数字通信系统中,常采用插入帧同步码的方法来实现帧同步。 帧同步码插入方式是指:在发送端怎样将帧同步码插到信息码流中作为帧的起始标志。 通常的插入方式:( 1 ) 集中插入方式 ( 2 ) 分散插入方式。 4 帧同步码的识别 帧同步码的识别方式是指,接收端的帧同步系统从接收到的数码流中识别和检测出帧 同步码。通常采用的两种识别方式:( 1 ) 码型检出方式:( 2 ) 逐位比较方式。 逐侥比较方式:接收端产生一个与发送端插入的帧同步码型相同的本地帧码,在识别 电路中使本地帧码与接收的数码逐位进行比较。当系统处于同步状态时各对应比较码位 都相同。当系统处于失步状态时,对应比较的码位就不同。 5 最佳同步码 同步码的选择可有效的避免假同步。 假同步的形成与下面几个因素有关: 一 ( i ) 帧同步码码型:( 2 ) 帧同步码码长,码长越大,形成假同步的可能性越小;( 3 ) 信息 码中0 和“1 ”出现的概率 最佳同步码码型 码长最佳同步码码长最佳同步码 81 0 1 1 1 0 0 01 21 1 0 1 0 1 1 0 0 0 0 0 9 1 0 1 1 1 0 0 0 01 31 1 1 0 1 0 1 1 0 0 0 0 0 1 01 1 0 1 1 1 0 0 0 01 41 1 1 0 0 1 1 0 1 0 0 0 0 0 1 11 0 1 1 0 1 1 1 0 0 01 51 1 1 0 1 1 0 0 1 0 1 0 0 0 0 数字音频水印理论与方法研究 6 帧同步码码长的选择 帧同步码码长的选择也是很重要的,选择不当也将影响帧同步系统的性能。帧同步码 码长的选择与很多因素有关。首先帧同步码码长越长,在随机性码流中产生假帧同步的概 率就越小,但其帧同步码越容易被传输误码所破坏,另外,码长过长对宿主音频引入的噪 声也就越多。 4 1 2 帧同步与巴克码 在数字通信系统中,实现帧同步的方法通常有两种:起止式同步法和集中式插入同步 法。起l t 式同步比较简单,一般是在数据码元的开始和结束位置加入特定的起始和停止脉 冲来表示数据帧的开始和结束。该方法在电传机中广泛使用,其中由1 5 个码元宽度的高 电平转换到1 个码元宽度的低电平表示数据帧的开始;由1 个码元宽带的低电平转换为1 5 个码元宽度的7 5 个码元宽度的高电平表示结束。电报码占5 个码元宽度。另外在计算机 r s 2 3 2 串口通信中通常也使用类似方法。本节主要对集中式插入同步法有关的内容进行讨论 和仿真。集中插入式同步法中插入的同步码要求在接收端进行同步识别时出现伪同步的概 率尽可能小,并且要求该码组具有尖锐的自相关函数以便于识别。同时接收机端的同步码 识别器要尽量简单。目前用得比较广泛的是性能良好的巴克码( b a r k e r ) 。 巴克码是一种有限长的非周期序列。它的定义如下:一个n 位长的码组 置,x 2 ,x ,x 。 ,其中x 。的取值为+ 1 或一l ,若它的局部相关函数 则称这种码组为巴克码,其中_ ,表示错开的位数。 4 2 音频水印中的同步问题 ,= o o - , ,z 歹h 音频水印检测的第一步需要将检测器与含水印数据块调整对齐,失去同步将导致检测 错误。对含水印音频作品进行普通信号处理操作或者恶意攻击时都会产生去同步作用, 例如使用m p 3 编码器对音频信号编解码后会在信号起始处添加1 0 0 0 个左右的采样值,另外 恶意攻击者会在音频信号中随机抽取或者插入采样值,或者对信号沿时间轴缩放。时间标 度修改是一种时域攻击,它在所攻击的音频信号中周期性地添加或删除样本或者使用复 杂的时间标度修改技术来维持音调。这样,音频信号的长度可能会缩短或者增加。另外, 可使用频率标度修改( 或者音调压扩) 调整频率并采用时间标度修改来保持音频信号的长度 不变a 这种攻击可采用复杂的音频信号处理技术来实现。非周期性的修改更加难以处理。 在音频信号中有很多特征,例如:信号的过零率、音调、节拍和频谱的形心等等,只 要这些特征在受到攻击时具有不变性,就可使用它们来进行水印同步。 1 与扩频水印扩频码相结合的方法 这种方法直接利用扩频水印扩频码的相关特性来同步其优点是不需要额外的同步码, 缺点是计算量较大,常用于起始帧同步。采用扩频方式的音频水印往往将扩频水印信号重 1 4 l一 仉m ,(l = 叫 葺 x 州h | i ),l 足 数字音频水印理论与方法研究 复地嵌入每一帧中,故可采用圆周相关来寻找含水印信号的起始点,设五( 玎) 表示第k 帧信号的第n 个采样值,w ( ) 表示扩频水印信号,则检验统计量采用 1 一l ( n ) = 专枷f + n ) m o d n ) w ( f ) i f f i o 检测器使用该检验统计量的最大值m a x s 。( 九) 来判断水印是否存在。 n 另外一种方法使用广义似然比检测对起始端同步。广义似然比检测主要用来解决复合 假设检验问题,设检测器接收到的信号可表示为 主( f ) = x ( i + f ) + n ( f ) 0 蔓f n 一1 其中,石( f ) 表示嵌入器输出的信号,h ( f ) 表示信道噪声,假定为高斯白噪声,f 表示 信道延迟时间,这里f 是一个未知参数。广义似然比的基本思想是在两种假设情况下分别 对未知参数进行极大似然估计。然后使用估计的未知参数下的随机变量的分布组成似然 比检测器来判断哪个假设成立。在信道噪声为高斯白噪声情况下。采用的似然比为 人=甲e x p 滢加h ( f + 矿w ”) ) 2 m a x e x 一篓c 量c 。一x c ,+ r ,2 e x p | 一善 o 卜“力r 其中,w ( o 表示水印信号。这种方法只适用于非盲检测,因为在广义似然比检验时需 要原始石( f ) 。 2 近似同步 水印同步的最终目标是精确同步,然而这样的同步很复杂,故需要使用近似同步来快 速有效地定位可能的同步位置。一旦确定了近似同步位置,就可使用精确同步方法来准确 定位。由此,近似同步方法应该简单并且快速1 。 近似同步一个比较好的例子是联合采用能量和过零率方法。在这种方法中,需要计算 每一帧信号的能量和过零率。通过一个滑动窗获得各帧信号。如果某帧的这两个量满足预 定准则,则可判定这一帧接近同步帧。这种结论是从如下假设中获得的:音频信号的能量 和过零率具有不变性。例如,当一帧信号的能量很低而过零率很高时,这一帧为同步提供 了很好的线索。过零率高表明音频信号中有高频信号成分。信号能量的计算实现起来简单, 只需要将采样值取绝对值,然后求和。通过计算信号从正值到负值的变化次数,可计算山 每帧信号的过零率。 回声隐藏也可用来进行水印近似同步。例如如果确认存在回声,这表明这一i 愤信号 离同步很近。可惜的是,回声检测的计算量很大。 3 同步码 在时域中使用基于巴克码( b a r k e r ) 的同步码是一种很好的方法。巴克码可用来进行 同步是因为这种码具有特殊的自相关函数。为了在信号中连续地嵌入巴克码,若要嵌入的 信息为1时,信号采样值的最低1 3 比特被置为“1 1 0 0 0 0 0 0 0 0 0 0 0 ”,否则被置为 】5 数字音频水印理论与方法研究 0 1 0 0 0 0 0 0 0 0 0 0 0 ”。这种方法具有抗加性噪声能力和不可感知性等良好性能。 4 特征点提取方法 提取特征点而不改变原始信号也是一种很好的方案l “。这种方案的基本思想是提取 信号的特征点,即将音频信号能量快速爬升到峰值的部分作为特征点。对于只有几种乐器 演奏的音频片断,这种方法工作得很好。然而对于复杂的音频片断,这种方法有两个缺点: ( 1 ) 对于有很多乐器同时演奏的复杂信号,能景的变化变得模糊不清,特征点的稳定性下降。 ( 2 ) 要定义一个对所有信号片断都台适的闽值是很困难的,高阈值适合于能量变化很快的信 号,但是如果将同样的闽值用于复杂的信号,将产生很少的特征点。因此,需要使用音频 信号分析将信号分解为简单的信号,这种方法能够使特征点的稳定性提高。同时,相同的 闽值能够适用于所有音频片断。为避免这种复杂操作,可对音频信号进行特殊整形来近似 同步。这种方法特意修改信号的形状来保持特征点,使特征点在恶意修改攻击的情况下保 持不变。例如选择信号快速上升的部分,将其标记为特殊的锯齿波。这种修改会产生入 耳能够昕到的高频噪声。通过仔细摧形能够将噪声减小到几乎听不到。 5 节拍一比例缩放变换 节拍是音频信号中的显著的周期,是音频信号基本特征之一。严重的节拍变化能破坏 籀个乐曲。所以,节拍在攻击下几乎不变。在这种情况下,节拍可作为同步的重要标志, :1 ,拍一比例缩放可用来在水印检测器和音频片断中水印位置间进行同步“1 。节拍一比例缩 放变换方法计算音频信号中的平均节拍周期,并尽可能准确地确定每个节拍的位置,然后 将音频片断进行比例缩放( 即压缩或者拉伸) ,使每个节拍周期相等且等于平均节拍周期, 平均节拍周期被舍入到离它最近的样本块的整数倍上。在缩放后的音频片断中嵌入水印, 然后恢复为原来的节拍。只要节拍保持不变,就可从缩放后的节拍周期中检测到水印。使 用节拍一比例缩放变换方法进行同步依赖于节拍检测算法的准确性。 1 6 数字音频

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论