(信号与信息处理专业论文)抗mp3编码的音频水印技术研究.pdf_第1页
(信号与信息处理专业论文)抗mp3编码的音频水印技术研究.pdf_第2页
(信号与信息处理专业论文)抗mp3编码的音频水印技术研究.pdf_第3页
(信号与信息处理专业论文)抗mp3编码的音频水印技术研究.pdf_第4页
(信号与信息处理专业论文)抗mp3编码的音频水印技术研究.pdf_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

抗n p 3 编码的音频水印技术研究 上海大学硕士学位论文 摘要 本论文主要研究方向是以音频数据的版权保护为目的,在数字音频信号中 嵌入高度稳健的数字水印信号。该课题是国家自然科学基金项目“数字音频中 高度稳健的数据隐藏技术”( 6 0 0 7 2 0 3 0 ) 以及“基于统计盲分析理论的反密写 研究”( 6 0 3 7 2 0 9 0 ) 的组成部分。 数字水印技术是将一段特殊的信息隐藏在文本、图像、视频、音频等多媒 体数据中。音频数字水印的研究相对图像水印而言涉及得较少,但随着数字化 音像制品的大量制作和发行,音频数据的版权保护也显得越来越重要。数字水 印技术必然面临各种有意或无意的攻击,而就音频水印而言,m p 3 压缩是其面 临的最常见的操作之一。因此,本文的研究是围绕如何有效地抵抗m p 3 压缩展 开的。 作者通过深入研究数字水印技术和m p 3 的编码原理,将两者结合起来,取 得了以下主要成果: 口提出了一种能抵御m p 3 压缩的音频水印频域嵌入算法。该算法基于 m p 3 编码中所应用的心理声学模型和感知熵( p e ) ,对音频信号中p e 值大于1 8 0 0 的帧进行数字水印嵌入。嵌入在频域中进行,通过叠加一 个加权的随机复序列嵌入水印信息。在接收端,采用频域相关法能可靠 提取嵌入数据,仅用到少量系统参数丽不需要原始信号。 2 1 提出一种基于部分m p 3 编码的音频水印方案。该方案对原始的p c m 信 号进行部分m p 3 编码,通过调整迭代循环后相邻的一对量化m d c t 系 数的大小关系嵌入水印信息,然后进行局部m p 3 解码得到含水印的 p c m 信号。水印提取时不需要原始信号,也不需要进行迭代循环,只 要依次比较相应频带中相邻的一对m d c t 系数的大小即可。由于水印 算法应用了m p 3 编码的原理,所以对m p 3 有优良的稳健性。 关键词:数字音频水印,心理声学模型,感知熵,m p 3 编码,音质评价 抗m p 3 编码的音频水印拽术研究 上海大学硕士学位论文 a b s t r a c t t h i st h e s i sf o c u s e so ne m b e d d i n gr o b u s tw a t e r m a r ki nd i g i t a la u d i os i g n a lt o p r o t e c tc o p y r i g h t o fa u d i op r o d u c t i o nt h i si sa p a r to fp r o j e c t “h i g h l yr o b u s t t e c h n i q u ef o r d a t ah i d i n gi n d i g i t a l a u d i os i g n a l s ”( 6 0 0 7 2 0 3 0 ) a n d “a n t i - s t e g a n o g i a p h yb a s e do i lt h et h e o r yo fb l i n ds t a t i s t i ca n a l y s i s ”( 6 0 3 7 2 0 9 0 ) f u n d e db y n a t i o n a ln a t u r a ls c i e n c ef o u n d a t i o no f c h i n a d i g i t a lw a t e r m a r k i n gt e c h n i q u eu s e dt oe m b e ds p e c i a li n f o r m a t i o ni n t ov a r i o u s f o r m so fm e d i as u c ha s t e x t ,i m a g e ,v i d e o o ra u d i ot h er e s e a r c ho fa u d i o w a t e r m a r k i n gi sm u c hl e s st h a ni m a g e o t h e r w i s e ,t h ec o p y r i g h tp r o t e c t i o no fa u d i o d a t ai sm o r ea n dm o r ei m o r t a n tw i t hw i d eu s eo fd i g i t a la u d i op r o d u c t s d i g i t a l w a t e r m a r k i n gm u s tc o n f r o n tv a d o u sm a l i c i o u so ra n c o n s c i o u sa a a c k s m p 3e n c o d i n g i so n eo fm o s tc o l y l r t l o no p e r a t i o n m a i nr e s e a r c ho ft h et h e s i si sh o wt oa c h i e v eh i g h i m p e r c e p t i b i l i t ya n ds a t i s f a c t o r yr o b u s t n e s sa g a i n s tm p 3e n c o d i n g m a i nc o n t r i b u t i o n so ft h ea u t h o r sr e s e a r c ha n dd e v e l o p m e n tp r e s e n t e di nt h i s t h e s i sa r ea sf o l l o w s : 口t h ef i r s tm e t h o di s p r o p o s e d ,b a s e do nt h ep s y c h o a c o u s t i cm o d e l i ia n d p e r c e p t u a le n t r o p y ( p e ) u s e di nm p 3e n c o d i n g w a t e r m a r ke m b e d d i n gi s c a r r i e do u tb ym o d i f y i n gt h ef r a m e sw i t hp ea b o v e1 8 0 0 b ya d d i n ga r a n d o mc o m p l e xs e q u e n c et ot h es p e c t r a lc o m p o n e n t si nt h em e d i u ma n d l o wb a n d si nt h ef r e q u e n c yd o m a i n ,aw a t e r m a r ki se m b e d d e d e x t r a c t i o no f t h ee m b e d d e dd a t ai sa c h i e v e du s i n ga f r e q u e n c yd o m a i nc o r r e l a t i o n a p p r o a c h ,w i t h o u tu s i n gt h eo r i g i n a lh o s ts i g n a lb u to n l yaf e ws y s t e m p a r a m e t e r s 口t h es e c o n ds c h e m ei sb a s e do np a r t i a lm p 3e n c o d i n g t h eo r i g i n a lp c m s i g n a li sf i r s tu n d e r g o n eap a r t i a lm p 3e n c o d i n gt op r o d u c eq u a n t i z e dm d c t c o e f f i c i e n t s a na p p r o p r i a t eb a n di nt h ec o t m t lr e g i o n ,i nw h i c hm a g n i t u d e o fa n yq u a n t i z e dm d c tc o e f f i c i e n ti se i t h e rlo r0 ,i sc h o s e nf o rd a t a e m b e d d i n g e a c hp a i ro ft h eq u a n t i z e dm d c tc o e f f i c i e n t si su s e dt oh i d e1 b i ta f t e rm o d i f i c a t i o no ft h ec o e f f i c i e n t s ,p a r t i a ld e c o d e ri s p e r f o r m e dt o r e t u mt ot h ep c md o m a i n a st h e a l g o r i t h m h a st a k e na c c o u n tt h e c h a r a c t e r i s t i c so f m p 3e n c o d i n g ,i ti sr o b u s ta g a i n s tm p 3 i i 抗m p 3 编码的音频水印技术研究 i 一海大学颁:e 学何论文 k e yw o r d s :d i g i t a la u d i ow a t e r m a r k i n g ,p s y c h o a c o u s t i cm o d e l ,p e r c e p t u a le n t r o p y m p 3 e n c o d i n g ,a u d i t o r yq u a l i t ya s s e s s m e n t i i i 原创性声明 本人声明:所呈交的论文是本人在导师指导下进 行的研究工作。除了文中特别加以标注和致谢的地方 外,论文中不包含其他人已发表或撰写过的研究成果。 参与同一工作的其他同志对本研究所做的任何贡献均 己在论文中作了明确的说明并表示了谢意。 签名:亟 络日期丝! :乏 ! 本论文使用授权说明 本人完全了解上海大学有关保留、使用学位论文 的规定,即:学校有权保留论文及送交论文复印件, 允许论文被查阅和借阅;学校可以公布论文的全部或 部分内容。 ( 保密的论文在解密后应遵守此规定) 签名: 导师签 日期: 抗m p 3 编码的音频水印技术研究上海大学硕士学位论义 绪论 第一节引言 在现今的信息化世界里,由于数字产品便于携带、修改和传输的特点,使 得数字媒体产品的应用大幅增长,包括数字图像,数字音频,数字视频等。虽 然数字媒体产品有着诸多的优点,但是同时给多媒体产品的发行带来了很多突 出问题。比如,任何人可以很容易地通过网络下载到各种信息资料,甚至可以 不经作者同意,任意地复制、传播,侵犯了原创者的著作权。从多媒体产品生 产者及作者的角度看来,毫无限制的复制必须禁止,这不但侵犯了知识产权, 也给他们造成重大经济损失。因此,信息安全保护在数字媒体日益普及的今天 显得越来越重要。 近年来,水印技术作为信息安全保护的一种途径,得到了很快的发展。数 字水印技术属于信息隐藏的范畴。它是利用听觉和视觉的掩蔽效应和信号本身 的冗余,在不降低载体商用价值的前提下,将稳蔽的版权信息嵌入到原始信号 中,作为知识产权保护的一种重要技术手段。为了能够抵抗恶意的攻击或在通 过恶劣的传输环境之后仍然能检测出水印数据或证明特定水印的有无,要求水 印算法具有良好的稳健特性。 第二节课题来源 本论文研究的课题是国家自然科学基金项目“数字音频信号中高度稳健的 数据隐藏技术”( 6 0 0 7 2 0 3 0 的组成部分。该项目研究工作主要包括两方面: 一是高保真音频信号中的数字水印,以知识版权保护为主要应用目标;另一个 是语音通信中隐蔽嵌入信息技术,是在数字语音信号中嵌入附加信道,并且维 持已有通信系统框架不变,具有高度兼容性。 本文的研究属于第一种应用:以知识版权保护为目的的高保真度音频信号 巾的数字水印,在深入研究m p 3 编码原理和信息隐藏技术的基础上,将两者结 合起来,提出能够很好地抵抗m p 3 压缩的稳健音频水印算法,并且进行音质评 测、抗攻击性能测试和讨论,以及探讨参数调整给系统性能带来的影响。 2 执m p 3 编码的音频水印技术研究上海大学硕士学位论文 第三节本文的研究内容 作者研究和开发所取得的成果主要包括以下几个方面: 口提出两种数字音频水印嵌入方法。第一种方法是利用了m p 3 编码中所 应用的心理声学模型i i 和感知熵( p e ) ,直接在频域的复数表示中嵌 入水印信息,实现高度隐蔽和稳健的公有水印嵌入。( 论文:抗m p 3 编码的音频水印频域嵌入方案, 应用科学学报录用) 口第二种方法是对原始的p c m 音频信号进行部分m p 3 编码,通过调整迭 代循环后相邻的一对量化m d c t 系数的大小关系嵌入水印信息,同样 具有高度的隐蔽性和稳健性。( 论文:一种基于部分m p 3 编码原理的 音频水印,中山大学学报,2 0 0 4 增刊( 2 ) ) 本项研究的创新之处有: 口 利用可感知熵p e 寻找嵌入帧。p e 值表示信号对噪声的容忍度,它可 用来评估音乐中与感知特性有关的信息量,能够表示音频信号压缩的 理论潜力。在m p 3 编码时,对p e 较大的帧会分配较多的比特数,即 m p 3 压缩对其产生的影响较小,根据编码原理选择p e 值大于1 8 0 0 的帧作为水印的嵌入帧可有效提高水印抵抗m p 3 编码的稳健性。 口 利用m p 3 编码中所应用的心理声学模型i i 计算出来的掩蔽闽值,对 水印信息进行整形,因此在嵌入强度一定的情况下,使水印隐蔽性好 且具有较强的鲁棒性。 口 嵌入时,用掩蔽阙值对一个等幅值的随机复序列所代表的水印信号进 行频谱整形,这样可使水印信号频域能量的分布与掩蔽闽值的形状保 持一致。在接收端,可直接在频域的复数表示中做相关检测即可。 口 本文所提出的第二种算法是在m p 3 编码的迭代循环后通过修改量 化后小值区中的m d c t 系数来嵌入水印信息。由于小值区中的 m d c t 系数的幅值是小于等于1 的,因此修改的最大范围是在量化步 长之内,所以具有较好的隐蔽性。 口 嵌入时,是以小值区中前后两个m d c t 系数的大小关系来表征水印 信息的,所以避免了量化步长的传递。在接收端,不需要进行迭代循 环,只要判断相应频带中前后两个m d c t 系数幅值的大小,即可提 取出水印信息。 3 执m p 3 编码的音频水印技术研究 上海大学硕上学位论文 第四节论文内容安排 本文最主要的工作是将m p 3 编码原理和数字水印技术结合起来研究,充分 利用m p 3 压缩的特性,提出能够很好地与m p 3 编码相兼容的稳健音频水印算 法。嵌入的水印在稳健性和隐蔽性方面都有优良的性能。 论文各章的具体安排如下: 第一章是概述。主要介绍数字水印出现的背景,主要的应用以及决定水印 技术优劣的性能指标,这是在水印技术设计以及性能评价的时候非常重要的参 数。最后扼要介绍了常见的数字音频水印技术。 第二章详细介绍m p 3 编码原理,本论文所提出的两种算法都是基于本章的 内容之上,这是本论文研究工作的重要基础。 第三、四两章为本论文重点。第三章提出一种抗m p 3 编码的音频水印频域 嵌入方案。由于充分利用了m p 3 编码所用的心理声学模型i i 和p e 值,所以具 有优良的隐蔽性和稳健性,其性能在系统性能的测试与分析中得到验证。 第四章首先简要分析了以往针对压缩标准所提出的几种算法。然后,详细 介绍了一种基于部分m p 3 编码的音频水印方法,该方法对每条谱线修改的最大 范围是在量化步长之内,所以具有较好的隐蔽性。同时,嵌入策略简单易行, 也避免了量化步长的传递。本算法严格按照m p 3 编码过程进行处理,具有很强 的针对性,所以对m p 3 有很好的稳健性。 第五章结束语。 4 抗m p 3 编码的音频水印技术研究上海大学硕上学位论文 第一章数字水印概述 本章内容提要: 口数字水印定义和性能参数 口数字水印技术的主要应用 口常见的数字音频水印技术简介 第一节数字水印技术产生的背景及主要应用 一引言 正在进行的数字信息革命给我们的社会和生活带来了深刻的变化和影响。 信息媒体的数字化为信息的处理、存储、拷贝和传播提供了极大的便利,也显 著提高了信息表达的效率和准确性。但随之带来的问题是:多媒体信息产品有 可能在没有得到作品所有者许可的情况下被无限剑地拷贝、传播和篡改,给信 息拥有者的合法权益构成极大的潜在威胁。这种威胁将极大地打击数字媒体工 作者的创作积极性和网络在线服务的发展,进而可能严重地阻碍数字媒体产业 ( 细数字音频、数字图像、数字视频等) 和信息服务业的发展。因此,多媒体 产品的版权保护已成为一个富有挑战性并且迫切需要解决的问题 1 2 1 。 数字水印技术就是在上述背景下被提出的,它是近年来多媒体信号处理领 域提出的一种保护数字媒体版权的新方法 ”。数字水印技术属于信息隐藏的范 畴它是将标志产品著者、所有者、发行者、使用者、出品时间等的信息在不 影响载体信息商用价值的情况下按一定的算法嵌入到载体数据中,并且水印信 息可以从加载了水印的信号中检测或提取出来。数字水印技术的目的不是制止 非法复制,而是鉴别哪些产品是非法复制品,从而用作证据,成为保护知识产 权的重要技术手段。数字水印技术与信息隐藏、密写术、密码学的关系关系如 图11 所示。 5 执m p 3 编码的音频水印技术研究 上海大学硕士学位论义 图1l 数字水印技术与信息隐藏、密写术、密码学的关系 二数字水印研究发展现状 2 0 ! :纪9 0 年代多媒体技术的逐渐成熟和电子商务的兴起,网上多媒体信 息急剧增加,这就迫切需要能够有效地保护数字产品版权的手段,市场需求促 成了技术的产生,这种需要成为数字水印技术研究的推动力。 第一篇关于数字图像水印的文章发表于1 9 9 0 年。1 9 9 5 年以后,数字水印 技术获得了广泛的关注并且得到了较快的发展,第一届有关这项技术的国际学 术会议于1 9 9 6 年召开。1 9 9 8 年,美国版权保护组织( c p t w g ) 成立了专门的 数据隐藏小组( d h s g ) ,考虑制定版权保护水印的技术标准。 为研究网络时代音乐版权保护技术而由r i a a 及大唱片公司于1 9 9 9 年2 月 成立了业界团体s d m i ( s e c u r ed i g i t a li n i t i a t i v e ) ;v e r a n c e 公司是由a r i s 和 s o l a n a 两家公司于1 9 9 9 年6 月合并的,它在音频水印技术开发及应用方面处于 世界先进水平。 由欧洲委员会资助的几个国际研究项目也正致力于实用的水印技术研究。 t a l i m a n 的目标是为欧盟成员国的服务提供者提供一个标准版的版权保护机 制,以保护数字化产品,防止大规模商业盗版和非法拷贝。欧盟期望能使其成 员国在数字产品电子交易方面达成协议。其中的数字水印系统可以提供对复制 品的探测追踪。 最近几年,数字水印发展得很快,研究目标也从版权保护扩展到了很多其 它的应用领域。但是目前的研究成果还很不成熟,即使是研究最多的版权保 护,也尚未形成统一的国际标准。而且,随着多媒体技术的发展,数字水印技 6 抗m p 3 编码的音频水印技术研究 上施大学硕上学位论文 术涵盖的应用领域也在不断扩大,有很多领域尚未被研究或研究得很少。 困此,出于数字水印技术对于实际应用的重要性以及这项技术目前的研究 现状,对其进行更为广泛而深入的研究是很有必要的。 三水印技术的应用举例 数字水印主要有以下几个方面的应用: i 版权保护 互联网和电子商务的发展,使数字媒体可以通过下载或者网上直接购买, 如何有效保护这些数字产品的版权成为一个非常关键的问题,这也是数字水印 技术的主要推动力。 2 数字指纹 为了避免未经授权的拷贝制作和发行,出品人可以将不同用户的i d 或序列 号作为不同的水印( 指纹) 嵌入作品的合法拷贝中。一旦发现未经授权的拷 贝,就可以根据此拷贝所恢复出的水印来追查非法拷贝的来源。 3 防止非法复制 有效的版权保护,还必须跟相应的多媒体设备相结合,使得非授权者不能 对数字产品进行非法拷贝。对含有“允许拷贝次( c o p yo n c e ) ”水印的数据 只能拷贝一次,而不能多次拷贝。 4 真实性认证 真实性认证的目的是指示数字产品的内容是否被破坏、如何被破坏以及被 破坏的程度和区域。 5 ,电子商务中的网页保护和票据防伪 随着高质量复制设备的出现和电子商务的兴起,票据防伪技术也在不断发 展,电子票据的水印也将在今后几年得到更多的研究。 6 保密通信 可以把需要传递的秘密信息嵌入到可以公开的媒体中。 7 数据传输的辅助通道 在同一个信道同一个频带中传输两种不同的混合数据,并且能与现有的模 拟设备兼容。比如在电视伴音信号或者电话话音信号( 一般为模拟信号) 中隐 藏额外的信息,可以在不改动现有设备的前提下,提供数据传输的辅助通道。 7 抗m p 3 编码的音频水印技术研究上海大学硕士学位论文 第二节数字水印系统及性能指标 数字水印的一般系统构成图 数字水印 原始载体信息 水印密钥 水印信息 水印密钥 图1 2 数字水印的一般系统构成图 一攻击 印数据 二数字水印系统的性能指标 从上面的介绍可以知道,水印技术有很多不同的应用。在不同的应用场 合,对数字水印系统性能的具体要求会有所不同。但是,有些要求在大部分场 合下都要满足,这部分将介绍水印系统最基本的一些要求。 1 隐蔽性 水印系统一个基本要求就是感觉上的透明性。在多媒体数据中嵌入数字水 印不能造成载体信号主观质量的明显下降且不易被察觉,否则的话将失去信息 隐藏的意义,同时也将影响原始信息的使用价值。 2 鲁棒性 在不破坏多媒体主观质量的前提下,对多媒体数据经过有意或无意的操作 后,数字水印仍能保持完整性,且能被鉴别出来。这些操作包括所有可能的信 8 抗m p 3 编码的音频水印技术研究 _ | 二海大学硕士学位沦文 号处理,如加入信号、滤波、变形、剪切、编码等,电包括所有未经授权的恶 意攻击。 3 信息量 它是指在不影响载体原有质量的前提条件下,所能嵌入水印数据的量。数 字水印算法对信息隐藏容量的要求依赖于不同的应用。如版权保护、指纹等应 用中对于可嵌入的信息量要求不大,而在隐蔽通信、辅助信道中要求的町嵌入 信息量则要大得多。 总之,对任何系统来说,都存在隐蔽性,鲁棒性,信息量三个性能如何折 衷的问题。鲁棒性与嵌入强度真接有关;而嵌入强度越大,隐蔽性就越差;如 果既要有强的鲁棒性又要保持好的隐蔽性,就要以牺牲水印信息容量为代价。 实践中需根据具体应用要求在三者之间寻求平衡点。 第三节数字音频水印技术简介 一概述 数字图像水印【4 ,5 1 由于有着迫切的市场需求和广泛的应用前景而备受重视, 相比较图像水印的发展,音频水印技术的研究滞后一些。但是,随着数字化音 像制品和音乐制品的大量制作和发行,音频数据的版权保护也显褥越来越重 要。通过在音频载体中嵌入水印信息,可以实现拷贝限制、使用跟踪、盗用确 认等功能。近年来有关音频水印技术方面的研究工作发展的速度很快,尤其在 变换域的音频信息的嵌入技术方面,由于能将信息嵌入到载体的敏感区域,使 得对其进行研究更具有实用性。 二音频信号的特性 虽然基于音频信号的信息隐藏技术近几年来得到了迅速发展,但与图像和 视频水印相比,对音频水印算法的研究还不够成熟,主要原因在于人类听觉系 统比人类视觉系统更加敏感,水印算法很难在保证透明性的同时又具有良好的 鲁棒性。 由于人类的听觉与视觉的特性差别比较大,因此相对于图像来说,音频信 号有一些自己的特点。 9 抗m p 3 编码的音频水e _ :j 技术研究 上海大学项十学位论文 处理,如加入信号、滤波、变形、剪切、编码等,也包括所有未经损权的恶 意攻a i 。 3 信息量 它是指在不影响载体原有质量的前提条件下,所能嵌入水印数据的量。数 字水印算法对信息隐藏容量的要求依赖于不同的应用。如版权保护、指纹等廊 用中对于刮嵌入的信息量要求不大,而在隐蔽通信、辅助信道中要求的司嵌入 信息量则璺大得多。 总之,对任何系统来说,都存在隐蔽性,鲁棒性,信息量三个性能如何折 衷的问题。鲁捧性与嵌入强度直接有关:而嵌入强度越大,隐蔽拌就越差;如 果既要有强的鲁棒性又要保持好的隐蔽性,就要以牺牲水印信息容量为代价。 实践c t 需根据具体应用要求在三者之间寻求甲衡点。 第三节数字音频水印技术简介 一概述 数字图像水f pf 4 , 5 1 由于有着迫切的市场需求和广泛的应用前景而备受重视, 相比较图像水印的发展,音频水印技术的研究滢后一些。但是,随着数字化音 像制品和音乐制品的大量制作和发行,音频数据的版权保护也显得越来越重 要。通过在音频载体甲嵌入水印信息,可以买现拷贝限制、使用跟踪、盗用确 认等功能。近年来有关音频水印技术方面的研究工作发展的速度很快,尤其在 变换域的音频信息的嵌入技术方面,由于能将信息嵌入到载体的敏感区域,使 得对其进行研究更具有实用性。 二音频信号的特性 虽然基于音频信号的信息隐藏技术近几年来得到了迅速发展,但与翻像和 视频水e f 相比,对音频水印算法的研究还不够成熟,主要原因在于人类听觉系 统比人类视觉系统更加敏感,水印算法很难在保证透明性的同时又具有良好的 鲁棒性。 d 于人类的听觉与视觉的特性差别比较太,因此相对于图像来说,音频信 号有一些自己的特点。 g 有一些自己的特点。 9 抗m p 3 编码的音频水印技术研究上海大学硕士学位论文 1 图像是二维的信号,而声音是一维的信号。二者的带宽不i 刊。 2 人类对声音的感知是声音的强弱( 声强) 和声调的高低( 频率) ,人 类对图像的感知是图像的光的亮度和不同的颜色。人耳可以看作是一个滤波器 组,即直接感知声音的频率。人类听觉系统的一些感知特点可以用心理声学模 型束描述。 3 对于图像来说,把图像变换到频域,人类对图像的相位感知很敏感。 而对声音来说,人耳对声音的相对相位是敏感的,而对绝对相位是不敏感的。 4 相对于人眼对颜色的感知,人耳对不同频率的敏感程度差别很大,其 中列2 k h z 4 k h z 范围的信号最为敏感。而在低频区和高频区,能被人耳听到的 s p l ( s o u n d p r e s u r el e v e l ) 要高得多。 5 相比静止图像,音频信号的数据量要大得多,因此,很多算法要分块 处理,这样必须考虑块与块之间的一些问题。另外,声音是一种非平稳信号, 在对声音进行分块变换时,需要考虑信号的时变特性。 三音频水印常用技术 基于上述音频信号的特点,提出了许多音频水印1 的嵌入算法,这些算法 大致可以分为时域算法和变换域算法两大类。由于时域方法的鲁棒性比较差, 目前研究的方向主要集中在变换域的方法。下面对两类算法中常用的音频水印 嵌入技术的基本原理做简要介绍。 1 时域算法 1 2 1 最不重要位( l s b ) 方法 l s b 方法是将水印信息嵌入到宿主信号中最简单的方法。它在空时域实现 隐藏。任何水印序列都可以转化为二进制的码流,用此码流来替换信号中不重 要的低能比特,实现信息嵌入。有两个方法可以用来提高安全性,一是水印序 列进行预加密;二是在嵌入时用伪随机序列控制水印比特嵌入的位置。伪随机 序列产生的种子可以作为水印提取时的密钥,接收者只需要根据密钥,在指定 位置提取出隐藏的比特流即可。 l s b 算法具有如下优点:方法本身简单易实现:音频信号里可编码的数据 量大:采用流加密的方法对数据本身和嵌入过程进行加密,安全性完全依赖于 密钥;嵌入和提取算法简单,速度快。它的最致命的缺点是对信道干扰和信号 l o 抗m p 3 编码的音频水印技术研究 上海大学硕上学位论文 处理的抵抗性很差,通常的信号处理过程都将使水印信息的提取失败。 口相位编码 相位编码利用了人的听觉系统一个重要特性:人耳对绝对相位不敏感而对 相对相位敏感。基于这一特点,用水印数据对应的参考相位代替原音频段的绝 对相位,然后对其他音频段的绝对相位进行调整,保证各段信号间的相对相位 不变。 要注意,嵌入数据后的相位变化要平缓,因此对原始信号相位改变的频率 不能过快,否则如果相位突变较大,就会被人耳察觉。一般相位编码的信息嵌 入率为8 b p s 一3 2 b p s ,如果背景比较安静,选择8 b p s ;如果背景比较嘈杂,可增 大嵌入率到3 2 b p s 。 口回声编码 同声编码利用人类听觉系统在时域的后掩蔽效应,即:弱信号在强信号消 失后1 5 0 m s 内出现,不能被人耳察觉它的存在。在回声编码算法中,用不同延 迟的回声信号来分别对应水印序列中的0 和1 。 其中0 ,1 对应回声的时间偏移量以及相对原始信号的衰减值直接影响了水 印的隐蔽性和提取的准确性。回声的偏移量应该在5 0 1 5 0 m s ,大于1 5 0 m s 就会 被察觉,小于5 0 m s 将增加提取的难度;幅度衰减的选取应该在隐蔽性和提取 的准确度间进行折衷。 提取时应用了倒谱。对一个音频回声信号,在倒谱的自相关相应位置上会 有一个脉冲出现。通过提取此脉冲的位置,可以得知嵌入的比特是0 还是1 。 2 变换域算法 口d c t 方法,1 2 】 离散余弦变换( d c t ) 域中的水印方案在图像领域得到了深入的讨论,这是 因为d c t 是数字图像有损压缩j p e g 的核心算法。为了增强音频水印的稳健 性,也尝试在音频信号的d c t 系数中嵌入秘密信息。在水印嵌入时,根据选 定的门限t - ,大于该门限的系数嵌入水印;接受方给定另一个门限值t 2 ,如果 系数大于该门限,认为嵌有水印。 口d f t 方法 频域( d f t ) 方法也是音频水印的主要方法。对频域的修改可以扩散到一 帧信号时域上的所有采样点。而且,如果水印的频域嵌入只影响了频域系数的 抗m p 3 编码的音频水印技术研究 上海大学坝l 学位沦文 幅度,检测提耿水印时可以不要求水印信号的精确同步。凶为帧起始位管的偏 差会引起频域系数的相位发生变化,对幅度影响不大,所以只要检测提驳日i 的 一帧信号与嵌入时的一帧信号绝大部分重合就可以正确恢复出水印信号。如果 水印信号的嵌入既利用了频域系数的幅度又利用了频域系数的相位,那么在检 测提取时就要要求信号的精确同步。 口小波变换方法 与以往的水印算法比较,小波水印显示出良好的稳健特性,在经历了各利t 处理和攻击以后仍能保持很高的可靠性。对于水印的添加而言,小波变换的类 型、水印的种类、水印添加的位置以及水印的强度,这四大要素决定了水印嵌 入算法的类型。关于音频小波域的水印嵌入技术还有待进一步的探讨。 此外还有量化水印、扰动调制和其他一些水印方案。 l2 抗m p 3 编码的音频水印技术研究 上海大学硕士学位论文 第二章m p 3 编码原理 本章内容提要: 口m p 3 编码原理概述 口m p 3 的编码过程 第一节m p 3 编码原理概述 南i s o i e c 组织所制订的m p e g 。i 1 6 3 音频编码标准是目前使用最广泛的音 频压缩方法之一,它支持单声道、双声道、立体声或联合立体声的编码格式。 m p e g 一1 音频部分提供了三层独立的编码方式,它们具有不同的运算复杂度, 提供不同的音质及压缩率,以适应各种各样的应用需求。层t 最简单,适于使 用的比特率为1 2 8 k b i v s ( 每声道) 以上。层i i 的精度比层i 更高,复杂度中 等,适于使用的比特率为1 2 8 k b i t s ( 每声道) 左右,其应用包括;数字,1 。播, c d - - r o m 以及v c d 等。层i i i 即现在流行的m p 3 音乐格式,它加入了些可 实现低速率高保真音质的先进技术,算法复杂度最高,但音质最好。以下将主 要介绍第三层( 即m p 3 ) 的编码原理。 m p 3 编码原理的框图如图2 1 所示。以单声道而言,m p 3 的一个编码框包 含11 5 2 个声音取样( 一个编码框又分成两节( g r a n u l e ) ,每节包含5 7 6 个声音 取样) ,每个取样为1 6 比特。m p 3 编码时,首先将原始输入的1 6 b i tp c m 信 号经过滤波器组分析( f i l t e rb a n ka n a l y s i s ) ,转换成3 2 个等频宽的子频带信 号( s u b b a n ds i g n a l s ) ,然后经过修正的离散余弦变换( m d c t ) ,将每个子频 带信号,再细分为1 8 个次频带。然后根据心理声学模型i i ( p s y c h o a c o u s t i c m o d e li i ) 所提供的信号掩蔽比( s m r ) 。对每一个子频带信号,做比特分配 和最化编码。最后只要将编码后的数据依照m p e g 1 定义的比特流的格式输出 即可。 l3 抗m p 3 编码的音额水e ;| j 技术研究上海大学硕上学位论文 叫椭嚣:嚣蒿。h ,r a t e & 。d 。i s 。t 叩o r t i o “卜 l jl b i t s t r e a m w i n d o w s m r f o r m a t t i n g s w i t c h 、r 一j 。,i i s i d i n f o r m a t i o m o d e l 图2 m p 3 编码原理框 第二节m p 3 编码原 一混合滤波器 混合滤波器组包含两部分:多项式分析滤波器组和修正型离散余弦变 ( m d c t ) ,如图2 2 所示 图2 , 2 混合滤波器 抗m p 3 编码的音频水日】技术研究 上海大学硕士学位论文 多项式分析滤波器组是用来做信号的子频带分析的,由3 2 个f i r 型b p f 组成,每个b p f 的长度是5 1 2 点。它将输入信号分解成3 2 个等频宽的子频带信 号输出。因此,实际上是用一个3 2 5 1 2 的变换矩阵将输入序列中连续的5 1 2 个数据点构成的输入矢量,变换成一个具有3 2 个分量的输出矢量。其中,输出 矢量中的3 2 个数据点是按子带频率从低到高顺序排列。 滤波器组完成了输入样本从时域到频域的映射,由于标准提供了特定的时 频变换矩阵,所以计算得到的频域样本数与时域样本数相同。每输入3 2 个 p c m 信号做一次滤波器组分析,然后可以得到3 2 个输出( 每个子频带有一个 输出) 。在m p 3 编码中一个编码框有1 1 5 2 个样本,所以共需做3 6 次予频带分 析。 修难型离散余弦变换( m d c t t ”1 ) 是由d c t 变换发展来得。d c t 变换一 般是各分块独立进行的,由于边界处存在着固有的不连续性,因此在这些分块 边界处就可能产生很大的噪声。为了削减这种噪声,通常采用将相邻分块的数 据点进行部分重叠后再做变换。但这种重叠变换导致了d c t 编码效率的降低, 为此,p r e c e n 和b r a d l y 提出了一种修正型d c t ,简称m d c t ”】。 在m p 3 编码中采用m d c t 来实现信号的时域到频域的映射变换,主要是 麟于以下几点考虑: 1 ) m d c t 具备完整重建特性,在无限精度条件下可以准确重建信号。 2 ) m d c t 一次处理m 个新数据,产生m 个频域系数。因此m d c t 具有临 界抽样特性,不产生冗余数据,不增加系统的数据负荷。 3 ) m d c t 可以有效地降低编码重建信号的块边界效应。 4 ) m d c t 域和d f t 之间存在直接的关系,m d c t 变换的系数可以代表信 号频谱。 5 ) m d c t 是重叠调制变换,可以利用基于f f t 的快速算法,也可以利用 基于d s t 和d c t 的快速算法来实现。 原始信号经过滤波器组分析之后,分解成3 2 个等频宽的子频带信号,为了 提高频率分辨率,将每个子频带信号再经m d c t 细分成多个频率信号。m d c t 包含了m d c t 窗、m d c t 和长窗重叠对消( a l i a s i n g c a n c e l l a t i o n ) 三个部分。 15 执m p 3 编码的音频水印技术研究 上海大学硕十学位论文 m d c t 热有四种窗:长窗( n o r m a lw i n d o w ) 、长短窗( s t a r tw i n d o w ) 、 短窗( s h o nw i n d o w ) 和短长窗( s t o pw i n d o w ) 。窗类型的选择是由心理声学 模型计算出来的p e 值决定的。决定好窗的类型后就可以做m d c t 变换: 一v ,= y 。,。z , j 。- 。( 、:t + ,+ 詈 ( z r + ,) j f o rf - 0 , 1 ,善一1 ,( 21 其中,磊是子频带信号与m d c t 窗相乘后的结果。若此处是短窗则做短块d c t ( n - 1 2 ) ,否则做长块d c t ( n = 3 6 ) 。对于长块d c t 变换后,还需要做重叠 对消( a l i a s i n gc a n c e l l a t i o n ) 来降低边界效应。得到的x 的值将被量化后进行 编码。 二心理声学模型 m p e g 1 a u d i o 之所以能够达到高压缩比并且维持一定的声音品质,最主要 的原凶是它采用了心理声学模型来模拟人耳的听觉特性。心理声学模型是为了 获得滤波器组每一个子带内刚好察觉的噪声级即它的掩蔽阈值( m a s k i n g t h r e s h o l d ) 。对于子带滤波器组输出的频谱值量化后产生的噪声,如果能够被 控制在掩蔽闽值以下,则最终的压缩数据被解码以后的结果与原始信号可以不 加区分。一个给定信号的掩蔽能力取决于它的频率和响度,所以心理声学模型 最终输出的是信掩比s m r ( s i g n a l t o ,m a s kr a t i o ) ,即信号强度与掩敲闽值的 比率。其中,阈值是以频率为自变量得到的。 m p e g 1 音频标准提供了两种心理声学模型,模型i 比模型i i 简单,两个模 型对所有层次都适用。实际上,对两种可供选择的模型,m p e g 1 建议第一、二 层采用模型i 计算,而第三层采用模型i i 。两种模型之间的差别是模型t 输出 的是每一个子带的信掩比,而模型i i 输出的并不是面向3 2 个子带的信掩比,在 m p 3 中是基于对混合滤波器组输出的频谱值重新分割后,即将时频映射后的谱 值重新分割,把它们分成6 3 个闽值分区,然后将每个分区中的闽值直接转换到 比例因子频带中。按照规定,对于长块,算法将6 3 个闽值分区转换成2 1 个比 例因子频带,需要计算每个比例因子频带的信掩比。而算法将每个短块的3 9 个 阊值分区转换为1 2 个比例因子频带,对于每节数据的三个短块一共要求出3 6 个比例因子频带的信掩比。 l6 抗m p 3 编码的音频水印技术研究 上海大学硕十学位论文 在m d c t 的运算中包括四种窗,其中,长窗、长短窗和短长窗属于长块编 码,短窗属于短块编码。每节的数据是用长块编码还是短块编码,是取决于前 节的编码类型和和当前节计算出来的感知熵( p e ) ,p e 值是由心理声学模型提 供的,其具体的计算过程请参照第三章。根据图2 , 3 来选择当前节的编码类型, 网中当p e 1 8 0 0 时,表示条件成立。 图23 编码类型状态圈 三量化与编码 根据心理声学模型的输出,对经过m d c t 输出的样本以节为单4 _ , 2 进q 3 :l l 特 位的量化和分配。m p e g - 1 使用了一个三级迭代的循环,如图2 , 4 。最高一级为 帧循环程序,帧循环程序调用一个称作外层选代循环的程序,外层迭代循环调 用它的子程序,即内层迭代循环。 图2 , 4 三层迭代循环模型 l7 抗m p 3 编码的音频水印技术研究上海大学硕士学位论文 量化编码是根据心理声学模型提供的s m r 进行的。首先帧循环对此模型所 用剑的迭代变量复位,计算压缩每节数据所能提供的最大比特数。然后调用外 层迭代循环,这层循环首先调用内层迭代循环,通过递增量化步长使量化输出 能够在一定的比特位数限制之内被编码。然后确定霍夫曼码表的选择,并对量 化频谱进行比特编码。如果经过量化产生的噪声过大,有可能导致样本失真而 无法被正确解码,所以外层迭代循环根据内层输出来检测每个比例因子频带的 量化噪声,如果超过了所允许的最低掩蔽阀值,则以比例因子为迭代变量,不 断递增其值,重新调用内层迭代循环,使量化满足要求。一旦满足要求,存储 每个比例因子频带最终的比例因子数值,跳出外层迭代循环。在帧循环中计算 存储每节数据实际所用到的比特数。 1 ) 帧循环 在该层循环中主要包括:计算每个编码框所需的平均比特数、复位所有的 迭代变量和计算比例选择因子( s c s f i ) 。 式( 2 2 ) 是计算编码框所需平均比特数的计算方法。以4 4 1 k i - i z 的采样频 率,1 2 8 k b i t ( 双声道) 的编码速率为例,一帧数据被压缩后所占的比特数为 3 3 4 3 比特,去掉每帧数据的头信息( 3 2 比特) 和附加信患,得到每节在双声道 压缩时的平均比特数是1 5 2 7 比特。 每帧可编码的平均比特数:鱼! 翌型! ! ! b i t s f r a 。( 22 ) s a m p l i n gf r e q u e n c y 复位的迭代变量包括:各比例因子频带的比例因子数值,量化步长的计数 器q q u a n t ,预加重标志p r e f l a g 等。 m p 3 将每一帧数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论