(通信与信息系统专业论文)基于ucl的音频数字水印嵌入技术研究.pdf_第1页
(通信与信息系统专业论文)基于ucl的音频数字水印嵌入技术研究.pdf_第2页
(通信与信息系统专业论文)基于ucl的音频数字水印嵌入技术研究.pdf_第3页
(通信与信息系统专业论文)基于ucl的音频数字水印嵌入技术研究.pdf_第4页
(通信与信息系统专业论文)基于ucl的音频数字水印嵌入技术研究.pdf_第5页
已阅读5页,还剩65页未读 继续免费阅读

(通信与信息系统专业论文)基于ucl的音频数字水印嵌入技术研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

西南科技大学硕士研究生学位论文第1 页 摘要 随着网络技术和音频压缩技术的飞速发展,音频资源量每天都在不断攀 升且其在网络中承载的业务也越来越多元化,这直接导致了对海量音频管理 难度的加大,究其原因是忽略了音频资源内容语义信息,从而导致了信息孤 岛难于理解且相互分离。论文以音频语义理解为基点,以资源管理为目标, 主要围绕其中的数字音频分级管理和数字音频安全传输管理两方面展开研 究,并根据实际要求设计了较为全面的算法。论文主要研究内容如下: ( 1 ) 针对网络前端音频资源量大、难于管理的问题,构建了基于数据价 值的分级存储管理( h i e r a r c h i c a ls t o r a g em a n a g e m e n t ,h s m ) 算法。首先综合考 虑了影响数据价值的本征属性和预测价值,然后将两因素按一定的比例进行 关联,使数据价值得到了精确的表示,进而将音频资源分为高低价值两个等 级,并将高价值数据作为优先发送的数据集。实验仿真表明,当迁移量占总 量的一半时,相比传统的c a c h e 缓存替换算法,本算法具有更高的迁移准确 率。 ( 2 ) 研究基于统一内容定位( u n i f o r mc o n t e n tl o c a t o r ,u c l ) 标引的数字 水印音频语义管理技术,分析了基于分类语义的音频数字水印算法。首先通 过全面分析音频内容特征,将它们进行规划整合形成完整的语义标引表,并 进一步根据用途分类,形成分类语义信息,作为本算法待嵌入的水印信息。 然后将音频特征点和特征段作为水印嵌入位置,根据心理声学模型自适应确 定水印嵌入强度,最后利用本文提出的改进的量化算法,根据各类语义水印 的特点嵌入到不同的位置上。用语义水印实现了语义信息与原始音频信号的 一体化传输,并用高效的算法保证了语义水印的安全性和完整性,为水印的 后续应用提供了前期保障。实验结果表明,相较于其它同类算法,本算法的 水印容量是它们的数倍,同时在不可听性和鲁棒性这两个性能指标上也具有 明显的优势。 关键词:分级存储数据迁移策略数据价值数字音频水印 分类语义水印 西南科技大学硕士研究生学位论文第| l 页 a b s t r a c t w i t ht h er a p i dd e v e l o p m e n to fn e t w o r kt e c h n o l o g ya n da u d i oc o m p r e s s i o n t e c h n o l o g y ,i tb e c o m e sm o r ea n dm o r ed i f f i c u l tt om a n a g ei m m e n s ea m o u n to f a u d i or e s o u r c e sb e c a u s et h e ya r ei n c r e a s i n ge v e r y d a ya n dd e l i v e r i n gm o r e v a r i a b l es e r v i c e s t h ei g n o r a n c eo fs e m a n t i cc o n t e n tm a n a g e m e n to fa u d i o r e s o u r c e sl e a d st oi n c o m p r e h e n s i o na n ds e p a r a t i o no fi n f o r m a t i o ns i l o s t h i s d i s s e r t a t i o ni s m a i n l y f o c u s e do nc l a s s i f i c a t i o nm a n a g e m e n ta n ds a f e t y t r a n s m i s s i o n m a n a g e m e n t o f d i g i t a l a u d i or e s o u r c e sa n d c o r r e s p o n d i n g a l g o r i t h m sa r ed e s i g n e d a tt h es a m et i m e t h ea i mo ft h i sd i s s e r t a t i o ni st o e f f i c i e n t l ym a n a g er e s o u r c e so nt h eb a s i so fs e m a n t i cu n d e r s t a n d i n go fd i g i t a l a u d i o t h i sd i s s e r t a t i o n p r e s e n t s ah i e r a r c h i c a ls t o r a g em a n a g e m e n t ( h s m ) a l g o r i t h mb a s e do nd a t av a l u ea i m i n gt os o l v et h ep r o b l e mt h a ta u d i or e s o u r c e s a r eh u g ea n dh a r dt om a n a g ei nt h ew e bf r o n t e n d i n t r i n s i cp r o p e r t ya n d p r e d i c t e dv a l u ew h i c ha f f e c t s v a l u eo fd a t aa r ec o n s i d e r e da d e q u a t e l ya n d a s s o c i a t e di ns o m er a t i os ot h a td a t av a l u ec a nb er e p r e s e n t e da c c u r a t e l y a u d i o r e s o u r c e sa r ed i v i d e di n t ot w oc l a s s e s ,i e ,h i g ha n dl o wv a l u er e s p e c t i v e l y t h e o n ew i t hh i g hv a l u ei st a k e na st h ed a t as e ts e n tf i r s t e x p e r i m e n tr e s u l t ss h o w t h a tt h i sa l g o r i t h mh a sah i g h e ra c c u r a c yr a t et h a nt r a d i t i o n a lc a c h er e p l a c e m e n t a l g o r i t h m sw h e nm i g r a t i o np r o p o r t i o nr e a c h e s5 0 o f t h ew h o l ed a t ar e s o u r c e s s e m a n t i cm a n a g e m e n tt e c h n i q u eo fa u d i or e s o u r c e sb a s e do nw a t e r m a r k i n d e x e db yu n i f o r mc o n t e n tl o c a t o ri ss t u d i e da n dad i g i t a lw a t e r m a r k a l g o r i t h mf o ra u d i or e s o u r c e sb a s e do nc l a s s i f i e ds e m a n t i c si sp r o p o s e di nt h i s p a p e r f i r s t l y ,c h a r a c t e r i s t i c so fa u d i oc o n t e n t sa r ea n a l y z e dt h o r o u g h l yi no r d e r t h a tc o m p l e t es e m a n t i ci n d e x e sw h i c ha r eu s e dt op r o d u c ec l a s s i f i e ds e m a n t i c i n f o r m a t i o na c c o r d i n gt ot h e i ru s a g e sc a nb eg e n e r a t e d t h ec l a s s i f i e ds e m a n t i c i n f o r m a t i o ni se m b e d d e di n t oa u d i om a t e r i a l sa sw a t e r m a r ki n f o r m a t i o n s e c o n d l y ,f e a t u r ep o i n t sa n ds e g m e n t sa r ec a l c u l a t e da se m b e d d i n gp o s i t i o n sa n d e m b e d d i n gs t r e n g t hi s d e r i v e df r o mp s y c h o a c o u s t i cm o d e l t h i r d l y , s e m a n t i c w a t e r m a r k sa r ee m b e d d e di n t od i f f e r e n tp o i n t sa c c o r d i n gt ot h e i rt r a i t sb yt h e i m p r o v e dq u a n t i z a t i o na l g o r i t h mp r o p o s e d i nt h i sd i s s e r t a t i o n t r a n s m i t t i n g 西南科技大学硕士研究生学位论文第1 il 页 o r i g i n a la u d i oi n f o r m a t i o na n di t ss e m a n t i cl n f o r m a t i o nt h r o u g hw a t e r m a r ka r e r e a l i z e d s a f e t ya n di n t e g r i t yo fs e m a n t i cw a t e r m a r ka r eg u a r a n t e e db yt h e e f f i c i e n t a l g o r i t h m w h i c hp r o v i d e sas a f e g u a r df o r s u b s e q u e n ta p p l i c a t i o n s e x p e r i m e n tr e s u l t ss h o wt h a tw a t e r m a r kc a p a c i t yo ft h i sa l g o r i t h mi s s e v e r a l t i m e sl a r g e rt h a tt h eo t h e ro n e so ft h es a m ec l a s s ,a n dt h ei m p e r c e p t i b i l i t ya n d r o b u s ta r ea l s os u p e r i o r k e y w ords :h i e r a r c h i c a l s t o r a g em a n a g e m e n t ( h s m ) ;d a t am i g r a t i o n s t r a t e g y ;d a t av a l u e ;d i g i t a la u d i ow a t e r m a r k i n g ;c l a s s i f i e d s e m a n t i cw a t e r m a r k 西南科技大学硕士研究生学位论文第1 页 1 绪论 1 1 课题的研究背景及意义 音乐与大众生活息息相关,是人们休闲娱乐的主要方式之一。随着网络 技术和音频技术的快速发展,音频资源日益增多形成了一个巨大的资源库, 人们面临的选择也越来越丰富。根据2 0 1 2 年1 月1 6 日由c n n i c 发布的第 2 9 次中国互联网发展状况统计报告n ,可知,2 0 1 1 年网络音乐的使用率在网 络应用中排名第三,高达7 5 2 ,网络音频的迅速发展使之成为当前网络数 据中不可忽视的中坚力量。然而人们的满意程度并没有随着信息量的增多而 提高,人们在享受网络技术带来便利的同时,不得不面对随之而来的负面影 响音频管理越来越困难。具体表现在:音频资源信息量大,包括各种格 式、各种派别、各种热度的作品,当搜索包含相同关键词的音乐作品时,出 来的结果可能会包含很多相关或不相关的资源,用户不得不再次面临更加精 确的选择。音频标签往往只有几个关键字,非常局限,往往不能全面反映 音频本身所要表达的内容,用户根据这些信息很难对音频资源进行有效的管 理。多媒体数字作品被盗版者大量复制和传播,并以此获取暴利,严重损 害了版权所有者的利益。出现这些现象的原因主要有以下几个方面:对于 某一固定群体来说,各类音频资源被平等对待,没有等级之分,即高热度音 频和低热度音频在网络中拥有相同的地位,占有相同的资源,对用户具有相 同的影响力。这与实际情况显然是相违背的,对于群体用户来说它们有其特 有的群体特征,如对某一类事物的偏爱;而对网络音频来说,它们也有其自 身的网络特征,如某类音频最近在网络中点击率很高。忽略对这些因素的考 虑,显然在搜索资源时得不到准确的、有针对性的结果。在网络音频管理 中忽略了信息内容语义。目前音频资源在网络中是利用其底层特征来表现的, 底层特征属于音频的低层语义,它包括子带周期、m f c c 、过零率、短时平 均能量、熵、带宽均值等,这些特征是音频固有的属性,反应音频本征特性。 但是它与人类思维中的语义概念不是同一层面,无直接对应关系,用户无法 据此判断该音频是否所需信息。而信息内容语义属于音频高层语义,它包含 了歌名、歌手、所属流派等信息,这些与人类思维是相一致的,用户可以直 接从中直观地了解音频内容的相关信息。高层语义与音频特征之间的语义鸿 沟直接导致信息难于理解和相互分离,从而无法用人类的思维进行有效管理。 西南科技大学硕士研究生学位论文第2 页 当前数字音频相关技术相当成熟,如编辑、拼接等,使人们对音频进行各 种处理变得极其容易,这对音频资源的安全性造成了严重的威胁。 为了解决信息量大、利用率低问题,提出了分级存储的理念1 ,它根据 价值将数据分配到与之匹配的存储设备中进行分级管理。这不仅有效辨别了 数据的重要性,提高了信息利用率,同时节约了管理成本、提高了数据访问 速度。分级准确率的高低与否在于迁移策略n ,( 包括价值评定模型和迁移条 件) 的制定。目前数据迁移策略主要有基于存储空间的高低水位法,c a c h e 数据缓存替换算法拍3 和基于生命周期管理( i n f o r m a t i o nl i f e c y c l em a n a g e m e n t , i l m ) 中的数据迁移哺儿”。在这些策略中它们考虑的因素过于简单,且只考虑了 文件当前的价值,没有对文件迁移后的再利用价值作预测,往往不能达到较 高的迁移精确度。 在音频语义理解的研究进程中,相继出现了多媒体内容描述接口 ( m p f g 7 ) 标准,多媒体框架描述( m p f g 2 1 ) 标准。其中,m p e g 7 是为了解 决海量资源与检索难度之间的矛盾而提出的,通过对音频内容进行标准化描 述,使用户能快速有效地搜索感兴趣的资源。尽管m p e g 7 在某种程度上对 音频内容进行了描述,但是却没有对它进行语义理解,没有站在用户的角度 对其语义元素和字段进行准确的定义,因此,在一定程度上限制了它的应用 。m p e g 2 1 的出现是为了解决网络透明传输、多媒体数据扩展和重复利 用的难题。它提供了一系列的内容服务( 内容创建、定级、传输等) 供用户 之间相互作用。不过,m p e g 2 1 只对描述框架进行了定义,没有对多媒体内 容信息进行语义理解和标引n 们n 帅“。 针对多媒体信息安全问题,使用数字水印技术得到了很好的解决。其基 本原理是在不影响听觉质量的前提下向原始音频信号中加入特定的信息即水 印,通过这些信息实现版权保护、信息完整性认证、内容监控、篡改拷贝检 测等作用,是多媒体信息安全保障的有力技术手段。但目前的数字水印算法 中,嵌入的内容较为单一,仅仅应用在内容认证,版权判别等领域,而对嵌 入点的利用以及嵌入内容的应用没有得到充分的挖掘。 因此,在开放、自由、共享的网络环境下,如何吐陈纳新,去除冗余信 息保留有用信息,根据用户兴趣行为建立信息分级管理机制;如何跨越“语 义鸿沟”,用人类的思维建立具有语义理解的、高效的统一内容管理机制;如 何建立可靠的、可信的信息安全保护机制是亟待解决的问题。 西南科技大学硕士研究生学位论文第3 页 1 2国内外研究现状 1 2 1 分级存储管理 信息技术高度发达,各种各样的事物正以信息数据的形式存在着,充斥 着整个网络和现实世界。尤其是对于企业用户,信息更是它们耐以生存的宝 贵财富,所以信息的安全存储和高效利用是它们一直都非常重视的问题。然 而面对呈几何级数快速增长的数据,他们不得不面对数据在存储管理上出现 的难题:存储系统成本增加、管理更加复杂;数据存取的速度降低。分级存 储管理技术的出现使得以上问题迎刃而解。数据分级存储管理的基本思想是 在不同性能的存储设各上以不同的存储方式存放不同的数据。其分级的主要 依据是数据的访问量、访问时间、重要性等性能指标。重要的数据放在高级 存储设备中,而不重要的数据放在低级的存储设备中。在这个过程中,迁移 策略成为分级存储的关键。根据制定的策略,当数据达到迁移触发条件时即 可进行迁移,最终实现分级。 目前数据迁移策略主要有基于存储空间的高低水位法、c a c h e 数据缓存 替换算法和基于生命周期管理i l m 中的数据迁移。高低水位法预先设定存储 的高水位和低水位,当数据量达到高水位时,将数据迁移至性能低的存储层 中,直至低水位才停止1 。这种方法以存储设备为中心,根据其状态迁移数 据,忽略了数据自身的特性,因此无法使数据得到有效地利用,降低了系统 的性能。c a c h e 缓存替换算法根据某种策略将存储器中不再具有价值的文件 替换出去,以释放空间“。替换策略目前有很多种:如l r u “、s i z e 、g d s 、 l f u 等。基于生命周期管理的数据迁移是根据对数据价值的评定,分配与其 价值相适应的存储设备h “。数据价值的评定有基于数据块的方法如文献 【1 7 】 1 8 】【1 9 所述和基于文件的方法如文献 2 0 】 2 1 】【2 2 】所述。c a c h e 缓存替换 算法和基于i l m 的数据迁移都存在相似的不足:考虑的因素较为简单,尽管 都考虑了访问时间和频率,但有的为了便于计算而简化了用户数量和文件大 小等重要因素,往往不能达到较高的精确度。 为了更加精确地定位用户感兴趣的内容,同时也为了减小资源标引的工 作量,本文正是利用分级存储的思想来管理海量音频,把它们分为高价值和 低价值两个等级。将高价值的文件作为优等资源优先进行语义标引然后通过 广播网络进行传送以备进一步的应用,而低价值资源则暂时不予应用,除非 它随着时间、访问率以及其它因素的影响转变成为高价值。而价值的评定方 法和对应的阀值设置则是通过迁移策略来实现。针对上述迁移算法存在的缺 西南科技大学硕士研究生学位论文第4 页 陷以及论文研究内容的实际需要,在第三章中提出了一种基于文件价值的高 效的迁移策略。 1 2 2 语义标引技术 在音频资源的应用范畴中,音频资源标引起到至关重要的作用。如音频 分类、个性推荐系统、智能代理系统、音频检索、安全传输、版权保护等, 它们都是根据音频资源的内容标引进行各种具体操作。目前,音频资源的内 容标引主要是通过音频信号的底层特征来表示n “,因为底层特征是音频信号 固有的属性,它们可以通过直接对音频信号进行相应的处理得到,所以便于 提取、表达,因此,也更便于给音频资源贴上标签。当前,音频底层特征主 要包括m e l 倒谱系数、子带能量比、能量分布曲线、短时平均能量、带宽均 值、能量点、过零率等,根据音频资源的具体应用背景,贴上对应的底层特 征即语义标签。j o h ns a u n d e r s 心引在对商业电台的广播内容的分类中,应用过 零率和能量分布曲线这两个特征;麻省理工学院( m i t ) 的e r i cs c h e i r e r 凹53 等人 通过提取音频信号的频谱流量、频谱中心等十三种特种,经过相互结合来区 分音乐和语音信号。目前,国内外学者对音频资源的高层特征也开展了一系 列的研究。音频高层特征是一种抽象的语义,但它更符合人类思维对大众事 物的理解。具体包括音频所表达的情感;音频作品携带的版权信息如作曲者、 作词者、出版者等;旋律、音色等。文献 2 6 2 7 】通过分析音频信号的特征, 然后以语义标引的形式显示了音频所含的器乐信息。文献【2 8 】为了辨别音频 信号所传达的情感,应用相关分析法来进行信号处理。文献【2 9 】 3 0 】通过分析 音频信号的节奏特征来识别音乐的流派。其中,节奏特征由信号的m f c c 系 数来表示。文献【3 1 3 2 【3 3 】通过对音频资源进行人工标引形成了“s o c i a l t a g s ”,可以进行检索和分类等应用。但人工标引有其自身的缺陷:当数据 量很小时,人工方式可以实现,但是当数据量很大时,工作量非常大,用人 工标引的方式显然不现实。对于一样的音乐作品,不同的标引者会有不同 的见解,且有时人们对音乐所表达的内容情绪很难找到合适的文字去形容, 因此,人工标引的方式很难形成统一的标准。文献 3 4 重点研究了四个音乐 描述参数,即音符、音高、起效时间、节奏。针对不同的参数设计了不同的 提取算法将它们提取出来,最后通过设计相应的软件,实现自动标引。 论文应用u c l 标引技术对音频内容特征进行标引,通过全面分析音频作 品内容本身携带的信息,制定全面、详细、准确的语义标引表。每首音乐对 应一张标引表,当对音频进行管理时,仅需查看表中的某些项进行相应的语 西南科技大学硕士研究生学位论文第5 页 义计算即可达到管理的目的。 1 2 3 数字水印技术 、数字水印技术是近几年来国际学术界兴起的一个前沿研究领域“。它与 信息安全、信息隐藏、数据加密等均有密切的关系。尤其是作为加密技术的 补充,在多媒体信息的版权保护与完整性认证方面得到迅猛的发展。数字水 印技术是通过一定的算法将一些秘密信息一水印直接嵌到多媒体的内容当 中,但不影响原内容的价值和使用,并且不能被人的知觉系统觉察或注意到。 水印信息可以是无意义的随机序列或是有意义的版权标识、作者序列号、公 司标志等,可以用来证明版权归属或跟踪侵权行为等。随着数字水印技术的 不断发展,应用范围不断扩展,各种应用需求不断提高,数字水印技术已经 渗透到许多领域,如秘密通信、拷贝监控、交易跟踪、真伪鉴别、广播监控 等阳“。水印的植入仅仅利用数字媒体的原始空间,并不增加额外的空间。数 字水印技术必须具有较强的鲁棒性、安全性和透明性。 目前,音频数字水印算法的研究主要集中在时域、频域和压缩域。时域 音频水印算法是通过直接修改采样点的值来实现水印的嵌入。典型算法包括 最不重要位水印算法( 1 e a s ts i g n i f i c a n tb i t s ,l s b ) 和回声隐藏算法( e c h oh i d i n g ) 等。文献 3 7 提出了一种改进的l s b 水印算法,该算法在水印嵌入位置的选 择上较以往的算法更加合理,同时在水印信号的嵌入过程中修改采样点值, 使得嵌入前后的样点值差值最小,提高了水印的不可感知性,但鲁棒性比较 差。文献 3 8 采用分布式方法,通过新的l s b 编码算法实现将水印嵌入至l s b 较高层的功能,提高了算法的鲁棒性和比特率。l s b 算法简单易实现,但是 对某些信号处理比较敏感,抗干扰能力差,稳健性差,因此实用价值较小。 当前,频域水印算法是数字水印领域的主流算法,它通过修改频域系数 的方式来实现水印的嵌入。典型算法包括离散傅立叶变换( d f t ) e 3 们、离散余 弦变换( d c t ) 4 1 4 2 ,、离散小波变换( d w t ) n 引n 们等。频域算法较时域算法具有以 下几点显著优势:为确保水印信息的不可听性,频域中嵌入水印信号能量 可分布于原始音频信号中时域的任何位置上。在水印编码的实现过程中, 人们对音频的听觉处理特点使频域具有更强的水印结合能力。文献 4 5 提出 了d c t 域自适应量化算法,通过设计有效的量化规则和选择合适的量化步长, 将鲁棒性水印和脆弱水印同时嵌入水印中。实验表明一种水印能抵抗防伪攻 击,而另一种水印能抵抗常规信号处理。文献 4 6 1 提出了基于音频特征的多 小波域水印算法,通过将音频帧进行分抽样为两个子音频帧并分别将其变换 西南科技大学硕士研究生学位论文第6 页 到多小波域。利用两个子音频帧在多小波域的能量来估计所嵌入水印的容量, 并根据它们的能量大小关系完成水印的嵌入。在保证听觉质量的同时提高了 水印的鲁棒性。压缩域水印算法的基本原理是将水印信息嵌入至压缩位流或 对应索引中。该类算法的主要缺点是编码系统比较复杂,受格式化变化的限 制较大。压缩处理本身已经过滤掉了很多冗余信息,所以再往里面添加水印 信息的难度较大。文献 4 7 】提出了m p 3 s t e g 压缩域水印技术。文献 4 8 提出盲 检测音频水印技术,该类技术直接作用于压缩域中嵌入的水印。文献【4 9 采 用比特流比例因子的方法,来完成水印的嵌入。结合上述三个域的水印算法, 压缩域水印算法格式符合当前主流格式但是存在鲁棒性差的问题,时域水印 算法实现简单但是不可听性和鲁棒性之间的矛盾得不到有效的解决。而频域 水印算法在保证不可听性和鲁棒性得到有效的权衡的情况下,实现起来并不 复杂,因此论文第四章将采用频域水印算法来实现分类语义水印的嵌入。 1 3课题来源 本课题来源于国家自然科学基金一新一代广播网的语义计算与内容管理 机制研究( 项目编号:6 0 9 0 2 0 2 1 ) 。 1 4 论文主要研究内容和结构 论文主要研究音频资源管理问题,围绕其中的音频资源分级管理和安全 传输管理进行深入研究。试图解决音频资源信息量大,难于管理的问题,提 高信息的利用价值;解决音频资源缺乏语义标识难于理解的问题,提高信息 的可解可读性;解决音频资源在网络中的安全传输问题,提高信息的可信性。 通过建立易于理解的、高效的资源管理机制,更加有序的管理音频资源,以 满足用户的需求。论文研究内容概况为以下三部分: ( 1 ) 音频资源分级存储管理机制研究 在网络前端,对音频数据进行分析进而将数据分级管理,把其中人们最 常用的、最有价值的、热度最高的音频筛选出来进行优先推送,这不仅使寻 找资源时范围缩小了,难度降低了,同时使存储系统的成本降低了、管理简 化了,数据存取的速度也提高了。 ( 2 ) 音频信息语义标引规范及分类语义形成 在源端对大量音频资源的内容特征进行分析、记录和提取,找到音频信 西南科技大学硕士研究生学位论文第7 页 号共有的高层属性,采用u c l 技术将它们形成一个规范的、完整的音频语义 描述框架。依据框架,可以对每个音频贴上其对应的语义标签。同时,根据 接收端语义信息的不同用途,将语义信息进行分类,以便在源端对各类水印 进行有针对性的嵌入。 ( 3 ) 搭建音频数字水印系统 搭建音频数字水印系统,结合原始音频信号的特点将语义水印嵌入其中, 完成语义信息在网络中的安全传输。利用载体音频携带的语义水印,在保护 音频版权的同时,对音频资源进行管理,如音频分类、检索等。水印系统主 要依据这两个方面的应用,在算法设计时,有针对性的考虑了相关细节。 论文总体结构图如图1 1 所示。 网络前端 , 3 每翥h 鲁耋卜 u 一。柔霉羲、 1 1 1 l, 血 世 7 菇 疆 嚣 l 接收终端 语义解析 ( 水印提 取) 一瞒幻烁 口 ,e 7 l l ,j 、矿、 语 语义计算卜_ 义 分类 应 l l 士盅 位系 、 用 叫个性推荐 图卜1总体框架 f i g 1 - 1 m a inf r a m e w o r k 西南科技大学硕士研究生学位论文第8 页 首先在网络前端将音频资源进行分级管理,主要目的在于:降低资源标 引工作量;提高资源利用率。本文的主旨是用语义信息管理音频资源。那么 语义标引是最基础也是最重要的环节。音频资源浩海如烟,若是将所有文件 都进行标引,那么工作量将非常大。同时考虑这些资源的利用率问题,不同 的资源在网络中的行为互不相同,有的热度高,有的热度低,有的热度甚至 为0 ,即它们从未被访问过。且考虑到终端用户的兴趣行为,他们对众多音 频资源的兴趣程度也是不一样的,是具有选择性的。也就是说,不是所有的 资源都能被利用或是被高效利用,那么,若是他们以平等的概率传送至大众, 无疑,总的利用率是很低的。因此我们仅需对海量资源中价值大、热度高的 音频进行标引,以备进一步的管理应用,不仅提高了资源利用率,同时减少 了标引工作量。所以,我们首先在网络前端采用分级存储的思想将资源进行 整合,根据资源的重要性、访问频率、保留时间、容量等指标,将数据分为 高价值和低价值两个等级,进而进行分级存储管理,并把高价值数据作为优 先发送的数据。然后提取出这些音频资源的语义信息,将它们按用途分类, 并嵌入至原始载体中,形成含水印的音频信息。然后把它们推送至广播信道 进行传输。在接收端,从接收到的音频资源中提取出语义信息,并进行相关 的计算应用到相关的领域。 根据研究内容论文一共分为四章,具体安排如下: 第一章主要分析了论文研究背景和意义,概述了分级存储管理和数字音 频水印的研究现状。绪论中还介绍了课题的来源,最后对论文总体框架作了 简要的描述,并总结了论文的主要内容。 第二章对文中涉及的两大关键技术即分级存储管理技术和音频数字水印 技术作了详细的全面的介绍。首先介绍了分级存储理论的概念、基本模型及 优缺点,并根据论文的需要,阐述了分级存储理论与论文研究内容的契合点。 然后分析了数字水印的模型、性能、常见的数字水印算法、常见攻击方法和 评价标准,以及它在文中的作用。 第三章提出了基于数据价值的分级存储管理算法。首先介绍了算法的设 计思路以及总体模型。然后对算法中涉及的参数作了详细的讨论。最后通过 实验仿真讨论了参数的取值问题,并进一步与传统算法作对比实验,验证本 章算法的性能。 第四章提出了基于分类语义的数字音频水印算法。首先介绍了音频语义 标引框架和水印信息的形成,然后针对水印信息和音频自身的特点对水印嵌 入位置和嵌入量的选择作了详细讨论,最后通过仿真实验测试了算法的性能。 西南科技大学硕士研究生学位论文第9 页 2 分级存储与数字音频水印相关理论 2 1 分级存储管理 2 1 1分级存储的必要性 信息作为世界上“最具价值的资产”之一,其存储和管理的重要性自然 不言而喻。然而,面对当前呈爆炸式增长的数据,要访问、存储和管理它们 变得越来越困难。如果把所有数据和文件都存放在高性能的存储设备中,势 必会导致存储成本的持续攀升,且管理的复杂度也会持续增高。但是是否有 这个必要性呢,我们知道各种数据在网络中的行为并不一样,它们有不同的 访问时间,不同的访问率等。存储的“二八原则”哺们表明高访问率的数据在 总的数据量中只占有很小的比例。据统计,用户经常访问的数据在磁盘阵列 中仅占有2 0 的比例,而剩下的8 0 的数据几乎很少被访问,甚至从来不被 访问。事实上,根据信息生命周期管理i l m 理论可知,数据是具有生命周期 的,它们在不同的时期具有不同的意义,不同的价值。大多数情况下,点击 率最高的数据总是近期才创建的数据,此时它为企业创造的价值也最大。随 着时间的推移,数据热度降低,访问率也会降低,同时数据的价值也随之下 降。因此若是把所有数据都放在高性能的存储设备中,必然造成资源的浪费, 且存储成本非常高,显然是没有必要的。在这样的背景下滋生出了分级存储 管理技术,它的出现为信息存储提供了一条成本低且高效的存储途径。它将 不同的数据存放在与其相匹配的存储设备中,当然数据不会一直存在一个级 别的存储设备中,因为随着时间的推移,数据的价值也会发生相应的变化, 此时会有专门的管理软件将数据在不同级别的存储设备之间进行迁移,最终 实现高级别存储设备存放高价值、经常被访问的数据,低级别存储设备存放 低价值、不经常被访问的数据。这里解释一下出现的两个关键概念:匹配 规则,由数据的价值即重要性和存储设备的级别来制定的。迁移策略,是 整个分级管理过程中最为关键的技术之一,数据何时迁移,迁往何处均有该 策略来确定,也就是说,数据达到该策略设定的阀值即迁移的条件就会进行 转移。因此,迁移策略的准确度直接影响分级结果的准确度。迁移策略通常 可以根据实际情况进行调整,其制定的依据往往是根据数据的重要性、访问 量、访问时间、存储设备的容量、性能要求等因素综合确定的最优存储方案。 由此可以看出,数据利用分级存储的思想进行管理后,不同数据匹配对应级 别的设备,使得数据资源和存储设备都得到了充分的利用,从而使得分级存 西南科技大学硕士研究生学位论文第10 页 储管理系统的总体性能达到最优。 2 1 2 分级存储管理系统架构 分级存储管理系统是一个完整的存储管理系统。它由应用程序层、系统管 理层以及存储设备层这三个逻辑层次构成。分级存储对数据的管理实行整个 贯穿生命周期的管理,且各个层次有其自身的功能,所以各个层次的具体构 造有着对应的特殊性,存储系统框图m ,如图2 1 所示。 应用程序层 三婶迁移策略 9 系统管理层 数据管理服务 彳 弋夕 存储设备层 存储设备 ,其离散余弦变换定义为: 也= 吼委n - 1 驷s ( 2 i + 1 ) u z r - l ( 2 - 1 3 ) 相应的逆变换( i d c t ) 定义为: 西南科技大学硕士研究生学位论文第17 页 薯= 篓脚。s 訾 ( 2 - 1 4 ) 其中系数口定义为: 驴j 塑舻o ( z ,、- 1 5 ) o 口t ,= 一 ll j “l 2 甜0 若x ,是实数,那么它的d c t 也是实数。由此可以看出,d c t 避免了复 数的运算。 ( 3 ) 离散小波变换 基于离散小波变换( d i s c r e t ew a v e l e tt r a n s f o r m ,d w t ) i 拘数字音频水印的 主要优点是:d w t 把原始信号分解成多频段的信号,能准确提取信号的局部 时频信息,提供多分辨率的表示功能以有利于信号特征提取;能适应人耳的 听觉特性,且使得水印的嵌入和检测可分为多个层次进行;小波变换域数字 水印方法兼具时空域方法和d c t 变换域方法的优点。自适应小波基算法的提 出,更进一步提高了d w t 在信号处理领域的作用。当前采用d w t 来实现音 频水印的嵌入技术受到了较大的关注。信号经过d w t 变换后,分解为高频 分量和低频分量,分别对应信号的细节分量和近似分量。其中近似分量可进 一步分解为细节分量和近似分量,并可以此类推分解下去。d w t 所分解的层 数决定了小波变换的级数,而分解层数可根据不同的应用和信号长度而定, 其分解层数越多信号处理越精确,但代价越大。每层分解后的数据即为d w t 系数,该系数可用于原始信号的精确重建,即为离散小波逆变换( i n v e r s e d i s c r e t ew a v e l e tt r a n s f o r m ,i d w t ) 。 小波分解算法可表示为: x “1 ( ,2 ) = 矿( n ) h 0 ( 2 i - n ) ( 2 1 6 ) d k + l ( ,1 ) = d 2 ( n ) h l ( 2 i 一玎) ( 2 1 7 ) 其中,d k ( n ) ( k = 1 ,2 ,h ) 即为信号的细节分量系数;x 七( 力) ( k = l ,2 , h ) 9 对应近似分量系数,x d ( 玎) = 3 c ( 玎) ;瑶( ,1 ) 和砰( 玎) 分别为低通和高通滤波器 的系数。有近似分量和细节分量定义知,d w t 后的主要能量集中在近似分量, 而较少能力集中在细节分量。 作为d w t 的逆过程,i d w t 可根据式( 2 1 8 ) 实现: 西南科技大学硕士研究生学位论文第18 页 工工 x 扣1 ( ,z ) = ( n ) g k o ( 2 i - n ) + d ( n ) g ( ( 2 i - n ) ( 2 一1 8 ) i = li = l 在d w t 算法中,可选的小波基主要包括:m o r l e t 小波、m a r r 小波、d o g 小波、h a a r 小波、样条小波和d a u b e c h i e s 小波等。 、 2 2 4音频数字水印的常见攻击方法 在音频作品发布和传递的过程中,不可避免的会受到各种攻击,这使得 在设计水印系统时必须重点考虑水印的鲁棒性问题哺“。对音频水印的攻击通 常分为两种情况:试图破解水印算法,若是成功,则所有用该算法加密的 数据都将失去安全性,但实际上,这种破解是十分困难的。对嵌入的水印 进行破坏或篡改。在水印算法的设计过程中,鲁棒性的要求即是希望水印算 法能够抵抗这种攻击。下面就音频水印技术中常见的攻击方法作简要介绍。 ( 1 ) 滤波:包括低通滤波和高通滤波。低通滤波是将设定阀值之上的频 率成分抹去,而高通滤波则是将设定阀值值之下的频率成分抹去。 ( 2 ) 重采样:即改变信号的采样率。为适应不同的硬件播放条件,音频 信号经常需要变换采样率。例如,2 2 0 5 k h z 的音频信号通过插值变换为 4 4 1 k h z 的音频信号或4 4 1 k h z 的音频信号通过次抽样变换为2 2 0 5 k h z 的音 频信号。 ( 3 ) 重量化:即改变量化精度。例如,可把量化精度为1 6 b i t s 变成8 b i t s 或者3 2 b i t s 。 ( 4 ) 添加噪声:信号通过有噪信道或者存储中受到修改,都可看作向原 始信号中添加噪声。另外也可能是攻击者蓄意添加的恶意噪声。 ( 5 ) 有损压缩:为了降低对传输带宽的要求,音频信号常常被压缩之后 再进行传输。事实上有损压缩与音频数字水印的工作原理是相互矛盾的,一 个减小信息量,一个添加信息量。有损压缩是在不影响音频品质的条件下, 最大可能地去掉信号中与人类感知无关的冗余分量以减小信号的大小。而音 频水印则是在人类感知不到的地方尽最大可能地隐藏水印信息。因此,有损 压缩对音频水印有较大的影响。 2 2 5 音频数字水印的评价标准 水印系统应用在不同的环境中要求有不同的性能指标,为了对它们进行 评价就需要相应的评价标准m ,。建立精确的评价标准,有助于衡量音频水印 算法的好坏。论文仅考察不可感知性、鲁棒性和水印容量这三方面的性能, 西南科技大学硕士研究生学位论文第19 页 下面就对应的评价标准作简要介绍。 ( 1 ) 不可感知性 主观测试法。以人耳的主观感受为评价算法质量的标准。常用的方法 有:平均意见分法( m e a no p i n i o ns c o r e ,m o s ) 、a b x 测试方法、主观听觉 区分度( s u b j e c t i v ed i f f e r e n c eg r a d e ,s d g ) 等。实验中我们主要使用第一种 测试方法,该方法需要若干个测试者,根据它们对给定音乐的听觉质量优劣 程度进行评分,将所有打分求平均作为对音频信号质量评价的结果。通用的 标准大多是5 分制,各个档次的评分标准如表2 1 所示。 表2 - 1m o s 主观标准 t a b 2 1m o ss u b j e c tiv 6s t a n d a r d 主观判定的评价会受到测试者的知识、背景、测试环境等因素的影响和 限制,所以具有一定的不确定性。因此不能将主观测试作为评定音频质量的 唯一标准,而是要结合客观方法进行综合分析。 客观测试法。客观测试法在判定音频水印的质量方面占有十分重要的 位置,因为客观测试法可以定量的评价音频数字水印的质量。常用的客观评 价方法有: a 信噪比( s i g n a l t o n o i s er a t i o ,s n r ) 将嵌入到原始音频信号中的水印信号看成相对于原始信号的噪声,从而 通过计算信噪比来量化所嵌入的水印信号对原始音频信号的影响程度。假设 宿主信号为x ( 力) ,嵌入水印的音频信号为x 。( 刀) ,则信噪比可以表示为: l 萎伽 (219)snr1 0 i 2 g l _ - 坐l 一l i i x w ( 刀) 一x ( 刀) 1 2 西南科技大学硕士研究生学位论文第2 0 页 其中,n 为音频信号的采样点数,三为音频信号的长度,且0 n 三,单 位为d b 。 b 峰值信噪比( p e a ks i g n a l - t o n o i s er a t i o ,p s n r ) 峰值信噪比可以定量地评价嵌入水印后音频信号的不可感知性,论文就 采用这

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论