(电路与系统专业论文)音频MP3的自嵌入方法研究[电路与系统专业优秀论文].pdf_第1页
(电路与系统专业论文)音频MP3的自嵌入方法研究[电路与系统专业优秀论文].pdf_第2页
(电路与系统专业论文)音频MP3的自嵌入方法研究[电路与系统专业优秀论文].pdf_第3页
(电路与系统专业论文)音频MP3的自嵌入方法研究[电路与系统专业优秀论文].pdf_第4页
(电路与系统专业论文)音频MP3的自嵌入方法研究[电路与系统专业优秀论文].pdf_第5页
已阅读5页,还剩61页未读 继续免费阅读

(电路与系统专业论文)音频MP3的自嵌入方法研究[电路与系统专业优秀论文].pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 ii|1| 摘要 自嵌入技术是信息隐藏研究的重要内容之一,可以用于网络传输丢帧恢复及 证据保全等方面。自嵌入方法的研究既有一定的理论意义,也有现实应用价值。 m p 3 是音频数字产品的主流格式,有着广泛应用的需求,对其知识产权的保 护越来越重要。本文在深入研究信息隐藏技术的基础上,针对m p 3 音频文件进 行了自嵌入方法研究。具体工作如下: 1 、提出一种m p 3 音频文件的自嵌入方法。该方法使用l s b 和矩阵嵌入算法, 将减采样的m p 3 音频嵌入到原m p 3 文件的m d c t 系数中,实现了自嵌 入: 2 、为了协调好嵌入容量与音频质量之间的关系,在大值区s d d , 值区采用不 同的嵌入方法,增加了嵌入容量;并对原文件减采样,减少了待嵌入信 息量; 3 、完成了一个实验性m p 3 自嵌入软件系统,由嵌入模块、信息模块、破坏 模块和恢复模块构成。该系统能够正常运行,文内所有实验均在本系统 上完成。 该方法在w i n d o w sx ps p 2 操作系统上的v c + + 6 0 软件平台上进行了实验验 证,实验结果表明,丢帧和破坏帧的音频文件可以实现一定程度上恢复,得到较 为满意的实验结果。 关键词:m p 3自嵌入l s b 隐藏矩阵隐藏m d c t 系数 a b s t r a c t a bs t r a c t s e l f - e m b e d d i n gt e c h n o l o g yi sa ni m p o r t a n tp a r to fi n f o r m a t i o nh i d i n gt e c h n o l o g y , a n di tc a nb eu s e di nm a n yf i e l d s ,s u c ha sr e c o v e r yo ft h el o s td a t aw h i c hi sl o s tw h i l e b e i n gt r a n s m i t t e dt h r o u g ht h ew e b ,p r o t e c t i o no fi m p o r t a n te v i d e n c ei s a n o t h e r e x a m p l e h law o r d ,b o t ht h e o r e t i c a lr e s e a r c ha n da p p l i e dr e s e a r c hb a s e do nt h i s t e c h n o l o g ym a k es e n s e m p 3i st h em o s tp o p u l a rf o r m a to fd i g i t a la u d i of i l e ,a n di ti su s e dw i d e l y , s oi t b e c o m e sm o r ea n dm o r ei m p o r t a n tt op r o t e c tt h ei n t e l l e c t u a lp r o p e r t yr i g h t so fm p 3 a u d i of i l e s d e e p l yh i d i n ga l g o r i t h m sr e s e a r c h i n gb a s e do n ,t h i sp a p e rp r e s e n t st h e r e s e a r c ho fm p 3s e l f - e m b e d d i n gm e t h o d s p e c i f i ct a s k sa sf o l l o w s : 1 p r e s e n tam e t h o do fs e l f - e m b e d d i n go fm p 3f i l e s t oa c h i e v et h ef i n a lg o a l , t h i sm e t h o d e m b e d st h e c o m p r e s s e dc o p y f i l ei n t ot h eo r i g i n a lo n e sm d c t c o e f f i c i e n t sw i t ht h eh e l po fl s ba n dm a t r i xh i d i n ga l g o r i t h m s 2 t oi m p r o v et h ec o n f l i c tb e t w e e nt h ee m b e d d i n gc a p a c i t ya n da u d i oq u a l i t y , d i f f e r e n th i d i n ga l g o r i t h m sa l eu s e di nb i gv a l u em d c ta n ds m a l lv a l u em d c t c o e f f i c i e n t s ,a n d t h ee m b e d d i n g c a p a c i t yi n c r e a s e s b e s i d e s ,t h ec o p yf i l e i s c o m p r e s s e db yt h em e a n so fr e d u c i n gs a m p l et or e d u c et h ed a t aq u a n t i t y 3 f i n i s h e da ne x p e r i m e n t a ls o f t 、, v a r es y s t e mo fm p 3s e l f - e m b e d d i n gw h i c h c o n t a i n se m b e d d i n gm o d u l e ,i n f o r m a t i o nm o d u l e ,d e s t r o ym o d u l ea n dr e c o v e r m o d u l e t h es o f t w a r es y s t e mr a nw e l la n da l lt h ee x p e r i m e n t so ft h i sp a p e rw e r e d e m o n s t r a t e do nt h i ss y s t e m w ed e m o n s t r a t et h es e l f - e m b e d d i n gm e t h o do nt h ep l a to fw i n d o w sx ps p 2a n d v c + + 6 0 r e s u l t st e l lt h a tt h ed e s t r o y e df i l ec a nb er e c o v e r e dt oac e r t a i ne x t e n t ,a n d w eg o ts a t i s f i e de x p e r i m e n tr e s u l t s k e y w o r d s :m p 3 s e l f - e m b e d d i n g l s bh i d i n ga l g o r i t h m m a t r i xh i d i n ga l g o r i t h mm d c tc o e f f i c i e n t s i i 中国科学技术大学学位论文原创性和授权使用声明 本人声明所呈交的学位论文,是本人在导师指导下进行研究工作 所取得的成果。除已特别加以标注和致谢的地方外,论文中不包含任 何他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究 所做的贡献均已在论文中作了明确的说明。 本人授权中国科学技术大学拥有学位论文的部分使用权,即:学 校有权按有关规定向国家有关部门或机构送交论文的复印件和电子 版,允许论文被查阅和借阅,可以将学位论文编入有关数据库进行检 索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 保密的学位论文在解密后也遵守此规定。 作者签名:避 扣0 7 麓勰,1 。汀弘 第1 章绪论 i i i i i i i i i i i i i i i i - 一 ii _ i i ii 1 1 研究背景及意义 第1 章绪论 在当今世界上,数字媒体的发展速度日益加快,网络上流传着很多种数字媒 体,大体归类为视频、音频、文字、图像等。这些数字媒体是人们获取信息的主 要载体,例如同常生活中看到的网页新闻、聆听的数字音乐、以及欣赏的高清数 字电视等都是将信息以数字的形式传递给人们。而且随着数字通信的发展,数字 媒体在网络上的流动随之加快,而在网络速度及稳定性一定的条件下,将数字媒 体进行适当的压缩可以使传输所需时间减短,传输错误率降低,并节省存放空间。 于是,很多公司及研究机构对媒体的压缩方法进行了深入研究,最终出现了目前 非常流行的媒体格式,例如图像中的j p e g 、g r i f ,视频中的a v i 、r m v b 、w m v , 音频中的m p 3 、w m a 等等。这些压缩方式共同的特点就是在尽量不损坏媒体质 量的前提下将媒体所占空间尽量降低。例如音频中的主流格式m p 3 ,将p c m 信 号进行一系列处理后,去掉了人耳不敏感的高频信号,结合霍夫曼编码,删除了 大部分冗余【i5 1 ,使其所占空间降低至原来的1 1 0 1 1 2 ,而且压缩过程去掉高频 信息对音频质量几乎没有什么损坏。 自嵌入技术是信息隐藏技术衍生而来的分支科学,即以数字媒体文件作为载 体,将其本身的副本经过有损或无损压缩后得到待嵌入数据,然后把待嵌入数据 利用信息隐藏等方法嵌入到载体文件中,当数字媒体被人为篡改或者在传输中缺 损时,通过从破坏或残缺的媒体中提取出的信息,可以验证并近似恢复原始媒体。 在证据保全、网络传输等方面,自嵌入方法均有着积极的意义。它涉及到媒体信 息压缩、数据隐藏等方面的技术。 当今社会上一些重要的媒体文件需要特殊的保护。目前已有很多有关隐藏和 自嵌入的文献针对媒体安全认证等方面提出了很有价值的方法 2 9 , 3 1 , 3 7 , 4 0 。如果重 要文件在存放或网络传输过程中发生丢帧或帧数据被人为破坏的情况,将会导致 严重的后果。自嵌入的意义,在于当原文件遭到破坏时可以通过某种方法将嵌入 的内容恢复出来,一定程度上还原文件,减轻文件缺失或破坏带来的不良后果。 因此,当发生传输丢帧或人为破坏时,可以通过自嵌入恢复的方法进行一定程度 第1 苹绪论 i i 还原,以减少损失。如今网络上的视频、音频信息非常丰富,但网络速度却往往 不能达到人们所希望的要求,如果把要传输的数据流进行自嵌入处理,会在一定 程度上缓解网络压力。例如,把需要传输的数据流分为1 0 0 份,然后将偶数份嵌 在奇数份中,当网络不顺畅的时候,每当传输完奇数份,就将嵌入其中的偶数份 提取出来进行播放,且在播放偶数份时可以同时传输下一奇数份数据,这样视频 或音频播放时就能很好的缓解“卡死”的现象。综合以上可以看出,自嵌入技术 有着重要的理论研究意义和应用价值,更有巨大的商业潜力。 自嵌入技术中会采用一些有损或无损的隐藏方法作为嵌入方法。信息隐藏, 即利用人类感觉冗余( 人类感觉器官的不敏感) ,以及多媒体数字信号本身存在 的冗余,将秘密信息隐藏在宿主媒体中,不被察觉到并且不影响载体的感觉效果。 目前已有多种成熟方法,例如有损隐藏中较为常用的有l s b 隐藏、扩频隐藏 4 , 1 4 , 1 6 】、回声隐藏【1 , 9 , 1 1 】、矩阵隐藏 6 3 0 , 2 1 1 、d c t 隐藏【1 3 】等 1 2 , 1 8 , 3 2 】,除此之外,还 有一些无损的隐藏方法,2 0 0 3 年,t i a nj 给出了一种基于图像的大容量的无损 信息隐藏方法【2 2 , 2 3 】,t h o d i 等人也在2 0 0 4 年给出了一种基于预测误差扩展的无 损数据隐藏方法【2 4 】。同年,a l a t t a r 对t i a nj 的算法进行了扩展和改进f 2 5 ,2 8 1 。信 息隐藏方法多用于传输秘密信息和数字水印技术,基于信息隐藏方法的特点,一 般自嵌入方法中会借用到这些隐藏方法。 1 2国内外研究现状 自嵌入自2 0 世纪9 0 年代末以来,得到了一定的发展。国内外的学者对自嵌 入技术的发展都做出了重要的贡献。1 9 9 9 年,j f r i d r i c h 2 j 等人提出了自嵌入的 概念,提出一种图像自嵌入方法,将最低位置零,分化d c t 及量化,并对前1 1 个低频系数分配位长,作为该子块低质量图像编码,嵌入到偏移子块。y i l m a z 和a l a t a n 8 】在2 0 0 3 年,结合图像的边缘信息、块长及奇偶校验位,组成待嵌入 水印,将其隐藏在图像的d c t 系数中,当图像块出错时,使用嵌入的信息较好 地对出错部分进行纠错。2 0 0 4 年,张等人【5 j 在f r i d r i c h 等人方法的基础上做了改 进,调整码长分配表,并且改进了偏移值的选择。2 0 0 5 年,a d s u m i l l i 3 等实现了 视频自嵌入。2 0 0 5 年,m a k u r a 提出一种文本自嵌入的水印算法【3 4 】,随后在2 0 0 6 年t h i e nv u ik h e n 和m a k u r a 在此基础上作了一定的改进【35 1 ,2 0 0 7 年,s a n t o s h a r j u n n 和n e g i a 又提出了一种基于l z w ( l e m p e l z i v - w e l c h ) 3 6 】的文本自嵌入 2 第1 章绪论 方法【3 3 1 。在国内也有较为成熟的研究,论文一种图像自嵌入方法【2 0 】介绍了 一种图像的自嵌入保护方法,将图像分成8 8 的子块,每个子块的压缩编码与 偏移子块的认证信息嵌入到偏移子块中,其采用的嵌入方法是基于宿主可修改数 据的数位信息隐藏方法【3 0 1 。另外一种d c t 域的图像自嵌入算法提出一种基于 d c t 域的自嵌入算法1 2 7 】,这种算法可以抵御一定的j p e g 压缩,从而拓展了图像 自嵌入的应用范围。2 0 0 8 年s b e n g - b i n gc h e 等人提出一种基于s v d 3 9 1 的图像自 嵌入方法【38 1 。 目前自嵌入方法多采用一些成熟的隐藏方法,因此信息隐藏的发展环境直接 影响到自嵌入方法的发展前景。 国际上的第一届信息隐藏大会于1 9 9 6 年在英国的剑桥大学举行,这次会议 推动了信息隐藏理论和技术的研究。1 9 9 8 年在美国的波特兰召开了第一届信息 隐藏研究会;1 9 9 9 年在德国召开了第三届信息隐藏研讨会。近些年i e e e ,i c i p , e u s i p c o 的会议中也都有关于信息隐藏技术的专题或文章。这些专题研讨会的 召开极大的促进了各个研究团体在这一领域内的交流和合作,也吸引了越来越多 ,的人投身于信息隐藏技术的研究。 我国在1 9 9 9 年1 2 月,由北京电子技术应用研究所组织,召开了全国第一届 信息隐藏学术研讨会。在2 0 0 0 年召开了全国第一届信息隐藏学术研讨会。2 0 0 1 年召开了全国第三届信息隐藏学术研讨会。这些学术研讨会的召开对国内信息隐 藏研究工作者的交流起到了很好的促进作用。 综上所述,自嵌入方法具有很好的理论研究意义及应用价值,并且到目前为 止,自嵌入方法研究在国内外已经得到一定的发展,为自嵌入方法研究提供了坚 实的基础,p 本文将在这些基础上对m p 3 的自嵌入方法进行研究。 1 3本文研究内容与组织结构 本文围绕着m p 3 文件的自嵌入问题,主要进行了以下几方面的研究:1 ) m p 3 文件数据流及编解码研究:2 ) 音频压缩及还原;3 ) 。自嵌入及提取方法研究。结 合这三个方面的研究工作,本文内容组织如下: 第l 章:绪论。主要介绍了课题研究的目的和意义,以及国内外研究现状。 第2 章:m p 3 数据流。阐述了m p 3 数据流的基本知识,大体讲解了m p 3 文件的 编码及解码方式。 第1 章绪论 第3 章:自嵌入系统概述。介绍自嵌入系统框架及模块,并详细介绍了自嵌入系 统各模块功能。 第4 章:嵌入方法及软件实现。阐述了本文所用嵌入方法,及相应的提取方法, 并介绍了本方法在软件上的实现。 第5 章:音频自嵌入软件系统。介绍自嵌入软件系统的各个模块功能。 第6 章:实验结果和分析。本章有完成此课题所做实验的实验结果以及相应的分 析。 第7 章:总结与展望。对全文进行了总结,提出论文中存在的问题和需要进一步 研究的方法。 1 4小结 本章主要介绍了信息隐藏技术和自嵌入技术的研究背景和研究意义,并对当 前这些技术的发展状况进行了一定的阐述,除此之外还对本文进行了组织结构安 排。1 1 节介绍了自嵌入技术和信息隐藏技术的研究背景和研究意义;1 2 节阐述 了自嵌入与信息隐藏技术的发展现状;1 3 节对整篇文章的结构进行了科学地组 织安排。 4 第2 章m p 3 数据流 第2 章m p 3 数据流 2 1mp 3 介绍 m p 3 ( m p e ga u d i ol a y e r 3 ) 【1 5 1 是一种有损压缩方式,以极小的声音失真换 来很高的压缩比。此编码算法是i s o ( i n t e r n a t i o n a ls t a n d a r do r g a n i z a t i o n ) 于九 十年代初就视频压缩、音频压缩及多种压缩数据流的复合和同步而提出的国际标 准。它基于现代的听觉编码技术,充分利用人耳听觉系统( h a s ) 和心理声学模 型【7 1 ,以1 :1 2 的压缩比减少了原p c m 信号的数据量。该技术特别适用于低传输 速率下高保真音频数据的传输,因而在因特网上得以流行,并且在数字音频和广 播系统中得到了广泛应用。 2 2m p 3 码流及特点 m p 3 文件由多个帧组成,也就是说帧是m p 3 音乐文件的组成单元,并且帧与 帧之间都是相互独立的。每个帧由自己的帧头和帧数据组成。m p 3 音频文件没 有文件头,因此,可以分割出m p 3 音频文件的任何一部分进行播放。 一一帧 主数据: m d c t 系数编码数 卜 主数据( 若干b y t e ) 、_ i l t l f 0r 霍夫曼编码数据 f 。辅助 冈子i 比特 l i 大值m d c t 系“小值区m d c t 系r 鼠: 数编码数据数编码数据i 图2 - 1 帧数据流组成 帧头:对于m p 3 音频文件来说,通过其第一帧的头部信息,并且假设所有 的帧的头部信息是相同的,就可以了解到整个m p 3 音频文件的信息( 大体来说, 所有帧的头部信息是一致的) 。对帧来说,其头部信息恰好是由一帧的前4 个字 节构成的。其中前1 2 比特称为帧同步信号( s y n c ) 。所以,可以通过搜索m p 3 第2 章m p 3 数据流 i i_i i 音频文件中最早出现的1 2 比特同步信号,再把整个头部读检查一遍,来寻找帧 的起始点。通过下面所列举的表格,可以查出头部中每一比特的确切含义,而且 可以检查该比特值的合法性。 帧头结构如下: 表2 - i 帧头参数表 帧头数据名称比特位帧头数据描述 s y n c 1 2帧同步信号 v e r s ! o n1 m p e g 文件版本 1 a y e r 2 层描述 e r r o r _ _ p r o t e c t i o n 1 保护位 b i tr a t ei n d e x4 码率指标 s a m p l e _ r a t e i n d e x 2 采样频率指标 p a d d i n g l 填补位 e x t e n s i o n1 私有标志 c h a n n e lm o d e2通道模式 m o d ee x t e n s i o n2 模式扩展 c o p y r i g h t l 版权 o r i g i n a l 1 原著 e m p h a s i s 2 强调方式 帧可能会有一个c r c ( 错误检测) 校验,但大多数的m p e g 音频文件都没有。所 谓的c r c ,如果有的话,是1 6 比特的0 ,1 串,而且是紧跟在帧头部后面的。c r c 串之后,就是m p 3 的声音数据了。如果需要读其他的帧头部的话,首先要计算 一下一帧的长度,而且通过计算帧长,还可以检验c r c 的正确性。这个方法很适 合检查m p 3 头部的合法性。 通道信息:在帧头后边是s i d e i n f o ( 称之为通道信息) 。对标准的立体声 m p 3 文件来说,其长度为3 2 字节。 通道信息结构如下: 6 第2 章m p 3 数据流 表2 - 2 通道信息参数表 描述比特数 单声道双声道 c h = 0 c h = 0 ,1 主数据开始指针( m a i n d a t a b e g i n ) 99 私有位( p r i v a t e b i t s ) 5 3 两个粒度共有选择信息( s c f s i c h s c f s i b a n d ) 4 ,| c l2 4 1 粒主数据位数( p a r t 2 3 一l e n g t h g r c h ) 1 22 半1 2 度大值( b i g v a l u e s g r c h )9 2 * 9 组 全局增益( g l o b a l g a i n g r c h ) 82 * 8 1 比例因子压缩( s c a le f a c c o m p r e s s g r c h ) 42 * 4 的 窗切换,啄志( w i n d o w _ s w it c h i n g f l a g g r c h ) l2 1 帧 窗切 块类型( b l o c k t y p e g r c h ) 22 * 2 边 换标混合块标志( m ix e d blo c k f la g ) 1 2 1 信 志为 表选择( t a b l e s e l e c t g r c h r e g i o n ) 2 * 52 * 2 * 5 息l 时 子块增益( s u b b l o c k g a i n g r c h w i n d o w ) 3 * 32 * 3 * 3 , 窗切 表选择( t a b l e s e l e c t g r c h r e g i o n ) 3 * 52 * 3 * 5 即 换标 区域0 一计数( r e g i o no _ c o u n t g r c h ) 42 , 4 g 志0 时 区域卜计数( r e g i o ni c o u n t g r c h ) 32 * 3 r 预标志( p r e f l a g g r c h ) 12 1 = 比例因子一缩放( s c a l e f a c s c a l e g r c h ) 12 1 0 计数1 表选择( c o u n t lt a b l e - s e l e c t g r c h ) 12 1 粒度组2 的帧边信息,即g r = l同粒度同粒度 组1 组1 总占用的字节数1 7 字节 3 2 字节 主数据:主数据【1 5 】包括比例因子、m d c t 系数霍夫曼编码数据和辅助比特。 m d c t 系数分为大值区、小值区和零值区。大值区系数的绝对值较大,范围为 - 8 1 9 1 8 1 9 1 ,两个系数为一组进行编码;小值区系数只能取一1 ,1 或o ,四个为 一组进行编码:零值区表示高频区域,不进行编码。因此m d c t 系数霍夫曼编 7 第2 章 m p 3 数据流 i i i 码数据由大值区系数和小值区系数的霍夫曼编码数据组成。一般地讲,大值区的 系数与m p 3 的中低频率有关,不能改动过大,而小值区一般为中高频,改动后 对音频质量影响稍小。 火值区系数槛系数零值区系数 锗搿 r hr 1 、 一m d c t 系数金笺暨编码数据 lm d c t 系数塞篓嬖编码数据1 圈m d c t 系数霍夫曼编码数据| 系数霍夫曼编码数据f | l 二二二_ j 气= = = = = = = = = = = = = = = = = = = = = = = 纠、= = = = = = = = = = = = = = = = = = = = = = = = = = 纠 2 3mp 3 编解码 2 3 1m p 3 编码流程 m p 3 编码【1 9 1 主要由3 大功能模块组成,包括混合滤波器组( 子带滤波器组和 m d c t 变换) ,心理声学模型,量化编码( 比特因子分配和霍夫曼编码) 。 si!g_nal型32-chennelp o l y p h a s e 一 t a ) ( y r _ 缀爱 r 1 n a l y s i s f i l t e r b 柚k 璧一誊。 l 嬲翰翰鞠鞠勰缀缓嬲翰凝绷黝麟暖嬲隰 删篇s m r s w l t c hn gl 一一一,一上 一j 一- j c o d i n go f 【s i d e i n f o m a t i o n l 图2 3m p 3 编码流程图 混合滤波器组:混合滤波器组包括子带滤波器组和m d c t 变换两部分。子 带滤波器组编码完成样本信号从时域到频域的映射,并将规定的音频信号通过带 通滤波器组分解成3 2 个等宽子带输出,但是由于心理声学模型得到的临界带宽 8 怒薹| 第2 章m p 3 数据流 不是等宽的,所以为了使进行编码的各个比例因子带与临界频带相匹配,需要对 每个子带信号作m d c t 变换。将子带滤波器组的输出送到m d c t 滤波器组后, 每组细分为1 8 条频线,共产生5 7 6 条频线。然后利用心理声学模型中计算出来 的子带信号的信掩比( s m r ) ,决定分配给5 7 6 条谱线的比特数。心理声学模型 利用了人耳听觉系统的遮蔽效应特性,移除大量的不相关信号,从而达到压缩音 频数据的效果。为了精确地计算遮蔽阈值,要求信号有更好的频域解析度,因此 在使用心理声学模型前先对信号进行傅立叶变换。 心理声学模型:m p e g 1 提供了两种心理声学模型,第一种模型计算简单, 在高比特率编码时提供适当精度;第二种模型比较复杂,一般在较低比特率编码 时使用。m p 3 编码使用第二声学模型。心理声学的目的就是求出各个子代的掩 蔽阈值,并以此控制量化过程。心理声学模型实现过程一般是先用f f t 求出信 号的频谱特性,根据频谱特性找出各频率点上的音调成分( 或称音乐成分) 和非 音调成分( 或称噪声成分) ;根据掩蔽域曲线确定各个音调成分和非音调成分在 其他频率点的掩蔽阈值;最后求出各频率点的总体掩蔽域,并折算到编码子带中。 对于子带滤波器组输出的谱值量化后产生的噪声,如果能够被控制在掩蔽域值以 下,则最终的压缩数据被解码后的结果与原始信号难以区分。一个给定信号的掩 蔽能力取决于它的频率和响度,所以心理声学模型的最终输出是信掩比s m r , 即信号强度与掩蔽阈值的比率。 量化编码:量化编码使用一个三层迭代循环模型来实现比特分配和量化。这 三层包括:帧循环、外层循环和内层循环。帧循环复位所有的迭代变量,计算能 够分配给每帧数据的最大比特数,然后调用外层迭代模型;外层迭代模型首先使 用内层迭代模型对输入矢量进行量化,通过递增量化步长使量化输出能够在一定 的比特位数限制之内被编码。霍夫曼编码对量化的最大值有限制,所以需要判断 所有的量化值是否超过限制,如果超过限制,则内层迭代循环需要递增量化步长, 重新量化。然后确定霍夫曼编码的位数,使其所占的比特数小于由帧循环计算出 的每帧编码所能提供的最大比特数,否则也要增加量化步长重新量化。当量化满 足要求后,存储最终的比例因子数值,跳出外层循环,并在帧循环中计算存储每 帧数据所用的比特位数。 9 第2 章m p 3 数据流 2 3 2m p 3 解码流程 m p 3 解码流程主要包括两大步骤:帧参数提取并解码( 包括查找同步信息、 通道信息解码、比例因子解码和霍夫曼数据解码) ,m d c t 系数处理( 包括再量 化频谱、频谱重排序、立体声处理、减小混叠、通过i m d c t 综合并重叠、通过 多相滤波器组) 。 帧参数 提取 及解码 图2 - 4 m p 3 帧解码流程图 帧参数提及并解码:解码器首先对输入比特流同步,读出帧头( 共4 字节) , 然后读出3 2 字节的通道信息,通道信息必须先存储起来,在有关的解码中应用, 例如选择霍夫曼码表等。主数据( 包括比例因子、霍夫曼码数据和辅助信息) 不 一定放在通道信息后面,主数据的起始位置用目前帧通道信息的m a i n _ d a t a _ b e g i n 参数来标示。如果非负参数m a i n _ d a t ab e g i n 等于0 ,那么表示主数据紧跟在通 道信息之后;如果m a i n _ d a t a _ b e g i n 大于零时,表示主数据从帧头前 m a i nd a t a 个字节开始,和通道信息后的主数据部分相连接。找到主数据begin 的起始位置后,进行比例因子的解码,随后进行霍夫曼解码,根据通道信息的 b i g _ v a l u e s 参数获得大值区参数的个数,然后用t a b l e s e l e c t g r c h r e g i o n 数据表 解码大值区m d c t 系数;余留的霍夫曼码位按照c o u n t l _ t a b l e _ s e l e e t g r o h 表解 码,解码过程直到所有霍夫曼码位都已解码,或者代表5 7 6 条频线的m d c t 系 数均被解码。 m d c t 系数处理:m d c t 系数处理和编码时p c m 样点信号转为m d c t 系 1 0 第2 罩m p 3 教据流 数的过程是互逆的,首先经过再量化器,然后对重新量化过的系数进行重新排序, 再进行立体声处理,对于长块的颗粒( b l o c k _ t y p e l = 2 ) ,在i m d c t 处理前,综 合滤波组的输入需要预处理以减少混叠。然后进行i m d c t ( 逆m d c t 转换) , 把转换后的信号输入多相滤波器组进行频率倒置的补偿,最终得到p c m 信号, 至此解码结束。 2 4小结 本章对m p 3 的数据流和编解码进行了介绍。2 1 节主要介绍了m p 3 格式的 发展历史及应用背景;2 2 节较为详细地介绍了数据流格式,并且列举了帧头和 帧边信息的数据流列表,对主数据的分布情况用结构图( 如图2 1 ) 进行了详尽 地描述,除此之外,对m d c t 系数的分类情况也进行了阐述;2 3 节主要介绍了 编解码的流程,对几个重要的步骤进行了详细的介绍,为下文嵌入过程的步骤介 绍作了很好的铺垫。 第3 章自嵌人系统概述 第3 章白嵌入系统概述 3 1白嵌入系统框架 自嵌入技术的核心主要有两个方面,即1 ) 嵌入技术;2 ) 压缩技术。对于嵌 入技术,一般采用信息隐藏方法,例如l s b 方法和矩阵方法等。而压缩技术, 可以采用减采样等方法。本文所述自嵌入系统共分为两大模块:即m p 3 压缩模 块和信息嵌入模块( 如图3 1 ) 。 女一一一i ! lm p 3 音频原文件 三二唰? 、 i l 音频原文件! :- 砟两弼j 、 # 一一; 7 。, l霎i ,。i 刮,谯黔“ l一 -一 。 i r 一一一1 ,7 r l ,副本压ii 一7e l 缩文件 l i l 一一j ; i l ! ,一压缩模块 王4 - ,删,匡i 嵌入模块 图3 - 1 自嵌入系统流程图 自嵌入方法中嵌入信息量和恢复质量之间存在着相互制约的关系。首先,嵌 入信息量大,则会使自嵌入后的载体文件质量下降;嵌入信息量小,则说明副本 的压缩率高,即恢复出来的文件质量比较低。概括地说,即压缩比高,则需要嵌 入的数据量小,自嵌入后的载体文件质量高,但恢复出的文件质量低;压缩比低, 则需要嵌入的数据量大,自嵌入后载体文件质量低,但恢复出的文件质量高。 图3 2 压缩比与质量之间的矛盾关系 1 2 第3 覃目嵌入系统概述 对于m p 3 文件,冗余比较少,嵌入量有限,因此需要压缩比比较高,对于 高品质的音乐文件,自嵌入没有什么实用意义,而对于一些作为重要证据的语音 音频,只要恢复出来不妨碍听清内容,就达到了自嵌入保护的目的,因此本文方 法采用高压缩比的主导思想进行。 3 。2系统模块及功能描述 3 2 1压缩模块 在对媒体质量要求不高,而对压缩率有更高要求的情况下,减采样、变立体 声为单声道、减少样本比特数的方法也是可行的。例如,对于一段语音,并不需 要有太高品质的音质,而只需要能够听清说话人所说的内容即可,这种情况下, 我们可以采用减采样、减少声道、减少样本比特数的方法。假设这段语音是w a v 格式的,立体声,样本比特数为1 6 ,采样率为4 4 1 0 0 h z ,那么1 0 分钟语音内容 就占有空间= 登苎型鲨壁 离譬耄高筹燮, 1 0 0 9 4 m ,一2 0 3 0 分钟的 语音文件就需要2 0 0 3 0 0 m 的空间,这难以让人接受。但是如果进行以上方法处 理后,同样的w a v 文件,将立体声改为单声道,样本比特数由1 6 变为8 ,那么 这段音频所占空间可以缩小到原来的l 4 ,即只有5 0 7 5 m ,再经过m p 3 转换, 最终只有10 。15 m 左右,而且这种改变对语音质量来说并不会造成很大伤害。这 三种方法的图解如下: 1 ) 减采样:由于数字音频多是模拟信号的采样量化,因此在一定程度上具有“连 续性”,连续几个样点间一般不会发生巨大跃变,因此去掉连续样点中的一些 样点,不会对整个音频文件的音质造成巨大损坏。 卜口田团团曰田田曰曰日日曰曰l j 减采样 j - 卜口田田田日曰l 图3 - 3 减采样图示( 每两个样点中取一个) 2 ) 变双声道为单声道:双声道是为了模仿入耳在自然界听到声音时的生物学原 理,简单的讲,就是有两个声音通道,相当于在空间放置了两个互成一定角 第3 章自嵌入系统概述 度的扬声器,每个扬声器单独由一个声道提供信号。但一般来说,双声道的 两个通道信号内容上是一致的。立体声的两个声道信号内容不一致,但相差 的只是些配乐,对于主要内容没有太大差别。因此,对于立体声或双声道 音频来说,去掉其中一个通道信号也能获得比较重要的信息。 l 去掉右声道 一l 图3 4 双声道变为单声道 3 ) 减少样本比特数:以w a v 文件为例,把一个需要1 6 比特描述的样点进行归 一化处理,用8 比特描述,则可以节省一半的空间,对音质没有太大损坏。 1 6 位描述一个样点 i i 归一化 u l 。1 1 0 1 1 0 1 0 1 0 1 1 1 0 0 0 1 图3 - 5 将1 6 位样点通过归一化变为8 位样点 压缩模块在自嵌入系统中起着至关重要的作用,目的是在不对音质造成很大 破坏的前提下尽量提高压缩率。本文m p 3 压缩方法采用减采样、双声道变单声 道、减少样本数三种方法,步骤图解如图3 - 6 所示。 压缩步骤: s t e p l :将m p 3 原文件复制,得到m p 3 文件的副本,然后利用m p 3 的解码算 法将其解码,得到p c m 信号,即w a v 文件。 s t e p 2 :将得到的w a v 文件进行去声道处理,将双声道变为单声道,得到单声 道的w a v 文件; s t e p 3 :将得到的单声道w a v 文件进行减少样本比特数处理,将原来1 6 比特描 1 4 第3 章自嵌入系统概述 述的一个样点利用8 比特描述; s t e p 4 :将得到的w a v 进行减采样,每8 个样点取一个样点,得到最后的压缩 完成的w a v 文件; s t e p 5 - 将压缩后的w a v 文件进行m p 3 编码,得到压缩后的m p 3 文件,即待 嵌入数据,压缩过程完成。 囤司圈蜀国 回仁目每圜 3 2 2 信息嵌入模块 图3 - 6 压缩模块 信息嵌入模块是自嵌入系统的核心。本文所采用的嵌入方法是:将m p 3 部 礴分解码,得到m d c t 系数。对于大值区的m d c t 系数,由于幅值较大,其绝对 值改变较小并不会有太大影响,因此采用l s b 隐藏算法;而对于小值区的m d c t 系数,由于值较小( 0 ,l 或1 ) ,因此采用嵌入效率较高的矩阵隐藏算法,尽量 少地改变系数;具体流程图如图3 7 。 嵌入步骤: s t e p l :将原m p 3 文件进行部分解码,只需经过霍夫曼解码后即可,得到大值 区和小值区的m d c t 系数; s t e p 2 :对于大值区m d c t 系数,利用l s b 嵌入算法将待嵌信息嵌入; s t e p 3 :对于小值区m d c t 系数,利用矩阵嵌入算法将待嵌信息嵌入; s t e p 4 :将嵌入后的m d c t 系数利用霍夫曼码表进行编码; s t e p 5 :将编码后的数据重新组成m p 3 数据流。 第3 章自嵌入系统概述 |11| 囤粉删冒黼 3 3小结 图3 7 信息嵌入模块 本章对本文自嵌入系统进行了概述性的介绍。3 1 节介绍了自嵌入系统的总 体框架以及音频质量与压缩率的矛盾关系;3 2 节介绍了压缩模块和嵌入模块的 流程及本文所采用的关键方法,为下文的自嵌入软件系统的嵌入模块作下铺垫。 1 6 第4 章嵌入方法及软件实现 第4 章嵌入方法及软件实现 4 1嵌入方法框架介绍 4 1 1 嵌入方法框架 嵌入过程是本文所研究问题的核心部分,嵌入方法及嵌入位置的选择是极其 重要的。由4 1 1 节可以知道,本文所使用的嵌入方法是l s b 嵌入方法和矩阵嵌 入方法,这两种方法会在后面详细介绍。而嵌入位置的选择则是指待嵌帧数据和 载体帧数据之间的位黄关系如何确定,才能使自嵌入方法更可靠,恢复成功率更 高,这会在本小节介绍。整个嵌入过程步骤如下: ( 1 ) 计算原载体m p 3 和压缩后m p 3 的帧数( 由于减采样、减声道等处理,使 得压缩后帧数减少) ,确定压缩后每帧数据应该藏在载体的多少帧中。例 如,原载体1 6 0 帧,压缩后m p 3 有1 0 帧,那么压缩后的一帧应该藏在载 体的1 6 帧中。 ( 2 ) 确定嵌入区域位置。嵌入位置的选取直接影响到恢复成功的概率,使互嵌 的两个区域的距离尽量大就可以减小同时被破坏的概率。本文采用的嵌入 区域位置选取方法如下: 1 、将载体的所有帧分为数量相同的组,例如共有1 6 0 帧,压缩后m p 3 有 1 0 帧,那么将原载体的1 6 0 帧分为l o 组,每一组1 6 帧。 2 、将压缩后m p 3 的第n 0 ,z 8 ) 帧( 由载体第n 组压缩得到) 嵌在载体的 第1 6 一n ( 1 n 8 ) 组中,而将压缩后m p 3 的第1 6 一n ( 1 玎8 ) 帧嵌在载体 第n 0 门8 ) 组中,这样互嵌的组相距较大,发生同时损坏的概率较小( 如 图4 1 所示) 。 ( 3 ) 利用大值区嵌入方法和小值区嵌入方法按照嵌入位置进行嵌入。首先先在 每一帧的大值区嵌入,然后再在小值区嵌入,都嵌入完成后本帧进行编码, 写入数据流。 第4 章嵌入方法及软件实现 网冈冈冈网冈网丽丽风 笫】倾jf 讹2 帧i 笫3 帧fl2 ;4 帧ll 笳j 帧f l 第6 帧if 第7 帧lj 第8r 坎ll 第9 帧 图4 一l 压缩与嵌入位置( 虚线表示压缩关系,实线表示嵌入关系) 整个嵌入过程流程图如下: 4 1 2 宿主选取 图4 2 本文嵌入方法软件实现总流程图 本文嵌入方法中选择的嵌入位置是大值区和小值区的m d c t 系数,因为 m d c t 系数编码成数据流是采用了无损的霍夫曼编码方法,因此编码和解码过 程中这些系数是不会发生变化的,换句话说,信息嵌入在m d c t 系数中理论上 可以百分之百的正确提取,且可以抵抗某些已有m p 3 隐臧检测方法【1 7 】的分析。 所采用的嵌入方法是较为常用的l s b 方法和嵌入效率较高的矩阵嵌入方法【1 0 】。 大值区的m d c t 系数绝对值较大,采用l s b 方法进行嵌入;小值区系数绝对值 第4 章嵌入方法及软件实现 小,采用嵌入效率高的矩阵嵌入方法嵌入。 4 2大值区的l s b 嵌入方法 4 2 1l s b 嵌入方法 l s b 隐藏方法是较早提出并广泛使用的一种隐藏方法。其主要思想是以某个 变量为宿主,然后用待嵌入比特替换宿主变量的最不重要位( l s b 位) ,以实现 隐藏的目的。 嵌入过程如下: ( 1 ) 将宿主变量利用若干个比特位表示;例如x = 1 3 ,利用比特位表示,即 1 1 0 1 ,其中最后位“1 ”即是最不重要位( l s b ) ; ( 2 ) 用待隐藏比特y ( y = 0 或1 ) 替代宿主变量的l s b 位,则载密变量变为 x7 = 1 1 0 y ,完成隐藏; 4 2 2l s b 方法特点 l s b 方法算法简单,隐藏容量较高,对宿主的影响与宿主变量的绝对值有关, 例如宿主变

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论