一种基于倒谱分析的音频信息隐藏算法及其改进_第1页
一种基于倒谱分析的音频信息隐藏算法及其改进_第2页
一种基于倒谱分析的音频信息隐藏算法及其改进_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计算机应用与软件Computer Applications and Software收稿日期: xxxx-xx-xx。国家或省市基金项目(基金编号)。第一作者,职称/学历,主研领域: 。所有其他作者,职称/学历。一种基于倒谱分析的音频数字水印算法及其改进摘要 在分析一种基于倒谱系数统计平均值音频水印算法基础上,针对算法在鲁棒性方面的不足进行改进。将一帧音频信号分为两个子块,利用两个子块倒谱变换系数的不等关系来嵌入水印数据。通过添加平滑过渡区来解决水印嵌入所造成的帧之间的突变问题。实验结果表明算法改进后可以抵抗大多数攻击,尤其对剪切和时移攻击有很好的鲁棒性。最后,提出以改进前水印算法来标记水印同步起始位,同时采用改进后的算法来嵌入水印数据的双重水印嵌入方案。关键词 倒谱分析数字水印鲁棒性平滑过渡中图分类号 TP309文献标识码 A DOI: 10.3969/j.issn.1000-386x.2013.01.001A digital audio watermarking algorithm based on cepstrum analysis and its improvementAbstract This paper analyzes a cepstrum-based audio watermarking algorithm via the mean-value manipulation, and improves the algorithm focusing on shortcomings in terms of robustness. A frame of the audio signal is divided into two sub blocks, and the watermark data is embed by using the unequal relationship of cepstrum transform coefficients between the two blocks. The problems of the mutation between frames caused by watermark embedding are solved by adding a smooth transition zone. The experimental results confirm that the improved algorithm can resist most attacks and havegood robustness especially for time-scaling and time-shift attack. Finally, this paper propose a watermark scheme that the conventional algorithm is used to initiate a start and the new one is used to actually embed watermark bits. Keywords Cepstrum analysis Digital watermarking Robustness Smooth transition计算机应用与软件30 引言 根据水印嵌入方式的不同,数字音频水印算法可分为空域算法和变换域算法两大类,空域水印对于类噪声攻击的抵抗性较差,如MPEG压缩等处理。目前变换域方法较为普遍, 因为变换域方法通常具有较好的稳健性, 对音频压缩、滤波及噪声均有一定的抵抗力。倒谱分析是一种同态映射, 在语音识别中是一种最有效的特征提取方法, 还可用于语音信号的基音检测、低比特率编码的语音分析/综合系统。本文介绍的两种数字音频水印算法均属于倒谱域水印算法。1 一种基于倒谱域的统计平均值数字水印算法倒谱表示法在语音分析和识别的研究中已被广泛采用。由于音频信号的倒谱系数具有很大的不相关性,且倒谱能量主要集中在零点附近,可以根据倒谱系数分布将水印数据扩展到音频信号的几个倒谱分量中,使每个分量的能量都较小而不易被检测出来,从而保证对无意或有意的攻击具有较高的安全性。时域音频信号可使用傅里叶变换、复对数运算以及逆傅立叶变换转化为实倒谱表示。 (1)通过在倒谱域中嵌入水印将公式(1)中的变成,然后经公式(2)逆变换至时域音频信号: (2)其中表示从所产生的相位谱。嵌入过程包括两个主要步骤:Step1:计算偏置平均置D:减去偏置平均值: (3)Step2:在指定的范围内,如果嵌入数据=0,倒谱保持不变;如果嵌入数据=1时,改为: (4)其中,范围选为65,66,.,1983。公式(4)中变量的值为4/M,其中M表示在范围内满足这个条件的个数。另外,当嵌入数据=0时,在一帧内的总和为0,当嵌入数据=1时则为4。因此,可以通过将每一帧的倒谱系数和与阈值进行比较来提取水印,在本文中取为3。 (5)由于该算法在运算过程中倒谱系数会减去一个偏置平均值,逆变换后音频信号肯定会发生变化,因此,其透明性和鲁棒性都会受到影响。基于此,提出下面的改进算法。2 改进算法2.1 水印嵌入与提取该算法利用了原始语音信号每一帧中两个子块内倒谱系数平均值的不等关系来嵌入水印数据。首先,在一帧中分别设定两个范围和用于统计平均值的分析和比较,其中选为65,.544 U 1504,. ,2043, 选为545,.,1503, 、和U的倒谱系数统计平均值分别设为,和。根据和之间的不等关系,可以嵌入1bit数据,嵌入步骤如下所示:Step1:如果=1且,则: (6)在这里作为一个阈值用来判断和的关系,本文将其设定为0.002。Step2:如果=0且,则: (7)Step3:如果以上两种情况均不是,则倒谱系数保持不变。对倒谱系数的修改不可避免地改变了帧能量。为了防止帧能量的波动,将重新调整为: (8)由于经过以上一系列运算后每一帧倒谱系数的统计平均值并未改变,则上一部分中描述的算法仍然可以用来嵌入额外的水印。因此,水印容量可以通过两种算法的嵌入而增加一倍。当然,这样做必然会使得嵌入水印后的语音信号透明性有所下降。为了提取水印,在接收端分别计算和范围内的倒谱系数平均值,设为和,并通过以下公式来提取水印数据 。 (9)2.2 帧之间的平滑过渡由于水印嵌入过程以帧为单位,因而可能导致在帧结点的突变。这种突变往往导致不理想的嵌入效果,不仅降低了音频质量,也暴露了水印的位置。为了弥补这一缺陷,本文提出在突变的帧之间插入一个额外平滑过渡区。具体地讲,设表示水印嵌入后的第k帧的波形偏差,即 (10)其中和分别表示原始的和嵌入水印后的音频信号的第i个样本。假设第k帧覆盖样本指数从t+1至t+ N,第(k+1)帧开始位置为t+ N+1且N N,则区间(t+ N+1,t+ N)可以充当帧之间的缓冲边界,以减轻的突变。本文采用了分段保形三次插值法以达到平滑过渡的目的。通过从第k个和第k +1个帧构成的已知点收集样本,在过渡区中利用插值法得到未知点的偏差,即| i= t+ N+1,.,t+ N。然后音频信号修改为= +, i =t+ N+1,.,t + N。实验显示在使用该方法后帧之间的突变消失了,而且主观音频听觉测试也证实在音频信号在质量方面有了很大的改善。3 性能比较3.1 透明性比较为测试算法改进前后的透明性,从几个CD专辑中收集3段不同风格的录音,音频信号以16位分辨率及44.1kHz的频率进行采样,嵌入数据则采用20bit二进制序列。图实验结果表明,算法改进前后透明性都非常不错,水印数据嵌入前后语音信号的波形并没有产生大的变化,透明性良好。3.2 鲁棒性比较为了检验算法改进前后的鲁棒性,本文还测试了在下列攻击中水印提取的正确率:表1 两种算法鲁棒性对比攻击类型改进前算法改进后算法=1=0=1=0无攻击100.00%100.00%100.00%100.00%重采样100.00%100.00%100.00%100.00%重量化100.00%100.00%100.00%100.00%加高斯白噪声100.00%100.00%100.00%100.00%低通滤波100.00%100.00%100.00%100.00%抖动100.00%100.00%100.00%100.00%MPEG压缩100.00%99.97%100.00%99.97%时移(3%)93.80%80.12%98.52%97.30%时间伸展(103%)99.72%90.87%98.24%97.80%时间压缩(97%)98.22%90.96%97.80%98.77%表1是两种算法对于不同的攻击手段都具有良好的鲁棒性。但是另一方面,算法改进前嵌入水印数据为0的情况下,当嵌入水印的载体语音遭受时移和时间压缩、伸展攻击时,算法鲁棒性明显下降,而算法改进后这种情况下的鲁棒性明显提高,问题得到了很好的解决。因此从表1可以得出结论,算法改进后鲁棒性有所提高,尤其是对时移攻击和时间伸展、压缩攻击的抵抗能力得到了明显的提升。3.34 结语尽管改进前后的两种倒谱水印算法能在无干扰的情况下同时进行水印嵌入,但是必然会对总体透明性和鲁棒性产生一定影响。因此本文提出利用这两种基于倒谱的水印算法形成一个兼容性的水印系统有着特殊的前景。具体来讲,就是利用改进后的算法来嵌入数字水印,而利用改进前的算法标记水印起始位置。这种工作方式可以看作双通道水印,也就是一个用来进行数据嵌入,另一个则用作标记。在用来标记的通道中,数据位通常保持为0,若出现6个连续的比特“1”则表示水印启动。下图对双通道水印进行了阐释。图1 双通道水印示意图参考文献 1 X. He, M.S. Scordilis, Efficiently synchronized spread-spectrum audio watermarking with improved psychoacoustic model, Res. Lett. Signal Process (2008) Article ID 251868.2 X.Y. Wang, P.P. Niu, H.Y. Yang, A robust digital audio watermarking based on statistics characteristics, Pattern Recognition 42 (2009) 30573064.3 S. Xiang, H.J. Kim, J. Huang, Audio watermarking robust against time-scale modification and MP3 compression, Signal Process. 88 (2008) 23722387.4 张敏瑞,易克初.倒谱域音频与图像水印算法J西安电子科技大学学报(自然科学版),2003,6:730- 7385 白树锋.鲁棒性音频水印算法的研究D.南京邮电大学.2013.6 邸峥.基于小波分析的数字音频水印技术的研究D.昆明理

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论