一种基于倒谱分析的音频信息隐藏算法及其改进 下载本文

内容发布更新时间 : 2024/5/20 10:06:49星期一 下面是文章的全部内容请认真阅读。

计算机应用与软件

Computer Applications and Software

一种基于倒谱分析的音频数字水印算法及其改进

摘 要 在分析一种基于倒谱系数统计平均值音频水印算法基础上,针对算法在鲁棒性方面的不足进行改进。将一帧音频信号分为两个子块,利用两个子块倒谱变换系数的不等关系来嵌入水印数据。通过添加平滑过渡区来解决水印嵌入所造成的帧之间的突变问题。实验结果表明算法改进后可以抵抗大多数攻击,尤其对剪切和时移攻击有很好的鲁棒性。最后,提出以改进前水印算法来标记水印同步起始位,同时采用改进后的算法来嵌入水印数据的双重水印嵌入方案。 关键词

倒谱分析 数字水印 鲁棒性 平滑过渡

中图分类号 TP309 文献标识码 A DOI: 10.3969/j.issn.1000-386x.2013.01.001

A digital audio watermarking algorithm based on cepstrum analysis and its improvement

Abstract

This paper analyzes a cepstrum-based audio watermarking algorithm via the mean-value manipulation, and improves the algorithm focusing on

shortcomings in terms of robustness. A frame of the audio signal is divided into two sub blocks, and the watermark data is embed by using the unequal relationship of cepstrum transform coefficients between the two blocks. The problems of the mutation between frames caused by watermark embedding are solved by adding a smooth transition zone. The experimental results confirm that the improved algorithm can resist most attacks and have good robustness especially for time-scaling and time-shift attack. Finally, this paper propose a watermark scheme that the conventional algorithm is used to initiate a start and the new one is used to actually embed watermark bits. Keywords

Cepstrum analysis Digital watermarking Robustness Smooth transition

0 引 言

根据水印嵌入方式的不同,数字音频水印算法可分为空域算法和变换域算法两大类,空域水印对于类噪声攻击的抵抗性较差,如MPEG压缩等处理。目前变换域方法较为普遍, 因为变换域方法通常具有较好的稳健性, 对音频压缩、滤波及噪声均有一定的抵抗力。

倒谱分析[]是一种同态映射, 在语音识别中是一种最有效的特征提取方法, 还可用于语音信号的基音检测、低比特率编码的语音分析/综合系统。

本文介绍的两种数字音频水印算法均属于倒谱域水印算法。

?(n)?IFFT(exp(FFT(c?(n)?ej?s(n)))) (2) s其中?s(n)表示从FFT(s(n))所产生的相位谱。嵌入过程包括两个主要步骤:

Step1:计算偏置平均置D:

D??c(i)i?1N-1N?1

减去偏置平均值:

c'(n)?c(n)?D (3)

Step2:在指定的范围Ic内,如果嵌入数据Wm=0,倒谱保

?(n): 持不变;如果嵌入数据Wm=1时,c'(n)改为c??c'(n)??c(n)????c'(n)?ifc'(n)?0&n?Ic (4)

ifc'(n)?0&n?Ic1 一种基于倒谱域的统计平均值数字水印算法

倒谱表示法在语音分析和识别的研究中已被广泛采用。由于音频信号的倒谱系数具有很大的不相关性,且倒谱能量主要集中在零点附近,可以根据倒谱系数分布将水印数据扩展到音频信号的几个倒谱分量中,使每个分量的能量都较小而不易被检测出来,从而保证对无意或有意的攻击具有较高的安全性。

时域音频信号s(n)可使用傅里叶变换、复对数运算以及逆傅立叶变换转化为实倒谱表示c(n)。

c(n)?IFFT(log(FFT(s(n)))) (1)

?(n),通过在倒谱域中嵌入水印将公式(1)中的c(n)变成c?(n): 然后经公式(2)逆变换至时域音频信号s其中,Ic范围选为{65,66,...,1983}。公式(4)中变量α的值为4/M,其中M表示在Ic范围内满足c'(n)?0这个条件的

c'个数。

?(n)在一帧内的总和为0,另外,当嵌入数据Wm=0时,c当嵌入数据Wm=1时则为4。因此,可以通过将每一帧的倒谱系数和与阈值T'进行比较来提取水印,在本文中T'取为3。

??1如果c??c(n)?T' (5)

Wm??n?I?0其他情况?由于该算法在运算过程中倒谱系数会减去一个偏置平均

收稿日期: xxxx-xx-xx。国家或省市基金项目(基金编号)。第一作者,职称/学历,主研领域: 。所有其他作者,职称/学历。 2

计算机应用与软件

值,逆变换后音频信号肯定会发生变化,因此,其透明性和鲁棒性都会受到影响。基于此,提出下面的改进算法。

2 改进算法

2.1 水印嵌入与提取

该算法利用了原始语音信号每一帧中两个子块内倒谱系数平均值的不等关系来嵌入水印数据。首先,在一帧中分别设定两个范围IA和IB用于统计平均值的分析和比较,其中IA选为{65,...544} U {1504,... ,2043}, IB选为{545,...,1503},

IA、IB和IAUIB的倒谱系数统计平均值分别设为MA,MB和MA?B。

根据MA和MB之间的不等关系,可以嵌入1bit数据,嵌入步骤如下所示:

Step1:如果Wm=1且MA?MB??,则:

?AA?BNBT/2??fori?IA (6) i)??c(i)?M?M?A?N?NBc(?Ac(i)?MB?MA?B?NT/2??NA?NBfori?IB在这里?作为一个阈值用来判断MA和MB的关系,本文

将其设定为0.002。

Step2:如果Wm=0且MB?MA??,则:

???c(AA?BNBT/2c(i)??i)?M?M??NA?NBfori?IA (7) ?A??c(i)?MB?MA?B?NT/2N?Nfori?IBABStep3:如果以上两种情况均不是,则倒谱系数保持不变。

对倒谱系数的修改不可避免地改变了帧能量。为了防止帧

能量的波动,将s?(n)重新调整为: N?12(i)s(n)?s?(n)(?si?0)1/2 (8)

?N?1s?2(i)i?0由于经过以上一系列运算后每一帧倒谱系数的统计平均值

并未改变,则上一部分中描述的算法仍然可以用来嵌入额外的水印。因此,水印容量可以通过两种算法的嵌入而增加一倍。当然,这样做必然会使得嵌入水印后的语音信号透明性有所下降。

为了提取水印,在接收端分别计算IA和IB

范围内的倒谱系数平均值,设为MA和MB,并通过以下公式来提取水印数

据Wm 。

W??1如果MA?MBm?? (9)

??0如果MA?MB2.2 帧之间的平滑过渡

由于水印嵌入过程以帧为单位,因而可能导致在帧结点的突变。这种突变往往导致不理想的嵌入效果,不仅降低了音频质量,也暴露了水印的位置。为了弥补这一缺陷,本文提出在突变的帧之间插入一个额外平滑过渡区。

具体地讲,设dk(i)表示水印嵌入后的第k帧的波形偏差,即

dk(i)?sk(i)?sk(i) (10)

其中sk(i)和sk(i)分别表示原始的和嵌入水印后的音频信号的第i个样本。假设第k帧覆盖样本指数从t+1至t+ N,第(k+1)帧开始位置为t+ N'+1且N'> N,则区间(t+ N+1,t+ N')可以充当帧之间的缓冲边界,以减轻dk(i)的突变。本文采用了分段保形三次插值法以达到平滑过渡的目的。通过从第k个和第k +1个帧构成的已知点收集样本,在过渡区中利用插值法得到未知点的偏差,即{dk(i)| i= t+ N+1,...,t+ N'}。然后音频信号修改为sk(i)= sk(i)+dk(i), i =t+ N+1,...,t + N'。实验显示在使用该方法后帧之间的突变消失了,而且主观音频听觉测试也证实在音频信号在质量方面有了很大的改善。

3 性能比较

3.1 透明性比较

为测试算法改进前后的透明性,从几个CD专辑中收集3

段不同风格的录音,音频信号以16位分辨率及44.1kHz的频率进行采样,嵌入数据则采用20bit二进制序列。

实验结果表明,算法改进前后透明性都非常不错,水印数据嵌入前后语音信号的波形并没有产生大的变化,透明性良好。

3.2 鲁棒性比较

为了检验算法改进前后的鲁棒性,本文还测试了在下列攻击中水印提取的正确率:

表1 两种算法鲁棒性对比

改进前算法 改进后算法 攻击类型 Wm=1 Wm=0 Wm=1 Wm=0 无攻击 100.00% 100.00% 100.00% 100.00% 重采样 100.00% 100.00% 100.00% 100.00% 重量化 100.00% 100.00% 100.00% 100.00% 加高斯 白噪声 100.00% 100.00% 100.00% 100.00% 低通滤波 100.00% 100.00% 100.00% 100.00% 抖动 100.00% 100.00% 100.00% 100.00% MPEG压缩 100.00% 99.97% 100.00% 99.97% 时移(3%) 93.80% 80.12% 98.52% 97.30% 时间伸展(103%) 99.72% 90.87% 98.24% 97.80% 时间压缩(97%) 98.22% 90.96% 97.80% 98.77% 表1是两种算法对于不同的攻击手段都具有良好的鲁棒性。但是另一方面,算法改进前嵌入水印数据为0的情况下,当嵌入水印的载体语音遭受时移和时间压缩、伸展攻击时,算法鲁棒性明显下降,而算法改进后这种情况下的鲁棒性明显提高,问题得到了很好的解决。因此从表1可以得出结论,算法

计算机应用与软件

3

改进后鲁棒性有所提高,尤其是对时移攻击和时间伸展、压缩攻击的抵抗能力得到了明显的提升。

3.3

4 结语

尽管改进前后的两种倒谱水印算法能在无干扰的情况下同时进行水印嵌入,但是必然会对总体透明性和鲁棒性产生一定影响。因此本文提出利用这两种基于倒谱的水印算法形成一个兼容性的水印系统有着特殊的前景。具体来讲,就是利用改进后的算法来嵌入数字水印,而利用改进前的算法标记水印起始位置。这种工作方式可以看作双通道水印,也就是一个用来进行数据嵌入,另一个则用作标记。在用来标记的通道中,数据位通常保持为0,若出现6个连续的比特“1”则表示水印启动。下图对双通道水印进行了阐释。

a10.50 1 1 1 1 1 1 0 0 00123456789b通道1 标记水印起始位置10.500 0 0 0 0 0 0 1 0 1123456789通道2 嵌入水印数据

图1 双通道水印示意图

参 考 文 献

[1] X. He, M.S. Scordilis, Efficiently synchronized spread-spectrum audio

watermarking with improved psychoacoustic model, Res. Lett. Signal Process (2008) Article ID 251868.

[2] X.Y. Wang, P.P. Niu, H.Y. Yang, A robust digital audio watermarking

based on statistics characteristics, Pattern Recognition 42 (2009) 3057–3064.

[3] S. Xiang, H.J. Kim, J. Huang, Audio watermarking robust against

time-scale modification and MP3 compression, Signal Process. 88 (2008) 2372–2387.

[4] 张敏瑞,易克初.倒谱域音频与图像水印算法[J]西安电子科技大学学报

(自然科学版),2003,6:730- 738

[5] 白树锋.鲁棒性音频水印算法的研究[D].南京邮电大学.2013.

[6] 邸峥.基于小波分析的数字音频水印技术的研究[D].昆明理工大

学.2012.

[7] 田乃鲁.基于变换域的音频水印算法研究[D]. 南京理工大学 2013. [8] 郭琮.基于遗传神经网络盲检测的音频水印技术研究[D].北京邮电大

学, 2013.

[9] 兰宇琳.鲁棒性数字音频水印算法的研究[D].中南林业科技大学,2012. [10] 张媛.数字水印算法的研究与实现[D]. 西北大学 2011.

[11] 刘芳,李学斌.一种基于混沌与DWT的数字音频水印算法[J].微计算机

信息.2011(01).

[12] 庞慧敏,徐金东,赵建平.基于快速曲波变换的图像水印算法[J].通信技

术.2011(01).