多功能音频水印

关键词: 算法 水印

多功能音频水印(精选八篇)

多功能音频水印 篇1

音频水印算法按照水印的应用要求, 可分为鲁棒性水印算法和脆弱性水印算法。鲁棒性水印算法主要用于数字音频的版权保护, 脆弱性水印算法主要用于数据的真伪鉴别和完整性认证。然而, 在实际应用中, 一些音频作品, 如法庭上的证据录音、重大的事件信息报道等, 即有版权保护的需要, 又有保证其内容完整性和真实性的需要。因此, 为了加强其信息的安全性, 需要在音频作品中嵌入多个水印以实现上述目的。多功能音频水印算法也由此产生。目前, 对音频多功能水印算法的研究还很少, 算法也主要基于量化的方法进行水印嵌入。本文首先总结了多功能音频水印嵌入算法框图, 然后重点阐述了多功能音频水印在抗同步攻击方面取得的进展, 最后针对该领域的发展趋势, 提出今后研究方向的建议。

2 多功能音频水印嵌入算法

2.1 多功能音频水印嵌入算法框图

多功能音频水印的嵌入算法首先对原始音频信号预处理, 方便水印信息的嵌入;然后对预处理的音频信号在变换域进行变换, 并采用合适的方法嵌入水印信息;最后对含水印的音频系数进行逆变换, 得到含水印的音频信号, 嵌入算法流程如图1所示。

在图1中, 水印信息主要包括有意义的二值图像和伪随机数。为了提高算法的安全性, 需要对水印信息进行预处理, 比如进行置乱处理、加密等。

2.2 多功能音频水印嵌入算法

由于多功能的音频水印方案一般要求原始作品的信号能够隐藏较大的信息量, 需要更好地利用人类视觉系统 (Human Visual System, HVS) 和人类听觉系统 (Human Auditory System, HAS) 特性。但是人类听觉系统要比人类视觉系统更加敏感, 因此音频多功能水印技术的研究面临更大的挑战, 目前对多功能音频多功能音频水印嵌入算法的研究主要基于量化算法。在[1]中采用均值量化的方法嵌入鲁棒性水印, 采用量化单个系数的方法嵌入脆弱性水印。采用均值量化方法主要是因为样本均值比单个样本具有更小的方差。每个水印比特位通过量化的方法嵌入到一系列系数的平均值中, 这样, 原始音频信号失真对单个水印位的影响就会大大降低。

[2]在离散余弦域添加随机序列作为鲁棒性水印, 然后采用适当的量化策略, 实现在鲁棒性水印的基础上加入了脆弱性水印。该方法不能实现鲁棒性水印的盲提取, 并且需要考虑鲁棒性水印和脆弱行水印的嵌入顺序, 脆弱水印不能实现篡改定位。

[3]采用量化算法, 把小波变换域同级奇偶系数之和的差作为新的量化对象嵌入鲁棒性水印, 把量化噪声分散到小波变换偶系数上, 有效提高了信噪比, 增强水印的不可感知性。实验表明, 该算法的鲁棒水印能有效抵抗各种常见攻击, 而脆弱水印对各种攻击具有足够高的敏感度。但是该算法没有对去同步攻击进行验证同时该算法不能对篡改的音频进行定位与恢复。

[4]将基于RBF神经网络的音频零水印方案作为版权认证水印, 脆弱水印在经典量化算法的基础上采用一种新的双极性量化方法嵌入脆弱水印, 把常规量化取区间中值改为取边界值以提高脆弱水印的敏感性。实验结果表明, 该方案认证水印具有很强的抗攻击鲁棒性, 脆弱水印具有很强的敏感性, 且能够对恶意篡改进行精确定位。

[5]采用通过对语音信号做线性预测分析 (Linear Predictive Coefficients, LPC) 并在对LPC系数做多级矢量量化的过程中实现了语音多功能水印的算法。但是该算法存在两方面的不足, 一方面是乘积码书尺寸过大导致码字搜索时间较长, 不利于算法的实时实现;其次, 该算法直接对语音的LPC系数做矢量量化而没有引入心理声学模型, 导致带水印语音信号的质量较差。[6]提出了一种基于量化方法的多功能水印的音频算法。该算法采用了掩蔽阈值做量化步长, 通过正负调制在音频信号的FFT域一次嵌入水印, 可以使用不同的检测过程用于版权保护或进行篡改检测。该方法的缺点是不能实现盲检测, 不能对篡改的音频进行定位与恢复。

[7]利用混合变换域低频系数构造系数生成鲁棒水印, 基于量化的方法嵌入脆弱性水印。实验表明该算法实现了对音频作品的内容完整性认证以及版权保护, 但是该算法未对抗同步攻击进行验证。

[8]采用均值量化的方法将可辨的二值图像分别嵌入到经过离散小波变换的中低频系数中, 实现了鲁棒性水印和脆弱性水印同时嵌入到音频载体的目的。实验结果证明了该算法在版权保护和内容认证方面的有效性, 但是没有对抗同步攻击进行验证。

[9]提出一种基于质心的混合域半脆弱音频水印算法。该算法对每个音频帧计算质心并实施密码学中的hash运算生成水印, 将水印加密后在由离散小波变换和离散余弦变换构成的混合域嵌入到含有质心的音频子带上。该算法有效地解决了音频内容真实性和完成整行的可靠认证。

[10]分别提取混合变换域的低频系数和中低频系数作为水印的构造和嵌入域, 文章利用原始音频的特征构造零水印并嵌入半脆弱水印, 实现音频版权保护和内容完整性认证。实验结果表明, 该算法的不可感知性很好, 具有良好的鲁棒性, 并且能够对恶意窜改进行定位。

3 总结与展望

综上所述, 多功能数字音频水印在抗同步攻击方面已经取得了很大的进展, 但是仍有很多实际问题需要解决。根据音频信号本身所具有的特点以及音频水印技术的实际需求, 以下几个问题值得进一步研究:

(1) 多功能音频水印算法在抵抗同步攻击方面能力较弱, 如何进一步提高多功能音频水印的鲁棒性是一个现实的有意义的问题;

(2) 如何避免鲁棒性水印和脆弱性水印之间的相互干扰;

(3) 多功能水印算法由于嵌入多个水印, 使得原始音频作品的嵌入量增加, 如何平衡算法嵌入量、鲁棒性与不可感知性三者的关系有待解决;

(4) 具有修复功能的音频水印算法的研究。

摘要:多功能音频水印算法在数字媒体的版权保护与内容认证中发挥着重要作用。本文首先介绍了多功能音频水印的嵌入算法框图;然后对多功能音频水印的嵌入算法进行了详细地阐述并分析了不同算法的优缺点;最后探讨了多功能音频水印领域进一步研究的方向与存在问题, 这些问题的解决将对数字媒体的版权保护与内容认证提供理论和技术支持。

关键词:多功能音频水印,量化,版权保护,内容认证

参考文献

[1]刘海燕, 熊曾刚, 刘易.一种用于版权保护与内容认证的多功能音频水印算法[J].北京工业大学学报, 2014, 41 (1) :68-75.

[2]杨洋, 陈小平.一种基于DCT变换的音频多水印算法[J].数据采集与处理, 2006, 19 (2) :215-219.

[3]廖琬明, 张玉贤, 李东晓, 等.基于小波变换的脆弱-鲁棒双重音频水印[J].浙江大学学报 (工学版) , 2009, 43 (4) :721-726.

[4]马朝阳, 张雪英, 李雯璐.一种能进行篡改定位的音频双水印算法[J].太原理工大学学报, 2011, 42 (2) :107-110.

[5]N.Chen, J.Zhu.Multipurpose.Speech.Watermarking.based.on.Multistage.Vector.Quantization.of Linear Prediction Coefficients[J].The Journal.of.China Universities of Posts and Telecommunications.2007, 14 (4) :64-69.

[6]CHEN.Ning, ZHU.Jie A.multipurpose.audio.watermarking.scheme.for.copyright protection.and.content.authentication[C].IEEE.International.Conference.on.Mutimedia and Expo, 2008, 2:221-224.

[7]王永琦, 杨洋.基于混合变换域的数字音频双水印算法[J].计算机应用, 2007, 27:128-123.

[8]朱海峰, 赵春晖, 孙世国.基于均值量化的多目的数字音频水印算法[J].哈尔滨工程大学学报, 2005, 26 (5) :676-678.

[9]王红霞, 范明泉.基于质心的混合域半脆弱音频水印算法[J].中国科学:信息科学, 2010, 40 (2) :313-326.

美图秀秀新功能:消除笔震撼去水印 篇2

平常想从网络截存美图并发微博时,总是被一些恼人的水印所困扰,PS操作起来又太考究技术,让不少并非“专业P图选手”的用户们苦恼不已。美图秀秀3.0.9新版软件里新增加的“消除笔”功能,就帮大家解决了这种难题。打开新版美图秀秀,导入原图后在“美化”功能标签下就能发现新增加的这项功能按钮了,如图1所示:

图1 新增“消除笔”功能

操作方法也很简单,进入消除笔功能窗口后,根据要处理的区域大小,将图片放大,然后用画笔在需要消除的部位涂一涂,就可以看到完美的消除效果了(如图 2)。实际上,这个“消除笔”功能的用处确实不小,不仅可以拿来祛斑祛痘、去水印Logo,还可以用于消除多余的路人,让你的照片回归干净,

有了“消除笔”这个功能,不用再为图片瑕疵发愁了吧!

图2 消除笔功能操作示意

最后再给大家看一组经过“消除笔”功能处理的前后对比图,效果很震撼哦!如下图所示:

图3 超强消除笔效果图

图4

图5

图6

为图片去水印、路人,一直都是Photoshop“门外汉”最苦恼的问题。网上也有不少专门针对去水印的工具,但是大多效果不佳,容易破坏原图的整体效果。美图秀秀3.0.9新版软件的“消除笔”功能,最大的亮点就在于它不仅操作简单,而且最大程度保留原图效果;在实施消除时软件会很智能的根据原图进行效果补偿,这对于普通用户来说真的是福音啊!

一种安全的数字音频水印方案 篇3

数字音频水印技术作为数字音频作品版权保护的有效手段, 已经得到学术和产业界重视[1,2,3]。目前, 针对音频水印算法的研究很多。但是抵抗随机裁剪、抖动攻击往往很容易让水印信息无法正确提取。文献[4]把信号短时平均幅度从低向高改变, 并将改变程度最大的点作为特征点, 并采用给定幅度参数阈值t1和t2来控制特征点数, 其算法不具有通用性。文献[5]以变换域上的局部极值点作为特征点进行定位, 嵌入和提取过程都是从音频的起始点分帧, 用时间域裁剪攻击会出现帧移现象。文献[6]将同步信息添加到音频帧数据的小波域中, 在裁剪攻击或抖动攻击中, 同样会引起帧移并逐步加大。文献[7,8,9,10,11]采用音频特性定位或嵌入同步码的方式实现水印在同步方面的鲁棒性。上述水印算法基本没有考虑水印信息的安全性能, 这些算法在公开的情况下, 基本上可以很容易地把水印信息去除。

在此提出一种安全的音频水印方案, 利用密钥序列生成同步码, 同步码嵌入在音频载体的时间域。对水印信息进行结构化分块, 结构化水印信息包括分块编号、分块水印信息、校验信息等。分块水印嵌入在音频信号的离散小波变换系数上, 提高了水印算法的安全性, 在未知密钥的情况下很难检索到水印的同步码, 水印内容嵌入到小波变换域上, 增强了水印信息的鲁棒性。仿真实验验证了水印在抵抗同步攻击、抖动攻击方面具有很好性能, 对常见的音频信号处理也具有良好的鲁棒性。

1 水印算法设计

1.1 水印信息预处理

一般而言, 作为版权侵权追踪中水印嵌入的实际需要, 嵌入的水印信息可以是代表该版权归属的企业标识或企业名称等信息, 其水印信息内容不大。比较适合作为水印信息的形式, 通常可采用二值图像或灰度图像。水印信息预处理的目的在于增加水印抵抗攻击的能力, 在部分的水印分块提取错误时, 不至于影响其他水印分块的提取。预处理分为以下几个步骤。

(1) 水印信息分块。

水印信息通常采用可视的二值或灰度图像形式, 以方便实际应用中对版权归属的确认。在此, 以二值图像作为水印讨论, 把水印信息分成n×n (n取4或8) 大小的块, 对水印图像做预处理, 可以恰当的数量分块。

(2) 分块水印信息结构化。

经过分块的水印信息进行结构化处理。首先, 在分块信息之前增加分块编号信息, 分块信息进行二进制序列化, 然后根据密钥进行置乱处理, 最后增加二位校验位, 一位为分块编号校验和;另一位作为水印信息校验和。

1.2 水印同步码

在水印检测时实用的水印系统不能依赖原始的载体[1], 必须是盲检测, 这就要求嵌入的水印必须能正确地定位, 任意选择一定长度的音频载体, 只要其中嵌入完整的水印信息, 即可正确的提取其中的水印信息。同时, 要求水印算法可以公开, 水印算法的安全性不能依赖于算法的保密来实现。本算法提出的同步码是由密钥生成的序列。利用m序列生产器, 生成长度为k的序列码, 作为同步码。

1.3 同步码嵌入

为提高水印信息检索效率, 同步码嵌入在水印载体的时间域。水印嵌入位置对于水印的鲁棒性影响很大, 水印嵌入位置的选取极为重要, 同步码的嵌入步骤如下:

(1) 嵌入位置检索。假设需要嵌入水印的音频载体为A={a (n) , 1≤nN}, 确定一个宽度为Lw的滑动窗口, Lw的取值与同步码的长度k相同, 即Lw=k。把滑动窗口在音频载体的时间轴上移动检索, 计算窗口内音频采样点的能量值Ej=i=ji=j+Lw-1a (i) ×a (i) , 选取窗口中能量Ej大于某一个阈值TE的音频段作为同步码嵌入的音频段。

(2) 同步码嵌入。对 (1) 中选取的音频段, 每一个音频采用点嵌入一个比特的同步码, 嵌入方法为直接修改音频采用点最低2~4位上, 采用直接的位替换方案, 直接把同步码位逐个按序替换方法, 替换位置在最低第2, 3, 4位上选择, 选择方法为采用密钥生成0~1之间的随机数序列, 根据随机数序列所在的位置确定同步码被替换的位置。由于滑动窗口的长度与同步码的长度一致, 所以这就很容易实现同步码的嵌入。

(3) 在检索到一个同步码的嵌入音频段之后, 其长度为La的音频段, 即为用于嵌入水印的音频载体。假设分块水印长度为M, 则La取值为4M

(4) 下一个同步码的检索, 在长度为La的音频之后, 继续重复 (1) 步骤检索同步码嵌入位置。

1.4 水印嵌入

在上述音频信号中, 根据检索到的同步码可以确定水印分块的嵌入音频信号段, 并且音频信号段的长度为La, 假设嵌入音频分块的音频信号为Aj={a (i) , j+1≤ij+La}。水印嵌入的步骤如下:

(1) 对音频信号Aj进行N层小波变换, 这里N一般取2或3。音频信号在进行小波变换后分为低频系数和高频系数。音频信号的能量主要集中在低频系数, 因此选择小波的低频系数用于水印分块的嵌入;

(2) 采用量化的水印嵌入方案进行修改低频系数。修改后的低频系数及保留的高频系数部分, 经过小波逆变换, 生成Aj的几位嵌入水印分块音频段。

1.5 水印提取

水印的提取过程与水印嵌入过程类似, 具体步骤如下:

(1) 生成同步码, 使用嵌入时候相同的密钥生成同步码序列。

(2) 对于待检测的音频信号, 根据嵌入时候确定的滑动窗口, 在时间域检索同步码, 计算滑动窗口内音频信号的能量, 对于大于阈值αTE (这里α取值为0~1之间, 小于1;如果α为1, 可能造成同步音频信号无法检索到) 的滑动窗口, 按照嵌入时候相同的方案提取出同步码, 若为同步码, 则定位到嵌入水印的音频为其后的Lw长音频段, 否则继续检索。

(3) 对于检索到的同步码, 即可确定其后的Lw长的音频段中嵌入的分块水印内容。取其后的Lw音频段, 进行N层小波变换, 按照与嵌入相同的方式, 在低频系数提取水印分块。

(4) 如果提取的分块水印满足水印分块的结构, 即水印分块号在正确值范围, 同时分块的校验码都是正确的, 则可认为提取的水印分块是正确的。否则, 认为水印分块提取的信息是错误的, 抛弃提取的水印分块, 继续步骤 (2) 。水印的分块嵌入过程是把同步码及水印分块信息多次循环地嵌入在音频信号中。因此在音频信号足够长的情况下, 很容易地提取到各个水印分块。

(5) 把提取的完整的各个水印分块, 按照分块编号, 重新组合成完整的水印。

2 实验结果

为验证所提出水印算法的性能, 本文在Window XP和Matlab 7.1环境下进行仿真。实验中, 选用原始信号为44.1 kHz, 分辨率为16 b, 长度为31 s的单声道数字音频信号。水印信息选取32×32的二值图像, 如图1所示。算法中采用3层DB -2小波基。同步码长度k的取值为16, 滑动窗口大小即为Lw=k=16。其中, 能量阈值TE取值为1.5, 这个阈值的选择根据情况做调整, 用它将影响同步码的定位, 也影响水印的鲁棒性能。 表1给出了本文算法和文献[6]算法的抵抗攻击能力对照结果。

通过上述的实验数据可以看到, 算法对于随机裁剪攻击具有很好的性能, 对常见信号处理具有较好的鲁棒性, 对MP3压缩处理和高斯噪声处理, 略低于文献[5]的性能, 其他的如重采样、重量化等攻击都表现很好的性能, 特别是对随机裁剪攻击, 具有很好的鲁棒性。

3 结 语

在此提出了一种安全的音频水印算法, 它采用的水印同步码及水印同步码的嵌入位置均通过了密钥控制, 增加了水印的安全性。同步码嵌入在时间域上可以大大减低同步码的检索效率。把水印嵌入在小波变换域上, 采用了水印分块的方法, 并对每个分块应用校验码技术, 提高了水印的鲁棒性。仿真实验验证了水印是安全和有效的。本文算法的缺点在于滑动窗口计算能量之后, 需要一个预先设定的能量阈值。然而这个阈值的确定, 可能因为音频类别的不同而不同, 因此实际上可以寻找更好的方案, 以实现可以自适应的调节。在同步的基础上进一步提高水印在抵抗MP3压缩攻击、噪声攻击的性能, 将是下一步的研究课题。

摘要:提出一种安全的数字音频水印算法, 利用密钥生成的序列作为水印同步码, 并在时间域嵌入同步码。水印信息采用分块结构化编码方式, 水印分块中采用校验码机制, 水印内容采用量化方式嵌入在小波变换域, 水印分块在音频段中循环冗余嵌入方式, 以抵抗同步攻击的能力。提出的算法不仅具有较好的不可感知性, 对低通滤波、噪声、重量化、重采样、MP3压缩等信号处理具有较好的鲁棒性;同时对抵抗随机裁剪攻击、抖动攻击、时间延展等同步攻击具有很好的鲁棒性。

播出系统音频水印技术应用分析 篇4

在广播电视领域,数字水印技术原本用于对节目的合法性、版权进行监测管理,防止出现非法攻击、版权侵犯等行为。伴随移动互联网技术的发展应用,掌上智能终端逐渐普及,人们越来越愿意将时间花费在手机等“小屏幕”上,因此如何实现屏幕扩展,充分利用电视“大屏幕”的吸引力,与“小屏幕”的优势相结合,创造出新的观看体验,成为了电视从业者关注和研究的方向。近年来国内外各电视媒体陆续开始在节目中尝试应用音频水印技术,在不影响电视节目的收看收听效果的前提下,将特定信息嵌入到节目音频中,观众用户通过智能终端检测水印信息,参与节目实时互动。

一音频水印技术应用发展情况

通过音频水印技术应用,电视用户可以通过手机、PAD参与节目、广告的互动。利用节目的吸引力,在节目、广告播放过程中设置易于操作互动的环节,可以对节目冠名品牌等进行曝光宣传,对节目内容进行关联扩展(如背景介绍、字幕显示、信息分析等),与观众进行抽奖等游戏互动,对当前播出的广告商品进行产品介绍或商品链接,甚至对用户观看电视的时间、时长等习惯形成大数据。总的来说,既可以提升观众对节目内容的关注度,又拓展了电视台广告业务的新方向,为广告商提供创新性质的投放渠道,甚至直接转化为用户消费行为。

国际上英国Channel 4、法国M6、美国华纳兄弟、日本wowow等电视媒体,以及国内的《中国好声音》《蒙面歌王》等一系列优秀电视节目也开始了这方面的尝试,实现以节目为依托,利用互动将观众效应最大化,增加用户粘性,促成关注聚焦。通过新颖有趣的玩法,与节目形式实时精准互动,高度契合,形成更有效的传播。

相比较传统扫描二维码的方式,应用音频水印技术参与互动,用户不用靠近电视屏幕,使用手机对准二维码扫描,而只需手机摇一摇即可,如图1所示,在操作上更加简便,使用户体验更加人性化。对于未来广阔的应用前景,音频水印技术在与电视节目内容相关的应用,已成为越来越重要的研究领域。

二音频水印技术要求

在电视互动应用中,为保证用户获得良好的使用体验,音频水印技术应满足数据量与可读性、鲁棒性、不可察觉性要求。

1.数据量与可读性

由于用户终端接收水印信息时,仅仅获知是否有水印标记是不够的,还需要明确互动方式和内容,尤其是广告投放性质的互动,如购买某个商品的链接或广告等等,不同时段和栏目的投放点所代表的经济价格和责任是不同的。因此水印信息的数据量大小与可读性至关重要,数据量大小一方面影响原有音频的收听效果,是否具有不可觉察性,另一方面是否符合鲁棒性需求,在传输过程中不受影响。可读性是指在用户终端获取音频水印信息时,需提取所携带的目标长度的bit位信息,获取完整ID,以在终端匹配相应的互动方式与内容。

2.鲁棒性

由于电视信号从电视台播出系统到用户机顶盒,尤其全国上星播出的节目,中间经历数模转换、噪声滤波干扰、多次转码、压缩编解码、音频下混处理等,而各地运营商所使用的处理方式也不尽相同,因此播出链路设备的水印嵌入需具有十分良好的鲁棒性,避免水印在传输链路中被破坏,保证各地观众都能正常接收检测水印。鲁棒性是指嵌入水印的音频信息在接收时,与原始音频信息有差异时,终端仍然尽可能地从中检测出完整ID信息。

3.不可察觉性

为保持节目的原有效果,嵌入水印后不应对观众的主观感受产生差别,这是音频水印最基本的要求,尽可能在人的感官上保留节目音频的原有特征。如果水印添加后主观评测显示出较大的音频质量损伤,或可明显感知,该节目音频则失去播出效果与价值,因此音频水印应具有不可察觉性。

考虑节目在不同频道、不同时段重播时,对节目互动的需求并不完全一致,如果在节目文件制作时将数字水印嵌入,将导致节目跨频道或重播时失去互动的灵活性、时效性。播出系统在线添加音频水印,能够实现同一节目在不同频道、不同时段播出时,根据事先的编排计划,采取任意互动方式与内容。考虑系统建设维护,用户在水印识别、提取操作的便利与容错等方面因素,使用音频水印能够支持Android、i OS终端操作系统应用,并且对软硬件的处理能力要求低,不需要设计建立复杂的后台支持系统,终端从节目音频中提取ID进行互动匹配,避免大量用户同时访问后台压力。

观众在收看电视节目的同时,可以通过手机APP获取节目中的音频水印信息,该信息与特定互动方式相关联,如广告链接、参与抽奖等,因此音频水印应能够标识定位当前播出的节目内容,利用人耳掩蔽效应,携带能够唯一对应互动内容的信息。如图2所示,嵌在节目声音信号中的水印,前10bit用于标识频道或节目,后10bit用于标识该节目时间线,即在该节目任意时间点,可设计任意不同的互动效果。水印的bit位长度将决定卸载信息量大小,互动方式的多样性,也决定检测一个完整水印所需的时间长度。

三节目中嵌入音频水印的方式

按照不同处理方式及业务,在节目中嵌入音频水印的方式有两种,一是在播出系统中增加通路设备受控在播出信号中实时处理,另一种方式是在节目制作过程中离线添加生成。一般情况下,使用后者文件级水印添加方式,将带来以下两个问题:效率方面,文件级嵌入将带来额外的时间开销,视音频分离的MXF OPAtom音频文件效率可达到30倍速,1小时节目文件需2分钟左右,MXF Op1a则只能达到2倍速,1小时节目文件需30分钟左右。通过提高硬件配置及相关优化调试能够提高效率,但相比播出信号级方式的实时性,其代价时间开销仍然不可忽视,尤其对于时间紧急的直送文件节目,生产效率大为降低的同时,甚至影响正常送播,成为播出安全隐患。合理性方面,播出信号级方式的优势在于针对同一节目不同频道、不同时段的播出,可以灵活掌握嵌入信息,设计不同互动方式与内容,例如同一部电视剧在不同频道播出时,可根据频道定位特点或广告出售情况,观众可参与互动发生变化,如投票、抽奖或投放不同广告。然而文件级方式一旦嵌入水印信息,需要变更时,不同频道播出则需制作不同版本节目文件,重播时则需进行出库修改,带来不必要的生产资源开销与浪费。因此,采用播出信号级音频水印嵌入方式,在效率与合理性方面是更优的选择。

通路中采用播出级嵌入设备,通过以太网方式接收控制机命令,对输入的SDI信号进行音频水印嵌入,使电视节目变为可识别水印的节目。因此在播出系统添加音频水印嵌入设备,如图3所示,应在响度控制器之后,下变换器之前。考虑音频水印信号在经过响度控制器后,对信号波形产生影响,从而可能对水印的检测效果产生影响,将嵌入设备取在下变换之前,可以同时保持高标清链路的水印效果,在部署方式上更加经济。

四技术应用功能及性能分析

在视音频接口特性上,需符合GY/T 155-2000《高清晰度电视节目制作及交换用视频参数值》和GY/T 157-2000《演播室高清晰度电视数字视频信号接口》的要求。同时,结合目前播出系统特点,还需考虑设备延时、AFD通过性等需求。

1.接口特性指标

接口指标测试结果如表1所示。

2.业务功能及性能

硬件功能方面,作为播出级产品,应满足如下需求:设备双电源,掉电及直通,监控报警上传、分声道嵌入、下混及压缩编码不受破坏、可修改水印、设备延时固定、AFD通过、网络控制等。

不同bit位长度所负载信息量和检测时间不同,从错误检测和数据完整性角度考虑,bit位长度定义为4的整数倍。20bit长度水印即可产生100万个不重复互动ID。经测试,20bit长度水印在使用APP进行检测时,所需时间为4.8秒。

考虑随着电视台内音频水印的推广进度,需要做互动添加水印的节目、互动的种类将呈现逐渐增长的过程,而这一过程也无法准确预测。另一方面,单个水印的信息量大小又将影响观众APP的检测时间。因此从技术角度出发,希望在电视台嵌入端根据水印在节目部门的推广情况,逐渐增大bit位,使互动效果与用户检测时间之间总是保持平衡最优。客户端APP需根据电视声音信号中的水印信息,自动检测匹配bit位长度,避免手动操作或更新APP。然而经过实际测试,目标还无法支持bit位长度动态自适应检测,如表2所示,因此需在设计阶段充分考虑业务应用及扩展能力,确定最符合需求的bit位长度。

在节目播出过程中,水印信息将随着节目的变化而不断改变,因此在水印变化的切换点前后,如果观众进行了互动操作,所检测的ID信息是否准确,将影响用户体验。通过对节目音频连续分别嵌入ID值为“1089”、“2154”的水印,使用手机APP在水印切换前3秒进行检测,检测结果如表3所示,即水印切换时检测结果为切换后的水印ID,响应时间为一个完整水印检测周期+切换前的检测时长。从业务角度分析,用户实际操作是在切换前,期望的是本节目互动,应在发现水印切换且未完成检测时,放弃此次检测,并报出检测失败,而非给出下一个节目的互动。产品在这方面的特点,要求在系统控制时,避免嵌入不完整ID序列。

在得到检测的基本响应时间后,还需针对不同节目形态所具有的,声音连续性与音量大小起伏的不同,再做针对性的测试,表4即是选取了歌唱类、动画类、电视剧类、体育类、新闻类以及广告类节目,通过在节目中连续嵌入20bit水印,人工使用手机APP进行随机检测,检测时间超过15秒则判定为漏检。测试发现由于电视剧类节目无声音的场景较为频繁,其检测结果校其他节目形态差,有20%左右的漏检率,而歌唱类、体育类及广告类节目由于其节目形态具有声音连续且起伏不断的特点,水印掩蔽嵌入效果较好。针对这种情况,一方面需要产品加强嵌入检测能力,同时对不同节目形态在应用水印技术时,也要有所注意,避免将水印加在无声音或声音不连续的时段。

由于使用掩蔽效应在节目声中嵌入音频水印,节目声与环境声的相对大小关系,将实际影响终端检测水印的响应能力,即响应时间的大小。通过模拟三种不同收看环境场景,可获知影响关系。使用APP手动操作触发检测100次,记录20bit长度的水印信息检测每次响应的时间,可得出平均响应时间及分布关系。首先模拟用户在家收看节目的常规场景,即节目声在环境中可清晰分辨,一般比环境噪声高10d BA左右,如图4所示,此时检测的平均响应时间为4.8秒,其中4.1秒以下有2次,4.1秒至4.4秒有6次,4.4秒至4.7秒23次,4.7秒至5.0秒36次,5.0秒至5.3秒31次,5.3秒至5.6秒1次,5.6秒至5.9秒1次。可以看到,响应时间大小相对比较集中,每次检测差异不大,基本围绕平均时间4.8秒左右小量波动。

当我们提高节目音量或使测试环境更安静,即在节目声显著高于环境噪声的场景中,如图5所示,平均响应时间为4.8秒,其中4.1秒以下有3次,4.1秒至4.4秒有5次,4.4秒至4.7秒23次,4.7秒至5.0秒38次,5.0秒至5.3秒31次。此时检测结果并未显著提升响应能力,每次检测的波动大小也与上一场景基本一致,可以确认20bit长度水印信息的常规响应时间为4.8秒。

当我们降低节目音量或使测试环境更嘈杂,即在节目声在环境中只可模糊分辨的场景中,如图5所示,平均响应时间为5.8秒,其中4.4秒以下有3次,4.4秒至4.7秒11次,4.7秒至5.0秒29次,5.0秒至5.3秒20次,5.0秒至13.7秒之间分布出现了30次,还有7次超过15秒。这种情况下表现出了水印检测响应能力的降低,影响用户的操作体验。

从上述结果可以看出,在节目可清晰分辨的情况下,20bit水印配置的平均响应时间约4.8秒。观众收看节目时所选择音量大小与环境噪声相差越小,响应检测效果越差。在节目所选择声音大小相对环境噪声可分辨但音量偏小时,平均响应时间约5.8秒。节目音量与环境声音相差越明显,响应时间的测试方差越大。尽管如此,只要保持观看电视节目时的常规音量大小,用户就能获得较为理想的互动响应体验。

五总结

播出系统音频水印技术应用,能够满足实时性、数据量与可读性、鲁棒性、不可察觉性等方面要求,是观众参与电视互动的有力手段。随着更多节目形态产生互动、推广等方面的需求,智能终端硬件水平的提升,以及优秀客户端APP所提供的用户入口,音频水印技术的推广应用将更加广泛。

摘要:本文介绍了电视领域音频水印技术应用发展的情况及技术要求,对播出系统采取信号级实时音频水印嵌入的方式进行了分析阐述,说明了其检测响应时间等性能指标及特点。

均值量化在音频数字水印中的应用 篇5

关键词:均值量化,音频数字水印,鲁棒性

1 量化思想

量化是实现盲检测的有效途径。量化指数调制 (QIM) 是一种非线性方法, 与扩展频谱方法相比具有更强的稳健性。这种方法先由Chen和Womell于1999年提出, 并被应用于图像水印中。王秋生实验了将音频频域系数量化调制的方法, 高海英等人提出了一种基于量化的小波域自同步数字音频水印方法, 该算法引入了系数量化的思想, 将嵌入的水印位对音频段的能量进行量化调制, 以一定的比例修改能量段各采样点的幅值使此段能量变化为量化后的值。按这种原理嵌入的水印信号在提取时不需要原始数据, 这对水印算法的实用性是非常有用的。

参考上面的方法, 本文提出一种更为有效的量化方法, 即均值量化。

2 均值量化原理

设由K个小波系数构成的集合为{x0, Lxk-1}, 其均值为:。

假设在均值i∈{0, 1}所 引 起 的 误 差 为 α , 即 嵌 有 一 个 水 印 比 特 wi后 的 K个 信 号的 均 值 为, 由 此 可 知 , K个 小 波系数的集合中的所有单个系数也将进行相应 的 修 改 , 即 其中, xi′是 指 某 个 被 修 改 后 的 系 数 值 。由均 值 式 子 可 知 , 当在K个 系 数 的 均 值中嵌入一个水印比特时, 所产生的嵌入误差 α 同 时 加 到 了 K个 信 号 的 每 个 分 量 上 , 亦即每个分量xi也产生了嵌入误差 α 。假设嵌有水印的信号在传输过程中受到了一定的攻击, 攻击对每个信号产生的误差为δi, 即攻击后K个小波系数中某个小波系数为, 则 攻 击 后 K 个小波系数的均值为假设, 即δi服从均值为 0, 方差为σ2的高斯分布, 依据概率统计知识, K个服从高斯分布的随机变量其平均值仍然服从 高 斯 分 布, 但 是 方 差 缩 小 了K倍, 即

3 均值量化在音频数字水印中的实现

提出一种基于混沌扩频的小波域数字音频水印的算法, 并在嵌入过程中加入均值量化的思想。

3.1 水印的嵌入

在水印嵌入的过程中, 选择适当的小波基对每段音iA频进行DWT变换, 分别计算每一个第H层的低频系数CAHi的均值, 其中L为CAHi的长度。利用心理学模型计算出的量化步长∆对系数进行取模和取余数运算。分别得模值为z, 余数为r。

对系数量化处理与水印比特W的取值密切相关:当W=1时, 使量化结果等于与最接近的A区间集中某一区间的中间坐标值;当W=0时, 使最接近的B区间集中某一区间的中间坐标值。量化结果可以表示为4种情况。iF′iF

(1) 当≥0, w=1时,

(2) 当≥0, w=0时,

(3) 当<0, w=1时,

(4) 当<0, w=0时,

设上述的水印嵌入算法中对均值Fi进行量化所产生的误差为αi, 即为了求得嵌有水印的音频信号, 还需将量化引起的误差αi分别加到对应的每一个系数上。

3.2 水印的提取

本文的水印提取不需要原始数字音频信号, 是一种公开 (盲) 水印算法。

3.3 仿真实验及评价

为了验证本算法, 在仿真实验中, 选取了一段长度20秒流行音乐进行测试。原始数字音频信号是单声道, 采样频率为44.1kHz分辨率为16比特, 共取882000个采样点, 其波形图如图1所示。水印采用一64X64的普通黑白二值图像如图2所示。量化步长定为∆=0.05, 选择K=8。通过听觉感知和波形图, 原始信号和嵌入水印后的信号并没有明显的区别。嵌入水印后的信号波形图如图3所示 (见图1、图2、图3) 。

为了验证采用均值量化的水印算法的鲁棒性, 对含水印的音频信号进行了重采样、低通滤波、加白噪声、去噪、MP3压缩、重量化等攻击测试, 分别计算了嵌入水印后的峰值信噪比, 以及相关系数, 如表1。图4是本文算法分别经过以上攻击后的含有水印的音频信号中提取出的水印图像 (见表1、图4) 。

4 总结

利用均值量化的方法, 不仅实现了水印信号盲检测, 提高了算法的鲁棒性和稳定性, 实验结果表明当含有水印的音频信号被噪声污染经过低通滤波时, 仍能提取出视觉效果较好的二值水印图像。

参考文献

[1]Brian Chen, Gregogy W.Wornell.Quantization Index Modulation Methods for Digital Watermarking and Information Embedding of Multimedia.Journal of VLSL Signal Processing, 2001, 27:7~33.

[2]王秋生, 孙圣和.基于量化数字音频信号频域参数的水印嵌入算法.声学学报, 2002, 27 (4) :379~385.

[3]高海英, 钮心忻, 杨义先.基于量化的小波域自同步数字音频水印算法.北京邮电大学学报, 2005, 28 (6) :102~105.

多功能音频水印 篇6

关键词:数字音频水印,人工神经网络,离散余弦变换

0引言

随着计算机网络技术和多媒体信息处理技术的迅猛发展,人们能够更方便地进行数字化作品的无损复制,从而对知识产权和产品保护提出了更高的要求。数字水印技术以其较好的安全性、鲁棒性和不可感知性,为版权保护和信息安全提供了一个潜在的解决方案。数字音频水印技术,就是利用人类听觉系统的某些特性,将秘密信息嵌入音频文件,以达到掩蔽通信和版权保护目的的一种数字水印技术。

现有的数字音频水印技术,根据嵌入水印时对信号的处理方式不同,可分为时域算法和频域算法。前者直接将水印信息嵌入到音频信号的时域选定的采样数据中以隐藏信息,主要有最不重要位算法[1]、相位编码算法[2]、回声隐藏算法[3]等;后者首先对音频信号的采样数据进行适当的变换,然后将水印信息嵌入到变换域选定的系数上,最后通过相应的逆变换恢复出含有水印信息的音频信号,主要有离散傅立叶变换(DFT)法、离散余弦变换(DCT)法、离散小波变换(DWT)法。一般来说,频域算法可嵌入水印数据量大,透明性好,安全性高。但无论是时域算法还是频域算法,都是通过修改原始信号来达到嵌入秘密信息的目的,虽然利用了人类的听觉模型系统,仍不同程度地改变了信号的感知质量。

本文提出利用人工神经网络学习和自适应特征,将音频信号的重要特征作为人工神经网络的输入,通过人工神经网络的学习,建立音频信号与水印信息的对应关系,达到在不修改音频信号情况下把水印“嵌入”到原始音频信号中。该方法不改变原始音频信号感知质量,提高了水印的不可感知性,并且在提取水印的时候不需要原始音频信号。

1人工神经网络反向传播算法(BP算法)

人工神经网络BP算法[4]属于δ算法,是一种监督式的机器学习算法,其主要思想是从后向前(反向)逐层传播输出层的误差,以间接算出隐含层误差。算法分为两个阶段:第一阶段(正向过程)输入信息从输入层经隐含层逐层计算各单元的输出值;第二阶段(反向传播过程)输出误差逐层向前算出隐含层各单元的误差,并用此误差修正前层权值。在反向传播算法中通常采用梯度法修正权值,使网络输出层的误差平方和达到最小。反向传播算法通常采用Sigmoid函数作为输出函数。如图1所示,处于某一层的第j个计算单元,脚标i代表其前层第i个单元,脚标k代表后层第k个单元,Oj代表本层输出,Wij是前层到本层的权值,当输入某个样本时,从前到后对每层各单元作如下计算(正向算法):

netj=iWijΟi (1)

Oj=f(netj) (2)

对于输出层而言,y^j=Oj是实际输出值,yj是理想输出值,此样本的误差:

E=12j(yj-y^j)2 (3)

为使式子简化,定义局部梯度:

δj=Enetj (4)

考虑权值Wij对误差的影响,可得:

Ewij=Enetjnetjwij=δjΟi (5)

权值修正应使误差最快地减小,修正量为:

Wij=-ηδjΟiWij(t+1)=Wij(t)+Wij(t)

(6)

如果节点j是输出单元,则:

Οj=y^jδj=Ey^jy^jnetj=(yj-y^j)f(netj)

(7)

如果节点j不是输出单元,由图1可知,Oj对后层全部节点都有影响,因此,

δj=Enetj=kEnetknetkΟjΟjnetj=kδkwjkf(netj)(8)

在实际计算时,为了加快收敛速度,往往在权值修正量中加上前一次的权值修正量,一般称之为惯性项,即△Wij(t)=-ηδjOi+α△Wij(t-1)。对于Sigmoid函数,y=f(x)=11+e-x,f′(x)=e-x(1+e-x)2=y(1-y),反向传播算法步骤如下:

(1) 选定权系数初始值。

(2) 重复下述过程直至收敛(对各样本依次计算):

① 从前向后各层计算各单元Oj:netj=iWijΟi,

Oj=1/(1-e-netj);

② 对输出层计算δj:δj=(y-Oj)Oj(1-Oj);

③ 从后向前计算各隐层δj:δj=Oj(1-Oj)kwjkδk;

④ 计算并保存各权值修正量:△Wij(t)=αWij(t-1)+ηδjOi;

⑤ 修正权值:Wij(t+1)=Wij(t)+△Wij(t)。

2音频水印的嵌入与检测

水印的嵌入应该利用音频信号中最重要的特征,这样可使水印具有良好的鲁棒性。低频是声音信号能量最集中的部分,一般对音频文件的操作都尽量避免对低频信息的损失,否则会对音频质量造成很大的破坏。本算法采用对数字音频信号进行离散余弦变换(DCT),选取低频系数构造音频信号特征,并将该特征作为人工神经网络的输入向量,通过网络训练,建立音频信号重要特征与水印信号的对应关系,达到在不修改音频信号情况下把水印“嵌入”到原始音频信号中。

2.1水印信息的预处理

本算法嵌入的水印信号不是传统的一维伪随机序列,而是将一幅有意义的二值图像作为水印,从而具有更好的实用价值。假设WM×N的图像,它可以表示为W={w(i,j),0≤i<M,0≤j<N}。其中w(i,j)代表水印图像的第i行、第j列像素的灰度值。式中w(i,j)∈{0,1}。由于水印序列是二维图像,为了能够嵌入到一维的数字音频信号中,必须对水印图像进行降维处理,变为一维序列,即:V={v(r)=w(i,j),0≤i<M,0≤j<N,r=i*M+j}。

为了进一步消除二值水印图像的像素空间相关性,提高数字水印算法的鲁棒性,对上面得到的一维二进制序列V进行置乱变换。另外,为了加强保密性对其进行加密处理,这样即使有人能够从音频信号中提取出水印,但是经过加密后的水印,只有掌握密钥的人才能正确地恢复出水印,达到保密的目的。本算法采用文献[5]中的方法,由密钥K生成由1到M×N的随机排列,然后根据随机排列重新调整V中向量元素的位置,得到由V转换而来的新一维二进制序列X={x(i),0≤i<Nw,Nw=M×N}。

2.2水印嵌入算法

设音频数据被定义为:A={a(i),0≤i<n},嵌入算法描述如下:

(1) 将数字音频信号进行分段,每个音频段含有L个数据,将整个音频信号划分成n/L个音频段,即

A={A(k),0≤k<n/L},A(k)={a(kL+i),0≤i<L};

(2) 将水印信息X也分成n/L段,每段含有q个数据,即

X={X(s),0≤s<Nw/q,Nw=M×N },X(s)={x(sq+i),0≤i<q};

(3) 对每段音频信号进行离散余弦变换,选取变换后的m个低频系数,即

CA={CA(k),0≤k<n/L},CA(k)={ca(kL+i),0≤i<m};

(4) 建立人工神经网络,输入层、隐含层和输出层分别具有m个、p个和q个神经元。将CA(k)作为人工神经网络的输入向量,X(s)作人工神经网络的输出向量,通过人工神经网络权值的调节训练网络,建立CA(k)与X(s)之间的对应关系,即音频信号重要特征与水印信号之间的对应关系。

2.3水印的提取与检测算法

(1) 将数字音频信号进行分段,每个音频段含有L个数据,将整个音频信号划分成n/L个音频段,即

A={A(k),0≤k<n/L},A(k)={a(kL+i),0≤i<L};

(2) 对每段音频信号进行离散余弦变换,选取变换后的m个低频系数,即

CA={CA(k),0≤k<n/L},CA(k)={ca(kL+i),0≤i<m};

(3) 将CA(k)作为训练好的人工神经网络的输入向量,得到人工神经网络输出向量X′(s);

(4) 利用密钥K对水印信息X′进行逆随机置乱,得到原始水印的一维二进制序列V′={v′(r),0≤r<Nw,v′(r)∈{0,1}};

(5) 对所得到的一维二进制序列V′升维,便可恢复出二维水印图像W′={w′(i,j),0≤i<M,0≤j<N}。

利用训练好的人工神经网络提取水印时无需原始音频信号。为了消除观测者的经验、身体条件、实验条件和设备等主、客观因素的影响,需采用归一化相关系数NC(Normalized Cross-Correlation)[6]对抽取的水印和原始水印的相似性进行定量评价,即可判断出音频的版权归属。

3实验结果

Windows XP平台上用Visual C++6.0实现了本文算法。实验中,原始数字音频信号的采样频率为44.1kHz,分辨率为16比特。水印选用了32×32的二值图像。

对嵌入水印的音频信号进行攻击实验,叠加噪声(在音频信号的时域中加入高斯白噪声),进行低通滤波(低通滤波器长度为6,截止频率为22.05kHz),有损压缩(对音频信号进行压缩比为12:1的压缩,再解压缩),重新采样(采样频率降低为22.05kHz,再还原为原采样频率44.1kHz),重新量化(将音频信号从16比特量化为8比特,再量化为16比特),攻击后提取的水印如图2所示。

4结论

本文提出了一种基于人工神经网络的数字音频水印方法。利用人工神经网络学习和自适应的特征,通过训练网络建立音频信号重要特征与水印信号的对应关系,把机器学习的方法应用于数字水印的检测中。由于加了水印的声音信号也就是原始信号,因此要想发现音频是否被水印保护是很难的,这是零水印方法很大的一个优点。本算法具有计算简单、容易实现、保密性强,同时对滤波、重采样量化、有损压缩等攻击具有很强的稳健性。特别是在水印检测时不需要原始音频信号的参与,这大大地扩展了它的应用范围。

参考文献

[1]Bassia P,Pitas I.Robust Audio Watermarking in the Time-domain[A].Proceedings of EUSIPCO’98,Rhodesk,Greece,1998:25-28.

[2]Bender W,Gruhl D,Morimoto N.Techniques for Data Hiding[J].IBM System Journal,1996,35:313-336.

[3]赵朝阳,刘振华,王挺.数字音频信号的回声数据隐藏技术[J].计算机应用研究,2000,17(7):42-44.

[4]边肇祺,张学工.模式识别[M].北京:清华大学出版社,2003:254-257.

[5]Hsu ChiouTing,Wu JaLing.Hidden digital watermarks in images[J].IEEE Trans.on Image Processing,1999,8(1):58-68.

一种基于小波变换的音频水印算法 篇7

关键词:音频水印,离散小波变化,量化

引言

近年来, 网络通讯技术和多媒体的迅猛发展, 给人们的物质文化生活带来的极大的改变, 特别是mp3等数字音频压缩技术的盛行, 给我们带来了丰富多彩的视听享受。但是因为多媒体极容易复制和修改, 网上肆无忌惮的复制和传播盗版多媒体制品, 使得大量艺术作品的版权得不到有效保护, 作者和发行者的利益受到极大损害。

在这种背景下, 一种新的数字产品版权保护技术——数字水印应运而生, 该技术被认为是解决数字产品知识产权问题的重要手段, 已经成为当前的热点研究领域之一, 当前的数字水印研究中, 以图像水印研究最为深入, 而对于音频水印的研究相对较少, 一方面因为音频单位时间内的采样点较少, 可嵌入水印信息就要少, 另一方面由于人类听觉系统要比视觉系统更加灵敏, 也给音频水印的嵌入增加了难度。本文提出了一种基于小波变换的音频水印算法, 在音频小波变换域的近似分量嵌入水印, 对常见的音频处理有很好的鲁棒性。

1 算法基本思想

小波变换 (DWT) [1]是一种信号的时间-频率分析方法, 具有多分辨率分析的特点[2], 在时频域都有表征信号局部特征的能力, 即在低频部分有较高的频率分辨率和较低的时间分辨率, 高频部分有较高的时间分辨率和较低的频率分辨率。通过小波分析, 音频信息被分为两部分, 低频分量ca和高频分量cd, 低频分量可以继续分解以进行更高级别的小波分析。

本文算法在音频信号的小波变换域嵌入水印, 可以抵抗诸如重采样、加噪、mp3压缩等信号处理, 使数字产品的版权得到保护。本算法中先对原音频信号进行4级小波变换后, 把水印嵌入到占有音频大部分能量的近似分量ca4中, 实验中水印都采用直观的二值图像。在嵌入水印的过程中, 采用了双极性量化嵌入方法[3], 实现了水印的盲提取。

2 水印算法实现

2.1 水印的嵌入过程

设Ae表示含有L个采样数据的原始数字音频信号, 它可以表示为:

其中 是第l个数据的幅度值, p为每个数据用的比特数。

设W是二值图像水印, 它是一幅大小为M1×M2的二值图像, 可表示为:

其中w (i, j) ∈{0, 1}为二值图像的像素值。

为了取消水印图像的像素的空间相关性, 首先对图像进行Arnold置乱变换[4]。然后对水印图像进行降维操作, 使其转化为一维的二值序列:

对原始音频信号进行4层小波分解, 选取近似分量ca4中最大的5×M1×M2个系数嵌入水印序列V, 嵌入过程采用双极性量化方法, 为了进一步提高鲁棒性, 这里我们把水印序列V重复嵌入了5次, 虽然这对嵌入的水印容量有所减少, 但是极大的提高了鲁棒性。

值得注意的是量化步长的值越大, 水印的鲁棒性越好, 但是取值过大的话会使数字音频信号严重失真, 降低水印的使用价值。

2.2 水印的提取过程

设As是待检测的含水印音频信号, 检测过程如下:

首先对As进行4级小波变换, 根据量化策略, 对第四级近似分量ca4提取水印。

得到水印序列后, 利用公式 (3) 的把序列还原升维成二值图像。

将升维后的二值图像进行Arnold逆置乱就得到了水印图像。

3 仿真实验

实验中选取长度32s, 采样频率44.1k Hz, 16bits量化, 一段音频信号, 选取64×64的二值图像作为水印信号, 如图1 (a) 所示, 在含水印音频信号中提取的水印如图1 (b) 所示。图中可以看出, 几乎分辨不出嵌入前后水印的区别。我们让20个听觉正常的人反复听嵌入水印前后的两段音乐, 同样分辨不出哪一个是嵌入水印的音乐, 可见算法具有很好的不可闻性。

为了测试算法的鲁棒性, 对嵌入水印的音频信号作如下处理:

3.1 添加白噪声:将信号加入信噪比为30d B的高斯白噪声, 提取的水印如图2 (a) 。

3.2 重量化:将含水印音频信号先进行8bit量化, 再量化为16bit, 提取的水印如图2 (b) 。

3.3 重采样:将音频信号先下采样到32KHz, 再上采样到44.1KHz, 提取的水印如图2 (c) 。

3.4 有损压缩:将含水印音频信号进行5.5:1mp3压缩, 提取的水印如图2 (d) 。

3.5 低通滤波:将含水印信号通过截止频率10KHz的低通滤波器, 提取的水印如图2 (e) 。

图2. (a) (b) (c) (d) (e) 依次为从受到添加白噪声、重量化、重采样、有损压缩、低通滤波攻击的音频中提取的水印从图中我们可以看出, 本算法水印对于各种音频处理攻击具有很好的鲁棒性。

4 结论

提出了一种基于小波变换的音频水印算法, 在音频信号的近似小波分量实现水印的嵌入, 可以抵抗重采样、有损压缩、低通滤波等常见攻击, 对于音频信号的版权保护很有应用价值。

参考文献

[1]H Inoue, A Miyazaki, T Katsura.An Image Watermarking Method Based on the Wavelet Transform[C].Proc of ICIP.Vol3.1999:296-300.

[2]P.Meerwald, A.Uhl.A survey of wavelet-do-main watermarking algorithms[J].Proceedings of SPIE, Electronic Imaging, Security and Water-marking of Multimedia Contents III, P.W.Wong and E.J.Delp, eds.4314, SPIE, (San Jose, CA, USA) , Jan.2001.

[3]丁玮, 闫伟齐, 齐东旭.基于Arnold变换的数字图像置乱技术[J].计算机辅助设计与图形学学报, 2001, (04) :338-341.

[4]杨洋, 陈小平.一种变换域的音频多水印算法探索[J].微电子学与计算机.2001, 21 (6) :63~66.

汉明码在数字音频水印嵌入中的应用 篇8

现今,网络和通信技术飞速发展,多媒体产品的传输和获取变得快捷方便。与此同时,多媒体编辑软件的涌现,使得对多媒体产品的处理变得简单随意。然而,在这一系列的便捷之下,多媒体信息安全问题不容忽视。数字水印技术作为保护多媒体产品版权的有效手段,被广泛关注[1]。

数字音频水印算法是以数字音频信号为载体,通过一定方式将文本、图像、声音等水印信号嵌入到载体中的过程。水印信号的嵌入在具有好的不可感知性的同时要不影响音频信号的听觉质量。目前,水印算法主要分为时域算法和变换域算法。时域算法有最低有效位算法[2]、回声隐藏算法[3]等,变换域算法主要有离散傅里叶变换[4]、离散余弦变换[5]和离散小波变换[6]等通过改变变换域内系数值来嵌入水印的算法。变换域音频水印算法相对于时域音频水印算法具有更好的不可感知性和鲁棒性,但是时域算法实现过程相对简单。

音频信号在传输过程中会受到各种干扰,提取水印时就可能出现误码。本文提出一种基于汉明码的数字音频水印算法,将二值信号通过量化方式嵌入到原始载体信号的小波域系数均值中。实验结果表明,该算法降低了水印提取的误码率,并且有较好的不可感知性和鲁棒性。

1 相关原理

1. 1 汉明码原理

汉明码是以发明者理查德·卫斯里·汉明的名字命名的一种具有纠错功能的线性编码[7]。由于汉明码的编码方式简单,并且能够纠正1 比特的错误码,被广泛应用于信道的编码与译码中,以提高通信系统抵抗干扰的能力[8,9]。

假设信息位数为m,校验位数为r,则汉明码位数为n = m + r。想要实现充分的错误码纠正,m、r、n应当符合不等式( 1) 、( 2) :

通过上述不等式可得汉明码中校验码与最大可校验信息位数之间的关系如表1 所示。

其中,常用的汉明码是( 7,4) 汉明码,( 7,4) 汉明码的汉明码位数为7,信息位数为4,故其校验位数为3。下面就以( 7,4) 汉明码为例简单介绍汉明码的纠错过程。

假设一组( 7,4) 汉明码为A =[a6,a5,a4,a3,a2,a1,a0 ],前4 位是信息位,后3 位是校验位。S1、S2 和S3 是显示错误码位置的校正子,则校正子与错误码位置的对应关系如表2 所示。

由表1可得校正子和错误码位置的关系式为:

1.2双边量化

双边量化[10]是一种常见的量化方式,该量化方法原理简单,实现容易,在水印嵌入算法中被广泛应用。

假设待量化的系数为f,待嵌入的水印比特为w( 0 或- 1) ,量化步长为 Δ,量化处理后嵌入水印的系数为f1。系数量化原理如图1 所示。

首先,将坐标轴按照上图所示按量化步长 Δ 划分成相互间隔的A、B区间,属于A区间的水印比特为1,属于B区间的水印比特为0。

其次,对嵌入水印的系数f进行处理,取模m =mod( f ,Δ) ,取余r = f - m* Δ。然后根据要嵌入的水印比特( 0 或1) 量化系数f。量化过程如下所示。

①当w = 1,f≥0 时

②当w = - 1,f≥0 时

③当w = 1,f < 0 时

④当w = - 1,f < 0 时

上述操作的实质是将系数调整为与其最近的相同区间的中点值。该量化方式的最大量化误差为量化步长 Δ,即| f1 - f | ≤ Δ。提取水印时,根据待检测系数f2所在区间确定水印w,如果f2在A区间,则水印为1,如果f2 在B区间,则水印为0。水印提取方法可表示为:

由于均值量化方式具有较好的稳定性[11],在本算法中使用双边量化方式量化小波域低频系数均值。

2 水印的嵌入与提取

2. 1 水印的嵌入过程

①构造大小为512 × 4,处于( 0,1) 之间的随机数矩阵,将矩阵中的元素与0. 5 比较大小,得到一个大小同样为512 × 4 的二值随机数矩阵W,该矩阵即为初始水印信号。

②按照汉明码编码规则对水印信号W进行编码,得到大小为512 × 7 的汉明码矩阵H。

③选择合适的Logisctic映射初始值x0生成长度为512 × 7 的一维混沌序列S = { s ( i) ,1 ≤ i ≤( 512 × ) } 。设定一个合适的阈值x1,将混沌序列转换为二值序列,然后调整序列为512 行7 列的混沌矩阵R = { r( i,j) ,1≤i≤512,1≤j≤7 } 。将Logistic的初始值x0和阈值x1作为密钥保存。

④将混沌矩阵R与汉明码矩阵H进行异或运算,得到加密后的汉明码矩阵H_encoded。

⑤根据矩阵H_encoded的行数将原始音频信号A = { a( n) ,n = 1 ≤ n ≤ N} 分为512 帧,则每帧信号的长度为L1 = N/512,每帧信号可表示为Ai= { b( i) ,1≤i≤L1} 。再根据矩阵H_encoded的列数将每帧信号分为7 段,每段长度为L2 = N/3584,每段信号可表示为Aij= { c( i,j) ,1≤i≤L1,1≤j≤L1 } 。

⑥对每段信号进行小波基为“Db1”的三级小波变换,得到变换后的低频系数CAj,并计算每段低频系数均值avgj。

⑦通过双边量化方式,将1 比特的水印信息嵌入到每段信号的低频系数均值avgj中,则一帧信号中嵌入7 比特的水印信息,即矩阵H_encoded的一行数据。通过修改后的低频系数均值修改低频系数。

⑧根据修改后的小波系数进行小波重构,将重构后的每段信号连接起来并保存,得到嵌入水印后的数字音频信号A_embed = { d( i) ,n = 1 ≤n≤N } 。

水印嵌入过程的基本流程图如图2 所示。

2. 2 水印的提取过程

水印提取过程与水印嵌入过程的类似:

①根据密钥中的Logistic的初始值x0生成长度为512×7的一维混沌序列S={s(i),1≤i≤(512×)}。然后根据阈值x1,将混沌序列转换为二值序列,然后调整序列为512行7列的混沌矩阵R={r(i,j),1≤i≤512,1≤j≤7}。

②将待检测的信号A_embed={d(i),n=1≤n≤N}分为512帧,再将每帧信号分为7段。

③对每段信号进行小波基为“Db1”的三级小波变换,得到变换后的低频系数,并计算每段低频系数均值。

④根据双边量化方式从每段低频系数均值中提取水印矩阵W。

⑤将矩阵W与混沌矩阵R进行异或运算,所得结果再进行汉明码译码运算就得到检测到的水印W1。

3 仿真实验

为了验证算法的可行性与其性能,选择MATLAB R2009b作为实验平台进行仿真。选取的原始音频信号是一段采样率为44. 1k Hz,分辨率为16 比特,采样点为3670016 的单声道古典乐曲。水印是大小为512 × 4 的随机二值矩阵,其产生方式如嵌入过程步骤 ① 所示。双边量化过程中量化步长为0. 01。水印嵌入前后音频信号波形如图3 所示。

通过观察两组音频信号的波形可知,水印嵌入前后音频信号波形没有明显的变化。观察者的听觉系统也没有感受到两段音频在音质上的区别。

水印的透明性也可通过计算信噪比SNR来评价,SNR的计算式如式( 11) 所示。国际留声机联盟要求嵌入水印后的音频信噪比不得低于20d B[12]。通过计算可得嵌入水印后音频信号的信噪比SNR为26. 0556d B。故该算法具有较好的不可感知性与透明性。

其中,A和A' 分别表示原始音频信号和嵌入水印后音频信号。

为验证水印的鲁棒性,衡量算法的抗干扰能力,对嵌入水印后的音频信号进行常规处理后,分别计算水印的相关系数NC和误码率BER,通过这两个参数衡量音鲁棒性。NC的计算公式如式( 12) 所示。

其中,W和W' 分别表示原始水印信号和提取的水印信号。BER的计算公式如式( 10) 所示。

其中,E代表提取的水印信息中的错误比特数,N代表水印总比特数。

NC的取值范围为0 到1,越接近1,说明原始水印与提取水印的相似性越高,水印鲁棒性越好; BER的取值范围同样是0 到1,值越接近于0,则表示提取的水印错误率低,水印鲁棒性越好[13]。

对嵌入水印后的音频信号进行常规处理,检测提取的水印信号的误码率和归一化相关系数。如表1 所示。

实验结果表明,当添加的高斯白噪声为30d B时,算法仍有较好的鲁棒性,误码率低。随着截止频率的降低,水印的误码率增大,相关性减小。当截止频率为4k Hz时,低通滤波处理对音频音质的改变已经能够被人耳察觉,但是此时水印仍有较好的鲁棒性。重采样和重量化处理的误码率均为0,相关性均为1,也就是说该算法能有效的抵抗重采样和重量化处理,提取出的水印准确无误。

综合上述结果可知,该方法在保持水印的透明性的同时,能有效抵抗常见处理,具有良好的鲁棒性。

4 结束语

本文结合汉明码具有自动纠错功能的特性,提出了一种基于小波域的均值量化音频水印算法。首先使用汉明码对二值水印进行编码,然后将音频信号分帧,每一帧再分段,通过量化方式将水印嵌入到分段信号的小波低频系数均值中。实验表明,将汉明码应用于数字水印的嵌入中是可行的,该算法在保证较好的不可感知性的同时仍具有鲁棒性。该算法的不足之处在于,嵌入的水印是无意义的二值随机数,水印信息不够直观。并且对于同步攻击,该算法的鲁棒性较差,需要进一步的提升。

摘要:汉明码作为一种具有纠错功能的编码技术,在通信领域被广泛研究与应用。为降低水印提取的误码率,文中利用汉明码良好的纠错性能和均值量化的稳定性,提出一种基于汉明码的数字音频水印算法。首先将作为水印信号的二值信号进行汉明编码,并将编码后的汉明码矩阵利用Logistic映射加密,然后将原始音频数据小波变换,通过均值量化将加密后的汉明码嵌入到音频中。实验结果表明,该算法具有较好的透明性,对常规处理具有鲁棒性,有效降低了水印的误码率。

注:本文为网友上传,旨在传播知识,不代表本站观点,与本站立场无关。若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:66553826@qq.com

上一篇:数字水印技术及其应用 下一篇:零水印算法