文本数字水印算法研究

文本数字水印算法研究（精选八篇）

文本数字水印算法研究篇1

关键词：字符格式,字符属性,句法,字符间距

0引言

数字水印技术是一种极具潜力的数字作品版权保护技术。其基本思想是将含有作者电子签名、日期、商标、使用权限等的数字信息作为水印信号,嵌入到图像、文本、视频和音频等数字作品中,并且在需要时,能够通过一定的技术检测手段抽出水印,以此作为判断数字作品的版权归属和跟踪起诉非法侵权[1]的证据。各种重要数据信息传递过程中,文字信息占相当大的比重,针对文本数字水印技术的研究在水印技术研究领域中占有重要地位。

目前基于文本数字水印的算法研究主要集中在基于字符特征格式、字符属性、基于句法、语义改写、字符间距5种主要类型,后续研究的一些新的算法多是在此之上的进一步创新与衍生。每种类型的算法在透明性、安全性、鲁棒性方面都有自己突出的特点。而在实际的应用中可能有自己不同的侧重点, 有些情况对信息的安全性要求较高,如隐私信息,版权信息等,有时对透明性提出要求,不能使原始文档页面有细微改动,如重要票据、证据文件等。

本文详细分析了数字水印技术的主要性能指标要求,并对基于字符格式、字符属性、字间距、基于语义、句法改写的5种主要类型的文本水印算法思想, 以及它们的综合性能特点做了细致的论述。在实际的应用中,可以有选择地根据自己的需要,选择在各性能指标方面各有所长的水印算法以满足自己的要求。

1数字水印技术的特点

1. 1透明性

透明性是指数字水印的嵌入不会对文本的内容、页面格式产生任何影响。嵌入水印后的文档在外部视觉效果上与原文档别无二致,即不向原始载体数据中引入任何可知觉的附加数据。这样数字水印难以用统计的方法发现和篡改。

1. 2安全性

水印的安全性指水印在嵌入的过程中应当是秘密的,嵌入的水印是统计上不可检测的,数字水印的安全性主要通过密码学中的密码算法和密钥来实现。使用密码算法和密钥,可以提供两层保护: 第一,未经授权者不能提取出水印信号; 第二,未经授权者即使提取出水印信息,在没有密钥的情况下,也不能读出水印信息。

1. 3鲁棒性

数字水印的鲁棒性是指水印信息在经历多种有意或无意的信号处理后,仍然能保持完整性或仍能被准确提取的特征。标准数据处理时指数据或数字产品经数据发布渠道,如编辑、打印、增强、格式转换等过程。这个过程中水印可能会遭到攻击,攻击是指那些带有损害性、毁灭性的或者试图移除数字水印的处理过程。鲁棒性实际也就是水印的抗攻击能力。

1. 4容量

容量也是检验一种算法优劣的重要指标,对于同样的载体文档,不同的算法可以嵌入不同大小的水印信息,较长的水印信息,如果要实现全部嵌入,可能需要较大的篇幅,或该算法在容量方面有优势。同时, 容量的大小也与安全性,鲁棒性等有着密切的联系。

数字水印技术的安全性、鲁棒性和透明性的要求很大程度上取决于数字水印技术的最终应用。目前数字水印的领域有版权保护、数字指纹、身份认证、数据监测和数据跟踪等,不同层次的应用对数字水印的安全性、透明性、鲁棒性提出了不同层次的要求。

2常用水印算法及其特点分析

一种优秀的水印算法能同时满足各种性能指标的要求。本文讨论的是一些常用的常规的从不同角度设计的文本水印算法以及它们各自的优缺点。以便根据自己不同需求侧重点选择最优的方法。按照嵌入水印选择的载体不同可将算法主要分为: 基于字符格式、字符属性、字间距、基于语义、句法改写的5种主要类型。

2. 1基于字符格式的算法

基于格式算法,主要是通过改变字符的颜色、字体等嵌入水印信息。这类算法在鲁棒性、透明性、容量等方面各有优缺点。在实际应用中,可根据自己的需要,选择合适算法。

如基于字符颜色[2]的算法是根据字符特征编码原理,通过改变文档中的颜色特征加入及提取水印。在文档中每个文字都可以设置字体的颜色。通常情况下,每个文字的颜色都是黑色的。其中RGB的值为( 0,0,0) ,对于每个字符,根据随机数选取RGB等3个对象中至少一个嵌入有效的水印信息, 其余位置嵌入伪水印,字体对象嵌入程序定义的水印信息01串,用于对抗外部攻击,可有效嵌入水印信息量为4 ~ 12bit。

这种算法的优势在于: 1可嵌入的水印范围大, 最多一个字符12bit。2RGB颜色的修改,通过轻微修改文本颜色可以利用其不易被人眼察觉的特性嵌入水印。字符颜色值中R、G、B3个对象置换低四位不会影响颜色在视觉上的变化,且存储容量高。这种算法的劣势在于: 1水印的鲁棒性不强,攻击者可以通过改变字体的颜色使得水印被完全破坏。2会对页面产生一定程度的修改,即使在正常情况下肉眼无法观察出。这种算法可以用在隐蔽通信中,利用算法的高容量,可以隐藏传输大量水印信息。

基于字符字体类型的修改。实验证明,对于任一个文字在宋体与新宋体[3],楷体与华文楷体等这些相近的字体之间的差别是不轻易被人眼察觉的。故对于字符属性,每个字符可以嵌入1bit的水印信息。例如在水印序列位为“1”的时候,将字符属性设置为宋体,当为“0”的时候,将字符属性设置为新宋体。

这种算法的优势在于: 1算法简单,易于实现, 而且有一定的容量,可以实现每个字符嵌入一个bit信息。2嵌入水印后的文档与原文档别无二致,满足水印隐蔽性的要求。但是也有明显的劣势: 如果攻击者意识到是基于字体嵌入的水印,将文档字体统一设置为别的字体,如黑体,仿宋体等,那么水印将会被破坏无法提取。与基于颜色属性的算法有相同的缺陷。

2. 2基于一些隐性字符属性算法

这里的字符的隐性属性指的是该属性的变化不会对文档页面产生任何影响,实现无页面修改。不会像颜色、字体等会对页面产生细微的变化,即使人眼不易识别。例如字符kerning属性,该值指示是否启用字距调整,默认值为false。再如word中range对象的noproofing属性等,这些属性值的修改不会引起文本的任何变化。可选择两个属性作为载体分别对应水印序列“1”和“0”,当嵌入“1”时改变某个属性值,当嵌入“0”时,改变另一个属性值。例如, 设水印序列为:

mi= 1时,设置字符noprooving属性为true,嵌入bit“1”;

mi + 1= 0时,设置字符kerning属性为true,嵌入bit“0”。

这种算法的优势是: 1实现真正的无页面修改, 嵌入水印后文档与原文档页面、格式无任何变化,水印的透明性非常好。2不同于字体、颜色等可以简单地通过工具栏修改,若想更改属性值只能通过编程的方式改变,鲁棒性很强。但是,这种算法实现需要找到恰当的属性值,并通过编程加以控制,在容量方面不如基于颜色的算法。因为它的抗攻击能力很强,可以用来嵌入隐藏一些重要的关键信息,如版权信息、个人隐私信息等。有很好的商业用途。

2. 3基于句法的文本水印算法

基于句法[4]的水印算法就是在不改变原意的前提下,通过对句子的结构进行转换来加入水印,如移动附加语句的位置,加入形式主语,主动式变被动式[5]在句子中加入不影响句子语义的一些短语,修改句法分析树,调整修辞和句子的结构。这种方法中,公认的最常用的变换方式有以下4种:

1移动附加语的位置

拜仁最后夺得了欧冠

句中状语“最后”可以移至句首。这样上面的例句被替换为: 最后拜仁夺得了欧冠。

2加入形式主语

这种变换对于英文容易实现,由于汉语没有 “形式主语”,该方式无法直接应用于汉语的句法结构变换中。然而可以使用与之相近的变换方式。比如对于上面的例句,可以变换为: 是拜仁最后夺得了冠军。

3主动式变被动式

无论是在汉语中还是在英语中,任何含有及物动词的句子都可由主动式变被动式。由于对汉语句子的主动变被动中不用考虑人称、时态与语态的问题,因而相比较而言,这种变换更易在汉语中实现, 对于上述例句可变为: 冠军最后被拜仁夺得了。

4句中插入透明短语

所谓“透明短语”是指几乎不含语义的习惯表达,“众所周知……”“正如我们所看到的……”等等,这些词或短语的加入不会影响句子的语义。利用这种方式对上面的句子变换后得到结果: 正如所见到的,最后冠军被拜仁夺得了。

以上介绍的4种方法可以同时使用,有时仅用一种算法可能仍无法插入水印信息,可以综合使用。

2. 4基于语义的文本水印算法

基于语义[5]的水印算法主要是同义词替换( 如 “开心”替换为“快乐”,“很”替换为“非常”等) 以及基于偏正结构的短句改写。以偏正短语结构[6]为例,一些定语状语后面常附加有助词“的”其功能主要用于构造错落形式的文字和强调修饰语等,这种助词“的”的出现可有可无,例如:

定中短语: ( 宏伟/n的/u( 北京/n故宫/n) ) 0状中短语: ( 快速/a地u发展/v) ) 0

( 宏伟/n ( 北京/n故宫/n) ) 1 ( 快速/a发展/ v) 1

如果用定/状语后接有语用功能的助词“的”代表水印信息位为“0”,反之代表为“1”,每个这样的位置可以隐藏1bit信息。考虑到“的”是现代汉语中出现频率最高的词,基于它来设计算法可获得较好的通用性和容量。

综上,基于句法、语义的算法具有很好的鲁棒性,水印信息很难被破坏。针对句法的调整,不改变文本的原有语义,具有较强的隐蔽性。但是,嵌入水印的多少依赖于文章的句法结构,助词的多少,因此,应用范围有一定的限制,对于较小的文章可能无法实现水印的完整嵌入。该种算法适用于对鲁棒性要求较高,但水印信息较短或篇幅稍长一点的应用场合。

2. 5基于字间距的算法

选择字体字符间距[7]作为嵌入水印信息的载体。通过工具栏- > 字体- > 字符间距查看到利用的主要是人眼的识别分辨率在字符间距变化0. 1磅以下不敏感这一特点。算法的核心思想为: 当要嵌入的水印序列bit位是“1”时将选中字符的字符间距设置为加宽0. 1磅,将紧接着的字符间距设置为紧缩0. 1磅,当要嵌入的水印序列bit位是“0”时将选中字符的字符间距设置为加宽0. 05磅,将紧接着的字符间距设置为紧缩0. 05磅。前加后缩,累加和为0,这样的目的是为了让文档在整体上看起来与原文一致,尤其在段落或文章的末尾。

假设水印二进制序列为:

从文档的j位置嵌入水印。若wi= 1时,将j位置字符间距加大0. 1磅,将j + 1位置字符间距减小0. 1磅; 若wi= 0; 将j位置字符间距加大0. 05磅, 将j + 1位置字符间距减小0. 05磅。

这种算法的特点在于: 1与基于颜色、字体的算法相比,水印的鲁棒性较强,不能简单地通过工具栏设置使得水印完全被破坏,能抵抗一定程度的攻击。但是没有基于隐形属性的算法强。2水印的透明性较好,将改变后的字符与原字符在放大一定的倍数下才能观察到差别。3在嵌入容量方面,水印容量大于基于语义、句法的算法,小于基于颜色、字体的算法。该算法的综合性能方面属于中等水平。

3结束语

基于频域的图像数字水印算法研究篇2

关键词：数字水印；版权保护；离散余弦变换；离散小波变换

中图分类号：TP309.2文献标识码：A

随着信息产业的飞速发展，数字技术的进步，Internet应用日益广泛，数字媒体因其数字特征很容易被复制、篡改、非法传播及攻击，已经日益引起人们的关注，版权保护与信息完整性保证已逐渐成为人们迫切要解决的一个重要问题，除了与传统作品版权保护相类似的法律和管理手段外，还应该针对数字媒体提供技术上的保护。数字水印技术研究就是在这种要求下迅速发展起来的。

1 数字水印技术基本特征

数字水印技术是信息隐藏技术研究领域的重要分支，它除应具备信息隐藏技术的一般特点外，还有着其固有的特点。数字水印技术基本特征主要有：

(1)鲁棒性：水印信息在经过常规信号处理操作后，仍然能检测到水印的能力。

(2)隐蔽性：数字产品加入数字水印后，应该不会引起数字作品的明显质降，即因嵌入水印导致图像或音频的变化对观察者的视觉系统和听觉系统来讲应该是不可察觉的，数字信息产生的变动和失真应低于可感知的门限。

(3)安全性。指水印算法具有较强的抵抗人为攻击的能力。

(4)可证明性。能够为受到版权保护对象的所有权归属提供完全和可靠的证据。

2数字水印系统框架

整个数字水印系统框架可以描述为下图。

3基于频域的数字水印算法

根据算法作用域的不同，可以将水印分为空域数字水印和频域数字水印两种。空间域算法是直接将水印信息嵌入到多媒体数据中，通常这些位置不影响被嵌入对象基本属性，从而实现了水印的隐藏。该类算法实现比较简单，早期的数字水印算法基本上都属于该类。但是由于水印嵌入的位置在很大程度上相似，因此水印的鲁棒性比较差。常见的空间域算法有最低有效位算法(LSB)和基于统计特征的Patchwork算法等。

近几年，变换域算法如基于离散傅立叶变换、离散余弦变换(Diserete Cosine Transform，DCT)、离散小波变换(Dsortie Wavelet Transform，DWT)等各种时频分析工具的算法受到广泛关注，这主要因为变换域算法中可以使嵌入的水印信号能量分散到空间的所有像素上，有利于保证水印的透明性，并且可以更方便地与人类视觉系统的特性相结合。

3.1基于DCT域数字图像水印算法

基于DCT域数字图像水印算法根据嵌入的位置的不同可以分为三种，分别是嵌入低频区、嵌入中频区和嵌入高频区。将水印嵌入低频区域可以具有较好的鲁棒性，但透明性差；相反将水印嵌入高频区域虽然透明性好，但是鲁棒性较差。所以一种折中的办法就是将水印加入到中频区。

Cox等人提出了基于全局DCT变换的扩频水印算法，这是早期最著名的变换域水印算法之一。该算法的主要创新是明确提出将数字水印加载在图像的视觉敏感部分(主要对应于低频部分)。这种提法的理由是图像的视觉敏感部分是图像信号的主要成分，携带较多的信号能量，在图像有一定失真的情况下，仍能保留主要成分，作为水印载体，更有利于提高水印的稳健性。扩频通信技术的利用也是该算法的一项重要贡献，保证了水印的不可见性和稳健性。该算法可以抵抗一些几何攻击和通用的信号处理操作。Barni等人则是将一个实数序列作为水印嵌入DCT域的中频系数中，以调节水印的稳健性与不可见性之间的矛盾。Huang等人，基于对图像DCT系数振幅的定量分析，指出DC分量比AC分量有更大的感觉容量，从稳健性的角度，DC分量更有利于水印的嵌入，并提出了一个利用DC分量的自适应算法。

DCT域的方法计算复杂度较低，并且与JPEG、MPEG等国际数据压缩标准兼容，便于在压缩域中实现，因此受到普遍重视。

3.2基于DWT域数字图像水印算法

小波变换是傅利叶变换和窗口傅利叶变换的一个重大突破，为信号处理、图像处理及其它非线性科学的研究领域带来革命性的影响。在一些应用中，基于小波变换的数字水印方案比基于DCT变换的水印方案更具优势。因此基于离散小波变换的数字水印算法已成为当前研究的热点。

具体来说，小波变换是一种信号的时间一尺度(时间一频率)分析方法，它具有多分辨率的特点，而且在时频两域都具有表征信号局部特征的能力，是一种窗口大小固定但其形状可变，时间窗和频率窗都可改变的时频局部化分析方法。小波变换的基本思想就是对信号进行多分辨率分解。根据S.Mallat的塔式分解算法，图像经过一级分解后可以分解成四个子带：低频(LL)、水平方向(HL)、垂直方向(LH)、对角线方向(HH)，每个子带的划、为原图的四分之一，对低频(LL)进行继续分解，如图2所示。

研究表明，假设对一幅256*256图像进行三级小波分解，低频子图集中了图像的大部分能量，整个图像能力的97％集中在第三层，其中仅LL3低频子带图就占了93％，而高分辩子带图像上的数值都比较小，接近于零。

HVS指出，人眼对高频信息(如复杂的区域)的敏感度低于对低频信息(如平滑区域)的敏感度，因此水印嵌入到越高频的区域，对原始图像的影响越小，水印的透明性越好；但为提高水印对各种失真和噪声的抗御能力，水印应嵌入到越低频的区域越好。因此，通常从水印的鲁棒性和图像的失真度考虑，把水印嵌入到图像的中频带区。Cox等在进行图像水印嵌入的时候也总把DC系数排除在外，原因在于避免加水印的图像出现方块效应。这个基于DCT的嵌人对策现在已被人们接受。但在DWT域，由于小波变换是全局变换，在图像的低频系数带加入水印不会出现方块效应。

另外，嵌入水印的图像很容易遭受图像压缩、滤波等处理，根据信号处理理论，低频系数相对于高频系数来说，更不容易受信号处理所改变。因此，一种常见的方法就是把水印嵌入到小波图像低频系数。它在保持图像好的可靠性的同时又保持了图像的鲁棒性。

此类数字水印算法的一般嵌入步骤为：

(1)分别利用Amold变换将水印图像置乱，置乱后的水印记为WI；

(2)将原始图像P经过3级小波变换，得到不同分辨率下不同方向的子图PIK；

(3)将W1进行一级小波分解，得到4个子图WIK；

(4)将水印中的数据分别与原始图像子图的数据按照下式进行分块编码：

C1=C1(P1K+aW1K)(K=0,1，2，3)

其中C1是嵌入前的DWT系数，a是小波强度参数，W1是表示嵌入的水印，C1代表嵌入后的水印。

4结束语

本文回顾了数字水印技术的基本理论，并重点从不同的角度对数字水印进行分类，详细描述和分析各类水印的相关算法、性能及发展趋势。在我对频域数字水印研究的过程中有如下一些认识和体会：

(1)无论是在离散小波变换或是在离散余弦变换后的低频子带还是在高频子带，只要嵌入强度不超过人类的可感知界限，都是可以嵌入水印的。低频系数的绝对值比高频系数的绝对值一般大得多，考虑到鲁棒性。水印嵌入到低频系数则具有一定的优势，而考虑到透明性，高频系数又是不错的选择，但如何在鲁棒性与透明性这两个水印重要特征之间找到一个更好的平衡点将是进一步需要研究的工作。

(2)研究数字水印在实际应用中的模式、方法和领域也是数字水印的一项重要内容，也是该技术走向市场的主要途径。

文本数字水印算法研究篇3

数字水印通过在多媒体数据(如图像、声音、视频信号等)中嵌入秘密信息—水印来证实该数据的所有权或完整性,以达到版权保护等作用。嵌入信息可以是版权信息,也可以是其它的秘密信息等。下面着重介绍数字水印有哪些算法及信息隐藏的一种简单应用。首先对与数字水印相关的理论基础作一些介绍和总结。

2 信息隐藏与数字水印

2.1 信息隐藏技术简介

信息隐藏,也称为信息伪装(Steganography),是将有用或重要的信息隐藏于其他信息里面以掩饰其存在(就是将秘密信息秘密地隐藏于另一非机密的文件内容之中)。信息隐藏是一门具有渊源历史背景的新兴学科,涉及感知学、信息学、密码学等多个学科,涵盖信号处理、扩频通信等多个专业技术的研究方向。

2.2 数字水印的定义

数字水印的定义:数字水印技术,是利用数字作品中普遍存在的冗余数据与随机性把代表著作权人身份的特定信息,按照某种方式植入被保护的信息中,在产生版权纠纷时,通过相应的算法提取出该数字水印,从而验证版权的归属,确保著作权人的合法利益,避免非法盗版的威胁。被保护的信息可以是任何一种数字媒体,如图像、声音、视频或一般性的电子文档等。理想的数字水印方案应该是只有版权所有者才可以加载水印,但任何人都可以对其进行验证的水印方案。数字水印是嵌入在数字产品中的数字信号,水印的存在要以不破坏原数据的欣赏价值、使用价值为原则。

2.3 典型数字水印系统模型

图1为水印信号嵌入模型,其功能是完成将水印信号加入原始数据中;图2为水印信号检测模型,用以判断某一数据中是否含有指定的水印信号。

2.4 典型算法

近年来,数字水印技术研究取得了很大的进步,下面对一些典型的算法进行了分析,除特别指明外,这些算法主要针对图象数据(某些算法也适合视频和音频数据)。

1)空域算法

该类算法中典型的水印算法是将信息嵌入到随机选择的图像点中最不重要的像素位(LSB:least significant bits)上,这可保证嵌入的水印是不可见的。但是由于使用了图像不重要的像素位,算法的鲁棒性差,水印信息很容易为滤波、图像量化、几何变形的操作破坏。另外一个常用方法是利用像素的统计特征将信息嵌入像素的亮度值中。

2)Patchwork算法

方法是随机选择N对像素点(ai,bi),然后将每个ai点的亮度值加1,每个bi点的亮度值减1,这样整个图像的平均亮度保持不变。适当地调整参数,Patchwork方法对JPEG压缩、FIR滤波以及图像裁剪有一定的抵抗力,但该方法嵌入的信息量有限。为了嵌入更多的水印信息,可以将图像分块,然后对每一个图像块进行嵌入操作。

3)变换域算法

该类算法中,大部分水印算法采用了扩展频谱通信(spread spectrum communication)技术。算法实现过程为:先计算图像的离散余弦变换(DCT),然后将水印叠加到DCT域中幅值最大的前k系数上(不包括直流分量),通常为图像的低频分量。若DCT系数的前k个最大分量表示为D={di},i=1,…,k,水印是服从高斯分布的随机实数序列W={wi},i=1,…,k,那么水印的嵌入算法为di=di(1+awi),其中常数a为尺度因子,控制水印添加的强度。然后用新的系数做反变换得到水印图像I。解码函数则分别计算原始图像I和水印图像I*的离散余弦变换,并提取嵌入的水印W*,再做相关检验以确定水印的存在与否。

4)压缩域算法基于JPEG、MPEG标准的压缩域数字水印系统不仅节省了大量的完全解码和重新编码过程,而且在数字电视广播及VOD(Video on Demand)中有很大的实用价值。相应地,水印检测与提取也可直接在压缩域数据中进行。下面介绍一种针对MPEG-2压缩视频数据流的数字水印方案。虽然MPEG-2数据流语法允许把用户数据加到数据流中,但是这种方案并不适合数字水印技术,因为用户数据可以简单地从数据流中去掉,同时,在MPEG-2编码视频数据流中增加用户数据会加大位率,使之不适于固定带宽的应用,所以关键是如何把水印信号加到数据信号中,即加入到表示视频帧的数据流中。对于输入的MPEG-2数据流而言,它可分为数据头信息、运动向量(用于运动补偿)和DCT编码信号块3部分,在方案中只有MPEG-2数据流最后一部分数据被改变,其原理是,首先对DCT编码数据块中每一输入的Huffman码进行解码和逆量化,以得到当前数据块的一个DCT系数;其次,把相应水印信号块的变换系数与之相加,从而得到水印叠加的DCT系数,再重新进行量化和Huffman编码,最后对新的Huffman码字的位数n1与原来的无水印系数的码字n0进行比较,只在n1不大于n0的时候,才能传输水印码字,否则传输原码字,这就保证了不增加视频数据流位率。

5)NEC算法该算法由NEC实验室的Cox等人提出,该算法在数字水印算法中占有重要地位,其实现方法是,首先以密钥为种子来产生伪随机序列,该序列具有高斯N(0,1)分布,密钥一般由作者的标识码和图象的哈希值组成,其次对图象做DCT变换,最后用伪随机高斯序列来调制(叠加)该图象除直流(DC)分量外的1000个最大的DCT系数。该算法具有较强的鲁棒性、安全性、透明性等。由于采用特殊的密钥,因此可防止IBM攻击,而且该算法还提出了增强水印鲁棒性和抗攻击算法的重要原则,即水印信号应该嵌入源数据中对人感觉最重要的部分,这种水印信号由独立同分布随机实数序列构成,且该实数序列应该具有高斯分布N(0,1)的特征。

6)生理模型算法人的生理模型包括人类视HVS(Human Visual System)和人类听觉系统HAS。该模型不仅被多媒体数据压缩系统利用,同样可以供数字水印系统利用。利用视觉模型的基本思想均是利用从视觉模型导出的JND(Just Noticeable Difference)描述来确定在图象的各个部分所能容忍的数字水印信号的最大强度,从而能避免破坏视觉质量。也就是说,利用视觉模型来确定与图象相关的调制掩模,然后再利用其来插入水印。这一方法同时具有好的透明性和强健性。

随着数字水印技术的发展,各种水印算法层出不穷,水印的隐藏位置也不再局限于上述几种。应该说,只要构成一种信号变换,就有可能在其变换空间上隐藏水印。

下面介绍一种简单文本信息隐藏方法:

文本信息隐藏是通过改变文件模式或改变文本的某些基本特征实现信息嵌入的方法,它使文档产生一定的变化,但是这种变化对人的视觉是不可见的。与图像和声音文件相比,在文本里面隐藏信息是比较困难的,因为它几乎不包含任何冗余信息,因此在文本里面隐藏信息必须寻找那些不易引起视觉感知的方法。

在Word文档中实现信息隐藏的方法是改变文档中字符的间距离。在一篇正常的文档中字符间距通常是标准形式,即字符间距离为0磅,也可以将某两个字符的间距设为0.1磅。例如,或需要隐藏一个二进制串01100101(即字符a),此时可以在Word文档中栽个位置开始的连续9个字符的文本串,将其中的两两字符间距分别设为0磅、0.1磅、0.1磅、0磅、0磅、0.1磅、0磅、0.1磅,这样实现信息的隐藏。提取过程与此相反,根据文档字符间的不同间距形成被隐藏的二进制串。

下面分析该方法的可行性。我们知道人眼无法辨认眼认1/150英寸以内的间距变化,此间距为0.16993mm,而本文所采用的0.1磅间距变化为0.05405mm,此间距变化小于人眼能辨认1/150英寸的值。下面是利用该方法的实验结果。下一行是Word文档中字符间距全为0磅的正常显示样式:

在在在在在在在在在在在在在在

下一行是在其中隐藏了01100101二进制串的文本显示样子:

在在在在在在在在在在在在在在

大量的实验结果也显示,这样的间距变化是人眼是几乎无法辨认的。利用上述方法在Word中实现信息隐藏的关键是如何控制和提取文档中字符的间距。VBA语言是针对微软Office文档进行操作的语言,它可以对Office文档的各种操作进行编程。下面给出该方法的实现算法和程序的主要流程:

‘ch变量中的每一个二进制位利用位运算分别取出来,以设置文档中被选中的两个字符间距,上述Hide宏实现了在Word文档中隐藏一个8位的二进制串(即一个英文字符),若需要隐藏一个字符串,则只需重复上述过程。

该算法给出在文档中确定位置的隐藏和提取,在实际应用也可以采用非确定的位置,如按照文件中某些特征确定隐藏位置,也可以将隐藏的位置分散到文档中的不同位置。该方法对于信息的隐藏量是比较高的,若一篇文档有5001个字符,则最多可隐藏5000个二进制位。另外,也可以采用间距变化分别为0磅、0.1磅、0.2磅与0.3磅实现四进制数位的隐藏,但这样会加大字符间距变化的幅度,可能会引起怀疑。该方法的缺点是在文档进行重新排版时,所隐藏的信息会丢失或产生错误;也正是由于这个特性,可以利用它实现Word文档中的数字水印,起到一定的产权保护作用。

3 结论

信息隐藏及数字水印技术是近几年来国际学术界兴起的一个前沿研究领域。它与信息安全、信息隐藏、数据加密等均有密切的关系。特别是在网络技术和应用迅速发展的今天,水印技术的研究更具现实意义。今后水印技术的研究仍将着重于顽健性、真伪鉴别、版权证明、网络快速自动验证以及声频和视频水印等方面,并将与数据加密技术紧密结合,特别是顽健性和可证明性的研究。水印的顽健性能体现了水印在数字文件中的生存能力,当前的绝大多数算法虽然均具有一定的顽健性,但是如果同时施加各种图像攻击,那么这些算法均会失效。如何寻找更加顽健的水印算法仍是一个急需解决的问题。另外当前的水印算法在提供可靠的版权证明方面或多或少有一定的不完善性,因此寻找能提供完全版权保护的数字水印算法也是一个重要的研究方向。

参考文献

[1]张文俊.数字媒体技术基础[M].上海:上海大学出版社,2007.

[2]Petzold C.Windows程序设计[M].5版.北京:北京大学出版社,2006.

文本数字水印算法研究篇4

随着企事业单位对各种文本资料、档案的数字化保存, 对文本信息的版权保护、防篡改、注释、拷贝保护的要求也日益迫切, 由于不能破坏原始文本信息的内容, 文本数字水印技术在此领域得到了长足的发展。

对于文本数字水印嵌入和提取技术, 纵观近几年来相关的报道和文献。从整体框架构思到具体实现细节, 可以说是百花齐放, 设计思想往往取决于研究人员的研究背景和不同的入手角度。一般来讲, 主要包括以下几个方面。

1.1 基于文本格式信息的方法

1.1.1 字符间距调整的方法[1]

在文本中, 字符或单词之间存在一定的空白间距, 间距调整就是将不同的间距表示为不同的隐藏编码, 按照要嵌入的数字水印的编码, 对文本中的字符或进行水平移动来实现水印嵌入。

这种方法水印容量大, 对以拉丁字母为基础的语系 (如英语) 有一定优势, 但对于类似中文这样的方块文字为基础的语言, 由于不存在英文意义下的字符间距, 水印的嵌入比较困难。

1.1.2 文本行距调整的方法[2]

该方法与字符间距调整的方法类似, 不同的是将字符间距的调整修改为字符行距的调整。该方法的优点是可以适用于绝大多数语言。

1.1.3 利用字符特征嵌入的方法[3]

文本文件中的字符具有字体、颜色、高度、宽度、是否有下划线、是否为斜体等各种特殊的特征属性, 该方法通过调整字符特征来嵌入隐藏编码。

1.2 基于不可见字符的方法[4]

利用不可见字符的冗余性和隐蔽性来嵌入水印, 典型的方法有替代法和追加法。替代法就是对已有的不可见字符进行替换, 使得替换后的不可见码对应水印编码。追加法就是在文本的空白区追加不可见字符来嵌入水印信息。

1.3 基于文本内容的方法

基于文本内容的方法主要有同义词替换技术[5]、句法调整技术[6]等。同义词替换技术就是将原词使用同义词替换来映射水印信息, 句法调整技术通过主动句与被动句、顺装句与倒装句等的句法调整来嵌入水印信息。

1.4 基于图像水印技术的方法

较为普遍的文本数字水印技术就是基于图像水印技术的方法。将文本转化为图像的形式进行保存, 然后利用图像水印技术加入水印信息。例如通过修改图像黑白像素的奇偶性[7]、图像黑白像素的比例[8], 或通过对图像进行离散余弦、离散小波、离散傅里叶变换后嵌入水印[9,10]。

本文提出了一种基于图像处理的防篡改脆弱文本数字水印算法。首先给出了数字水印的嵌入和提取算法, 然后给出了实验结果。特别是将文本信息转换为图像信息, 然后通过将图像像素的值进行阶梯分段的方式嵌入数字水印信息, 在偶数段嵌入0, 在奇数段嵌入1。通过在图像信息中嵌入数字水印, 不仅提高了嵌入水印的信息承载量, 还增强了信息正常处理的鲁棒性, 对恶意的攻击和篡改又很敏感。

2 基于图像处理的防篡改脆弱文本数字水印算法

本文算法克服现有技术中存在的文本数字水印很容易被误过滤的问题和缺陷, 提出了一种基于图像处理、防篡改的脆弱文本数字水印算法。

该算法所述一种防篡改的文本脆弱数字水印嵌入和提取的方法包括以下模块:

(1) 将文本信息转换为图像信息来嵌入水印, 提高信息的承载量和水印对攻击的鲁棒性。

(2) 将图像像素的值进行阶梯式分段, 根据嵌入水印值而将对应像素的值调整到最接近的分段内。此方法对正常的信息处理有一定的鲁棒性, 但对于第三方的恶意攻击又很敏感, 特别适合作为防篡改的技术。

数字水印嵌入与提取的实施过程如图1所示。

该算法嵌入的数字水印是有意义的二值图像, 使用系数所在数据段的奇偶性来表示0或者1。如果系数值在偶数数据段内表示0, 属于奇数数据段表示1。

该算法首先将数字文本信息转换为数字图像进行保存, 得到原载体图像, 将原载体图像像素的取值范围0~255, 以4为段长, 分为64段。如果要嵌入1, 将相应位置上的系数值进行调整, 使得对应位置上系数属于奇数段;如果要嵌入0, 则反之。

提取水印的过程跟嵌入水印的过程是一样的, 根据嵌入水印载体对应位置上系数属于奇数段或偶数段来提取0或者1。

2.1 数字水印嵌入

该算法所述一种防篡改的文本脆弱数字水印嵌入的方法包括以下步骤:

第一步, 设原载体文本信息为X, 数字水印图像为W。将X转换为数字图像信息, 得到载体图像信息XX。设XX的宽为M, 长为N。

第二步, 文本信息转换为图像信息, 一般为灰度图像, 每个像素的取值范围为0~255。以4为段长, 将取值范围分为64段。

第三步, 计算出XX对应位置上系数所在数据段的奇偶性。如果要嵌入0, 使得XX (i, j) 的值调整到偶数段;如果要嵌入1, 使得XX (i, j) 的值调整到奇数段, 其中1≤i≤M, 1≤j≤N。

下面结合图1对嵌入水印的过程做个详细描述:

第一步, 设原载体文本信息为X, 数字水印图像为W。将X转换为数字图像信息, 得到载体图像信息XX, XX为灰度图像, 每个像素点值的取值范围为0~255。设XX的宽为M, 长为N。设W的宽为M, 长为N。M和N均为整数。

第二步, 将0~255以4为段长, 等间距分为64段, 形成0, 1, 2, 3, …, 63等64个数据段, 根据每个段序号的奇偶性, 分为32个偶数段, 32个奇数段。偶数段有0, 2, 4, 6, …, 62等32个数据段, 奇数段有1, 3, 5, 7, …, 63等32个数据段。

第三步, 根据数字水印图像每个像素的值, 调整XX每个像素的大小。设嵌入水印的载体图像为XX1。如果W (i, j) 等于0, 且XX1 (i, j) 的值不在偶数段范围内, 使得XX1 (i, j) =XX (i, j) +4, 将XX (i, j) 的值移入偶数段, 当XX (i, j) 的值在第63数据段时, 使得XX1 (i, j) =XX (i, j) -4, 将XX (i, j) 的值移入第62数据段;如果W (i, j) 等于1, 且XX1 (i, j) 的值不在奇数段范围内, 使得XX1 (i, j) =XX (i, j) +4, 将XX (i, j) 的值移入奇数段。

按照刚才的处理, 得到含水印的载体图像XX1。

2.2 数字水印提取

该算法所述一种防篡改的文本脆弱数字水印提取的方法包括以下步骤:

第一步, 设嵌入水印的载体图像为XX1, 将XX1每个像素的取值范围 (0~255) 以4为段长, 分为64段。XX1的宽为M, 长为N。

第二步, 判断XX1对应位置上系数所在数据段的奇偶性, 如果XX1 (i, j) 所在数据段为偶数段, 则W (i, j) =0;如果为奇数段, 则W (i, j) =1。其中

根据图1对提取水印的过程做个详细描述:

第一步, 设含有水印的载体图像为XX1, XX1每个像素的取值范围为0~255。将0~255以4为段长, 等间距分为64段, 形成0, 1, 2, 3, ……, 63等64个数据段, 根据每个段序号的奇偶性, 分为32个偶数段, 32个奇数段。偶数段有0, 2, 4, 6, ……, 62等32个数据段, 奇数段有1, 3, 5, 7, ……, 63等32个数据段。

第二步:根据XX1每个位置上系数所在数据段序号的奇偶性来提取数字水印。如果XX1 (i, j) 所在数据段为偶数段, 则W (i, j) =0;如果为奇数段, 则W (i, j) =1。其中1≤i≤M, 1≤j≤N。

遍历完XX1所有位置的系数, 就得到了需要提取的数字水印图像。

3 实验结果

本实验使用Matlab2010a版本, 测试所用载体图像为548×774大小的文本图像, 如图2。水印图像为548×774的二值图像, 如图3。嵌入水印的载体图像如图4, 提取出的水印图像如图5。含水印载体进行直方图处理后的效果如图6。

原始载体图像与嵌入水印的载体图像的相关系数为0.999 525。

原始水印图像与提取出的水印图像的相关系数为1。

嵌入水印后的载体图像信噪比为17.146 1 db。

4 小结

采用该算法所述方法, 经过实验验证, 水印隐蔽性好, 可以抗图像亮度调整、对比度调整、椒盐噪声、乘性噪声、高斯噪声、低通滤波、JPEG压缩各种攻击, 对含水印的载体进行直方图处理后, 水印会在载体图像的背景中显现。水印对于正常数据处理的鲁棒性强, 而对于裁剪、内容篡改等恶意攻击行为敏感, 是一种可行的保护文本信息的脆弱数字水印实施方案。

摘要：提出了一种基于图像处理的防篡改脆弱文本数字水印算法。将文本信息转换为图像信息, 并且将图像像素的值进行阶梯式分段。根据嵌入水印值而将对应系数值调整到最接近的分段内的方式来嵌入水印。提取水印的方式是嵌入水印的逆过程。通过实验验证, 该算法隐蔽性比较好, 对正常的信息处理有一定的鲁棒性;但对于第三方的恶意攻击又很敏感, 特别适合作为防篡改的技术, 是一种可实用的防篡改脆弱数字水印算法。

关键词：数字水印,信息隐藏,文本

参考文献

[1] Low S H, Maxemchuk N F.Performance comparison of two Text making mechods.IEEE Journal on Selected Areas in Communications, 1998;16 (4) :561—572

[2] Craver S, Memon N, Yeo B L, et al.Resolving rightful ownerships with invisible watermarking techniques:limitations, attacks and implications.IEEE Journal on Selected Areas in Communications, 1998;16 (4) :573—586

[3] 弋英民, 李人厚, 梅时春, 等.一种基于文本行和对角侧面特性的数字水印方法.小型微型计算机系统, 2005;26 (2) :293—296

[4] Ahern K.Invisible encoding of attribute data in character based documents and files.United States Patent, 09/333, 632, 1999/6/15

[5] Atallah M J, McDonough C J, Raskin V.Natural language processing for information assurance and security:an overview and Implementations.NSPW'2000:Proceedings of Workshop on New Paradigms in Information Security, New York:ACM press, 2000:51—65

[6] Atallah M J, Raskin V, Hempelmann C F.Natural language watermarking and tamperproofing.In:5 th Information Hiding Workshop (IHW) 2002, USA, 2002:196—212

[7] Zhao J, Koch E.Embedding robust labels into images for copyright protection.Proceedings of the International Congress on Intellectual Property Rights for Specialized Information Knowledge and New Technologies, Austria, 1995:242—251

[8] Min W, Tang E, Lin B.Data hiding in digital binary image.IEEE International Conference on Multimedia and Expo, USA, 2000;1:393—396

[9] 周亚训, 叶庆卫, 徐铁峰.一种基于小波多分辨率数据组合的文字水印方案.电子学报, 2000;28 (6) :1693—1695

数字水印算法的分析研究篇5

1数字水印的应用领域

1.1版权信息跟踪和保护为了对多媒体数据进行保护, 于是会通过将数字、序列号、文字、图像标志等版权信息对数字媒体进行保护, 而为了对这些版权信息进行保护, 要通过数字水印技术就可以完成版权信息的跟踪和保护。

1.2鉴定真假检测当前信息的真假, 使得信息不能够轻易的被篡改或者是被改造, 与此同时能够正确的检测到, 相对而言, 被误检的概率相对较低, 当本身的内容发生更改时, 数字水印信息也要随机发生变动。因此对当前数字媒体信息的真假可以进行鉴定。

1.3信息隐蔽对数字媒体信息进行保护的同时, 在不让本身的媒体信息受到影响的前提下, 又可以使得版权标志信息可以很好的隐蔽在主信息中, 这样可以更好的对数据媒体信息进行保护。

2现有数字水印算法分析

从数字水印的相关特性上来说, 数字水印分为脆弱、半脆弱、鲁棒性字水印。

2.1鲁棒数字水印在著作权进行保护的过程中, 可以数字作品的版权的相关信息, 后期可以进行各种各样的编辑处理, 鲁棒数字水印就可以针对这一问题得到很好的解决。文献中提出是基于二维超混沌序列能够与离散小波变换进行结合。1将图像进行加密, 通过将上面二者结合起来;2彩用二维DWT对图像在YIQ色彩空间中的Y分量进行4级分解, 主要是根据人眼的相关特性;3对水印图像进行加密的相关处理后, 再嵌入到主图像Y分理的DWT域m。这种算法具备了一定的鲁棒性与不可见性, 但是也存在一些不足, 针对抵抗小信号的滤波鲁棒性是比较差的。

2.2脆弱数字水印脆弱数字水印, 在验证数字水印版权信息的可信度及完整性方面, 通过对数字媒体作品和被破环的相关情况进行跟踪, 定位到被篡改区域, 对所修改的内容具有一定的敏感性。

文献中提出了一种基于混沌系统的脆弱性的水印算法。这个算法:1将图像的LSB位平百乾地置零处理, 再对图像可以进行不重叠分块;2得到每一灰度图像的平均值;3映射为二值序列, 通过使用混沌系统;4嵌入水印信息, 在LSB平面。

通过图像置乱算法的相关处理, 使得系统的字全性也就相对提高了。

文献实验结果表明, 对于敏感性加强, 在确定被篡改的位置得到比较大的提高, 但是在整个系统中, 用户的关键密钥KEY成了依赖。混沌序列要得到重构也将会非常的困难, 因此, 具备了一定的安全性。

2.3半脆弱数字水印基于之前两种数字水印算法, 可以允许数字水印在一定程度上可以失真, 而且可以取得被篡改、被篡改的程序、类型进行鉴定, 定位, 较强的敏感性是基本需求。而且可以对被修改的部分进行恢复, 在应用方面相对会更加的广泛。

3典型数字水印算法

下面是对一些典型的数字水印算法进行分析, 有部分算法也可以应用在音频与视频数字媒体之中。

3.1空域算法此算法, 主要是选取了图像中像素点中最不起眼的像素位置, LSB, least significant bits, 将信息嵌入到随机选择的图像的这个位置上。然而也有一定的不足, 当图像进行攻击之后, 此位置是不重要的, 此算法的鲁棒性也就会相对而言弱一些的。因此, 还有一种较常用的算法, 则是在像素的高度值中进行统计, 将水印信息进行嵌入。

3.2 Patchwork算法Patchwork算法, 随机选取M对像素点 (xi, bi) , 分别将ai, bi的亮度值增、减1, 对参数进行适当的调整。因此, 对图像进行裁剪等相关操作, 适当调整一下参数, 可进行JPEG压缩、 FIR滤波处理。不足之处是, 对所能嵌入的图像信息量, 有一定的限制, 解决这一问题, 则可以对图像进行分块操作, 然后再将每一块的图像信息作为水印信息进行嵌入操作, 这样在一定的层度上, 也就增长了能嵌入的水印的信息量。

3.3变换域算法变换域相关算法, 主要是首先对图像离散余弦DCT变换;再在图像的低频分量上找到幅值系统K, 图像在DCT域中。主要是体现在数字作品的版权保护方面, 有较强的抗攻击的能力, 但数据量是比较小。用离散小波变换 (DWT) 转化或者是离散傅里叶变换 (DFT) 对数字图片的空间域向频域系数进行转化。然后再编码, 主要是由类型确定。再选择高、中、低频系统序列。再对选好的频域系列的序列进行修改。最后, 通过数字图像的频域系数对得到的空间域数据进行反变换。

3.4压缩域算法此算法在数字电视广播及VOD有较好的应用。用漂移补偿方案, 对因为水印信息号的引入所导致的视觉变形抵消。

3.5 NEC算法该算法由NEC实验室的Cox等人提出, 针对人感觉最重要的部分进行嵌入, 因此它增强了水印鲁棒性和高攻击性。

3.6生理模型算法生理模型算法优点是具有好的透明性和强健性, 主要是在人的视觉和听觉系统, 用于压缩多媒体数据以及数字水印。

参考文献

[1]车生兵, 黄达, 李光.基于视觉特性的半脆弱水印算法[J].通信学报, 2007, 28 (10) .

[2]车生兵, 黄达, 李光.基于视觉特性的半脆弱水印算法[J].计算机工程, 2008, 34 (11) .

[3]王向阳, 杨红颖, 邬俊.一种基于自适应量化的半脆弱图像水印算法[J].小型微型计算机系统, 2006, 27 (5) .

[4]吴亚榕.基于DCT变换的半脆弱图像水印算法[J].软件导刊, 2012 (10) .

[5]于平平.基于VLSI实现的数字图像水印技术研究[D].2010.

[6]陈国峰.基于图像的半脆弱数字水印研究[D].2007.

基于QIM的数字图像水印算法研究篇6

关键词：数字水印,QIM,Matlab

1 引言

随着通信技术、计算机技术的飞速发展以及计算机网络的广泛应用, 数字产品如图像、视频、音频等的版权日益引起人们的关注, 其中数字水印作为一种有效的手段得到了广泛的注意。它利用数据隐藏技术将特定的信息隐藏在数字产品中达到标示和保护著作权的作用[1,2]。

量化索引调制算法 (QIM) 是麻省理工大学的Chen和Wornell提出的一种经典的水印算法, 能在获取较高的鲁棒性同时, 具有较小嵌入失真[3]。QIM算法的水印系统不仅容量大而且计算简单, 因此, 引起了广大研究者的重视。

2 QIM (Quantization Index Modulation) 算法

QIM算法的主要思想是:根据水印信息, 把原始载体数据用量化器量化到不同的索引区间, 水印检测时则根据调制后的数据所属的量化索引区间来识别水印信息。QIM算法的嵌入函数为: S (X, W) =QW (X) (1)

式中X和W分别是宿主信号和水印信息, QW (·) 为水印量化器, S是量化器的输出值。

图1给出了量化器为均匀量化步长时的抖动调制示意图。图中量化器Q (;W) 用于嵌入水印信息w∈﹛0, 1﹜。符号◇和○标记的值分别属于量化器Q (;0) 和Q (;1) 。调制方法为:若W=0, 则用Q (;0) 将宿主信号X量化为最相近的◇值;若W=1, 则用Q (;1) 将X量化为最相近的○值。

在接收端, 水印信息可以从有噪的相应水印信号S'中提取, 如果S'是Q (;0) 的输出值, 那么嵌入的水印比特被译码为‘0’;若S'是Q (;1) 的输出值, 则提取的比特为‘1’。

3 实验与分析

为了检验QIM算法的性能, 本节将给出算法的实验结果。实验中所使用的载体图像是512×512大小的Lena的8bit标准灰度图像, 采用64×64大小的有“惠经”字样的二值水印图像。数字水印的嵌入有两个基本要求, 一个是不可见性, 另一个是鲁棒性。实验中我们使用峰值信噪比PSNR值和归一化相关来系数NC值分别作为不可见性和鲁棒性的评价标准。

算法不可见性:

如图2所示, 算法嵌入水印的不可见性好, PSNR=42.0341。

算法鲁棒性

在实验中, 我们对含水印图像分别进行添加椒盐噪声、中值滤波和剪切攻击三种常见的攻击后提取水印信息。由图3可见, 含水印图像受到常见攻击后算法能正确地检测出水印。

4 结论

综上所述:QIM算法在透明性好的前提下可以在椒盐噪声、中值滤波和剪切攻击下能正确提取水印信息, 即QIM水印算法能在获取较小嵌入失真同时, 具有较高的鲁棒性。

参考文献

[1]葛秀慧, 田浩, 郭立甫, 等.信息隐藏原理及应用[M].北京:清华大学出版社.2008.

[2]张悦, 舒华忠, 伍家松, 等.一种基于新的正交复数变换的鲁棒水印算法[J].电子学报.2013 (41) :1574-1579.

试论数字图像水印算法的研究与实现篇7

1 数字水印技术特点

数字水印系统具有如下特点:(1)隐蔽性。也就是透明性,要求嵌入水印之后,载体具有足够的感知度。要求嵌入数字水印后,数字产品不会出现显著的降质,且不会被察觉。(2)鲁棒性。鲁棒性指的是对数字水印系统的常规处理能力加以评估,经过多重信号处理后,数字水印依然能够确保其完整性,仍能受到科学的鉴别。(3)容量。容量指的是系统所能承载的最大的有效数据量。对于水印系统而言,要求所嵌入信息应足以表达特定信息,并能够对版权问题加以解决,确保用户权益。(4)安全性。指的是系统能够抵抗蓄意攻击的能力,要求其嵌入算法具有较强的抵御攻击水平,水印检测及提取方法对于未授权者绝对保密,难以轻易加以破解。(5)自恢复性。系统经过处理、变换之后,会引发原图的破坏,自恢复性指的是通过所留片段数据,可以将水印信息恢复,恢复时不需要最初图像。在所有特点中,隐蔽性、鲁棒性、容量三大特征最为关键,其相互矛盾、彼此制约,在应用过程中很难实现兼顾,其实,对于所有数字水印方案而言,只能结合实际情况,从三者中寻求一个平衡点。

2 数字图像水印的几种主要算法

2.1 空域算法

该算法是最早提出的一种水印算法,以最低有效位算法为例进行说明,其指的是采用水印信息代替传统的图像所进行的一种算法。该图像很容易实现,主要利用模运算对水印嵌入的位置进行计算,并利用比特位对信息加以隐藏。其主要通过原始图像像素选择,将被选像素及邻域像素的大小关系进行调整,并将其嵌入水印。还可以采用量化策略,实现水印图像的嵌入,虽然此种算法简单,所隐藏的信息量大,但任何滤波器都能够改变值,因而鲁棒性差,不适用于最低有效位(Least Significant Bit,LSB)算法系统。

2.2 变换域算法

鉴于空域法较差的鲁棒性,变换域算法应运而生。其通过将水印信息嵌入图像某个变换域中,再利用反变换,实现水印能量的分散,极大地隐藏了水印图像,提高了其水印嵌入强度,同时,确保了其不可见性。以离散余弦变换为例,进行分析。该技术应用十分广泛,为了理解此种方法的优越性,需要对其进行定义。

对于离散余弦反变换而言,进行如下定义:

当图像像素矩阵变换后,所得频域矩阵左上角具有最大的元素值,属于直流分量,表示的是图像的整体亮度平均值。剩余元素值逐步降低,中、低频代表的是图像平滑区域,高频为图像边缘、复杂区域。如此可以利用双离合变速器(Dual Clutch Transmission,DCT)将其各特征区域进行区别,并根据要求选取相应区域嵌入水印。

2.3 盲水印法

应用过程中,很多情况下用户希望自主进行水印检测,但原始数据难以获得,此时需要利用盲水印算法进行解决。下文通过实例,提出了一种通过图像变换域上运用业务支撑系统(Business Support System,BSS),实现水印图像的盲检测的一种算法。该算法所选择的是二值图像作为水印,由于其具有良好的鲁棒性,能够有效嵌入图像中,并达到不可见等要求,因而近些年来应用十分成熟。

(1)水印的生成。在该算法中,水印分别被嵌入经小波分解的原始图像水平、垂直细节分量中,确保了其尺寸小于原图像的1/2。在算法中,选取二值图像作为其水印图,并将其转换为像素值为0,1的图像,经自上而下、自左向右的扫描,转换为0﹣1序列w。具体而言,原始图像属于N×M灰度图像I,水印S属于N×M二进制样本,且“0”和“1”的量一致。也就是:S={s IJ},i={0,1,…,N﹣l},j={0,1,…,M﹣1},s IJ={0,l}。根据原始图像将其划分为大小均等的子集A、B。其中,A={v IJ|s IJ=1},B={v IJ|s IJ=0}。

(2)水印嵌入。仍采用变换域法思想,以离散小波变换(Discrete Wavelet Transform,DWT)方法为基础,在原始图像小波域上将水印成功嵌入,再利用IDWT取得水印图像。在嵌入操作时,先生成了集合C={v IJ⊕k|v IJ∈A},再将集合B,C加以合并,得到了水印化图像I=C∪B。由于k值足够小,因而可以确保视觉的不可见性。任取其中一行向量作为水印向量,另一个作为密钥向量。最终获取水印、密钥向量作为新分量,结合伪随机序列将其置于原小波分量中,并对其进行重构,分别获取水印、密钥图像。

(3)水印提取。在嵌入中,采用的是线性叠加方式,将其嵌入图像中,也形成了相应的线性瞬时混合模型,为获取嵌入水印,通过盲源分离进行水印提取。本文采用的是自然梯度算法,将水印、密钥图像分别进行小波分解,获取低、高频子带。在高频子带中,选择水平、垂直两大分量作为待选区间。并输入密码获得伪随机序列,利用该序列获取待选区间中的分量系数,这样,水印、密钥分量系数共同构成观察信号。经反馈网络学习规则训练获取分离矩阵W,其中一个是水印向量,将两大行向量均从一维序列转换为二维图像,经过两幅图像内容的判断,获取水印图像,通过水印后处理,得到较好的图像质量。

(4)鲁棒性实验。本文选取256×256灰度图作为原始图,水印化图像为64×64二值图。原始图像通过小波分解,获取水印图像,嵌入强度为0.05。图1为多次运算中每一次提取出的水印图像。

根据图1(a)和图1(b),原始图和水印化图几乎无差别,已经达到了不可见性等的要求。实验显示,水印提取时每次运算所得图像的质量并不一致。甚至得到与原始水印图反色的图像,需要将所求得像素值取绝对值恢复为同原始水印相同的黑底、白字。图像质量存在降低现象,由于水印图像的二值性,可将其反色问题忽略。通过进行鲁棒性测试,对水印化图像进行处理,考察借助于算法嵌入的鲁棒性强弱,经加噪、剪切、灰度调整、JPEG压缩和缩放等一系列处理,得到最终的水印图像。结果显示,该算法具有较好的鲁棒性,且能够嵌入较大信息量,满足了盲水印方案的具体要求。

3 结语

在数字图像水印算法中,空域法是一种最早的算法,具有简单、隐藏量大等优势。但是,在图像压缩、处理中鲁棒性能较差,更多的用于无过多处理的图像中。变换域法具有良好的鲁棒性,但是变换、反变换所需计算时间长,操作不易。对于稳健性攻击而言,往往需要利用嵌入模板水印傅里叶变换(Discrete-Fourier Transform,DFT)信息对其进行抗旋转操作,而可以抵抗此类操作的水印算法仍是当前该领域的难点,也是研究的热点。

参考文献

[1]易开祥,王铁,石教英.基于DCT域的自适应二维数字水印系统[J].计算机应用,2010(8):112-115.

文本数字水印算法研究篇8

数字水印技术通过在原始媒体数据中嵌入秘密信息—————水印来证实该数据的所有权归属。水印可以?是代表所有权的文字、产品或所有ID、二维图像、视频或音频数据、随机序列等,主要应用于媒体所有权的认定(即辨认所有权信息、媒体合法用户信息),媒体的传播与算法研究,为实现有效的信息版权保护提供了一种重要的手段。

1 数字水印的基本原理

从图像处理的角度看,嵌入水印信号可以视为在强背景下迭加一个弱信号,只要迭加的水印信号强度低于人类视觉系统(Human Visual System,HVS)的对比度门限,HVS就无法感到信号的存在。对比度门限受视觉系统的空间、时间和频率特性的影响,因此通过对原始信号作一定的调整,有可能在不改变视觉效果的情况下嵌入一些信息。从数字通信的角度看,水印嵌入可理解为在一个宽带信道(载体图像)上用扩频通信技术传输一个窄带信号(水印信号),尽管水印信号具有一定的能量,但分布到信道中任一频率上的能量是难以检测到的。水印的译码(检测),即是在有噪信道中弱信号的检测问题。

一般来说,为了使水印能有效地应用于版权保护中,水印必须满足以下特性:

1)隐蔽性。水印在通常的视觉条件下应该是不可见的,水印的存在不会影响作品的视觉效果。

2)鲁棒性。水印必须很难去掉(希望不可能去掉)。当然,在理论上任何水印都可以去掉,只是要对水印的嵌入过程有足够的了解,但是如果对水印的嵌入只是部分了解的话,任何破坏或消除水印的企图都应导致载体严重的降质而不可用。

3)抗窜改性。与抗毁坏的鲁棒性不同,抗窜改性是指水印一旦嵌入到载体中,攻击者就很难改变或伪造。鲁棒性要求高的应用,通常也需要很强的抗窜改性。在版权保护中,要达到好的抗窜改性是比较困难的。

5)安全性。应确保嵌入信息的保密性和较低的误检测率。水印可以是任何形式的数据(如数值、文本、图像等),所有的水印都包含一个水印嵌入系统和水印恢复系统。

6)低错误率。即使在不受攻击或者无信号失真的情况下,也要求不能检测到水印(漏检,false-negative),以及不存在水印的情况下而检测到水印(虚检、false-positive)的概率必须非常小。

2 数字水印典型算法分析

近几年来,数字水印技术研究取得了很大的进步,这里对一些典型的算法进行分析。

2.1 空间域算法

数字水印直接加载在原始数据上,可以细分为如下几种方法[1,2,3,4]:

1)最低有效位方法(LSB)。

这是一种典型的空间域数据隐藏算法,L.F.Tumer与R.G.Van Schyadel等先后利用此方法将特定的标记隐藏于数字音频和数字图像内。该方法是利用原始数据的最低几位来隐藏信息(具体取多少位,以人的听觉或视觉系统无法察觉为原则)。该方法的优点是有较大的信息隐藏量,但采用此方法实现的数字水印很脆弱,无法经受一些无损和有损的信息处理,而且如果确切地知道水印隐藏在几位LSB中,数字水印很容易被擦除或绕过。

2)Patchwork方法及纹理块映射编码方法。

这两种方法都是Bender等提出的。Patchwork是一种基于统计的数字水印,其嵌入方法是任意选择N对图像点,在增加一点亮度的同时,降低另一点的亮度值。该算法的隐藏性较好,并且对有损的JPEG和滤波、压缩和扭转等操作具有抵抗能力,但仅适用于具有大量任意纹理区域的图像,而且不能完全自动完成。

2.2 变换域算法

基于变换域的技术可以嵌入大量比特数据而不会导致可察觉的缺陷,往往采用类似扩频图像的技术来隐藏数字水印信息。这类技术一般基于常用的图像变换,基于局部或是全部的变换,这些变换包括离散余弦变换(DCT)、小波变换(WT)、傅氏变换(FT或FFT)以及哈达马变换(Hadamard transform)等。

其中基于分块的DCT是最常用的变换之一,现在所采用的静止图像压缩标准JPEG也是基于分块DCT的。最早的基于分块DCT的一种数字水印技术方案是由一个密钥随机地选择图像的一些分块,在频域的中频上稍稍改变一个三元组以隐藏二进制序列信息。选择在中频分量编码是因为在高频编码易于被各种信号处理方法所破坏,而在低频编码则由于人的视觉对低频分量很敏感,对低频分量的改变易于被察觉。该数字水印算法对有损压缩和低通滤波是稳健的。另一种DCT数字水印算法[5]是首先把图像分成8×8的不重叠像素块,在经过分块DCT变换后,即得到由DCT系数组成的频率块,然后随机选取一些频率块,将水印信号嵌入到由密钥控制选择的一些DCT系数中。该算法是通过对选定的DCT系数进行微小变换以满足特定的关系,以此来表示一个比特的信息。在水印信息提取时,则选取相同的DCT系数,并根据系数之间的关系抽取比特信息。

除了上述有代表性的变换域算法外,还有一些变换域数字水印方法,它们当中有相当一部分都是上述算法的改进及发展,这其中有代表性的算法是I.Podichuk和ZengWenjun提出的算法[6]。他们的方法是基于静止图像的DCT变换或小波变换,研究视觉模型模块返回数字水印应加载在何处及每处可承受的JND(Just Noticeable Difference,恰好可察觉差别)的量值(加载数字水印的强度上限),这种水印算法是自适应的。

2.3 NEC算法

该算法由NEC实验室的Cox[5]等人提出,该算法在数字水印算法中占有重要地位。其实现方法是,首先以密钥为种子来产生伪随机序列,该序列具有高斯N(0,1)分布,密钥一般由作者的标识码和图像的哈希值组成,其次对图像做DCT变换,最后用伪随机高斯序列来调制(叠加)该图像除直流分量外的1000个最大的DCT系数。该算法具有较强的鲁棒性、安全性、透明性等。

2.4 其他一些水印算法

1)近年来,利用混沌映射模型实现数字水印、保密通信等成为混沌应用研究的热点。特别是自从Cox等借用通信技术中的扩频原理将水印信号嵌入到一些DCT变换系数或者多层分解的小波变换系数以来,人们已经提出了一些混沌数字水印方法。水印的嵌入与检测是基于人类视觉系统(HVS)的亮度掩蔽特性和纹理掩蔽特性,折衷水印的不可见性和鲁棒性之间的矛盾。结果表明,该方法嵌入的水印具有不可见性和鲁棒性,并且这种基于密钥的混沌水印方法更好的抗破译性能。

2)目前比较流行的还有一种基于盲水印检测的DWT算法。该算法首先对原始图像进行小波变换,根据人类具有的视觉掩蔽特性对低频分量进行一定的量化,同时可不影响视觉效果,并对作为水印的图像进行压缩和二值化处理,形成一维的二值序列,根据二值序列的值对上述量化后的原始信号的低频分量进行视觉阈值范围内允许的修改,从而实现水印的嵌入。水印提取过程是对含有水印的图像进行小波变换,对低频分量同样进行量化处理,为了增大算法的安全性,可以对水印形成的二值0,1序列在嵌入前进一步进行伪随机序列调制,相应地在水印提取过程需要增加用伪随机序列解调的步骤。这样,不知道伪随机序列的攻击者即使推测出水印的嵌入规律,也无法提取水印,大大增加了水印系统的透明性和鲁棒性。

3 水印技术的局限

为了对版权保护中使用水印的成功可能性进行评估,看能否满足实际应用需求,就需要对水印技术有更多了解。下面研究数字水印方案普遍存在的一些局限。

1)不知道能够隐藏多少位。尽管非常需要知道指定大小载体信息上可以隐藏多少比特的水印信息,但这个问题还没有得到圆满解决。事实上,对给定尺寸的图像或者给定时间的音频,可以隐藏信息量的上界,目前还不清楚。对图像水印,只能说目前使用的算法可以隐藏几百比特位的水印信息。

2)还没有真正健壮的盲图像水印算法。对于图像水印,鲁棒性还是个问题。目前还没有能够在经过所有普通图像处理变换后,仍能幸免的盲水印算法。尤其是能够抵抗几何处理的攻击,被认为是很难实现的目标。

3)所有者能去除标记。迄今为止提出的所有盲图像水印,实际上都是可逆的。已知水印的准确内容以及水印的嵌入和检测算法,则总能在没有严重损坏资料的前提下,使水印不可读取。目前,还不清楚这个缺点在将来还是否存在;同时在设计版权保护系统时,必须考虑如下问题:一旦水印内容已知,则有可能去除水印或者部分水印。

此外,迄今为止提出的水印算法,其可逆性使人们提出极大的疑问,即设计能够抗篡改的健壮公开水印技术是否可能?事实上,如果允许任何人读取水印,则任何人只要知道水印嵌入算法,就可以消除水印。

4 结论

随着电子商务的加速发展和网络用户的直线增长,媒体的安全要求将更加迫切,作为版权保护和安全认证的数字水印技术具有极大的商业潜力,作为一门学科交叉的新兴应用技术,它的研究涉及了不同学科研究领域的思想和理论,如数字信号处理、图像处理、信息论、通信理论、密码学、计算机科学及网络、算法设计等技术,以及公共策略和法律等问题,是近几年来国际学术界才兴起的一个前沿研究领域,得到了迅速的发展。但数字水印技术仍然是一个未成熟的研究领域,还有很多问题需要解决,其理论基础依然薄弱。随着一些先进的信号处理技术和密码设计思想的引进,必将日趋成熟且得到更为广泛的发展应用。

参考文献

[1]Eepa Kundur.Dimitrios hatzinakos.Digital watermarking fortelltale tamper proofing and authentication[J].Proceeding of the IEEE,2007,87(7):1167-1180.

[2]张春田,苏育挺.信息产品的版权保护技术——数字水印[J].电信科学,2006,14(12):15-17.

[3]Bender W,Gruhl D.Techniques for data hiding[J].IBM sys2tem journal,2007,35(3-4):313-336.

[4]Cox I J,Killian J,Leighton F T.Secure spread spectrum wa2termarking for multimedia[J].IEEE transactions on image pro2cessing,2007,6(12):1673-1687.

[5]Zhao J,Koch E.Embedding robust labels into images forcopyright protection[A].In:Proceedings of the knowright'95conference on in-tellectual property rights and new technologies[C].Vienna,Austria,2005:241-251.

本文来自古文书网(www.gwbook.cn)，转载请保留网址和出处

水印认证01-03

小儿健脾颗粒01-03

数据库水印01-03

二值图像水印01-03

冬季安全防火措施01-03

安全防火征文01-03

注：本文为网友上传，旨在传播知识，不代表本站观点，与本站立场无关。若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。E-MAIL：66553826@qq.com