图像嵌入

关键词: 半导体技术 实时性 系统

图像嵌入(精选九篇)

图像嵌入 篇1

嵌入式系统是先进的计算机技术、半导体技术、电子技术和各种具体应用相结合的产物, 是技术密集、资金密集、高度分散、不断创新的新型集成知识系统。它具有系统内核小、专用性强、系统精简、高实时性、多任务等诸多特点。

2 数字图像处理

数字图像处理又称为计算机图像处理, 它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。它以人为对象, 以改善人的视觉效果为目的。常用的图像处理方法有图像增强、复原、编码、压缩等。

3 图像质量评估

图像处理的过程中, 会因压缩、舍弃像素等操作使得图片质量在一定程度上受到损伤, 为了降低这种损伤对图像可视化的影响, 我们需要对图像处理中的相关算法进行评估, 这对影像的后续利用和促进对人类视觉感知的研究具有重要的理论意义。

3.1 PSNR算法

3.1.1 PSNR的定义

PSNR (Peak Signal to Noise Ratio) 是一种利用峰值信噪比来评定图像质量的客观标准, 评价结果以d B (对比分贝) 为单位来表示。2个图像间的PSNR值越大, 越趋于无劣化。劣化程度较大时, PSNR值趋于0 d B。

两个m×n的单色图像I和K, 如果两者的噪声近似, 那么它们的均方差为:

峰值信噪比为:

PSNR=10⋅log10 (MSEMAXI2) =20⋅log10 (MSEMAXI) . (2)

公式 (2) 中:MAXI——图像点颜色的最大数值。

如果每个采样点用8位表示, 那么就是255.

3.1.2 PSNR算法的局限性

PSNR算法能较准确地计算出图像质量的误差值, 并可以结合HVS视觉系统中生理学和心理学的特征, 使用经验公式对误差值进行修正。但该算法也存在一定的局限性, 即人类视觉系统是一种是非常复杂且高度非线性的系统, 但在建立模型的时候, 往往都是以线性结构或者类似线性结构的模型来仿真HVS, 所以这种基于误差敏感度的评估方式是建立在一些理想的假设之上的。

3.2 SSIM算法

SSIM (structural similarity (SSIM) index measurement system) 是一种衡量两幅图像相似度的新指标, 在图像去噪处理和图像相似度评价上已经全面超越了SNR (signal to noise ratio) 和PSNR (peak signal to noise ratio) 。

3.2.1 算法突破

自然图像信号都是高度结构化的, 这种结构化方式体现在图像的像素间都有很强的依赖性, 这些相互依赖的像素就承载着图像重要的结构信息。

结构度相似理论的特点有: (1) 结构相似度理论不再将图片的失真归结于空间上逐点像素信息间的差异, 而是将结构信息从图像中剥离出来, 作为全新的图像质量评价标准; (2) 基于HVS特性的方法与SSIM理论的最大区别是前者是自底向上, 后者是自顶向下; (3) 由于结构相似度理论是直接估计两个复杂结构信号的结构改变, 而不与人类的主观视觉挂钩, 因此这样就可以更客观地评定图像质量。

3.2.2 数学模型

作为实现结构相似性理论的一种方法, 从图像组成的角度出发, 可以将结构相似度指数定义为独立于亮度、对比度之外的反映场景中物体结构的一种信息。在结构相似性的计算中, 可以用均值估计亮度, 用标准差估计对比度, 用协方差度量结构的相似程度。

3.2.2. 1 结构相似度核心算法模型

结构相似度核心算法模型为:

公式 (3) 中:S (x, y) ——最终的度量, 即结构相似值;

l (x, y) ——亮度比较函数;

c (x, y) ——对比度比较函数;

s (x, y) ——结构信息比较函数;

f——对三个分量的调和。

同时, 相似度算法需要满足三个条件:

对称性:S (x, y) =S (x, y) 。

临界值:S (x, y) ≤1.

最大值条件:S (x, y) =1, 当且仅当x=y的时候 (就扩展来说, xi=yi, i=1, 2, 3…N) 。

3.2.2. 2 结构相似度表现模型

结构相似度表现模型为:

公式 (4) 中的α, β和γ都是正数, 用来对三个分量进行加权调和。

3.2.3 算法实现

为简化最终生成的结果, 可以将SSIM值三个分量的权值都设置为1, 即α=β=γ=1.还可以根据多次试验结果来修正这三个分量的权值配比, 从而提高质量评估的精准性。C1, C2和C3都是常量, 因此可以令C3=C2/2.此时, SSIM的表达式可以化简为:C1

对于两幅对比图像的SSIM值, 我们要以均值作为最后的计算结果, 即MSSIM (Mean SSIM) 。MSSIM的计算式为:

3.2.3. 1 求解μx, μy, σx, σy和σxσy的对应值

μx, μy, σx, σy和σxσy对应值的计算方法为:

3.2.3. 2 求解局部均值

局部均值的计算方法为:

3.2.3. 3 计算每个像素块的SSIM值

每个像素块的SSIM值的计算方法为:

3.2.3. 4 求出两幅图像的整体均值结构相似度MSSIM

将所有像素块的 (带高斯权值的) SSIM值进行累加, 然后除以像素块总数, 即可得到对比图像的结构相似度。相同均方误差, 不同SSIM值的图片对比如图1所示。

4 嵌入式中扩展应用

由于SSIM算法运算效率高、应用灵活, 且图像相似度测量的精确度更高, 因此在嵌入式领域中得到了广泛的应用。

4.1 指纹识别

随着越来越多的数据和私人信息流向于手持设备, 信息安全问题逐渐引起人们的重视。根据指纹纹路的各种特征进行建模, 并提取数据样本, 然后使用SSIM算法来计算每次验证指纹时的图像相似度, 从而给出相应的反映。在这一应用中, 指纹的唯一性特征完全可以类比于HVS的特征。

4.2 信号滤波器

在工业领域, 需要对各种传输信号进行过滤, 通常情况下是以频率为基准对信号进行过滤, 但在某些应用领域, 需要先对信号加载的信息进行筛选分析, 然后在对信号进行过滤。在引入SSIM算法对信号进行过滤时, 所选取的参数不再是亮度、对比度、结构信息等, 而是根据不同的信号种类建立不同的参考系, 最终达到信号信息过滤的目的。

5 结束语

随着技术的进步, 图像质量评价算法的研究呈现以下三个趋势, 即从单纯的客观评价算法转化为主客观相结合的评价算法, 无参考算法开始成为研究的热点, 面向具体任务的评价算法逐渐增多。

图像质量评价算法的目标是得到与人的主观评价相一致的评价结果, 任何图像质量评价的结果都要与人们的主观感知保持一致。目前的评价体系都在不同程度结合了HVS的相关特性, 同时还融入了HVS特性的算法, 这种方式比单纯以数据进行客观评价的算法更准确。因此, 主客观结合的评价体系是图像质量评价发展的主流。

摘要:嵌入式设备由于其硬件限制, 在对显示图像进行一系列处理时会对图像的质量造成损害, 进而影响显示效果。为降低损伤的程度, 需要对图像处理的相关算法进行评估。通过对峰值信噪比 (PSNR) 和结构相似度 (SSIM) 两种图像质量评估算法进行比较, 深入分析了图像质量的评估体系, 提高了图像压缩算法的保真性。

关键词:嵌入式系统,峰值信噪比,结构相似度,人类视觉系统

参考文献

[1]郭剑.基于嵌入式系统的数字图像处理技术的研究[D].西安:西安电子科技大学, 2006.

[2]周景超, 戴汝为, 肖柏华.图像质量评价研究综述[J].计算机科学, 2008 (07) .

嵌入式图像处理系统的软件设计论文 篇2

关键词:嵌入式;图像处理系统;软件设计

中图分类号:TP3文献标识码:A文章编号:1674-6708(2016)156-0080-02

DOI:10.16607/j.cnki.1674-6708.2016.03.049

在很多领域中,由于科学技术的不断发展,不可避免的需要使用大量的数据,面对这些算法复杂的数据,传统的图像处理系统已经不能满足要求。嵌入式图像处理系统在通讯、医药等方面都发挥着非常重要的作用,正是因为各个领域获得的图像数据越来越多,如何对图像数据快速准确的进行处理显得格外重要。所以需要设计出更优化的图像处理。

1嵌入式系统概述

1.1嵌入式系统的概念

嵌入式系统是建立在计算机技术基础上的应用型专用计算机系统,其软件和硬件都可以剪裁,系统对成本、功耗、功能都提出了更高的要求,具有可靠性强、体积小等优点,可以实现对其他设备的监视、控制和管理。随着嵌入式系统的不断发展,嵌入式系统已经渗透到人们的生活中,无论是在工业、服务业还是消费电子等领域都得到了广泛的应用。

1.2嵌入式系统的特点

与普通的计算机系统相比,嵌入式系统的专用性更强,一般是面向特定运用的,嵌入式处理器一般应用在用户设计的特定系统中,集成性高、体积小、功耗低,不仅具有方便携带的优点,操作系统更是实时操作的,可以满足实时性较强的场合要求。将嵌入式系统运用到应用程序中,在芯片上直接运行而不需要操作系统,未来可以充分利用更多的系统资源,用户需要选择RTOS开发平台,保障软件的质量。嵌入式系统主要包括硬件系统和软件系统,其中硬件系统是基础,软件系统是灵魂,复杂程度非常高。

2系统软件设计

基于RF5软件系统总体设计:嵌入式图像处理系统和传统处理系统一样,主要包括硬件和软件两个方面,硬件包括系统的硬件平台,软件包括嵌入式操作系统和图像处理算法两个方面。其中硬件平台又包括图像储存模块、通信模块和显示模块等,主要是为系统的软件系统提供支持。在图像处理过程中,硬件系统可以为其提供计算、显示、存储等条件[1]。RF5是以DSP和XDAIS为基础的代码参考框架,在DSP软件的设计和开发中具有重要的作用,参考框架在整个程序中具有非常重要的作用,是整个运用应用程序的蓝本。RF5的数据处理元素包括通道、单元、任务和XDAIS算法,这4个元素之间具有紧密的联系,独立又联系。嵌入式操作系统是整个系统的核心系统,提供了包括图形处理任务管理在内的各项管理,经过硬件的初始化、图像信息存储、图像信息显示等过程实现图像处理和存储。

3软件模块化程序实现

3.1初始化模块

软件系统的初始化模块主要包括处理器、RF5模块化初始化、图像处理算法、视频捕获、视频显示通道等。处理器和系统板初始化是指设备重启之后,通过软件配置的方式对外围设备进行配置和选择。系统在进行工作的时候,初始化模块是其执行的第一个任务,执行完初始化模块之后,程序的控制权将会转变到调度程序中,由调度程序来调度接下来的任务。

3.2视频捕获和显示模块

3.2.1视频捕获的实现

视频捕获主要负责将外部的视频解码器解码生成的数字视频信号采集收集起来,并且这个采集的过程非常方便,可以实现实时采集,最终形成的图形处理也是可以实时处理的,可以随时随地对大数据的图像进行处理,这也是其最大的优点和特点。采集到的数字视频信号进入到系统外扩的存储器中,从而实现视频的捕获。视频采集可以自动采集,当单元进入自动采集状态,完成了图像的采集之后,视频端口都会向系统自动发出中断请求,中断服务程序便开始发挥自身的功能,对图像的存储区进行连续更新,图像存储区一旦更新之后,图像采集系统就会采集下一个图像数据,最终进入一个循环。当视频端口的FIFO装满了采集的数据之后,会发生中断信息,进入EDMAISR中断服务程序将视频数据送入到SDRAM中[2]。

3.2.2视频显示的实现

视频显示的实现是通过视频图像显示模块来实现的,视频图像处理模块处理后的图像经过显示模块处理,处理之后将图像编码成数字视频流,标准数字视频流经过系统编码转化为虚拟视频信号,经过解码器之后视频流就变成了标准的模拟视频信号,分别经过EDMA控制器和EDMAISR之后最终进入到视频端口的缓冲区中,经过缓冲器之后,信号会使EDMA中断,送入新的图像信号,并在显示器上显示出来,视频显示的流程。输出作用在外部编辑器中。

3.3图像处理模块

图像处理模块比较灵活,是指在嵌入式的环境下实现对图像的处理。在图像处理系统中,又包括系统功能模块和图像增强模块。系统功能中包含图像增强功能,除了图像功能之外,还包括图像的几何变换、形态运输和图像分析。在图像增强模块中又包括图像的预处理和边缘检测、直方图修正、中值滤波、灰度变换调整,而图像预处理又包括图像平滑和图像锐化。图像平滑就是消除噪声对图像造成的影响,图像平滑的处理是通过高斯低通滤波法来实现,这样做虽然可以消除图像受到噪声的影响,但同时也存在着一定的弊端,图像经过处理之后会变得模糊。图像锐化的目的就是让模糊的图像重新变得清晰。图像模糊是由于图像受到平均或积分运算而造成的,图像锐化就是对其进行逆运算,重新使图像变得清晰[3]。

4结论

嵌入式图像处理系统的软件系统主要包括初始化模块、视频捕获模块、视频显示模块和图像处理模块,在确定了整个软件系统的程序流程之后,就可以分别设计纷纷模块的程序,最终完成整个软件系统的设计。

参考文献

一种改进的图像自嵌入优化算法 篇3

近年来, 随着计算机、通信技术的发展, 数字多媒体作品通过互联网等途径被广发传播。这使得数字多媒体作品的知识产权以及其真实性成为一个迫切需要解决的问题, 数字水印技术引起了人们的高度重视, 并逐渐成为国内外多媒体信号处理领域的一个研究热点[1,2]。

数字水印是二十世纪90年代发展起来的对数字产品进行版权保护的新技术, 它的实现包括水印预处理、水印嵌入和水印提取三部分。是数字水印的一支, 它除了具有水印的基本特征, 如不可感知等, 还具有修复篡改的能力。而图像自嵌入技术是将图像本身作为水印嵌入到图像中, 图像在被篡改后不仅能检测到篡改区域, 而且可在一定程度上恢复被篡改的信息, 属于脆弱性数字水印一种。也可作为图像数据的认证方式的一种, 它可以有效的确认数据的完整性以及真实性, 这在当今数字图像研究中是重要的课题之一。

1997年Cox等[3]提出了一种基于离散余弦变换 (DCT) 域低频信号的扩频水印算法, 影响了很多研究者[4]。图像自嵌入技术通常将采用将原图像DCT变换后, 产生的信息嵌入到原图像的LSB (最低有效位) 中, 这样做可嵌入较多信息, 还可以尽量保持图像的原貌。本文分析了DCT系数的特点, 在文献[5]和文献[6]的基础上提出一种改进的图像自嵌入算法, 通过判断图像块的平坦与否来增加嵌入的系数, 使恢复图像的质量进一步提高。

2图像的自嵌入及图像的验证修复

由于一幅图像的内容不可能完全嵌入其自身中, 因此在考虑到原图像的可嵌入容量, 以不影响水印嵌入后的图像质量, 又要抽取原图像的足够信息量以便篡改后恢复, 借鉴了JPEG图像压缩方式[7,8,9]。

下面几个小节是算法的主要过程。

2.1水印产生和嵌入

(1) 将原图像分为8×8子块;

(2) 将各块所有像素的LSB清零;

(3) 对每一个子块进行DCT变换, 根据质量因子对DCT系数进行量化, 量化后的DCT系数矩阵为q;

(4) 对量化后的系数根据编码位长进行二值编码, 产生8×8的水印矩阵。

(5) 将水印矩阵移动一个向量P, 向量的方向和大小可以任意定义, 实验中取图像尺度的1/4;

(6) 将水印矩阵嵌入原图像的LSB或最后两位中。

由于DCT变换将整个图像上的能量重新分布, 从而可以舍弃不重要的系数, 达到压缩效果的同时又不造成视觉上的太大差别。DCT变换后的系数有一定规律, 低频能量高, 处于左上角;高频能量低, 处于右下角 (如表1) 。在8×8的子块中位于左上角第一个位置的是直流分量 (DC) , 它具有最大的能量和重要性, 其余63个分量是交流分量 (AC) , 其重要性从左上角到右下角按Zig-Zag依次减小。

2.2量化系数编码位长的确定

文献[5]使用的码长如表2 (a) 所示, 文献[6]使用的码长分配表如表2 (b) 所示。文献[6]一共用64位表示了14个系数, 其中直流系数用7位表示。从结果中我们可以发现文献[6]中使用质量因子0.75明显是不正确的, 用质量因子0.75的DC是用质量因子0.5的DC的2倍, 即它的DC在0~255上均匀分布, 此时用7位来表示显然是不够, 下图也可以说明问题。

图1 (a) 是使用质量因子0.75的JPEG量化表的结果, 而图3 (b) 是使用质量因子0.5的JPEG量化表的结果, 很明显图3 (b) 的质量要好于图3 (a) 。

并且, 实验中还发现虽然系数中存在大量0, 特别是某些图像的平坦区域只有前几个系数有值, 其余都是0, 但是取DCT系数前14位来恢复图像是不够的, 有些复杂区域需要取DCT系数前28位, 以提高图像在复杂区域的表示精度。本文通过实验, 在嵌入水印时先计算8×8块里面q14至q27, 其绝对值是否有大于1的数, 有的话则采用取系数前28位的方法,

2.3水印的提取及图像的验证修复

水印的提取是水印嵌入的逆过程, 由于本文算法的一个水印矩阵可能含有另一个DCT变换矩阵的信息, 因此无论原图像还是水印信息, 只要判断被篡改, 就要用正确的信息替换。其具体过程如下:

1.从含有水印的图像中提取出水印, 并将含有水印的图像最后两位清零;

2.将图像分成8×8子块, 并进行DCT变换, 判断图像块取系数量化并用码长分配表取位数;

3.用产生水印的方法产生水印矩阵;

4.将两个水印矩阵对比, 若相等, 则没有被篡改;若不等, 则取向量P位置的矩阵对比, 若它们相等, 则用水印图像恢复原图像, 若不等, 则用原图像恢复水印。

3实验结果

本文算法在matlab6.5平台上实现, 攻击平台是画图工具, 下面是部分实验结果。

图3是原图与含有水印图像的对比。由于水印嵌入在LSB位, 且按照概率的理论, 只有一半的LSB位会改变, 因此水印的嵌入基本上不会改变原图像。实验结果证明了该观点, 插入水印后的图像 (图像大小256×256) 的PSNR值达到51.147 (峰值信噪比, 其值越大图像质量越好) , 肉眼无法判断图像中是否含有水印。

图4是通过嵌入水印的图像在没有受到攻击的情况下恢复的水印图像 (原图cameraman为256×256) , 其中 (a) 是原图像, (b) 是文献[6]的算法, (c) 是本文提出的改进算法。后两幅图像的PSNR分别为31.9378和39.621, 而且我们可以明显看出第三幅图像的质量要好于第二图。再看图7的四幅图像, 通过比较很明显也可看出图像 (c) 优于图像 (d) 。

图6是嵌入水印的图像 (256×256) 受到攻击时恢复的图像, 其中 (b) 是文献[6]算法恢复的, (c) 是本文提到的改进算法恢复的。 (b) 的PSNR值为35.256, (c) 的PSNR值为39.541, 证明本文提出的算法可以有效提高图像复杂区域的恢复效果。

4结束语

本文提出一种图像自嵌入的改进算法, 它是在分析了DCT域系数的基础上提出的。 能够直观地检测图像被窜改的位置, 并恢复出该位置的大部分信息。与文献[5]和文献[6]的嵌入算法相比较, 该算法具有以下优点:

1.保留了更精确的低频信息。

2.增加了图像复杂区域的表示系数个数。

正是由于这些优点使得本文提出的算法较文献[5]和文献[6] 的嵌入算法在恢复图像的质量上有了较大的提高。

参考文献

[1] NIU Xia-mu, LU Zhe-ming, SUN Sheng-he.Digital watermarking of still images with gray-level digital watermakes.IEEETrans on Comsumer Electronics, 2000, 46 (1) :

[2] KOCHE, ZHAO J.Towards Robust and Hidden Image Copyright Labeling.IEEE Worksho Pon Nonliner Signal and Image Process-ing.Neos Marmaras, Greece, 1995.452~455

[3] COX I J, Kilian J, Leighton T.et al.Secure spread spectrum water-marking for multimedia.IEEE Trans on Image Proccessing, 1997, 6 (12) :163~1687

[4] Barni M, Bartolini F, Cappellini V, et al.A DCT-domain system for robust image watermarking.IEEE Signal Proccessing, 1999, 66 (3) :357~372

[5] Fridrich J, Goljan M.Protection of digital images using self embedding.Proceedings of NJITSymposium on Content Security and Da-ta Hiding in Digital Media, (Newark, NJ) .New Jersty Institute of Technology May, 1999.

[6]张鸿宾, 杨成.图像的自嵌入及窜改的检测和恢复算法.电子学报, 2004, 32 (2) :196~199

[7] Kenneth R.Castleman.Digital Image Processing”, 北京:电子工业出版社, 2002.

[8]何孝富, 黄继风, 张培君, 戴蒙, 张功镀.一种具有自我恢复功能的脆弱性水印技术.上海师范大学学报, 2004, 33 (1) :56~62

图像嵌入 篇4

引 言

伴随着图像处理技术的快速发展,图像处理系统的性能需求也在不断提高,特别是在实时性上的要求。基于PC或者工作站的图像处理系统,常常不是一个可行的选择,原因如下:应用对处理时间要求苛刻;CCD摄像机数据量太大。另外,这类系统的资源有效利用率较低,体积大而笨重,功耗高,不适合便携式应用场合。

DSP是一种基于指令和代码的流水线处理器,具有强大的数据处理能力和较高的运行速度,采用C/C++或者线性汇编语言编程,可以支持复杂的算法处理,而FPGA则属于真正的并行架构,不同的处理操作无需竞争相同的资源,每个处理任务都可以不受其他逻辑块的影响自主运行,因此FPGA具有强大的并行处理能力,其现场可编程的属性也带来了更大的灵活性,但是,FPGA不擅长复杂的算法处理和逻辑控制。本文基于DSP+FPGA架构构建了一个嵌入式图像处理系统,使得DSP和FPGA可以发挥各自的特长,协同处理,与单独采用DSP或FPGA的系统相比,本系统具有更强大的数据处理能力,且更灵活、更通用。

1.系统架构

本系统采用DSP+FPGA架构,原理方框图如图1所示,其中DSP芯片采用TI公司单核最高性能的TMS320C6455(简称C6455)芯片作为核心处理器,负责完成视频图像的复杂算法处理,FPGA芯片采用Altera公司的Cyclone Ⅲ系列芯片EP3C55,FPGA作为DSP的协处理器,负责完成图像的采集、显示和传输等辅助功能,使得DSP可以专注于算法处理。

DSP和FPGA之间通过32位EMIF接口实现了高速同步无缝互联, 由图1可知,本系统的动态存储器均采用DDR2 SDRAM,其中C6455所带2片DDR2存储器用来存储图像和算法数据,为C6455处理大数据量、复杂算法提供了保证。FPGA所带2片DDR2存储器用来存储捕捉的Camera图像数据,以便VGA显示和DSP读取。FPGA采集的图像数据可通过EMIF和EDMA从FPGA所带的DDR2存储器搬运到DSP所带的DDR2存储器。

图1 系统方框图

2.FPGA设计

本文FPGA的主要功能围绕着DDR2存储器的.读写,如图2所示。

图2 FPGA的主要功能模块图

相机负责向缓冲区写数据,VGA显示和DSP负责从缓冲区读数据。本文中的DDR2控制器工作于Full?rate模式下,需要向DDR2 driver提供2倍数据宽度,即64 b数据。本文对每个读写数据通道,使用独立的FIFO进行不同时钟域之间的数据传输。从CameraLink相机的LVDS接收器解码得到8 b图像数据,在向Write FIFO写之前,需要按8 B进行打包处理,合并为64 b数据;而发向VGA显示的数据在从Read FIFO中读出后,需要先经过拆包处理,得到8 b图像数据后才能送给VGA Controller;从Capture FIFO读出的数据发送给DSP之前也要经过拆包处理,将64 b数据拆为2个32 b数据后,才能发送给EMIFA,进行传输。为方便可视化验证算法处理结果,DSP算法处理结果可以通过McBSP发送给FPGA,FPGA接收到数据,将其转换为可视的屏幕位置送给VGA Controller,在屏幕上进行叠加显示。

本系统应用于近红外图像处理领域,采用的CameraLink相机输出分辨率为1 024×768,帧率为30 f/s,而一般的液晶显示器刷新频率为60 Hz,为了将捕捉到的相机数据显示出来,需要将30帧图像插帧为60帧,但是显示时钟与相机时钟并不是同源时钟,其帧率并不是严格的两倍关系,这种相机和显示之间的异步时序关系如图3所示,所以不能简单地将一帧图像显示2次;同时,本系统的近红外图像算法处理时间根据图像的不同而具有不确定性,并非每帧图像都能在一个帧周期内处理完成。基于这两个因素,本系统没有采用常规的乒乓缓冲处理方式,而是采用了三重缓冲解决了这两个问题。

图3 相机和显示的异步时序关系

所谓三重缓冲,也即在DDR2存储器内开辟了三个缓冲:BufferA,BufferB和BufferC。其中,读写操作各占一个缓冲区,第三个存储区作为中转,先不考虑DSP从缓冲区读数据。

三重缓冲的示意图如图4所示,假设当前缓冲区BufferA正在进行写操作,缓冲区BufferB正在进行读操作,缓冲区BufferC则有2种可能:已写满(FULL)和已读完(EMPTY)两个状态。此时,如果需要进行读写翻页操作,即读复位信号或写复位

信号有效时,DDR2驱动程序可按不同情况给出不同的操作,如表1所示。

例如,当读复位信号有效,写复位信号无效时,说明缓冲区BufferA尚未写满,而缓冲区BufferB已经读完,此时,需要查询缓冲区BufferC的状态,如果缓冲区BufferC处于“FULL”状态,则读缓冲区将由当前的缓冲区BufferB改为缓冲区BufferC,并将缓冲区BufferB设置为“EMPTY”状态;如果缓冲区BufferC处于“EMPTY”状态,则将重新读取缓冲区BufferB。

图4 三重缓冲的示意图

表1 三重缓冲的决策表

再考虑DSP从缓冲区读数据的情况,为保证DSP任意时刻开始读数据,总能读到最新的数据,本文使用图像的场信号FVAL下降沿作为触发,定位DSP读数据的缓冲区地址,如果在下一个FVAL下降沿之前DSP始终未开始读数据,则在新的FVAL下降沿时刻重新定位缓冲区地址,反之,如果DSP开始读数据了,即使在FVAL下降沿未能读完,也会继续读,直到DSP读完数据,再重新定位缓冲区地址,按本文设计的方案,DSP会在很短的时间内完成读数据任务,而如果在两个FVAL内,DSP一直未完成读任务,则认为发生了错误,读控制器会进行复位矫正。

DDR2驱动的读写控制以显示的行信号HD为周期,周期性查询是否需要进行读写操作。其状态转移示意图如图5所示。

图5 DDR2读写控制的状态机

SignalTap Ⅱ Logic Analyzer是Quartus Ⅱ自带的嵌入式逻辑分析仪,与ModelSim软件仿真有所不同,是在线式仿真,可以实时捕捉和显示信号变化。图6所示是本文用SignalTap Ⅱ捕捉到的数据波形。

图6 SignalTap Ⅱ波形图

3.C6455软件设计

本文C6455的软件基于TI提供的抢占式多线程实时内核DSP/BIOS进行开发,网络部分使用了NDK开发套件,为了实现通过网络发送图像数据给计算机和接收来自计算机的图像数据,使用了面向无连接的UDP协议,相比TCP协议,UDP速度更快,更适合应用。C6455软件主要包含三个部分:实时性最高的硬件中断线程(HWI);采集线程和两个任务线程(TSK);处理线程和通信线程,流程图如图7所示。

图7 C6455程序流程图

4.实验结果

嵌入零树小波用于雷达图像压缩 篇5

关键词:小波变换,嵌入式零树小波,雷达图像

随着高分辨率雷达的普及, 雷达图像的像素越来越多, 相应的容量也越来越大[1]。因此, 如何更好地压缩雷达图像对于信息的传输与存储起着至关重要的作用[2]。传统的JPEG标准主要基于分块的离散余弦变换 (DCT) 编码, 而JPEG-LS标准则主要基于预测编码。一般只消除图像像素间的空间结构冗余, 压缩比 (CR) 不高, 且JEPG当CR>20时, 会出现较强的“块失真”, 人眼非常敏感[3]。

小波变换具有良好的时频局部化性能, 能有效克服傅立叶变换在处理非平稳的复杂图像信号时所存在局限性, 因而在图像压缩领域受到越来越广泛的重视。借助小波变换, 可以把图像信号分解成许多具有不同空间分辨率、频率特性和方向特征的子带信号, 实现低频长时特征和高频短时特征的同时处理, 更适合于人类视觉系统 (HVS) [4]和数据压缩的要求。

本文采用零树小波 (EZW) [5]对雷达图像进行压缩, 实验显示EZW可以实现递进式压缩, 并且压缩图像的峰值信噪比令人满意。

1背景介绍

1.1小波的发展

如图1所示, 信号处理中最常用的方法是傅立叶变换, 它能够得到信号的频谱图。然而, 傅立叶变换的基准信号是一个时域无限长的e-jω信号, 对应在频域是一个δ脉冲。因此傅立叶变换仅有频域分辨率, 缺乏时域分辨率[6]。

为了改善信号分析的时域分辨率, 一般通过短时傅立叶变换 (STFT) 技术, 也称加窗傅立叶变换。这种情况可以认为是时域分辨率与频域分辨率的折中。STFT能够同时提供时域与频域信息, 但是, 信息的精度与窗口大小有关。一旦窗口大小设置好, 则无法再次改变[7]。

小波变换 (WT) 可以认为是一种可变长度的加窗技术, 它能够提供任意精度的时域与频域信息, 被称作“数学放大镜”。

1.2 二维小波变换

图2给出了二维小波变换的示意图, 这里给定一副图像, 对其进行小波分解, 得到4幅子图{cA1, cH1, cV1, cD1}, 分别对应图像的近似子图、横向细节、纵向细节与对角细节。cA1作为下一次二维小波变换的图像, 继续分解, 得到{cA2, cH2, cV2, cD2}, 如此反复至所需要的级别。图3给出了脑图像的三层小波分解示意图。

1.3 嵌入式零树小波简介

由小波图像的多分辨率特点, 大量的小波系数分布在零值附近, 并且具有明显的方向性, 构造出的跨频带矢量也就具有不同的能量和方向特征[8]。通过对矢量进行分类后, 用各自独立的码书分别进行量化, 可以更有效地利用各子带间的相关性[9]。

矢量的能量大小决定了其对于恢复图像质量的贡献程度:能量越大, 贡献程度越高;反之越小。因此, 能量可以作为矢量重要与否的一个判别准则。

零树 (zerotree) 是基于小波系数相关性的一种假设:如果在低分辨率高频子带上的小波系数相对于阈值T是无意义的, 则位于同方向的同空间位置的高分辨率子带上的小波系数相对于T也应该是无意义的。把满足这种假设的系数用树状结构表示出来就是零树。零树矢量对恢复图像质量的贡献很小。若一个零树矢量同时能量满足小于给定的能量阈值, 就可以认为是非重要类, 不再对其进行编码, 将其中每一个分量置为0, 并用一个位标记, 而其他矢量均视作重要的, 标记为1, 进行较大码书尺寸的矢量量化, 以减少量化误差[10]。

采用能量阈值和零树矢量的双重标准, 既充分利用了子带相关性, 又有效地保护了图像的重要信息。

2 实验

2.1 递进式压缩

EZW编码作为递进式编码, 可以根据编码循环的次数 (No.of encoding loop, NEL) 对图像逐级编码, 图4给出了对于岛屿图像由1-10的编码结果。

2.2 EZW性能研究

对若干幅图像进行EZW编码, 指标采用每像素比特数 (bpp) 与峰值信噪比 (PSNR) , 分别衡量图像压缩的效率与恢复图像的质量。需要注意的是, 选取bior4.4小波, 规定分解级别为8, 调整编码循环数使得压缩后的bpp近似等于1。

选取的4幅雷达图像如图5所示, 压缩得到结果列于表1。

可见, EZW压缩后的结果明显令人满意, 在bpp近似为1的情形下, psnr能够在20—30之间。

3 结论

本文研究了基于小波变换的嵌入式零树小波, 实验证实了该方案能够递进式压缩雷达图像, 并且压缩图像的峰值信噪比令人满意。

参考文献

[1]董鹏曙, 张朝伟, 金加根.高分辨率雷达图像压缩编码算法及实现.系统工程与电子技术, 2009;31 (1) :54—56

[2]张煜东, 吴乐南, 王水花, 等.一种基于神经网络的遥感图像压缩编码.南京信息工程大学学报, 2009;1 (1) :82—88

[3]张煜东, 吴乐南.基于分割的彩色图像编码.中国科学F辑:信息科学, 2009;39 (4) :405—415

[4]张煜东, 吴乐南.一种新的空间掩盖效应的拟合公式.中国光学与应用光学, 2008;1 (1) :70—74

[5]陈冬, 张田文, 李东.扩充编码符号的EZW改进算法.哈尔滨工业大学学报, 2009;41 (8) :89—93

[6]张煜东, 吴乐南.基于SPCNN和Nagao滤波器的图像去噪.中国科学F辑:信息科学, 2009;39 (6) :598—607

[7]张煜东, 吴乐南, 韦耿, 等.用于多指数拟合的一种混沌免疫粒子群优化.东南大学学报, 2009;39 (4) :678—683

[8]张煜东, 吴乐南.基于二维Tsallis熵的改进PCNN图像分割.东南大学学报:自然科学版, 2008;38 (4) :579—584

[9]李天伟, 贾传荧, 韩云东.基于整数小波的雷达图像快速无损压缩算法.舰船科学技术, 2007;29 (5) :152—158

图像嵌入 篇6

目前在彩色图像中嵌入数字水印的算法主要包括离散余弦变换技术和色彩空间转换技术,但都局限于单一技术的研究,离散余弦变换技术数字水印算法[2,3,4,5]具有不易被破坏的特点,但健壮性不理想。

本文提出一种以离散余弦变换技术为基础,结合色彩空间转换技术,在彩色图像中嵌入灰色数字水印的综合算法,为避免在此算法中乱数安全性可能降低的问题,对算法进行了改进,在彩色图像中将灰度数字水印嵌入,而在乱数重排的过程中读取使用者密码,提高了乱数种子的安全性。实验证明此算法在彩色图像中嵌入灰色水印信息能较好的抵抗各类攻击,健壮性较好。

1 数字水印嵌入与提取算法

1.1 数字水印的嵌入步骤

1)将原始图像从RGB空间转换到YCbCr空间进行原始图像色彩分解。

2)对原始图像中的Y色板进行8x8离散的余弦转换(DCT),计算原图像的DCT频域系数,再从计算出的频域系数中找出具有较好强健性中低频区域如图1所示,作为嵌入数字水印信息的位置。

3)根据使用者密码,使用SHA1算法求得两组乱数种子,使用第1组乱数种子对数字水印进行打乱处理。

4)将打乱处理后的数字水印图像进行8x8区域DCT转换,得到数字水印的频域系数,然后由原始图像中选定的嵌入数字水印中低频区位置系数平均值q来产生量化表Q,产生方法如式(1)

式中P为过滤表,系数如式(3)所示:

使用Qr对每个4x4数字水印的频域系数W进行数字量化处理,得到数字水印量化后DCT频域系数Wq区块,如式(4)。

5)将量化后的数字水印的DCT系数进行置乱处理,使用第2组乱数种子,以乱数顺序取代原始图像的中低频相应位置的参数值。

6)对修改后的图像进行离散余弦反变换(IDCT,Inverse Discrete Cosine Transformation)处理,得到已嵌入数字水印信息的YCbCr图像,接着进行色彩空间变换从YCbCr转换到RGB,即完成整个数字水印嵌入,得到嵌有数字水印信息的图像。

1.2 数字水印提取步骤

1)读取嵌入有数字水印信息的图像进行色彩空间转换,由RGB空间图像转换成YCbCr空间图像。

2)对YCbCr中的Y色板进行DCT转换,接着由计算出的中低频相应位置取出数字水印信息。

3)读取使用者密码,由SHA1算法求出两组乱数种子,使用第2组乱数种子从中低频参数中以反乱序次序取出数字水印信息。

4)将取出的数字水印信息进行反量化处理,反量化计算如公式(5)所示:

5)将反量化处理后的信息进行IDCT运算,得到原数字水印信息。

6)接着使用第1组乱数种子对数字水印信息进行反乱数重组,即可提取到原数字水印信息。

2 实验结果分析

为验证算法的可行性及性能,实验以512x512图像为原始图像,以128x128的灰度图像为嵌入的数字水印信息,如图2所示。

在原始图像中嵌入数字水印信息后与原始图像相比较,及取出的数字水印与原始水印进行比较,采用PSNR(一种评价图像的客观标准)值和NC[6](归一化的相关系数,用来评估两幅图像相似度)值数据作为图像品质的评估标准。

数字水印嵌入前后的图像的PSNR值为29.512,取出的数字水印图像NC值为0.815427,可识别度较高。

下面对嵌入数字水印的图像进行切割处理、增强处理、Gamma修正处理、压缩处理后,再提取嵌入的数字水印信息,并采用NC值数据作为图像品质的评估标准。

2.1 切割处理

对嵌入数字水印的图像进行切割处理后提取其中数字水印信息,结果如表1所示。结果表明,此算法可以抵抗至剩余率至20%的切割破坏,若切割剩余率高于20%,则可较好的提取出水印信息;若切割剩余率低于20%,则提取出的数字水印几乎不可辨认。

3.2 增强处理

对嵌入数字水印的图像进行增强处理,结果如表2所示。结果表明,此算法约可抵抗至程度至25以上的增强处理,若是超过此值,数字图像失真较大,虽然能获取数字水印,但利用价值不大。

3.3 Gamma修正处理

对嵌入数字水印的图像进行Gamma修正处理,结果如表3所示。结果表明,此算法约可抵抗Gamma修正处理,修正值上限为7.5左右,若是超过此值过大,数字水印将趋于模糊,数字图像失真较大,利用价值不大。

3.4 压缩处理

对嵌入数字水印的图像进行JPEG压缩处理,结果如表4所示。结果表明,此数字水印算法能抵抗压缩率大于35%的JPEG压缩,压缩率若是小于此限,数字水印将趋至不可辨认。

4 结论

数字水印技术的发展对数字媒体著作权的保护具有重要的意义,本文提出以离散余弦变换技术为基础,结合色彩空间转换技术,在彩色图像嵌入灰色数字水印的综合方法,并在水印的嵌入和提取过程中,使用相关的密码处理,提高了水印的安全性。实验结果表明在嵌入数字水印后的原始彩色图像仍保有相当的品质,在受到切割处理、增强处理、Gamma修正、压缩处理等攻击时也具有相当的抵抗能力,健壮性较好。

摘要:近年来,数字水印技术用于数字媒体著作权的保护已成为一种发展趋势。本文提出一种以离散余弦变换技术为基础,结合色彩空间转换技术,在彩色图像中嵌入灰色数字水印的算法,试验结果表明:提出的算法可以较好的抵抗图像还原时的各种攻击。

关键词:彩色图像,数字水印,健壮性,离散余弦变换

参考文献

[1]Cox I J,Miller M L,Bloom J A,Digital watermarking,Morgan Kaufmann Publishres Inc.,San Francisco,CA,USA,2002.

[2]LI Xiao-qiang,XUE Xiang-yang.Improved Robust Watermarking in DCT Domain for Color Images[C].Proc of the 18th Int.Conf.on Ad vanced Information Networking and Application.0-7695-2051-0/04.

[3]Hsu C T,Wu J L.Hidden digital watermarks in images[J].IEEE Trans.On Image Processing,1999,8(1):58-68.

[4]Bas P,Chassery J M,Macq B.Geometrically Invariant Watermarking Using Feature Points[J].IEEE Trans,.Image Processing,2002,11(9):1014-1028.

[5]Hsu C T,Wu J L.Hidden Digital Watermarks in Images[J].IEEE Trans.On Image Processing,1999(8):58-68.

基于3G通信的嵌入式图像传输系统 篇7

随着嵌入式技术的飞速发展以及消费电子需求的逐年增长, 嵌入式处理器的应用越来越广泛。同时, 人们的需求已从简单的文字消息传输、浏览网页等转向对带宽要求更高的网络应用, 如:文件传输、图像传输等, 而GPRS低速率的网络传输已经不能胜任大数据量的高速传输应用。当前, 3G通信技术以其传输速率高、通信质量高、信号覆盖范围广等优势, 更适合于大数据量的传输应用。互联网和无线通信网络已成为人们获取信息和人际沟通不可或缺的基础设施[1]。本文提出一种基于3G通信的嵌入式图像传输系统设计, 适合多种特殊监控场合, 如高速公路图像监控、野外深林火灾监控、关键位置监控等, 能基本满足实时监控的要求。

1 系统整体硬件结构

本系统采用的是C/S服务模式, 其整体结构如图1所示:服务器运行在PC电脑上, 电脑可以使用有线接入互联网或无线WIFI接入互联网, 而且需要有对外开放的端口, 以供对外的服务器使用;嵌入式图像采集终端使用以ARM11为核心的嵌入式处理器S3C6410, 图像采集设备使用OV公司的OV9650摄像头, 而3G通信模块则采用华为公司的EM770W M2M模块, 其中, EM770W M2M模块的接口包括一个USB接口和一个串口接口, 虽然使用串口开发可以大大降低设计难度, 但由于串口的通信速率比较低, 不适用于大数据量的图像实时传输, 故本系统使用USB接口与3G通信模块通信[2,3]。华为EM770W模块的USB使用USB2.0接口, 数据传输速度满足图像传输需求;图像显示终端的运行平台可自由地选择, 或运行在PC电脑上, 或运行在嵌入式终端上, 图像显示终端可通过有线、无线WIFI或也使用3G模块接入互联网。

2 系统整体软件结构

2.1 系统软件整体流程

本系统整体的软件流程如图2所示。

系统基于TCP/IP协议, TCP/IP协议的重要特点[4]是:开放的协议标准、免费且不受任何计算机硬件或操作系统的限制;不受限于特定的网络硬件;通用的寻址方式, 使每一个TCP/IP设备都能通过独一无二的地址, 找到整个网络中的其他设备;各种标准化的高层协议, 可以广泛而持续地提供多种用户服务。

服务器端, 首先初始化socket, 建立一个TCP服务器, 然后进入等待图像采集端和图像显示端连接。每当服务器接收到一个连接, 则为该连接建立一个新的线程, 并建立一个线程共享的缓冲区, 用于缓存图像采集端发送过来的数据。

图像采集端, 由于图像采集端使用的3G网络联网, 需要先进行PPP拨号以获取3G的IP信息, 包括自身的IP地址、网关地址以及DNS服务器地址等信息, 然后将PPP拨号进入后台运行状态, 处理网络数据的交互, 关于3G的PPP拨号问题将在下文提到。接着, 图像采集端初始化socket建立TCP连接并登录到服务器, 通过OV9650摄像头采集图像。而OV9650采集到的是RGB的原始图像数据, 数据量比较大, 为了减少发送的数据量, 本系统调用IJG库对原图像数据进行JPEG压缩。最后, 将压缩后的JPEG图像数据发送至服务器端, 待收到对方的应答后, 再次重复图像采集步骤。

图像显示端:先初始化socket建立TCP连接, 并登录到服务器, 然后进入等待接收图像数据状态。每当接收完完整的一帧图像数据后, 调用IJG JPEG库对JPEG图像进行解压操作, 还原出原始的RGB图像数据, 然后再将图像信息显示在屏幕上, 并向对方发出应打响应, 再次进入等待接受图像数据状态。

2.2 3G模块的PPP拨号上网

2.2.1 为内核添加驱动支持

为了实现ARM11通过3G[5,6]模块接入互联网, 首先要安装对应的EM770W3G模块的USB驱动。本系统的Linux内核版本为Linux2.6.36, 此版本内核已经支持“USB driver for GSM and CDMA modems”, 故此不需要修改内核源代码, 只需要修改一下内核的配置即可。另外, 除了为Linux内核添加3G模块的驱动外, 还需要配置对PPP协议的支持:

(1) 清除之前的编译信息:make disclean

(2) 进入内核编译配置界面:make menuconfig

(3) 添加对EM770W的支持:在“Device Driver”→“USB support”→“USB Serial Converter support”→“USB Generic Serial Driver”中勾选“USB driver for GSM and CDMA modems”, 这样Linux内核就添加了EM770W的USB驱动程序。

(4) 添加对PPP协议的支持:在“Device Drivers”→“Network device support”→“PPP (point-topoint protocol) support”中勾选所有选项, 至此Linux内核便支持PPP协议。

(5) 编译内核:make z Image, 然后将内核映像文件下载到ARM11开发板上。

Linux启动完后, 把EM770W模块接上, 此时终端将会出现如图3所示调试信息, EM770W模块在Linux设备中映射为三个虚拟串口, tty USB0、ttyUSB1、tty USB2, 其中tty USB0就是人们拨号时候用到的串口。

2.2.2 添加PPP拨号脚本

本文需要三个脚本文件, 分别是用于建立协议、生成网络接口的pppd的脚本文件wcdma和实际与EM770W模块交互AT指令的chat脚本文件wcdma-connect-chat。其中wcdma脚本中, 比较关键的参数是指定串口号, 即/dev/tty USB0;波特率, 选择921600;用户名:wcdma模块的用户名为3gnet。而wcdma-connect-chat脚本文件中关键脚本如下:

完成后脚本文件的编写后, 通过pppd call wcdma即可进行拨号, 在终端会打印拨号连接的信息, 包括IP和DNS地址, 也可以在连接成功后通过ifconfig ppp0命令检查当前是否已经配置好网络参数。

2.3 IJG JPEG图像压缩库

图像采集终端从OV9650摄像头中获取的图像数据为RGB原始图像数据, 如果直接将原始图像数据发出去, 不但浪费宝贵的带宽资源, 而且将不能满足实时传输图像的需求, 因此必须要对原始的RGB图像数据进行压缩。本系统的图像采集终端采用IJG库对原始的RGB图像数据进行JPEG压缩, 如图3所示。程序首先初始化压缩变量, 包括压缩结构体、原始图像数据缓冲区指针等, 绑定压缩错误信息结构体, 设定原始图像参数, 包括原始图像的色彩空间RGB、图像的宽度、高度和每一像素所包含的字节数, 设定压缩输出图像文件名和图像压缩率参数。所有压缩参数都配置完之后, 就可以通过扫描方式, 开始压缩图像, 完成压缩之后, 需要对之前申请的动态变量进行释放操作, 防止内存泄漏, 对应的输出文件便是经过IJG压缩的JPEG文件。

2.4 图像的分块传输

不同的图像、不同的压缩比率设置使得压缩后的图像大小并不是固定大小的, 因而, 接收方并不能以固定大小的方式接收图像数据。本系统采用以下发送方式:将要发送的数据分成网络帧。每一个网络帧都以固定的格式填充数据:每一帧的开头都以0x FF作为帧标识头;网络帧的第二字节标识此帧的类型, 其中N代表文件名帧、D代表图像数据、T代表此帧为当前图像数据的最后一帧, A是接收方接收到完整一帧之后, 给对方发送的应答帧, 表示可以继续发送, 由于TCP连接是保证顺序的, 所以不需要为帧添加帧号标识, 以节约网络资源;第三、四字节表示此帧后面包含的数据长度, 是一个四位无符号整数, 其中第三字节为长度的低位;网络帧最后的数据为实际图像数据, 接收方需要根据识别的数据长度来读取数据, 否则将出错, 如图4所示。接收方, 如果在接受过程中, 如发现没找到帧标识头0x FF或网络帧标识位不是N、D、T, 那么, 很可能出现错误, 则进入逐字节扫描寻找网络帧头模式, 直到找到帧头为止。最后接收方向发送方发送应答帧, 如果接收出错也需要向对方发送应答帧, 应答帧数据段包含重发请求。

3 系统性能分析

整体测试:服务器运行在电脑PC上, 使用有线网络接入互联网;图像显示终端运行在电脑PC上也是通过有线网络接入互联网;而图像采集终端则运行在嵌入式板上, 通过EM770W3G模块接入互联网。测试效果良好, 网络延迟7秒左右, 图像帧率为2~3帧每秒, 基本满足了一般的实时图像采集系统的要求, 图5为图像显示终端正在接收并显示图像。

然而本系统还有需要改进的地方, 比如:本系统采用的TCP连接, 虽然, TCP连接为本系统提供了稳定而又可靠的连接。但由于TCP使用的是流式传输方式, 一旦数据流中某个数据在网络传输过程中丢失, 则需要多次重发以保证其接收方接收数据的准确性, 这样后面的数据必须要等待前面的数据完全正确传输才能发送。而如果采用UDP连接的话, 由于UDP没有流的概念, 而是数据报文, 发送过程中不需要进行确认, 速度会相应提高。然而, 需要上层程序对乱序、丢失的数据报文进行处理, 解决数据不完整的恢复问题。另外还需要对整体系统作优化, 使整体系统更加稳定和良好地运行。便携式3G图像采集系统具有广泛的市场前景, 是一个非常值得研究的课题。

4 结束语

本文论述了基于3G通信的嵌入式图像传输系统设计, 图像传输稳定, 网络延迟低。本文重点论述了嵌入式Linux如何实现通过3G模块上网以及使用IJG JPEG压缩库对原始RGB图像进行压缩, 以降低网络数据量, 提高图像传输速度。本系统适合于一些便携式的图像采集系统, 如一些在没有有线网络覆盖而有3G信号覆盖的区域进行图像采集的系统等。

参考文献

[1]王建宙.从互联网到“物联网”[J].通信世界.2009 (33) :12.

[2]王猛, 张为, 刘艳艳.基于ARM11的嵌入式通信系统[J].微型电脑应用, 2012, 28 (6) :6-9.

[3]邹颖婷, 李绍荣.ARM9上的嵌入式Linux系统移植[J].计算机应用, 2009, 28 (6) :43-45.

[4]Craig Hunt.TCP/IP网络管理[M].洪峰, 译.北京:中国电力出版社, 2000.

[5]骆华杰.3G与固定网络中实时音视频通信的研究[D].贵阳:贵州大学.2008.

[6]梅玉平.3G与固定视频业务的融合[M].北京:人民邮电出版社, 2005.

图像嵌入 篇8

1 嵌入式系统概念

嵌入式具有较高的技术密度, 它集合了计算机技术、半导体技术、通信技术、微电子技术、 传感器技术以及语音图像数据传输技术等, 是一种与具体应用对象结合的新型产品[2]。嵌入式系统可用于数据信息的收集、监视、控制 以及管理 ,其系统的软硬件具有较高的技术要求, 一般由微处理器、硬件设备、操作系统以及应用程序构成。

2 基于嵌入式系统和红外图像的火焰检测算法设计

2.1 火焰目标的提取

利用图像的二值重构进行火焰形态的提取, 即利用一个图像作为起始点, 另一个图像作为掩膜, 以此得到约束变换的过程。当灰度图像形成后, 利用8连接方式对二值图像进行快速重构, 二值化的阀值越小, 则图像的有用信息保存的越全面, 而阀值越大, 则可以有效地过滤干扰信息, 一般阀值在 [0,1] 的范围内[3]。

将起始图像作为背景, 将当前图像中的对应像素点与其相减, 将差值作为背景运动目标, 有如下检测规则[4]:

其中M (x,y) 表示运动目标像素的集合点, B (x,y) 表示背景图像中的像素点, I (x,y) 表示当前图像对应的像素点,TH为阀值。

红外图像可有效过滤一部分干扰, 借助红外滤镜对背景图像中的干扰进行了处理, 但实际情况中可能也会因测量环境的不同而产生其他干扰, 如噪声的干扰、钨丝灯的干扰等。在利用二值重构获得图像信息后, 各种新的干扰会导致运动目标的漏检, 为了更好地获得图像信息, 可结合中值滤波和形态学的开闭运算原理来尽可能地减小干扰。

中值滤波最初是用于分析时间序列, 后在图像的处理中得到了应用并对造成的过滤有较好的效果, 它通过将一个窗口下的所有灰度值进行排序, 进而取其中间值, 即g (m,n) =med {f (m-i,n-j) , (i,j) ∈W}。

同时, 孔洞填充算法也可以很好地减小干扰带来的影响。在这一算法之下, 必须要求小于2-3个像素点的物体间隔 ,以保证较好的相连性。

2.2 火焰特征的识别

2.2.1 火焰像素

不同因素下发生的火灾具有不同的颜色特征, 一般介于红色与黄色之间, 对RGB空间的火焰像素进行探讨, 若存在以下关系, 则可视为火焰像素:

其中R (x) 表示红色分量, G (x) 表示绿色分 量 , B (x)表示蓝色分量, k为像素个数, Rmean表示红色分量的均值。若检测的火焰饱和度大于上述某一表达式时, 即可消除假火焰像素点的影响。

2.2.2 动态火焰特征

动态的火焰具有一定的闪烁频率, 通常在10-20Hz的低频区, 但一般的视频图像采集频率在25Hz的水平上, 对于火焰频率的采用比较困难。为了解决这一问题, 有学者提出采用火焰高度的变化来替代火焰的闪烁特性, 火焰高度与其闪烁的特点具有相似的变化规律, 而火焰高度的采集要比闪烁特性更容易获取。其计算公式如下[5]:

其中A (k) 表示余弦变换系数, fd(A) 表示高度 变化函数。

2.2.3 火焰判定概率模型

火焰判定概率模型如下式所示:

其中调整系数用g表示。

采用samsun2410嵌入式系统进行实验, 并利用红外滤镜进行火焰图像的采集, 进而完成火焰检测算法的仿 真实验。在二值重构的实验中, 背景图像中不仅存在火焰, 还具有一处较明显的反光点, 而二值化的图像对两者的辨别度并不高,其灰度值相当接近, 只有进一步提取火焰的有效边缘, 才能消除假火焰的影响。最后, 利用了Matlab对火焰检测算法进行了仿真分析, 快速分析出图像中有无火焰, 并进行了准确定位。

3 结语

火灾事故对人们的生命财产安全有着极大的威胁, 运用火焰检测算法进行仿真分析可以有效地预测和控制火灾, 但火焰检测的算法受环境的影响较大, 具有较低的适应力。本文结合利用了嵌入式系统和红外图像技术, 经实验分析达到了较高的识别度, 具有较高的应用价值。

摘要:火焰的检测与识别是对火灾预防与控制的重要因素,目前已设计出一种嵌入式的图像采集系统,对嵌入式系统的概念进行了分析,分别探讨了火焰目标的提取、火焰特征的识别、火焰动态特征的识别以及火焰检测算法的设计,通过嵌入式系统以及红外图像的综合技术的实验分析,体现出该技术进行火焰检测算法的优势。

图像嵌入 篇9

结构化支持向量机(SVM)[9]是应用于图像分类的一种通用方法,该方法是对带标签的图像进行训练学习的,然而,标签的缺失限制了它在无标签图像分类中的应用,因此,基于标签嵌入技术和结构化支持向量机的原理,本文将标签嵌入和结构化支持向量机相结合,形成了结构化联合嵌入(SJE)框架。将图像特征作为输入嵌入,边信息作为输出嵌入分别映射到输入和输出嵌入空间,在输入输出空间建立一个兼容函数,通过对权值矩阵W的学习,使得输入嵌入输出嵌入达到最高的匹配。

本文采用深度卷积神经网络(CNN)和费舍尔向量(FV)[10]两种算法对图像进行特征提取,并对密集SIFT特征进行了优化。在2004年,DG Lowe提出了具有角度不变性的密集SIFT特征,该方法能够对少数收敛点进行特征提取,但当图像缺少纹理或者亮度较低时,特征提取效果不太理想。因此,本文采用了按网格点来提取SIFT特征的方法,从而得到图像的D-SIFT[11]特征,提高图像特征提取的准确度。

1 结构化联合嵌入框架

1.1 模型

给定输入和输出分别为,训练集S={(xi,yi),i=1,2,3,…,N},根据经验风险最小化原则,通过对f:X→Y进行学习,当正确的标签是y时,预测值为f(x),用0/1的损失,即如果y=z,Δ(y,z)=0,否则为1。

结构化联合嵌入框架如图1所示。

在输入空间X和结构化输出空间Y之间,定义了一个兼容函数F:X×Y→R,给定一个特定的输入嵌入,在SJE结构中通过兼容函数F最大化得到一个预测值,如下

式中:W是D×E的矩阵,D代表输入嵌入的维度;E代表输出嵌入的维度。因此,兼容性函数F的双线性形式如下

式中:θ(x)表示输入嵌入函数;φ(y)表示输出嵌入函数。

当输入嵌入维度D和输出嵌入的维度E数值非常大,那么计算成本将会非常高,因此将矩阵W进行低阶矩阵分解,即W=UTV,其中U是R×D矩阵,V是R×E矩阵,且R<<D,E,则F(x,y;W)可以改写成

则此时输入输出的联合嵌入在一个相同的R维数空间上。

1.2 参数学习

根据结构化支持向量机公式,目标是

误分类损失(xi,yi,y)的公式为

使用随机梯度下降方法来优化,在每个步骤中对(xi,yi)进行抽样,同时搜索排名最高的类y,如果,按以下公式更新W

式中:ηt是迭代t的学习步长。

1.3 联合输出嵌入学习

每个输出嵌入捕获输出空间的不同方面,提供关于输出空间简短的信息,通过将多种输出嵌入结合起来得到一个更好的联合输出嵌入。则联合输出嵌入的兼容函数如下

约束条件为

式中:W1…WK是联合嵌入的权重矩阵,WK对应于第K个输出嵌入φK。先单独训练WK,之后在验证集上对αK进行网格搜索。

2 输出嵌入

2.1 属性嵌入

属性[5,8]模拟了对象的共同特征,例如颜色、纹理、形状和空间联系等,这些属性通过众包技术[12]很容易获得。属性通过共享的对象特征将不同的类联系起来,一般通过人工来标注,并且转换成机器可读的矢量格式。描述性的属性集可以通过语言专家[9]来决定属性和类别之间的关系,其可能是一个二进制值φ0,1,它描述一个属性的存在/不存在,或者是一个连续值φA,它定义每个类的属性置信水平[8]。每个类的属性如下

ρy,i表示类和属性之间的连接关系,用实数或者二进制数表示,y代表类,E代表与类相关的属性数量。φA可能比φ0,1编码更多的信息。例如,以老鼠,猫和鲨鱼3类的大小作为属性,φ0,1={0,0,1}表示就体积而言,老鼠=猫<鲨鱼,然而φA={2,10,90}表示老鼠<猫<鲨鱼,其结果更加准确。

2.2 文本嵌入

Glo Ve[13](φg):通过对经常在文档中一起出现的单词进行统计编码,语义相似的单词如“眉毛”和“眼睛”一起出现的频率比“眉毛”和“高楼”一起出现的频率要高。通过训练学习词向量使得这两个单词的点积等于它们同现的概率。

Bag-of-Words[14](φb):Bo W通过计算每个单词在文档中出现的频率构建一个单词频率包,不保留每个单词在文档中出现的顺序。笔者收集与对象类相对应的维基百科文章,对出现频率较高的单词构建一个词汇表,最后建立这些单词的直方图使这些对象类向量化。

2.3 层次结构嵌入

根据类的分类顺序[15]作为层次结构输出嵌入,这种分类可以从预定义的本体Word Net[1]中自动构建。在这种情况下,通过语义相似度来测量节点之间的距离。最后,从大量无监督的文本语料库中得到分布式文本表示作为层次结构嵌入。用φh表示类层次嵌入。

3 实验

3.1 实验设置

在Caltech UCSD Birds(CUB)和Animals With Attributes(AWA)两个数据集中对结构化联合嵌入SJE进行实验分析,CUB数据集包含200种鸟的11 789张图像,AWA数据集中包含50种不同的动物的30 475张图像,在训练集和验证集上进行交叉验证,即训练不相交的子集。实验将CUB数据集中的150类作为训练集加验证集,其余50个不相交的类作为测试集。AWA有一个预定义分类,40类为训练集加验证集,10类为测试集。

3.1.1 输入嵌入

采用费舍尔向量(FV)和深度卷积神经网络(CNN)两种算法对图像进行特征提取,FV对每张图像进行统计,计算从本地图像补丁到固定长度的图像描述子。从多尺度正则网格中提取64维的D-SIFT特征,通过主成分分析算法(PCA)[16]将它们减少到32维,用128高斯模型构建一个视觉词汇表,最后费舍尔向量减少到2 048。同样,采用深度卷积网络进行特征提取时,这些特征通常是从充分激活的连接层中获得。将每个图像调整到112×112并传入由Alex Net[4]或者Goog Le Net[17]模型框架预先训练好的网络。Alex Net(记为CNN)模型用2 048维激活的顶层隐藏单元作为特征,而Goog Le Net(记为GOOG)模型则用512维顶层池化单元作为特征。这两种网络是用BVLC[18]实现的。

3.1.2 输出嵌入

AWA类有85个二进制和连续属性,CUB类有312个连续属性二进制属性。

用英文维基百科对Glo Ve模型进行训练,首先通过更换类名对它进行预处理,即用学名替代特殊类名,再交叉验证嵌入的维度。对于Bo W模型的训练,首先下载与每个类相对应的维基百科文章,并且通过删除低频和高频词汇来构建一个词汇表,然后交叉验证词汇表的大小。当这些词汇出现在对应的文档中时,则构成词汇表中单词的直方图。

层次结构嵌入模型使用的NLTK库来建立层次结构并测量节点间的相似性,因此,每个向量表示类与其他类的相似性程度。

3.1.3 输出嵌入的结合

将监督属性、无监督Glo Ve、Bo W、层次结构嵌入4种输出嵌入通过串联(cnc)或者并联(cmb)形式相结合。以AWA为例,45维φA和200维φb串联时,构成245维的输出嵌入,以1 024维的GOOG作为输入嵌入,则只需要对1 024×245维的W进行学习,如果是并联,需要对1 024×45维的WA和1 024×200维的WB分别进行学习,再对系数α交叉验证。

3.2 实验结果

3.2.1 离散属性对比连续属性

属性用一个类向量表示,向量代表了各属性存在和缺失或者各属性的置信水平。在表1中,在图像的深层特征方面,φA比φ0,1更好地表明了连续属性比二进制属性拥有更多的语义编码。总的来说,CNN优于FV,然而GOOG给出了最优的结果。

%

对表1进行分析,在CUB中,φA的准确率达到46.9%,远高于之前的22.7%,此外,φ0,1的准确率为33.7%也高于之前的18.6%。AWA也有同样的趋势。对φ0,1和φA进行分析得到,应用深层神经网络提取特征,φA的分类性能明显比φ0,1好,这表明,结构化联合嵌入方法对W矩阵进行学习时,φA比φ0,1具有更好的图像和边信息的兼容性。

3.2.2 文本嵌入

随着不同类的对象之间视觉相似度的不断增加,属性的收集成本也在增加,因此,从无标签的在线文本资源中自动提取类相似度很有必要。每种输出嵌入得到分类效果如表2所示。

在表2中,AWA准确率最高的是φg(55.7%),高于之前有监督的45.3%(表1),CUB准确率最高的是φb(22.9%),超过了之前有监督的22.7%(表1),但在φg和φb之间没有优劣关系。

3.2.3 层次结构嵌入

概念的层次结构通常体现了语言的一部分隐含信息,比如同义、语义关系等。通过类之间的层次距离定义语义相关性,其构成的数值向量将用于图像分类学习的输出嵌入。Word Net层次结构包括CUB的319个节点(200个类),AWA的104个节点(50个类),采用相似度测量方法来测量类之间的距离。

φh最高的准确率是48.9%(表2),这个值是紧随φ0,1(49.5%)之后并高于φb(41.2%),对于CUB,φh是18.9%(表2),仍在φ0,1(34.4%)之下,但接近φb(20.3%)。

3.2.4 输出嵌入结合

表2汇总了每种输出嵌入得到的结果,因为不同的嵌入试图封装不同的信息,所以若将属性嵌入、文本嵌入和层次结构嵌入3种输出嵌入结合,图像分类的准确率应该会提高。本文将多种输出嵌入通过cnc或cmb两种方式进行连接。cnc将执行全部的结构化联合嵌入训练并对串联输出嵌入进行交叉验证,而cmb将对每个并行输出进行联合嵌入的学习并且通过交叉验证来找到整体的权重。与cnc方法相比,cmb可以提高性能,同时不需要用额外的联合训练。观察表3可知,在大部分情况下,cmb都优于cnc。

在表3中,首先对无监督嵌入的结合进行分析,在AWA数据集中,φg(55.7%,表2)与φh(48.9%,表2)结合,准确率达到57.2%(表3),与之前的(45.3%,表1)相比,准确率有所提升。对于CUB数据集,φg和φh结合,准确率达到26.3%(表3),高于之前有监督的准确率(22.7%,表1),实验结果表明,从文本和层次结构获得的无监督输出嵌入是可以互相补充的。在大部分情况下,cmb比cnc的准确率更高或者基本持平。有监督嵌入(φA)和无监督嵌入(φg,φb,φh)的结合显现出相似的趋势。对于AWA,将φA,φg和φh结合,准确率达到69.3%,高于之前的45.3%(表1)。对于CUB,将φA,φg和φh结合,准确率达到47.9%,超过了之前有监督的22.7%(表1)。这些实验表明,在结构化联合嵌入框架中,通过人工标注获得的有监督输出嵌入也能与无监督输出嵌入相互补充。

对结构化联合嵌入框架的有监督属性嵌入和从层次结构和无标签文本语料库中获得的无监督输出嵌入进行实验分析,通过结合多个输出嵌入,建立了一个关于AWA和CUB的表格,如表4所示。

实验结果表明,结构化联合嵌入的无监督的图像分类在原来基础上得到了改善,AWA达到了57.2%,CUB达到26.3%。

4 小结

本文提出了多种输出嵌入相结合的方法,将多种输出嵌入通过串并联的方式进行连接,同时,采用了优化的D-SIFT对图像的特征进行提取,并将标签嵌入和支持向量机通过兼容函数结合起来。实验表明,多种输出嵌入相结合的方法能很好地实现图像分类,提高了分类的准确性。当然,本文仍有进一步研究的空间,在下一步的工作中,主要研究如何从文本中得到更好地表示图像特征的输出嵌入方法。

摘要:利用多种输出嵌入相结合的方法,改善无标签图像的分类性能。以边信息作为标签嵌入,用图像特征作为输入嵌入,在标签嵌入和输入嵌入之间构建一个联合兼容函数,建立结构化联合嵌入框架。通过调整联合嵌入的权重矩阵,使兼容函数取得最大值,据此确定图像的分类。借助两个数据集进行的验证,实验结果显示,多种输出嵌入结合的图像分类方法准确率优于单输出嵌入的图像分类方法。

本文来自 古文书网(www.gwbook.cn),转载请保留网址和出处

相关文章:

盲嵌入算法01-23

模式嵌入01-23

课程嵌入评价01-23

价值嵌入01-23

高阶段采场01-23

施工合同管理的注意点01-23

网络嵌入能力01-23

职业嵌入01-23

关系性嵌入01-23

终端嵌入01-23

注:本文为网友上传,旨在传播知识,不代表本站观点,与本站立场无关。若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:66553826@qq.com

上一篇:盲嵌入算法 下一篇:施工合同管理的注意点