关键词:
高光谱遥感图像(精选十篇)
高光谱遥感图像 篇1
高光谱具有波段多、光谱范围窄、波段连续、数据量大、信息冗余增加等特点。利用高光谱分辨率的特点可显著提高地物类型识别的精度, 但同时大数据量也给数据处理和重要信息提取带来了挑战[1]。由于高光谱图像的波段数量较多且波段间相关性较高, 图像光谱信息所包含的高维特征集, 反而可能会导致分类精度随着特征维度的过分增长而呈现下降趋势, 因此一般会通过降维或特征波段选择的方式选取有限的波段来参与分类识别[2]。
线性判别分析 (LDA) 是经典的特征提取方法。该方法通过最大化类间离散布矩阵同时最小化类内离散度矩阵, 增加类别区分度。但LDA也存在一些问题, 在小样本情况下, 类内离散度矩阵必须满足奇异性。主成分分析 (PCA) 是最常见的无监督特征提取方法, 它不考虑类间可分性, 将数据投影到最大方差方向上。当训练样本的数量有限时, PCA优于LDA, 而且PCA对不同训练数据集的敏感性较低[3,4]。SVM在解决高维数据的监督分类小样本、非线性问题中表现出许多优势。其核心思想是把样本通过非线性映射投影到高维特征空间, 以结构风险最小化思想为归纳原则, 在高维空间中构造维尽可能低的最优分类面作为分类面, 使分类风险上界最小化, 从而使分类器对未知样本具有最优的推广能力。本文提出基于FSDA的高光谱遥感图像分类算法, 进一步提高SVM的分类精度。
2 基于特征空间判别分析的高光谱遥感图像分类算法
2.1 特征空间判别分析
常用的特征提取方法LDA只是使用最大化类间离散布矩阵同时最小化类内离散度矩阵进行特征提取。在FSDA方法中, 除了类间的可分性之外, 还考虑光谱间的离散度。式 (1) 为训练样本矩阵:
其中xikj= (i=1, 2, …, d;k=1, 2, …, c;j=1, 2, …, nt) 属于第i个光谱中k类的第j个样本, nt是每个类训练样本的个数。
hij是一个包含每个类的训练样本的向量。
第一步:计算光谱间离散度矩阵。
其中
最大化tr (Sf) , 对其特征值递减排序。W是由这些特征值相关联的特征向量组成投影矩阵。利用投影矩阵W将原始特征空间投影到使光谱间离散度最大的新的特征空间中, 则有
根据式 (4) , 式 (1) 的样本矩阵Xj (j=1, 2, …, nt) 变为矩阵Rj:
向量gij和Rkj被定义为:
第二步:最大化类间离散度矩阵同时最小化类内离散度矩阵以增加类别差异。
其中
利用正则化方法处理Sw的奇异性。
特征空间判别分析通过最大化光谱间离散度矩阵、类间离散度矩阵和最小化类内离散度矩阵。将原始特征空间投影到低维样本空间中, 同时保证样本类别差异性[5]。
2.2 支持向量机
SVM是一种有监督的学习方法, 对于高光谱分类具有比较好的效果, 因为支持向量机小样本的特点降低了Hughes现象的影响。假设d维的训练样本集xi∈Rd (i=1, 2, …, N) 由两类样本点组成, 如果样本点xi属于第一类, 则标记为1, 否则标记为-1。从样本集中随机取n个样本点作为训练样本集 (xi, yi) , i=1, 2, …n, yi=1或-1。SVM学习训练的目的是要构造一个判别函数, 将两类模式的样本点尽可能正确地区分开来, 即两类样本点的分类间隔尽可能最大[6]。如果训练样本集的n个样本是线性可分的, 则必然存在某个超平面将两类样本完全分开, 即满足:
由式 (11) 构造并求解对变量w∈Rd以及b∈R的最优化问题, 得到:
进一步推导可得SVM的判别函数为:
为了求解式 (13) , 引入原问题的对偶问题:
支持向量是那些使得αi不为零的样本点, 这些样本点离超平面最近, 称这些样本点为支持向量, 支持向量机也由此得名。这样, 判别函数变化为:
如果这n个训练样本不是线性可分的, 可以通过核函数Φ (·) 将原问题映射到高维空间中, 这样求解最优化问题就变为求解下式:
式中核函数为K (xi, xj) =φ (xi) ·φ (xj) , 相应的判别函数为:
目前在SVM的实际应用中, 核函数种类繁多, 其中径向基核函数使用得最多, 如式 (18) 。
支持向量机作为一种新型机器学习方法, 以统计学习理论为基础, 相比传统学习方法, 在解决“局部极小陷阱”“维数灾难”“小样本学习”等问题上有突破性的贡献, 具有精度高、运算速度快、泛化能力强等优点[7]。
3 实验结果分析
本文采用由美国国家航空航天局 (NASA) 的机载红外成像光谱仪 (AVIRIS) 于1992年在美国印第安纳农场上空获, 具有400~2 450nm波长范围内的220个光谱带, 空间分辨率为17m。在去除20个水汽吸收波段和4个严重噪声波段后, 保留200个波段用于分类实验, 该数据包括16类地物, 图像大小为145×145像素。图1给出场景合成图像和地物类别的真实分布情况[8]。
本文实验数据选取常用的9类典型地物进行分类, 分别为免耕玉米地、玉米幼苗、草地/牧草、草地/树木、干草料堆、免耕大豆地、大豆幼苗、纯净大豆、木材, 共包含9 345个样本点, 随机选取70%作为训练样本, 30%作为测试样本。
通过实验, 对SVM和本文算法进行对比分析, 分类结果如表1所示:
从表1的结果中可得:本文提出的算法分类精度优于SVM算法, 提高了4.37个百分点;与此同时算法时间也比SVM快4.28s。实验结果表明本文算法能够有效的提升高光谱遥感图像分类的精度。
4 结语
本文针对高光谱遥感图像分类精度不高的问题提出了基于特征空间判别分析的高光谱遥感图像分类算法。利用特征空间判别分析最大化光谱间离散度矩阵和类间离散度矩阵, 同时最小化类内离散度矩阵, 将原始高光谱遥感数据投影到低维空间里, 在该空间里利用支持向量机进行分类, 实验中本文算法与直接利用支持向量机对原始高光谱数据分类相比, 分类精度、kappa系数和运行时间都有所提高, 证明了本文算法的优越性。
参考文献
[1]梅安新, 彭望禄, 秦其明.遥感导论[M].北京:高等教育出版社, 2008:1-13.
[2]耿修瑞.高光谱图像异常探测与分类技术研究[D].北京:中国科学院遥感应用研究所, 2005.
[3]杨哲海.高光谱影像分类若干关键技术的研究[D].郑州:信息工程大学, 2006.
[4]Maryam Imani, Hassan Ghassemian.Feature space discriminant analysis for hyperspectral data feature reduction[J].ISPRS Journal of Photogrammetry and Remote Sensing, 2015:1-13.
[5]高阳.高光谱数据降维算法研究[D].徐州:中国矿业大学, 2013.
[6]谭琨, 杜培军.基于支持向量机的高光谱遥感图像分类[J].红外与毫米波学报, 2008 (2) .
[7]郭春燕, 赵春晖.基于模糊支持向量机的超光谱遥感图像分类[J].应用科技, 2007 (3) .
积雪污染物含量高光谱遥感监测研究 篇2
积雪污染物含量高光谱遥感监测研究
摘要:积雪中的污染物含量可以用来反映区域和全球范围内人类活动对环境的污染,但是迄今为止,对大范围或人类活动难以到达的地区进行积雪污染物含量时空监测的`研究尚不多见.文章通过模拟大气沉降实验,应用光谱学技术分析了不同污染物含量对积雪反射光谱的影响,而后分别利用构建特征指数法、主成分分析法、BP神经网络以及RBF神经网络模型对积雪污染物含量预测,表明神经网络模型结合高光谱遥感数据方法能够较为准确地估算积雪污染物含量. 作者: 汤旭光[1]刘殿伟[2]张柏[2]杜嘉[2]雷小春[1]曾丽红[1]王远东[1]宋开山[2] Author: TANG Xu-guang[1]LIU Dian-wei[2]ZHANG Bai[2]DU Jia[2]LEI Xiao-chun[1]ZENG Li-hong[1]WANG Yuan-dong[1]SONG Kai-shan[2] 作者单位: 中国科学院东北地理与农业生态研究所,吉林长春130012;中国科学院研究生院,北京100049中国科学院东北地理与农业生态研究所,吉林长春,130012 期 刊: 光谱学与光谱分析 ISTICEISCIPKU Journal: SPECTROSCOPY AND SPECTRAL ANALYSIS 年,卷(期): ,31(5) 分类号: X87 TP79 关键词: 高光谱遥感 积雪污染物含量 主成分分析 神经网络 机标分类号: TP2 U41 机标关键词: 积雪污染物含量高光谱遥感遥感监测研究SnowHyperspectral Remote SensingRBF神经网络模型人类活动主成分分析法数据方法时空监测技术分析含量预测构建特征反射光谱沉降实验指数法区域和光谱学文章 基金项目: 中国科学院知识创新工程项目,国家重点基础研究发展计划专题 积雪污染物含量高光谱遥感监测研究[期刊论文]光谱学与光谱分析 --2011,31(5)汤旭光刘殿伟张柏杜嘉雷小春曾丽红王远东宋开山积雪中的污染物含量可以用来反映区域和全球范围内人类活动对环境的污染,但是迄今为止,对大范围或人类活动难以到达的地区进行积雪污染物含量时空监测的研究尚不多见.文章通过模拟大气沉降实验,应用光谱学技术分析了不同...
高光谱遥感技术在林业监测中的应用 篇3
关键词:光谱;林业遥感;森林资源;特征分析
1. 引言
自上世纪60年代以来,科学技术发展迅速,加速了遥感技术的应用。同时由于人口急速增长,木材需求量逐年递增。非法砍伐现象日益严重。但由于森林面积过大,这种违法现象很难最终追究处罚。由此便想到利用光谱遥感技术来监测林业砍伐,维护森林完整性。光谱遥感技术是将光谱技术和成像技术相结合,以超高的分辨率对目标地物进行成像,同时获取数百甚至上千个波段,从而形成连续光谱图像的技术。林业的监测和调查对于合理利用林业资源,森林资源变化信息提取、监测林业砍伐等起到了举足轻重的作用,为实时而科学的森林经营管理增添了一种新技术手段[1]。笔者们测量的对象包括了自然界的植被,土壤,岩石等地物,研究的波段基本覆盖了遥感所需的全部波段。
2. 试验材料及方法
2.1 试验材料
由于黄草地,枯叶从,土地等颜色较易与树桩混淆,我们采用这些材料进行光谱测定与对比。并设计诸如绿草地,黑棚等一系列颜色与树桩差异较大的材料作为对照组。
2.2 试验地点
中国科学院植物研究所,试验区为中国科学院植物研究所。
2.3 测定方法及数据处理方法
测定方法及时间: 我们选择在2017年1月24日,当天时间为正午12时在室外运用光谱仪进行数据采集(该天天气晴朗,少云),以减小光线对试验数据及结论的影响。又由于室外条件稳定度较低且天气较为寒冷,导致数据的离散程度偏大。所以我们进行了多点位大量数据采集。我们利用光谱仪(ASD FieldSpec HandHeld 1614)
在室外对新老树桩、枯叶从、土地、黑棚、黄绿草地采集了350-1050波段的高清晰度光谱数据。
数据处理:我们对严重离散的数据进行了删减处理,对每个测量点测得光谱数据进行平均值处理。且在图像绘制时,对每种地形各观测点的数据进行平均值处理。并利用Excel 2016进行图像表达,并且除去误差较大测量数据。最后对全波段进行粗略分析并对400-700波段进行详细分析。
2.4 测量仪器及数据处理软件
测量仪器:光谱仪(ASD FieldSpec HandHeld 1614)
数据处理软件:Excel,SPSS18
3. 光谱测定结果及初步分析
3.1 对不同地形光谱特征的对比分析
我们對各数据进行平均值处理后,为方便对其光谱特征进行比较,新树桩、黄草地、枯木从、黑棚和土地的光谱图类似于一次函数;绿草地由于叶绿素的作用,其光谱图呈现非常经典的绿色植物线形【2】;而旧树桩由于暴露于空气的时间过长,气候因素导致其光谱数据在750-1050波长阶段反射率数据异常快速增长。为了方便进行比较和鉴别,我们注重分析400-700波长阶段。鉴别的主要为在该波长范围内反射率增长速度(各曲线斜率)。图1中不难看出,新树桩在400-700的增长速度约为0.0015%/nm,明显高于旧树桩、黄草地、绿草地、枯木从、黑棚和土地在该波段内的增长率。但为了证明各一阶导之间的易分辨程度,我们对其进行了显著性测试。我们可以看出新树桩同枯叶有很大的显著性(p=0.123),即新树桩与枯叶非常相似,很难分辨出。但是也可以通过一阶导数进行分辨。而此又恰与图中测量的NDVI【3】数据所呈现的柱状图相吻合;而老树桩与黄草地,绿草地,枯叶,黑棚,土地有很低的显著性(p=0.00),即很易从光谱分辨出老树桩。
3.2 对新老树桩差异性比较
该实验的目的是由于在林业中,即便检测和处罚后,旧的树桩也很难移出,为避免重复性测量。需要有简便方法鉴别新旧树桩。新老树桩在350-950波长的反射率数据图像近似度极高,很难很快进行比较。所以我们着重分析了950-1050波长的反射率差异。新树桩由于暴露于空气的时间较短,其一阶导数数据基本与350-950波长的反射率一阶导数一样(二阶导数基本为0)。而旧树桩在此波段内一阶导数增长仅为显著(二阶导数基本为正),非常容易辨别。用这种方法可以用极短的时间鉴别木桩的新旧程度,避免重复的侦查和处罚。
结语:本文研究表明,通过遥感光谱数据分析,我们可以通过光谱数据图,NDVI数据以及显著性区分开树桩与其他物体。在400-700nm之间,我们可以通过反射率的斜率区分新树桩、老树桩、枯叶从、黑棚、黄草地、绿草地和土地。通过950-1050波长的反射率差异,我们可以简便的分情树桩的新老程度,在林业上有极大应用。
致谢:感谢中国科学院植物研究所唐治喜,北京少年行科技有限公司杨懿儒、胡萌等的帮助!
参考文献
[1] Wu Jian, Peng Dao-li, et al. 吴见,彭道黎等。高光谱遥感林业信息提取技术研究进展。 北京林业大学省部共建森林培育与保护教育部重点实验。1000—0593(2011)09—2305—08]
[2] Yang Feng, et al杨峰等。高光谱数据估测稻麦叶面积指数和叶绿素密度。1.南京210093; 2.江苏省环境科学研究院,南京210036)
[3] Rouse et al. (1974)
高光谱遥感图像 篇4
高光谱分辨率遥感或成像光谱遥感技术的发展是过去二十年中人类在对地观测方面所取得的重大技术突破之一,融合了成像技术和光谱技术,实时地获取研究对象的影像和每个像元的光谱分布。高光谱图像在获取和传播路径中受到很多因素的影响,引入大量的噪声,降低了数据可靠性,因此研究高光谱遥感图像的去噪算法非常有必要。
常规遥感图像的处理方法分别对光谱信号[1,2]和二维图像[3,4]进行去噪,忽视了高光谱图像图谱合一的特点。目前广泛应用于高光谱图像去噪的方法主要有两类:光谱域的光谱曲线平滑方法;图像域的滤波处理和条带消除。前者实现简单,但只考虑光谱域的噪声,忽视图像的空间信息,后者针对一幅图像进行处理,而对高维数据机械式地处理效率很低。
因此,本文提出了一种基于PCA[5]和BM3D[6]的高光谱图像噪声去除方法,利用PCA变换处理高维数据的高效性和BM3D优越的去噪能力,能够从整体上消除高光谱图像光谱域和空间域的噪声,并得到满意的效果。
1 主成分分析
主成分分析(Principal Component Analysis,PCA)是一种常见的高光谱图像数据降维方法,经过PCA分析可以消除高光谱图像间的相似性,并且其前几个主成分包含了原始数据的绝大多数信息。对于高光谱图像来说损失少量的信息,从而获得很低维度的数据,会在不失精确度的情况下大大提高去噪的效率。
主成分分析的基本原理如下:
根据K-L变换在测量空间中找到一组正交向量,这组向量能最大地表示数据的方差,将原始矢量从原来的n维空间投影到这组正交向量所张成的m(m≪n)维子空间上,其投影系数构成新的特征矢量,从而完成维数的压缩。
设X(x1,x2,⋯,xp),其中xi是N维矢量,则其PCA变换为:
其PCA重构为:
经过PCA变换,Y的各矢量之间的相关性基本消除,并且其前n个主成分包含了原始X的绝大部分信息,而次要主成分则以噪声为主。因此,可以选取适当的主成分进行最小二乘意义下的最优线性重构,重构均方误差,对于含噪X,则重构误差主要是噪声,能够去除一定的谱间噪声。
2 改进非局部块匹配BM3D
由于PCA分析只是方差意义下的最优变换,它并没有考虑图像的空间结构和特征。而BM3D(三维块匹配)正是基于图像的空间信息,是一种非局部的方法,比小波变换更好的图像稀疏表示。对比其他局部的去噪方法,BM3D不仅具有较高的信噪比,而且有很好的视觉效果。
目前对高斯白噪声最好的去噪方法是BM3D方法,对原始BM3D进行改进以适应高光谱情况,其中仅适用于BM3D第一步基本估计的结果,过程如下:
(1)样群组:应用非局部的思想,通过块匹配在整幅图像中寻找对应若干个相似块,这里使用的相似性度量是2范数。将输入图像z划分成若干个相互交叠的块Zx∈X,其中X是这些块的坐标构成的集合,每一个块Zx∈X执行块匹配操作,即将群组中那些与Zx相似的图像块(相似性从大到小,一般取前16个)构成一个三维矩阵:
(2)协同滤波:用三维变换稀疏表示获得的三维矩阵,再通过硬阈值收缩变换系数去除噪声,再执行逆三维变换:
其中T是一个可分的三维变换,T-1为T的逆变换。
(3)聚合:通过加权平均聚合每一组Yx3D∈X中的所有图像块获得最后的去噪图像。权值由下式给出:
其中NxRhar为三维矩阵变换且硬阈值化后非零系数的个数,σ为输入含噪图像的噪声标准偏差,具体的聚合公式为:
其中ybasic(x)即为估计结果。
3 基于PCA和BM3D的高光谱图像噪声去除方法
对于高光谱图像来说,噪声(主要是高斯白噪声[7])随机存在于多个波段的不同位置,PCA的过程利用谱间相关性,在一定程度上去除谱间噪声,并达到降维的效果,改进BM3D在图像空间域相关性上去除谱内噪声,两种方法分别考虑谱间和谱内的相似性,分别去除了两个维度的噪声。
3.1 噪声去除过程
图1给出了基于PCA和BM3D的高光谱图像噪声去除方法的主要过程。
3.2 降噪主分量的选取
在弱噪情况下,尽管PCA的前K个主分量通道包含总能量的大部分,当然他们也包含一部分噪声,不过如果对这些通道进行降噪处理,一些有用的细节信息将会丢失。所以在弱噪情况下,对剩余通道进行降噪处理[8]。而在强噪情况下,选取剩余通道进行降噪处理,去噪效果将会很差,受文献[6]中提出的彩色图像去噪的启发,在进行BM3D去噪时,由于大部分边缘、结构等信息保存在前几个主分量上,因此,在进行第一步块匹配的过程时仅需要对第一主分量进行块匹配,将第一主分量的块匹配结果用于剩余通道,这样不仅保证块匹配的结果更正确,同时在一定程度上加快了运行速度。本文将对强噪情况下的图像进行处理。
4 实验结果和分析
实验数据来自高光谱图像收集实验室(HYDICE),拍摄的是华盛顿地区,整个图像大小为1 208×307,包括191个通道。截取大小为256×256的子图,对176~191通道加入方差为30的高斯白噪声。
衡量去噪效果,首先是主观上从视觉效果观察噪声的消除情况,从客观上评价使用峰值信噪比,峰值信噪比客观衡量了去噪图像与原始图像相似程度,第l波段的图像的峰值信噪比定义如下:
式中:fl,i,j表示第l波段原始图像在坐标(i,j)的像素值;f*l,i,j表示该波段含噪声或去噪后的图像在坐标(i,j)的像素值;M,N分别表示图像的长和宽;L表示总的波段数。
算法程序在VS2010环境下运行,主成分分析选取前6个分量进行BM3D去噪,最后将结果与小波硬阈值[9,10]方法进行比较。图2为峰值信噪比曲线,可以看出此方法对所有波段的处理效果很平均,而小波方法对不同波段处理效果不一。总体性能上,本文方法平均PSNR比小波方法高3.2 dB。
图3,图4给出了第190波段的原始图像,含噪声图像,从图5中可以直观地看出小波硬阈值方法去噪后图像相对比较模糊,视觉效果一般,噪声点还有很多;而图6利用本文方法去噪后可以清楚地看到图像的轮廓信息,从而保证对高光谱图像后续工作的可靠性。
5 结语
传统的图像去噪方法并不适用于高光谱遥感图像,因为高光谱图像不仅存在两个维度的噪声,而且由于通道较多,数据维度较高处理更为复杂。该方法利用PCA变换具有的优越的数据降维能力,以及BM3D算法对高斯白噪声良好的处理效果,将两者结合做到在消除噪声的同时,最大限度地保留去噪后高光谱数据的质量。同时,由于PCA的降维消除相关性特性,一定程度上可以消除谱间噪声,并减少整体算法的运行时间。
参考文献
[1]田高友,袁洪福,褚小立,等.结合小波变换与微分法改善近红外光谱分析精度[J].光谱学与光谱分析,2005(4):516-520.
[2]徐广通,袁洪福,陆婉珍.CCD近红外光谱谱图预处理方法研究[J].光谱学与光谱分析,2000(5):619-622.
[3]CHANEG S G,YU B,VETTERLI M.Adaptive wavelet thresholding for image denoising and compression[J].IEEE Transactions on Image Processing,2000,9(9):1532-1546.
[4]DONOHO D L.De-noising by soft-thresholding[J].IEEE Transactions on Information Theory,1995,41(3):613-617.
[5]刘春红,赵春晖,张凌雁.一种新的高光谱遥感图像降维方法[J].中国图象图形学报,2005(2):218-222.
[6]DABOV K,KATKOVNIK V F A,EQIAZARIAN K.Image denosing by sparse 3-D transform-domain collaborative filtering[J].IEEE Transactions on Image Processing,2007,16(8):2080-2095.
[7]陈秋林,薛永祺.OMIS成像光谱数据信噪比估算[J].遥感学报,2000(4):284-289.
[8]ZHANG Hong-yan,HE Wei,ZHANG Liang-pei,et al.Hyperspectral image restoration using low-rank matrix recovery[J].IEEE Transactions on Geoscience and Remote Sensing,2014,52(8):4729-4743.
[9]OTHMAN H,QIAN Shen-en.Noise reduction of hyperspectral imagery using hybrid spatial-spectral derivative-domain wavelet shrinkage[J].IEEE Transactions on Geoscience and Remote Sensing,2006,44(2):397-408.
高光谱遥感图像 篇5
基于实测高光谱的太湖水体悬浮物浓度遥感估算研究
摘要:悬浮物浓度是水质和水环境评价的重要参数之一.利用-11-08~2007-11-21 14天时间对太湖74个样点进行水质取样分析和波谱实测.在提取水体遥感反射率后,分析其与悬浮物浓度的相关关系,发现在400~900nm波段范围的备波长遥感反射率与总悬浮物、无机悬浮物浓度都存在中高度相关,最大相关系数均出现在725nm处.分别为0.883和0.869,而与有机悬浮物浓度则无较好的相关性.同时利用敏感波段的遥感反射率建立了悬浮物浓度估算的神经网络模型.结果表明:对于总悬浮物浓度,隐含层节点数为6的神经网络模型的R2=0.948,RMSE=4.947,在备节点中的训练效果最佳;而对于无机悬浮物浓度,隐含层节点数为4的.神经网络模型的R2=0.956.RMSE:5.104,模型骼体训练结果最好.此外,通过测试样本对神经网络模型和经验模型的预测误差进行分析表明,无论是估算总悬浮物浓度,还是无机悬浮物浓度,无论从建模样本的建模精度,还是测试样本的误差分析,神经网络模型邰优干经验模型. 作者: 孙德勇李云梅王桥乐成峰黄昌春施坤王利珍 Author: SUN De-Yong LI Yun-Mei WANG Qiao LE Cheng-Feng HUANG Chang-Chun SHI Kun WANG Li-Zhen 作者单位: 南京师范大学,教育部虚拟地理环境重点实验室,江苏,南京,210046 期 刊: 红外与毫米波学报 ISTICEISCIPKU Journal: JOURNAL OF INFRARED AND MILLIMETER WAVES 年,卷(期): , 28(2) 分类号: X524 关键词: 遥感反射率 悬浮物 神经网络模型 太湖 机标分类号: V21 U67 机标关键词: 实测 高光谱 太湖水体 悬浮物浓度 遥感估算 TAI HYPERSPECTRAL DATA IN SITU BASED SUSPENDED MATTER REMOTE SENSING 神经网络模型 遥感反射率 总悬浮物 隐含层节点数 经验模型 误差分析 测试样本 最大相关系数 无机 基金项目: 国家自然科学基金,国家科技支撑计划,江苏省普通高校研究生科研创新计划,南京师范大学研究生优秀学位论文培育计划高光谱遥感图像 篇6
高光谱遥感是目前遥感领域的热门技术,高光谱传感器为高光谱影像每个像素提供了上百个波段的信息[1,2],丰富的信息量为更精确识别地物提供了可能,但同时也存在信息高度相关、冗余信息量大等缺点。为解决高维小样本的问题,通常采用特征提取与特征选择进行数据优化,主成分分析(PCA)、最小噪声分离(MNF)、独立成分分析(ICA)等是应用较多的特征提取方法,然而这些方法都是基于数据流形是线性的假设,都是在不同优化准则下寻求数据最佳线性模型。Bachmann等指出高光谱数据具有内在的非线性特征,其非线性源主要包括:地面散射的非线性性、非线性双向反射分布函数模型表述、水体衰减作用的非线性变化、亚像素的谱混合及地物的异质性等[3],传统的线性特征提取方法并不能有效揭示这些非线性特征。
流形学习是近年来发展起来的一种基于统计学习的非线性维数约简方法,是近年来模式识别和机器学习领域研究的热点,自从2000J.B.Tenembaum和Sam T Roweis等在《Science》杂志同一期上发表文章分别提出Isomap[4]和LLE[5]算法以来,流形学习就在数据挖掘、模式识别、机器学习等领域取得了广泛的应用。在高光谱数据处理方面,Chen Y C等人将Isomap算法应用于高光谱数据处理[6],Qian等人利用LLE、LE进行高光谱特征提取[7]。然而目前流形学习算法大都基于局部线性的假设和非监督聚类的思想,在面向分类问题时,没有考虑到样本的类别属性,并不利于分类。GENG X等人在Isomap算法中引入类别信息来指导Isomap降维[8],本文首先采用Kmeans算法对原始数据进行非监督聚类分析得到样本的初始类别标签,基于分类目的提出一种新的距离度量方法进行近邻搜索,并把这种监督Isomap方法应用于高光谱数据处理。
本文首先分析了面向分类的高光谱遥感影像降维面临的几个问题,然后描述了一种监督Isomap算法及其改进算法,并在UCI数据集和真实高光谱数据上进行了实验验证和结论分析。
1 影响流形学习降维分类的几个关键问题
1.1 数据本征维数的估计
本征维数即嵌入在高维数据中的低维流形的维数,数据本征维数的估计对低维嵌入结果有很大的影响,估计过大会造成信息冗余,估计过小则会造成高维空间的数据点在低维空间中出现重叠。然而如何准确地得到数据的本征维数则是一道经典难题,目前主要使用特征映射法[9]、几何学习法[10]、统计学习法[11]等对数据的本征维数进行估计。在Isomap算法中,Tenenbaum等人定义了重构残差,利用残差进行本征维数估计,本文也利用残差定义如下规则进行本征维数估计:
Ri/R1<0.01≤Ri-1/R1
那么Intrinsic Dimensionality(ID)=i-1,其中R为残差。
1.2 近邻点选择
近邻参数是影响流形学习算法分类性能的重要因素之一,如图1所示,选择过小的近邻参数K虽然保证了局部线性的假设条件,但是在面向分类问题时,不能反映类别信息,不利于分类;K值选择过大则不能保证局部线性,破坏了局部线性假设。确定合适的邻域搜索范围对低维嵌入结果有很大影响,虽然学者们对此做了大量研究,提出了许多改进的算法,但是目前并没有一个统一的标准来规范邻域参数的选择,大多数时候还是根据经验进行估选。
1.3 噪声影响
当前流形学习算法大都假设数据是均匀稠密采样于一个光滑流形,但是由于种种原因实际数据总是包含噪声,当算法在采用局部邻域思想重构流形结构获取对观测空间的有限描述时,如果存在大量噪声的话,则可能覆盖支撑域外的空间,从而产生错误的低维投影,图2为光滑流形和含噪声的流形低维嵌入结果,显然噪声流形低维嵌入不仅没能将流形拓扑结构展开,而且出现了畸变。
2 Isomap算法及改进的S-Isomap算法
Isomap算法是基于维尺度变换(MDS)[12]的一种流形学习方法,其核心思想是用近邻图中任意两节点间的测地距离来代替欧式距离;然后利用MDS计算高维数据的低维嵌入。作为一种全局数据降维算法,Isomap很好地反映了数据的流形结构,但它同时也是一种非监督的学习方法,在获取数据的低维嵌入过程中没有考虑到样本的类别标签,不利于后续的分类识别,带有监督信息的流形学习算法从数据分类的角度出发,经过投影后同类样本在低维目标空间更加紧凑,不同类的样本则更加分散,更有利于识别。文献[8]基于Isomap提出了一种监督流形学习算法,假设数据包含n个样本,那么可以将样本表示为(xi,xj),i,j=1,2,…,n,其中xi是样本的观测值,yi是样本的类别标签,d(xi,xj)是样本间的欧式距离,xi,xj两点间的距离可按下面规则定义:
当yi=yj时,如果:
那么:
否则:
当yi≠yj时,如果:
那么:
否则:
式中β用来防止d(xi,xj)过大时D(xi,xj)增长过快,α用于控制不同类间距离不至于太远。
基于分类目的,本文首先采用KMEANS算法对原始数据进行聚类得到样本的初始类别标签yi,i=1,2,…,n,xi,xj两点间的距离重新定义如下:
α用于描述类间相似性,α∈[0,1) ,一般设置为一个全局经验参数,显然上式类间距离大于类内距离,且参数较少,因而更加适合于分类。考虑到高光谱数据的特点,杜培军[13]等建议在Isomap算法构建近邻图时,可以采用光谱角(SA)、光谱信息散度(SID)[14]等代替欧式距离进行度量,光谱角不受光照等条件的影响,能很好地抵抗乘性干扰,提高了数据的稳定性,本文也进行了相关实验。假设高光谱数据有n为波段数,光谱A与光谱B的光谱角定义为:
设两个像素n个波段的光谱分别为A=(A1,A2,…,An),B=(B1,B2,…,Bn),那么光谱信息散度定义为:
SID(A,B)=D(A‖B)+D(B‖A)
其中:D(A‖B)=∑
D(B‖A)=∑
pi=Ai/∑
S-Isomap算法定义如下:
输入:原始高光谱数据X:a×b×D
输出:嵌入特征Y:a×b×d
① 拉伸并标记数据得
X:(x1,y2),(x2,y2),…,(xn,yn),n=a×b
② 构建近邻图,每个数据点为一个图节点
For i=1: n
If i与jε近邻或者K近邻
Connect i and j
If label(i)==label(j)
d(i,j)=d(xi,xj)
If label(i)~=label(j)
③ 利用Dijkstra或者Floyd算法寻找最短路径
Initialize if i and j connected
dG(i,j)=d(i,j)
Otherwise dG(i,j)=∞
For k=1: n
Replace dG(i,j) by min{dG(i,j),dG(i,k)+dG(k,j)}
得到图距离矩阵DG=dG(i,j)
④ 计算Sij=D
3 实验结果及其分析
3.1 UCI数据集实验
为了验证本文方法的有效性,实验基于Matlab 7.8,Intel Core(2) E7500 CPU,4GB内存,Win7操作系统,在UCI[15]数据集上进行测试,使用的UCI数据集有Iris,Air,Breast,Sonar,Wine,其数据集属性如表1。实验时随机选取数据集的50%作为训练样本,余下50%作为测试样本,采用KNN分类器,实验数据及结果见表1和表2,很明显新距离度量带类标签的S-Isomap分类精度高于Isomap和PCA。
3.2 高光谱数据实验一
实验数据采用普渡大学提供的高光谱影像数据[16],为1992年6月份印第安纳州的Pines地区AVIRIS影像,原始数据共220个波段,影像大小为145×145,共16类地面真实数据,波长范围为0.40002μm~2.49896μm,空间分辨率25m,由于数据采集质量问题,实验前去除由于水汽吸收和低信噪比波段后,保留了其中187个波段进行实验,随机裁剪出100×50大小影像,实验前采用基于二阶概率统计纹理滤波器进行数据滤波预处理。
图3为AVIRIS高光谱遥感影像及采用本文方法欧式距离计算邻域的S-Isomap降维10维前5分量图像,图3(g)为b、c、d分量假彩色合成图像,实验中邻域参数K取12,表3为传统Isomap算法和本文方法降维残差对比分析。图4为将光谱角(SA)引入到本文方法的降维结果,图4(a)为AVIRIS影像,图4(b)-(f)为降到10维后前5分量影像,图4(g)为其b、c、d分量假彩色合成。表4列举了光谱角度量Isomap和本文方法降维后各维残差。图5为文中各种降维方法残差对比分析图,图6为3种降维方法维数与信息量的关系。
实验结果显示,文中各种方法降维后前面5个分量信息量丰富,均达到90%以上,而且细节清晰,说明流形学习是一种有效的高光谱降维方法,图6显示本文S-Isomap信息量保持明显优于传统Isomap。在残差方面,采用欧式距离度量的Isomap算法和本文方法最小分别为0.0511和0.0129,采用SA度量的Isomap和本文方法最小分别为0.0043和0.0027,明显低于欧式距离度量,可见采用光谱角计算邻域优于欧式距离计算邻域。综上本文方法优于传统Isomap,将SA引入本文方法进一步提高了其降维性能。
图5显示欧式距离度量的 Isomap、欧式距离度量的S-Isomap、光谱角度量的S-Isomap残差曲线分别在3维、5维、3维后趋于缓和,因此在实际操作中也可将本征维数分别估计为3、5、3维。
3.3 高光谱数据实验二
实验三仍采用实验二的实验数据,裁剪影像区域为[117,145]× [18,57],该地区共包含4类地物,实验对比了传统线性降维方法PCA和本文方法在高光谱数据降维后各分量对分类的贡献,目标维8维,K取12。图7显示PCA降维后前面4个分量对分类贡献较大,图8显示基于S-Isomap降维后前面8个分量对分类贡献都比较大,说明流形学习降维不仅前面主要分量集中了数据集绝大部分信息,较传统线性降维方法,其次要分量对分类也能提供更多潜在的信息。
4 结 语
本文基于全局流形学习算法Isomap,将数据的先验类别标签信息引入到邻域计算中,给出新的距离测度,该方法使得同类样本更加紧凑,不同类样本更加离散,符合分类思想。UCI数据集和高光谱数据降维实验验证了该方法的可行性,实验过程中将光谱角引入到本文方法中用于改进距离计算,验证了SA度量的S-Isomap算法是最优的。但是相比传统线性降维方法,流形学习时间复杂度高、内存开销大,限制了它的实际应用,许多理论尚需完善,其中流形学习定量研究、定量分析算法与真实流形的逼近程度、流形学习稳定性及泛化能力研究、多流形学习、如何解决大样本数据集降维等都是极具挑战的问题。
摘要:在面向分类的高光谱遥感数据降维过程中,考虑到高光谱遥感数据内在的非线性结构和传统流形学习非监督的特点,提出一种新的监督等距映射方法(S-Isomap)。方法基于类间距离大于类内距离的思想,首先利用KMEANS算法对原始数据进行聚类得到样本的初始类别标签,采用新距离搜寻数据点的K近邻,进而实施等距映射降维。实验证明了该方法优于传统Isomap。
高光谱遥感图像 篇7
高光谱遥感影像能够提供丰富的光谱与空间信息,已广泛应用于城市规划、植被覆盖监测等诸多领域。另一方面,由于高光谱遥感影像各波段间包含了大量的冗余信息,因此在实际使用中需要有效的波段选择方法以提取其中的有效信息并减少运算量。目前常见的波段选择方法主要包括基于信息量准则和基于类间可分性准则的方法等。本文将结合这两种波段选择准则,使用信息散度表征波段间的相关性,对高光谱遥感图像进行子空间分解。
粒子群优化(Particle Swarm Optimization,PSO)算法是一种群智能算法。该算法中粒子的移动速度由自身惯性、自身最佳位置和群体最佳位置这三部分组成。算法中惯性权值的大小决定自身惯性速度,惯性权值同时影响算法的局部搜索能力和全局搜素能力。为了平衡算法的全局搜索能力和局部搜索能力,加快算法的收敛速度,本文算法中的惯性权重值随迭代过程线性变化。本文使用基于信息散度的子空间划分方法将高光谱遥感图像进行子空间划分后,把波段熵之和及熵的方差作为信息量标准,把Bhattacharyya距离作为类间可分性标准,构造适应度方程,使用改进粒子群算法进行波段组合优化选择。
1 波段选择方法及流程
根据高光谱遥感影像波段数目多、数据量大、波段之间相关性强、数据冗余度高等特点,本文把处理流程分为四个阶段:图像预处理阶段、子空间划分阶段、波段优化组合阶段、分类验证阶段。本文着重介绍波段去相关子空间划分和波段优选两部分,为了验证波段选择方法的有效性和可行性使用最小距离分类法对选出的波段组合进行分类验证。
2 基于改进粒子群算法的高光谱波段选择方法
2.1 子空间划分
在高光谱遥感图像处理中,虽然相关系数和信息散度都可用于表示两个波段之间的相关性,但也存在一些差别。相关系数作为常用的波段间相似性度量,为波段灰度向量与均值之差的积,其将波段作为一个向量,表示两个向量之间的夹角,为一种线性关系,当两个波段完全相同或为线性表达关系时,他们的相关性最大。信息散度也被称为KL距离或相对熵,是统计独立性的最佳测度。能够描述两个概率分布的距离,表征两个概率分布之间的差别。
本文的子空间划分方法依照的准则为:将波段序号连续的波段划分为一组,划分的界限为相邻波段间信息散度较附近其他波段间大的波段。
2.2 波段选择方法
本文提出的算法流程如图1所示。
2.2.1 粒子群算法的改进
如图1所示,为了让算法在搜索开始时具有较好的全局搜索能力,在搜索后期具有较好的局部搜索能力,本文使用变惯性权重的方法进行搜索。惯性权重ω的变换公式为:
其中,ω表示惯性权值,ωmax、ωmin分别表示惯性权值的最大值和最小值,iter、itermax分别表示当前迭代次数和最大迭代次数假设惯性权重最大值、最小值分别为1.2、0.1,最大迭代次数为500,惯性权重值线性递减,逐渐从搜索开始时的最大值递减到最小值。
2.2.2 算法适应度方程
算法中粒子被选中的概率由适应度值决定,本文将波段组合的信息熵之和、波段信息熵方差、类别之间的Bhattacharyya距离作为适应度函数,克服了使用单一准则带来的片面性。
(1)高光谱遥感图像中第i波段的信息熵表示为:
其中,Pj表示波段中光谱亮度值为j的概率,n表示波段中光谱亮度级数。
(2)波段熵的方差可表示为:
其中,n为波段组合的数量,H(xi)为第i波段的信息熵,为n个波段信息熵的平均值。
(3)Bhattacharyya距离由于在进行计算时,同时兼顾了一次统计量和二次统计量,可作为两类别在高维空间上的最佳距离测度,两个类别之间的B距离越大,表示两个类别之间的可分性越好,两类别a、b的B距离的表达式可表示为:
其中,μa,μb表示样本a,b的光谱亮度均值,∑a、∑b表示样本a,b对应区域的协方差矩阵。
3 实验结果与分析
本文使用AVIRIS高光谱遥感图像进行实验(采用第23、7、14波段融合后的多光谱影像,如图2所示),并与基于标准粒子群算法的波段选择方法进行对比,从而验证本文提出算法的有效性和实用性。实验采用MATLAB仿真平台。
3.1 子空间划分
对AVIRIS高光谱遥感图像相邻波段间信息散度的极值点进行统计,依照前文介绍的准则进行子空间划分,把原始图像划分为6个子空间,各子空间所含波段及维数如表1所示。
为了说明使用本方法进行波段子空间划分的正确性,着重考察局部极值点前后波段变化情况,使用波段灰度图进行直观比较,选取具有代表性的第35、36波段和第90、91波段前后波段进行对比。图3(a),3(b)中灰度图轮廓大致相同,两幅图中前3波段相似度较高,后3波段相似度较高。
3.2 波段选择
改进粒子群算法中各项参数设置如表2所示,算法中波段惯性权重为[0.2,1.3]。本文提出的波段选择方法将Bhattacharyya距离作为类别间距离的测度,B距离用来表征两个类别A与B之间的可分性,B距离的值越大,表示类别A与B的可分性越好,实验中在进行A、B样本选取时,按照地物类别相近但不相同的原则进行,在图像中分别选取24×24像素大小(共计576个像素点)的样本。
分别使用本文算法和标准算法进行波段选择,两种方法选出的波段组合如表3-4所示。
对比表3、表4中的实验结果,使用改进算法选出的波段组合各项参数明显较标准算法优,说明改进算法较标准算法寻优能力更强。改进算法中采用变惯性权重的方式,兼顾到了全局搜索能力与局部搜索能力,改进算法收敛速度较标准算法明显加快。
4 结束语
本文提出了一种针对高光谱遥感影像的波段选择方法,实现了对高光谱遥感影像的降维处理,有利于进一步提高高光谱遥感影像的使用效率。该方法使用信息散度表征波段间的相关性用于波段子空间划分,克服了使用相关性系数的片面性。同时,该方法分别从信息论和类别间可分离性双重准则进行考虑,把波段的熵值之和、波段组合熵的方差、类别之间的Bhattacharyya距离作为选择方法的适应度。与标准粒子群算法相比,本文算法的波段组合更优,同时具有更快的收敛速度,具有良好的可行性与有效性。
参考文献
[1]赵春晖,陈万海,杨雷.高光谱遥感图像最优波段选择方法的研究进展与分析[J].黑龙江大学自然科学学报,2007(5):592-602.
[2]Kennedy J,Eberhart R C.Particle Swarm Optimization[C]∥Proceedings of IEEE International Conference on Neural Networks.Perth:IEEE Neural Networks Society,1995:1942-1948.
[3]Kennedy J,Eberhart R C.A Discrete Binary Version of the Particle Swarm Algorithm[C]//Proceedings of the World Multiconference on Systemic,Cybernetics and Informatics 1997.Piscataway:IEEE,1997:4104-4109.
[4]Chein-I Chang,Qian Du,Tzu-Lung Sun,et al.A joint band prioritization and band-decorrelation approach to band selection for hyperspectral image classification[J].Geoscience and Remote Sensing,IEEE Transactions on Nov.,1999,37(6):2631,2641.doi:10.1109/36.083411.
[5]姚志均,刘俊涛,周瑜,等.基于对称KL距离的相似性度量方法[J].华中科技大学学报:自然科学版,2011(11):1-4.
高光谱图像技术检测柑橘果锈 篇8
柑橘是我国南方区域农业经济中的一大支柱产业,其品质特性倍受关注。果实生长发育过程中,受到潜隐性病毒的侵害,柑橘表皮上会产生痕斑、网纹和锈螨蚧类等附着物,形成柑橘表面的果锈,严重影响水果的洁净度。在柑橘等级分类的国家标准中,果锈总面积的大小是柑橘分级的重要指标之一。机器视觉技术已经成功地应用到柑橘在线分级,但由于果锈和正常区域的色差不大,容易造成传统视觉系统的漏判。
高光谱图像技术[1]集图像信息与光谱信息于一身,在农畜产品品质无损检测中得到了越来越广泛的应用[2]。如Qiao[3]和Lauren[4]分别利用高光谱图像技术检测猪肉和牛肉的品质,Park[5]、Mahesh[6]和陈全胜[7]分别利用高光谱图像技术对动物排泄物、小麦质量和茶叶质量等级进行分类。但利用高光谱图新技术检测柑橘果锈未见报道。主成分分析算法可以克服高光谱图像数据量大和相邻波段之间的强相关性等缺点,实现对高维数据的降维。但针对全光谱图像数据的主成分分析算法耗时长,影响检测的速度,无法满足实时在线检测的需求。因此,在前人研究的基础上试验尝试利用两步主成分分析的方法,优选特征波长,以提高检测的速度,满足实时在线检测柑橘果锈需求。
1 材料与方法
1.1 试验材料
试验采用的研究对象为永春柑橘,产地福建永春。购自镇江当地超市,共100个柑橘样本,包括50个果锈样本和50个的正常样本。
1:CMOS camera; 2:Optical fiber; 3:Power supply; 4:Computer; 5:Motorized positioning table
1.2 高光谱图像系统
高光谱图像数据是利用图1所示基于光谱仪的高光谱图像系统采集得到的。它是由基于光谱仪的高光谱摄像机(ImSpector,V10E,Finland),一个150 W的光纤卤素灯(DC-950A,Dolan-Jenner Co.,USA)、一套高精度输送装置(北京卓立汉光仪器有限公司)和一台高性能计算机等部件组成。其中,光纤卤素灯是通过一个Y型的光纤来提供两个对称的光源。高光谱摄像机的光谱采集范围为408~111 7 nm,光谱分辨率为2.8 nm,光谱的采样的平均间隔为0.69 nm,这样在408~111 7 nm波长范围内有1 024个波段。
1.3 图像采集
图像数据采集前,首先确定高光谱摄像机的曝光时间以保证图像的清晰;然后,根据相机的扫描频率确定输送装置的速度以避免图像尺寸和空间分辨率失真。利用150 W光纤卤素灯对称式照射,在柑橘表面形成足够的光照强度,在此条件下对相机的曝光时间进行优化,最终确定为30 ms。根据实际测量,摄像机的视野范围为170 mm,而其线状空间上的像素数为1 280,所以采集得到的图像中每一个像素对应的实际长度为170 mm/1 280=0.133 mm。
此时摄像机的扫描频率为9.2 frame/s,为避免图像垂直方向上的空间分辨率失真,设定图像采集过程中输送装置的前进速度为0.133 mm/frame×9.2 frame/s=1.22 mm/s。
数据采集时,线阵的探测器在光学焦面的垂直方向作横向扫描(x轴方向),获得一个线状空间,在这个线状空间中,每一个像素具有不同波长下光谱信息;同时随着样品的前进(y轴方向),线阵探测器就好像扫帚扫地一样扫出整个平面从而完成整个图像数据的采集,得到一个大小为1 280×Y×1 024的高光谱图像块(Y据样品的宽度而定),如图2所示,高光谱图像既有特定像素下的光谱信息又有特定波长下的图像信息[8]。
1.4 图像标定
由于各波段下光源强度分布不均匀及传感器中暗电流的存在,导致光照强度分布较弱的波段下,获得的图像含较大噪声,须进行标定。在与样品采集相同的系统条件下,首先,扫描反射率为99%标准白色校正板(Spectralon®,Labsphere Co.,England)得到全白的标定图像W;然后,关闭摄像机快门进行图像采集得到全黑的标定图像B;最后,按照式(1)完成图像标定,使采集得到的绝对图像I变成相对图像R[7,9,10]。
式中:I为原始的高光谱图像,B为全黑的标定图像,W为全白的标定图像,R为标定后的高光谱图像。
2 结果与讨论
2.1 数据预处理
由高光谱的原理知道,柑橘图像上的每个像素点都存在不同波长下的光谱信息。图3表示柑橘正常区域与果锈区域在408~1 117 nm范围内的光谱曲线。图中,上面的三条曲线是柑橘正常区域的光谱曲线,下面的三条是柑橘果锈区域的光谱曲线。从图中可看出,果锈区域与正常区域的光谱曲线在波长570~750 nm之间区别较大,而在570 nm以下和750nm以上的光谱曲线噪声明显。因此,在后期的数据处理过程中,选取570~750 nm范围内的高光谱图像数据进行分析。
为了减少噪声和数据冗余,并降低数据处理过程中的运算量,将标定后的图像块在光谱轴方向每5个像素取平均值,在条状空间(X轴方向)中选取281~800范围内的像素,以保证样品图像完整为准,就得到一个520×Y×51的图像块,大大减少了数据量。
2.2 主成分分析
主成分分析[11]是一种十分有效的多维数据降维方法。主成分分析沿着协方差最大的方向由高维数据空间向低维数据空间投影,将原变量线性组合为一些新变量,这些新变量(又称主成分)是不相关的,并且最大限度地表征了原始数据的信息,既实现数据的降维,又能消除原始数据中的冗余信息。所以本试验通过主成分分析来优选特征波长,根据方差贡献率的大小提取前面几个主成分图像,从中找到最容易检测柑橘果锈的主成分图像;然后根据这一主成分权重系数的大小,选择能够表征柑橘果锈的特征波长。
图4为对标定后的高光谱图像进行主成分分析得到的前三个主成分图像。其中,PCⅠ、PCⅡ和PCⅢ分别为第一、第二和第三主成分图像。由图中可以明显看出,第三主成分图像中果锈区域具有很高的灰度值,与周围区域的灰度差异最大,为试验寻找的主成分图像。
2.3 特征波长的选取
如果能使用最少的波数进行主成分分析,就能接近图4中PCⅢ的表征效果,这样就能大大提高数据处理速度,因此特征波长的选择很关键。由主成分分析的概念可以知道,主成分图像是由原始高光谱图像数据中所有波段下的图像经过线性组合而形成的,如式(2)所示。
式中:PCm为第m个主成分,αi为该主成分的权重系数,Ιi为单个波段的原始图像。
比较该线性组合中的权重系数αi,如果权重系数绝对值越大,对主成分图像贡献就越大。为了选取最佳的波长组合,必须保证它们的权重系数绝对值尽可能大,同时还要保证它们之间有一定的波长间隔。试验通过考察PCⅢ线性组合中的权重系数,优选571、652和741 nm作为3个特征波长,其对应的图像如图5所示。
2.4 目标提取
柑橘是个球状物体,容易形成光照不均匀,在其最上部接受到的光照强度最强,在图像的中心形成一个高亮区域,如图5所示。高亮区域对图像处理和特征提取造成一定的影响,因此必须消除高亮区域对图像处理的影响,通常情况下消除高亮区域的方法可以从两个方面着手:1)通过改善光照的方式,如采用漫反射式光照环境来消除高亮区域的影响;2)采用不均匀二次差分和两步主成分分析等算法来消除亮斑影响。本研究是通过第二种方法来消除高亮区域影响。试验表明,在不均匀二次差分算法中,波长间隔需要通过反复尝试来确定,主观性大。因此,本试验最终采用两步主成分分析算法来消除光照不均匀的影响。将上述三个特征波长图像组合成一个新三维数据块,再进行第二步主成分分析,仍可得到三个主成分图像(PC1、PC2和PC3),如图6所示。从图中可看出,第三主成分图像(PC3)已有效地消除了高亮区域,而且与PCⅢ图像十分相似,说明在果锈特征的表达上,三个特征波长图像包含了原始数据中的大部分特征信息,因此选取PC3图像作为目标检测图像。PC3图像存在很大的噪声,如图6(c),因此,首先对其进行中值滤波(3×3模板)处理,结果如图7(b);为了更容易检测到果锈区域,有必要对图7(b)进行平方根变换,结果如图7(c);再选择适当的阈值进行二值化处理,得到的二值图像如图7(d)。最后进行2次腐蚀(3×3模板)和两次膨胀(3×3模板)处理,以去除图像上存在的零碎亮斑,完成柑橘果锈的提取,结果如图7(e)。
2.5 检测结果
按照以上步骤,对100个柑橘样本进行检测,结果如表1所示。由表1可知,50个正常柑橘样本中,46个样本正确检测,4个检测误差;50个果锈柑橘样本中,44个正确检测,6个检测误差;100个样本的总体检测率为90%。经进一步分析,将正常柑橘样本误判为果锈柑橘的原因很复杂,主要是有些正常柑橘样本的表面不是很光滑,这种凹凸不平的表面容易被误判为果锈;而将果锈柑橘误判为正常柑橘的原因主要是果锈区域过小,进行形态学变换时容易将这些过小的区域腐蚀掉,导致误检。
3 结论
试验利用高光谱图像新技术检测柑橘果锈进行了初步研究,并利用两步主成分分析实现高光谱数据有效的降维。研究结果验证了基于高光谱图像技术及两步主成分分析方法检测柑橘果锈的可行性;根据主成分的权重系数,确定的特征波长能够充分反应其它波段的信息,实现多维数据的有效降维;采用两步主成分分析法可以降低光照不均匀的影响,并可利用试验得到的三个特征波长(571 nm、652 nm和741 nm),选取相应的滤波片,设计基于滤波片的高光谱图像采集系统以实现生产过程中对柑橘果锈的在线快速无损检测;可以利用高光谱图像技术的图像和光谱两方面信息,检测其它水果的品质。
摘要:高光谱图像技术作为农产品无损检测的新技术,探讨了其在柑橘外部品质检测的可行性。以检测柑橘果锈为目的,首先对经预处理的高光谱图像数据进行主成分分析,优选出571nm、652nm和741nm三个特征波长组成新的图像块;再进行第二步主成分分析,得到的第三主成分图像为最适宜检测柑橘果锈的图像;最后对该图像进行中值滤波、平方根变换、阈值分割和数字形态学运算完成特征提取。试验结果表明,此算法对柑橘果锈检测的正确率可达到90%。研究表明,利用高光谱图像技术结合两步主成分分析算法检测柑橘果锈是可行的。
关键词:高光谱图像技术,主成分分析,柑橘,果锈检测
参考文献
[1]Johnson III Owen N,Slidell Mark,Kreishman Peter,et al.Hyperspectral imaging:An emerging technology as a potential novel adjunct in assessing peripheral perfusion deficits and success of lower extremity revascularizations[J].Journal of the American College of Surgeons(S1072-7515),2008,207(3):S114.
[2]Gowen A A,O'Donnell C P,Cullen P J,et al.Hyperspectral imaging–an emerging process analytical tool for food quality and safety control[J].Trends in Food Science&Technology(S0924-2244),2007,18(12):590-598.
[3]Qiao Jun,Ngadi Michael O,Wang Ning,et al.Pork quality and marbling level assessment using a hyperspectral imaging system[J].Journal of Food Engineering(S0260-8774),2007,83(1):10-16.
[4]Govindarajan Konda Naganathan,Lauren M Grimes,Jeyamkondan Subbiah,et al.Visible/near-infrared hyperspectral imaging for beef tenderness prediction[J].Computers and Electronics in Agriculture(S0168-1699),2008,64(2):225-233.
[5]Park B,Windham W R,Lawrence K C,et al.Contaminant classification of poultry hyperspectral imagery using a spectral angle mapper algorithm[J].Biosystems Engineering(S1537-5110),2007,96(3):323-333.
[6]Mahesh S,Manickavasagan A,Ayas D S,et al.Feasibility of near-infrared hyperspectral imaging to differentiate Canadian wheat classes[J].Biosystems Engineering(S1537-5110),2008,101(1):50-57.
[7]陈全胜,赵杰文,蔡健荣,等.利用高光谱图像技术评判茶叶的质量等级[J].光学学报,2008,28(4):669-674.CHEN Quan-sheng,ZHAO Jie-wen,CAI Jian-rong,et al.Estimation of tea quality level using hyperspectral imaging technology[J].Acta Optica Sinica,2008,28(4):669-674.
[8]李庆利,肖功海,薛永祺,等.基于显微高光谱成像的人血细胞研究[J].光电工程,2008,35(5):98-101.LI Qing-li,XIAO Gong-hai,XUE Yong-qi,et al.Microscopic hyperspectral image study of human blood cells[J].Opto-Electronic Engineering,2008,35(5):98-101.
[9]Polder G,Wam G,Heijden V D,et al.Calibration and characterization of imaging spectrographs[J].Journal of Near Infrared Spectroscopy(S0967-0335),2003,11(3):193-210.
[10]Guerric le Maire,Christophe Fran-ois,Kamel Soudani,et al.Calibration and validation of hyperspectral indices for the estimation of broadleaved forest leaf chlorophyll content,leaf mass per area,leaf area index and leaf canopy biomass[J].Remote Sensing of Environment(S0034-4257),2008,112(10):3846-3864.
高光谱遥感图像 篇9
高光谱图像检测技术
高光谱图像检测技术作为一项新兴的检测技术, 具有超多波段、高光谱分辨率和图谱合一的特点。因此, 高光谱图像检测技术应用于农畜产品、食品的品质与安全性检测中具有较大优势和较高的检测精度。高光谱图像技术已经应用于水果内部品质、表面污染和瘀伤检测, 蔬菜成熟度和内部品质检测, 以及肉的内部品质检测方面。
高光谱图像检测技术的硬件主要包括光源、CC D摄像头、装备有图像采集卡的计算机和单色仪。光谱范围可以在200~400nm、400~1000nm、900~1700nm、1000~2500nm。基于图像光谱仪的高光谱图像检测系统如图1。它主要由面阵CCD摄像头和图像光谱仪组成。工作时, 图像光谱仪将检测对象反射或透射过来的光分成单色光源后进入CCD摄像头。该系统采用“推扫型”成像方法得到高光谱图像, 面阵CCD探测器在光学焦面的垂直方向上做横向排列完成横向扫描 (X方向) , 获取的是对象在条状空间中每个像素在各波长下的图像信息。同时, 在检测系统输送带前进的过程中, 排列的探测器扫出一条带状轨迹从而完成纵向扫描 (Y方向) 。综合横纵扫描信息就可以得到样品的三维高光谱图像数据, 如图2。
果蔬表面农药残留高光谱图像检测
在果蔬生产中, 随着农药的大量和不合理使用, 农药残留检测技术的发展已越来越受到社会的关注和重视。通过肉眼分辨不出果蔬表面的农药残留与否, 虽然对农药残留检测已经有了许多成熟可行的方法, 如酶抑制法、酶联免疫法、生物传感器法、近中红外光谱法、荧光光谱法、拉曼光谱法和核磁共振技术等, 但是高光谱图像技术结合了光谱分析和图像处理的技术优势, 为果蔬表面农药残留检测提供了一种新的无损检测方法。
以下使用北京卓立汉光仪器有限公司Gaia系列高光谱成像检测系统对果蔬表面农药残留进行检测。样本为在通风阴凉处放置72个小时以上, 表面滴有浓度为1∶100的炔幔特类农药的脐橙。采集时显示的RGB合成图像如图3所示。
在400~1000nm的可见光和近红外的光谱范围内, 综合曝光时间、扫描速度和光谱校正等信息, 采集到包括二维的图像像素信息和第三维波长信息的三维图像块。由于高光谱数据具有多光谱通道、高光谱分辨率和连续光谱的特点, 可分辨出极接近但不同波长下的两幅不同的图像, 并可得到有农药残留区域和无农药残留区域的连续光谱曲线。图4是脐橙表面涂有农药区域和正常区域的光谱曲线图, 从中可以看出在575~800nm范围内涂有农药区域和无农药区域的光谱曲线差异明显, 因此该波段范围内可以较容易地检测出有无农药残留。
对高光谱数据进行降维和去噪处理, 是因为其大数据量、高相关性等冗余信息、信号噪声等都对数据的处理和分析有着很大影响。分析方法之一是应用主成分分析法, 主要目的是去除波段之间多余信息, 将多波段的图像信息压缩到比原波段更有效的少数几个转换波段。通过主成分分析, 可根据方差贡献的大小来选择主成分图像, 如下图5所示, a为第二主成分波段的图像PC2, b为经过阈值分割后的图像PC2, 可清楚地看到涂有农药区域和正常区域的图像是不同的。图6是根据PC2图像的特征向量绘制的图像光谱曲线权重系数图, 692nm与702nm是PC2的特征波长。下图7中, a为波长692nm处样本的灰度图像, b为波长702nm处样本的灰度图像。
结论
高光谱遥感图像 篇10
柑橘树红蜘蛛虫害分布广、繁殖快,是柑橘的主要病虫害之一,大量发生时可导致树叶变色脱落及果实畸形早落,造成果树减产[1,2]。受柑橘红蜘蛛胁迫的叶片出现初期为淡绿色,后期为灰白色的斑点,失去光泽,叶片叶绿素及类胡萝卜素含量均有不同程度下降[3]。传统的红蜘蛛虫害胁迫情况理化检测方法需将采摘的叶片捣碎并浸泡较长时间后实现检测,工作量大,效率低下[4]。
受柑橘树红蜘蛛为害叶片的叶绿素和类胡萝卜素浓度与正常叶片相比有较大差异,通过该差异可确定叶片受红蜘蛛为害情况[5]。多项研究表明: 可用高光谱信息估测植物叶片色素含量,且估测精度较高[6~8],为采用高光谱图像技术识别叶片的色素含量,进而识别其受红蜘蛛为害情况提供了理论依据。李震等[9]研究了应用高光谱成像技术检测柑橘红蜘蛛为害叶片色素含量的方法,确定667 /522、667 /647、522 /647nm等3个特征波段反射率比值与叶片3种色素含量间具有较高的相关性; 基于征波段反射率比值建立了柑橘红蜘蛛为害叶片叶绿素a、叶绿素b和类胡萝卜素含量的预测模型。
树叶受红蜘蛛为害后,其色素含量在叶片的健康和受害区域间有所区别。为深入研究红蜘蛛的发生和为害规律,需要分析受害叶片的色素含量在不同区域的变化情况。已有的研究成果得到的均为整片叶片的平均色素含量,未区分叶片上各区域间色素含量的差异。传统的基于可见光的机器视觉技术难以识别导致叶片颜色变化的根本原因,而光谱成像技术可以获得目标的影像信息和光谱信息,得到目标的物质结构及化学组成,较好地区分由不同原因导致的叶片颜色发生的相同或相近的颜色变化,已在农产品品质检测等方面得到广泛应用[10,11,12,13,14,15,16,17,18]。
本研究探索从红蜘蛛为害叶片的高光谱图像中识别受害区域的方法,为深入研究红蜘蛛的发生和为害规律提供有效的技术手段。
1 材料与方法
1. 1 叶片光谱图像采集
从文献[9]所使用的400片受害树叶中选取20片受害区域差异较明显的叶片作为研究对象,使用Hypersis农产品高 光谱成像 仪 ( Hypersis - VNIR -PFH,卓立汉光,北京) 采集叶片的高光谱图像。光谱仪主要参数: 光谱范围380 ~ 1 000nm,曝光时间30ms,移动台运行速度5. 0375mm /s,扫面距离120mm,图像尺寸100×200pixel。光谱图像分析与处理使用ENVI4. 8软件实现。采集叶片高光谱图像前需进行黑白校正: 黑校正的方法为盖上镜头盖,得到全黑标定图像;白校正的方法为扫描反射率为99% 的标准白色校正板,得到全白标定图像。
利用全黑、全白校正图像对扫描的叶片图像进行校正,减少光源产生的噪声,公式为[19]
其中,Ia为校正后的叶片扫描图像,Io为校正前的叶片扫描图像,Iw为全白校正图像,Ib为全黑校正图像。
1. 2 基于比值图像法识别红蜘蛛为害叶片的受害区域
比值图像由不同波段高光谱图像灰度进行代数变换运算而获得的一种具有增强效果的新图像,通常用于数字多波段影像增强处理[19]。对多波段高光谱图像进行比值处理,可消除阴影干扰,使图像数据更接近目标本身光谱反射的真实值,从而改善图像质量,突出目标信息; 还可使影像中某些目标的均值拉开、方差缩小,便于将其分类。
从各叶片的高光谱序列图像中,选取文献[9]确定的522、647、667nm等3个与叶片色素含量间具有较高相关性的特征波段的高光谱图像,计算667 /522、667 /647、647 / 522等3个特征波段的高光谱图像的比值图像,进一步将各比值图像采用Otsu法[20]进行二值化,识别红蜘蛛为害叶片的健康和受害区域。比值图像及其二值图像均通过ENVI软件实现。
1. 3 识别效果检验
在Photoshop环境下从受害叶片的RGB图像中人工选取受害区域,以受害区域的像素数量作为受害区域的检验标准值,计算3幅比值图像的二值图像中受害区域的像素数量,与检验标准值进行比较。计算绝对检验误差公式为
其中: ε667 /522、ε667 / 647、ε6 4 7 /522分别为采用667 /522、667 /647和647 / 522等3个特征波段的高光谱图像的比值图像时的识别误差; I667 /522、I667 / 647、I6 4 7 /522、Is分别为3个比值图像的二值图像及RGB图像中受害区域的像素数量。
通过识别效果检验,确定基于比值图像法从红蜘蛛为害叶片的高光谱图像中识别受害区域的最优波段比值。
2 结果与分析
2. 1 光谱图像采集结果
从1片典型的红蜘蛛为害叶片的高光谱图像序列中选取522、647、667nm处的高光谱图像,如图1所示。其从左至右分别为RGB图像,522、647、667nm处的高光谱图像,叶片受害区域( RGB图像中白色和淡黄色区域) 在高光谱图像中显示为高亮区。将高光谱图像进行二值化后获得的黑白图像如图2所示。其从左至右分别为522、647、667nm处的高光谱图像的黑白图像,受曝光等因素影响,无法从黑白图像中直接识别受害区域。
2. 2 比值图像处理结果
通过ENVI软件计算获得叶片的647 /522、667 /647、667 /522比值图像及各图对应的黑白图像,如图3所示。其中,667 /647和667 /522两幅比值图像经二值化后的黑白图像均能够较好地还原叶片形状,消除叶片周围光噪声的影响。该结果与文献[9]中用于建立叶片色素含量预测模型的最佳特征波段反射率比值为667 /522和667 /647 nm的结果相吻合。667 /522比值图像的二值化图像中的高亮区与叶片的受害区域吻合度较高,说明应用667 /522比值图像能够较好地区分受红蜘蛛为害叶片的健康区域和受害区域。
进一步计算获得了20片受害叶片的667 /647和667 /522两幅比值图像及其二值化后的黑白图像,取其中2片叶片为例,如图4所示。由图4可以看出,667 /522比值图像均能够较好地区分受红蜘蛛为害叶片的健康区域和受害区域,应用667 /522比值图像分析叶片受红蜘蛛为害区域具有较高的稳定性。
2. 3 识别效果检验
在ENVI环境下编写程序,自动完成: 1从叶片的高光谱序列图像中提取522、647和667nm波段的高光谱图像; 2获得叶片的647 /522、667 /647和667 /522比值图像及各图对应的二值图像; 3计算各二值图像中“孔洞”区 ( 即受害区) 的像素数 量I667 /522、I667 /647、I647 /522。采用人工选取的方法获取叶片RGB图像中受害区域的像素数量Is,代入式( 2) ~ 式( 4) ,获得绝对检验误差。20片叶片的检验结果如表1所示。
由表1可以看出,采用667 /522、667 /647、647 /522比值图像的二值图像识别叶片中受害区域的绝对检验误差平均值分别为7. 16% 、13. 54% 和35. 74% ,即识别的平均准确率分别为92. 84% 、86. 46% 和64. 26% ,基于667 /522的比值图像识别橘树红蜘蛛为害叶片中的受害区域的平均准确率最高。
3 结论
1) 无法直接和自动从柑橘红蜘蛛为害叶 片的RGB图像或单一波段的高光谱图像中识别叶片的受害区域。
2) 667 /647和667 /522两个特征波段反射率比值的比值图像均能够有效地抑制高光谱图像中叶片周围的光噪声,进而还原叶片的外形轮廓。
3) 从667 /522特征波段反射率比值的比值图像中识别叶片受害区域的平均准确率达92. 84% ,在3个比值图像中识别效果最好。
4) 识别算法可通过计算机编程自动实现,可作为深入研究红蜘蛛的发生和为害规律的技术手段。
摘要:探索从红蜘蛛为害叶片的高光谱图像中识别受害区域的方法,内容包括:1采集20片受害区域色素差异较明显的柑橘叶片的高光谱序列图像,从各叶片的高光谱序列图像中选取522、647和667nm等3个与叶片色素含量具有较高相关性的特征波段的高光谱图像,计算667/522、667/647和647/522等3个特征波段的高光谱图像的比值图像及其二值图像,识别叶片中的受害区域;2计算自动识别和人工识别间的误差,检验算法的识别效果。结果表明:从柑橘红蜘蛛为害叶片的RGB图像或单一波段的高光谱图像中无法直接和自动识别叶片的受害区域;667/647和667/522两个特征波段反射率比值的比值图像均能够有效地抑制高光谱图像中叶片周围的光噪声,进而还原叶片的外形轮廓;从667/522特征波段反射率比值的比值图像中识别叶片受害区域的平均准确率达92.84%,在3个比值图像中识别效果最好;识别算法能够通过计算机编程自动实现,可作为深入研究红蜘蛛的发生和为害规律的技术手段。
相关文章:
重庆库区01-10
移动通信数字技术分析论文01-10
数字电子技术分析论文提纲01-10
算法分析实验题目01-10
数字电路分析论文01-10
状态抽样法01-10
地大物博01-10
ppt汇报动态演示CAD图教程01-10
小升初入学简历自我介绍01-10
小升初英语作文:自我介绍01-10