专题信息提取

关键词: 图像处理 宜昌 专题 数据

专题信息提取(精选六篇)

专题信息提取 篇1

1 数据、软件介绍

1.1 数据介绍

数据的地理范围是湖北省宜昌地区。TM1、3、4、5、7波段影像, 空间分辨率为30米, TM6波段影像, 空间分辨率为120米。参考影像为SPOT影像, 分辨率10米。另含投影信息和大地坐标文件, 为TXT格式。采用UTM投影, 投影带号为49。

1.2 软件介绍

ERDAS IMAGINE软件是一个功能完整的、集遥感与地理信息系统于一体的专业软件, 具有强大的图像处理功能, 常见功能包括图像几何纠正、投影变换、空间增加、辐射增强、图像分类、空间分析等。

2 数据预处理

因为ERDAS软件所处理的图像格式为.IMG, 因此图像预处理首先需要将宜昌地区TM各波段及SPOT影像.TIF格式图像使用IMPORT模块转换为.IMG格式。

由于TM影像没有进行几何纠正, 因此要建立标准的参考影像, 根据SOPT影像的坐标参数, 利用投影信息和大地坐标文件在Map Info模块中进行设置。

多波段影像包含的信息量较大, 有利于后续处理, 因此要将6个单波段影像叠加合成多波段影像, 充分利用影像信息。在Interpreter模块中选择Utilities, Layer Stack依此选择并加载单波段IMG图像, 即可完成波段组合。

3 几何纠正

在遥感图像处理中, 原始图像数据往往不能满足精度要求, 因此需要对图像进行几何纠正。由于多项式法在使用上灵活且可以用于各种类型的遥感图像, 因而通常采用多项式法进行纠正。在调用多项式模型时, 首先需要确定多项式的次方数, 一般采用三次以下多项式。最少控制点数的计算公式为 (t+1) * (t+2) /2, 其中t为次方数。本次数据地形较复杂, 故选择2次多项式, 至少需要6个控制点。

1) 加载文件。在Viewer模块中打开两个窗口 (viewer#1/viewer#2) , 并在两窗口中分别打开TM影像和作为参考的SPOT影像。

2) 启动几何校正模块。在Raster Geometric Correction模块中选Polynomial, 同时启动控制点工具。

3) 采集控制点。在viewer#1中寻找特征明显的地物点输入, 一般选择道路交叉点、路标等易识别的同名地物点。且要尽量均匀地覆盖整个区域, 不能形成线性。

4) 精度评价。在采集了一定数量的检查点后, 通过Computer Error模块对控制点精度进行评价, 要求所有检查点的误差小于一个像元, 如果超限则对控制点位进行调整, 使满足精度要求。

5) 影像重采样。选择Image Resample模块, 选择最邻近采样方法。

6) 检验校正结果。在两个窗口中分别打开已校正影像和参考影像, 通过窗口地理连接功能进行目视定性检查。

4 图像拼接

在几何纠正完成后, 需要将左右两幅影像拼接成完整影像, 通过Mosaic Image模块可以完成拼接操作。

1) 加载Mosaic图像, 在Mosaic Tool模块中, 依次加载待拼接的图像。

2) 拼接范围选择。ERDAS提供了5种方法, 这里选择利用AOI模板的方法, 即在待拼接影像中利用AOI工具绘制用于拼接的图幅范围。

4) 绘制剪切线。剪切线主要是为了改善接边差异太大的问题。绘制时最好尽可能沿着线性地物走。在Cutline Selection Viewer中可以进行绘制。

5) 定义输出参数。主要是输出图像区域、像元大小、数据类型等参数的设置, 在Set Mode for Output Images中可以设置。

6) 运行Mosaic。在Run the Mosaic Process to Disk中运行图像拼接。

5 图像增强

1) 色彩变换 (RGB to HIS) 。色彩变换是将遥感图像从RGB的彩色空间转换到IHS作为定位参数的彩色空间, 以改善图像质量, 达到增强目的。在Interpreter/spectral Enhancement/RGB to HIS中可以进行变换, 其中确定参与色彩变换的3个波段分别是Red, 4、Green, 3、Blue, 2。

2) 影像融合变换是将分辨率高的波段信息加载到分辨率低的彩色影像中, 在提高其分辨率的同时又保持影像的彩色效果。基于HIS变换的影像融合优势在于HIS变换把图像的亮度、色调、饱和度分开来, 图像融合只在亮度通道上进行, 图像的色调和饱和度不变。用SPOT影像的I分量代替多光谱影像的亮度分量, 在Interpreter模块中点击Utilities/lay stack中实现。

3) 色彩逆转换。将融合之后的影像转换成RGB形式。在Interpreter/spectral Enhancement/HIS to RGB中可以进行。

4) 图像裁剪。为避免对背景进行分类的情况, 需要事先对增强影像进行裁减。可以用AOI工具矩形框选中区域, 通过Subset Image建立裁剪后影像。

6 图像分类

根据遥感影像上不同地物的差异, 将图像上的所有像素按其性质分成若干个类别的过程, 称为图像分类。这是提取专题信息、制作专题图前最为重要的一个步骤。遥感图像的分类分为监督分类和非监督分类, 下面分别就两种分类方法简要介绍处理流程。

6.1 非监督分类

非监督分类是指在不需要先验知识的情况, 依靠影像本身特征进行特征提取。在ERDAS中是用自组织数据分析 (ISODATA) 算法来实现的。

在Unsupervised Classification模块中设置相关参数:初始分类数设定为10 (分出10个类别实际工作中一般将分类数取为最终分类数的2倍以上) , 最大循环次数设为20, 循环收敛阈值为0.95, 同时在Color Scheme Options中给各个类别赋相应的颜色。改变循环次数, 比较非监督分类的结果, 从中得到分类相对最好的图像。

6.2 监督分类

不同于非监督法分类, 监督分类需要掌握一定先验知识, 根据训练场提供的样本特征参数, 建立判别函数, 对待分类点进行分类。由于训练样本的不同, 分类结果会出现差异, 因此需要选择有代表性的样本。

1) 定义分类模板。主要在Signature Editor中完成, 选取样本时每一地物的采样点 (AOI) 不应少于10个, 每选取一块模板, 点击Edit/Add进行模板添加, 最后将属于同一类的模板进行合并, 输入对应类别名称, 设置颜色。模板建立好后, 可以对模板进行精度评价, 通常情况下, 如果误差矩阵值小于85%, 则需要重新建立模板。

2) 执行监督分类。在Supervised Classification模块中设置相关参数, 选择模板文件:设置分类距离文件为Distance File, 非参数规则为Feature Space, 参数规则为最大似然, 最后执行监督分类。

6.3 分类精度评价

1) 对于非监督分类影像, 将原始影像和分类后影像叠加显示, 将不参与比较的类别设为透明, 参与比较的类别设为不透明, 通过闪烁、卷帘显示、混合显示等方式进行类别意义和精度的确定, 同时标注类别的名称和颜色。如果初始类别较多, 可以进行类别合并, 形成新的分类方案。

2) 对于监督分类影像, ERDAS提供了多种分类评价方法, 如分类叠加、定义阈值、精度评估。分类叠加类似于非监督分类的方法, 将两幅影像叠合在一起, 查看分类结果的准确性。定义阈值则是指对每一个类别设置一个距离阈值, 将不属于该类的像元筛选出去, 被筛选出去的像元会被赋予一个新的值。在Threshold模块中可以进行操作。精度评定则是使用Classifer Accuracy Assessment模块, 选取至少20个随机点, 两图对照修改reference值, 来确定错分类的个数。

7 专题信息提取和专题图制作

1) 分类重编码。因为分类时光谱类和地物类的不对等性, 造成分类出的光谱类并不是专业上的地物类, 所以需要将不同的光谱类的编码和颜色改为相同的编码和颜色。这一操作在GIS Analysis/Recode中进行。

2) 专题地图编辑。在Map Composer模块中根据研究的需要和制图区域的特征设置图层、文本、比例尺、图例、格网、指北针、专题图名称、注记等整饰内容, 生成制图。在Annotation工具面板中包含专题制作的大部分功能可供调用。

3) 对地图进行美化操作, 使专题图的载负信息量与地图大小相适应。最后输出保存完善后的专题图, 专题图即制作完成。

8实验结果分析与评价

多波段叠加时, 选择波段6对提高分辨率无帮助, 而选择波段1对于分辨某些地物效果不佳。主要原因为每个波段有其特有的特点, 波段1、3、4、5、7等分辨率较波段6要高些。因此可以根据分类的侧重点及要求, 合理的选择波段进行叠加。正确的波段选择对于提高分类效果等有着较大帮助。

在几何纠正中, 边缘部分的纠正效果差一些, 主要原因为纠正区域的四周有大量山地, 很难在影像四周找到明显的, 能精确定位的地物标识, 因此影像四周选取的控制点较少, 分布在城区和坝区, 桥梁, 公路交叉口地带的控制点较多, 造成影像中间部分纠正效果明显优于边缘部分。

影像非监督分类中, 当迭代次数到达十几次后, 继续增加迭代次数对于提高分类效果无明显作用。这是由于迭代到十几次后阈值已达到设置阈值, 因此迭代无作用。调整阈值及迭代次数可以继续改善分类效果, 不停尝试能找到一个比较好的分类系数。

影像监督分类中, 某些像素反差较明显的地物被归为一类, 反差不明显的地物也被混淆, 这是由于该块地物面积较小 (如道路等) , 且该区域未提取样本, 导致被地物像素被周围大面积地物像素影响, 从而被归为其中。可以通过在该面积较小的区域内选取几个样本来解决这一问题。反差不大的地物混淆是由于像素值较接近, 导致分类出现错误, 可以通过在色素接近的区域多选择几个样本来解决。

参考文献

[1]杨昕, 汤国安, 等.ERDAS遥感数字图像处理实验教程[M].北京:科学出版社, 2009.[1]杨昕, 汤国安, 等.ERDAS遥感数字图像处理实验教程[M].北京:科学出版社, 2009.

[2]孙家柄.遥感原理与应用[M].武汉:武汉大学出版社, 2009.[2]孙家柄.遥感原理与应用[M].武汉:武汉大学出版社, 2009.

[3]彭前春.基于ERDAS的遥感信息提取与专题图制作[J].中国电子商务, 2009 (8) .[3]彭前春.基于ERDAS的遥感信息提取与专题图制作[J].中国电子商务, 2009 (8) .

信息的提取专题训练doc. 篇2

1、摘句法。(中心句、起始句、总结句、过渡句)

2、概括法。(对于没有中心句的文段则需要仔细阅读全文分清层次,进行归纳概括。常见的方法有:归纳法,就是摘引段中的关键信息然后整合;取舍主次法,抓主要内容,舍去次要内容。)

3、组合法。就是文段有几个并列的层次,把几个并列的内容组合起来。(一般格式为:人物+事件+结果)

这专题考试题型大致有六种,以下通过同学们的练习逐步讲解

一、给一则新闻加标题

1、(2012•河南)阅读下面材料,给这则新闻拟写一个标题。(不超过16个字)(3分)

新华网河南频道5月20日电

由中华炎黄研究会、河南省体育局等单位主办的首届中华轩辕龙舟大赛将于端午节期间在郑州举行,届时将有来自海内外的多支龙舟队伍同场竞技,共度佳节。

本次大赛是以“中原龙舟大赛”为基础升级成“中华轩辕龙舟大赛”的。大赛的宗旨是传承华夏历史文明,推动龙舟运动发展,促进中原经济区建设。大赛开幕式上设置了龙舟点睛、舞龙舞狮、龙风筝表演、龙舟对歌、龙舟豫剧等环节。从今年——农历壬辰龙年开始,以后每年的端午节都将举办这项赛事。

首届中华轩辕龙舟大赛将于端午节期间在郑州举行。

2、(2012•湖北襄阳)请给下面这则消息拟写一个恰当的标题。(2分,限18字以内)

(襄阳汉江传媒网消息)记者获悉,19岁的襄阳姑娘张丽婷已经入选中国女子篮球国家队备战伦敦奥运会的16人大名单,并于昨日抵达美国,准备即将开始的热身赛。张丽婷的父亲张庆林告诉记者,目前张丽婷的状态很好,她的实力也得到了教练的认可。原计划张丽婷要随国奥队来我市参加“奥星粮油杯”国际青年女篮四国挑战赛,但因备战奥运,此行只能作罢。张庆林说,张丽婷对此次不能回家乡比赛感到十分遗憾,她表示将努力训练,争取代表国家队参加伦敦奥运,在世界赛场上为襄阳增光添彩。(抓住“张丽婷”、“备战奥运”两个要点。

二、将一则新闻改为一句话新闻

1、将下列消息概括成一句话新闻。

人民网5月14日报道 5月13日,中国目前最大的一台光学天文望远镜在中国科学院云南丽江高美古天文观测站落成并正式运行。这台大型光学天文望远镜高8米,通光孔径2.4米,重40余吨,是东亚地区最大口径的通用光学天文望远镜之一。

据悉,2.4米光学望远镜可以清晰地分辨出300公里以外一根蜡烛的火苗,其综合性能属同级望远镜中的国际中上水平,主要用于对恒星和星系进行观测。据介绍,该望远镜投入使用后,每年能容纳数十项先进水平的天体物理观测课题和研究工作。

2、请用一句话概括这则新闻的内容。

昨日,为体验生活,西南政法大学的多位大学生在渝中区朝天门体验当力夫。

上午9点,朝天门交易厅附近,手拿扁担的潘匀满头大汗和同学张杰转悠着揽生意。“大学生当棒棒,挑不挑得动哟?”看着文质彬彬的两人,雇主们连忙摆手拒绝。半小时下来,两人“颗粒无收”。

“叔叔,我们只收一元钱”。两人只好狂压价格,终于抢到了第一笔生意,从未吃过苦的潘匀为此激动得泪流满面。

多位大学生体验当力夫。

三、给新闻加导语

1)、加导语解题思路:(1)找中心句---删去附加成分---梳理整合----准确表述;(2)压缩主体部分找出六要素。

2)答题格式:谁在何时地干了什么(或者什么怎么样了)。

3)提取中心句的方法:中心句一般在开头或者结尾,有时在中间,其他句子都是从不同侧面 支撑解释中心 句的。

习题:(十堰)根据下面消息的内容,加导语。(不超过15字)本报珠峰大本营5月8日电(记者王霞光)点燃奥运激情,传递人类梦想。2008北京奥运圣火于8日凌晨,由19人组成的突击队员和支援队员从海拔83 参与本次登顶活动的19人包括突击组l2人,支援组7人。经过6个多小时的攀登,北京时间9时17分,第五名火炬手次仁旺姆(女)在海拔8844.43米的世界最高峰00米的突击营地出发,开始向珠穆朗玛峰顶峰发起冲击。并于9点17分成功登上珠峰。

高举“祥云“火炬,向世界昭示2008奥运圣火攀登珠穆朗玛峰圆满成功。这是奥运史上难忘的时刻,中国人第一次把奥林匹克运动的圣火传递到世界的最高峰。

答案:2008北京奥运圣火顺利登上世界最高峰——珠穆朗玛峰(海拔8844.43米)。

四、给事物下定义-------根据提供的语句给某物下定义

这类题首先要明确下定义的方法:被定义概念=本质概念+属概念。其次要筛选下定义需要的要素:判断句、本定义概念、本质属性、属概念;第三要修饰语句使句子表达简明连贯。

1、根据下列提供的材料给“新贫族”下个定义

(1)26---35岁这个领导市场新潮的群体,相当一部分是都市里的“新贫族”;(2)所谓“贫”是指他们挣得不少花的更多,有钱时挥金如土,没钱时便一贫如洗;(3)他们大多生活在写字楼里;(4)他们拥有最强劲的消费热情,最前卫的消费理念,最cool的消费方式。新贫族是:

。参考答案:新贫族是由在写字楼工作的年轻人构成的拥有最强劲的消费热情、最前卫的消费理念、最cool的消费方式,领导市场新潮的重要群体。

2、给“光化学烟雾”下定义。

汽车和某些工厂都会排出许多废气,里边含有大量的碳氢化合物,这些有害气体经太阳紫外线照射后会发生光化学反应,于是产生了浅蓝色的烟雾。科学家管这种烟雾叫“光化学烟雾”,是一种严重的大气污染。20世纪50年代的洛杉矶拥有250万辆汽车,每天大约有一千多吨有害气体排入大气。(汽车、工厂排出废气中的大量的碳氢化合物经太阳紫外线照射后产生的浅蓝色有害烟雾,叫光化学烟雾)

五、概括文段主要内容

1、请用一句话概括下面这则新闻的主要内容。(不超过30个字)(2分)

开封日报(记者:张东伟)

4月3日上午,2014中国(开封)清明文化节踏春大 巡游活动在古都开封成功举行。今年的大巡游依然从清明上河园东门广场出发,终点是开封府门前广场,规模较去年更大、参加人数更多、节目更加丰富。参加大巡游的人员也由主要旅游景区工作人员,扩大到外省市的宋装爱好者,有1300多人。大巡游有赵匡胤、包拯、杨家将、岳家军、大臣及衙役形象展示,盘鼓、马队、高跷、梵乐、武术、花车、“非遗”展示,宋词朗诵、“倾城计划”志愿者宋服方队等民俗表演。大巡游队伍的节目各具特点,尤其是代表我市5家旅游企业的花车巡游方阵,更是主题鲜明,美不胜收。在今年的大巡游队伍中,有不少不同年龄段的青少年。市旅游局相关负责人表示,随着我市踏春大巡游活动品牌越来越响亮,吸引了更多的青少年参与,这将有利于清明文化在我市的进一步传承和发扬。

(学生发言,老师点拨。提取中心句法

中心句,一般在开头或结尾,有时也在中间,其它句子都是从不同的侧面来支撑解释中心句的。

4、、普查领导小组办公室、市统计局联合召开新闻发布会,公布全市第六次口普查主要数据:截至2010年11月1日零时,全市常住人口为5500307人;其中枣阳市常住人口最多,达到1004741人;鱼梁洲常住人口最少,不足1.3万人。据全省第六次全国人口普查主要数据公报显示,襄阳常住人口 数量位于全省第四,仅次于武汉、黄冈、荆州。

全市(襄阳市、我市)第六次人口普查(主要)数据公布。或“襄阳市公布(全市)第六次人口普查(主要)数据”。(2分)

六、材料探究

2、从下列材料中提炼出一条主要信息。

(1)有关部门对不同人群进行测试,要求每人写出“我虽然工作在风光旖旎的地方却很寂寞,所以我要跳槽”这句话。结果,写错“旖旎”两个字的占95%,“寂”字占54%,“寞”字占65%,“槽”字占70%;书写潦草的约占70%。

(2)上海的一份“汉字书写现状”调查显示,年轻人写钢笔字不规范的占70%-80%。(3)北京的一份调查显示,41%的小学生汉字书写达不到《语文课程标准》所规定的“正确、端正、整洁”的要求。

很多人汉字书写不正确、不规范。

3、阅读下面材料,完成后面的题。

材料一:作为互联网(Internet)最著名的搜索引擎,“百度”为人们查找资料、搜寻素材提供了莫大方便。但是,“百度”信息庞杂,真伪混淆,用“百度”做学问必须谨慎。

材料二:①目前,网络上有一种写作软件可助人写作。②你只需把想到的创作原材料输入,经过一定的积累和不断的排列组合,思路就会渐渐清晰,作品的框架就建成了。③它完全符合文艺创作。但是,它最根本的不足在于____________。

材料三:④防不胜防的各种电脑病毒会使电脑系统瘫痪,给人们的生活带来诸多不便和伤心。一些黑客也在网络上搞破坏,甚至擅自进入国家政治、经济、军事的核心领域,非法窃取重要信息,给国家和人民造成巨大的损失。

(1)从上述几则材料中,你能得出什么结论?

(2)请根据材料二的内容,在文中横线处填写一句话,使文意贯通流畅。

3(3)对“Internet”的翻译有两种——“因特网”和“互联网”,你更倾向哪一种?为什么?

(4)上述材料中标序的句子有两种语病,请指出序号并加以改正。

答案:(1)互联网是把双刃剑

(2)禁锢丰富想象力的发挥、限制鲜活思想感情的表达和鲜明个性的张行。

2、(3)“因特网”翻译简洁易记,“互联网”是音译,凸显网络特点,使人一目了然。(2016广安)《名师解密》149页

【材料一】

近几年,随着智能手机的普及,各种实用的移动端软件也应运而生,针对学生群体的多款作业软件也异军突起。因其强大的自动解题功能,受到学生的追捧。不少学生将“帮做作业”软件视为一种快捷的学习方式。

【材料二】

“帮作业、大眼作业、作业通、问他作业、学霸君”„„只要从手机应用商店搜索“作业”两个字,就能找到十几个解题的软件。“10个伙伴9个都在用;拍照搜题,秒出答案;作文搜索,高分作文随手拈来”。

【材料三】

据一位初二学生小华说,他们班大部分有智能手机的同学都下载了这些作业软件,只要拿起手机对着题目拍个照,上传上去,快的话几分钟内就可寻求到最佳的解题方案。用软件来问作业也成为时下学生交流的时髦方式。(1)请用简洁的语言国上述三则材料所表达的主要内容。(2分)答案示例:

(1)作业软件种类之多,操作之简便(1分),所以它备受众多学生青睐(或“它已成为众多学生使用的快捷学习方式”)(1分)。(共2分)

【2016 说明与检测上册综合测试

(一)6(1)题】《试题研究》135页

材料一 从2014年4月8日起北京三联韬奋书店24小时正常营业,方便读者随时购书或阅读,让更多的人从知识中汲取力量。

材料二 国家图书馆主要阅览室全年365天开放,并依托馆藏资源,网上24小时为读者服务。

材料三 郑州图书馆学会举办爱心图书漂流活动,设置多个图书漂流点,方便市民随时随地取阅,让图书漂流中传递书香,温暖社会。

材料四 澳门中央图书馆把一辆货车改建成一座流动图书馆,由专人负责图书的借阅与归还,为那些图书馆较远的市民提供读书的便利。请用简洁的语言概括是则材料的共同信息。(3分)

1某同学搜集了一下两则材料,仔细阅读,写出你探究发现的结果。、《试题研究》135页 材料一 调查显示,95%的同学喜欢吃膨化食品,88%的学生喜欢或比较喜欢吃“洋快餐”,43.6%的学生每月都吃洋快餐,73.6%的学生选择放学后在路边摊买羊肉串、麻辣烫等食品。

专题信息提取 篇3

汶川Ms8.0地震造成14个重灾县 (市) 发生崩塌、滑坡、泥石流等次生地质灾害约46560处, 灾害总面积约687.1km2[1]。如何快速定位次生地质灾害, 研究其空间分别规律, 对救灾和灾后重建工作意义重大。过去, 地震灾害调查都依靠人工实地勘测, 虽然该方法获取的数据精度高, 但存在工作量大、效率低、费用高、信息不直观等不足[2]。现代遥感技术的发展, 广泛应用于地质灾害信息提取。地质灾害信息提取方法已经从最初的人工目视解译[3,4]发展到现在的向量机模型[5], 面向对象方法[6]、基于多源数据的信息提取等[7,8]人工目视解译虽然在信息获取的精度和可靠性上具有优势, 但工作量大、效率低、成本高, 信息解译、汇集、整编所用时间长, 难以满足应用上对时效性的要求[2]。向量机模型、面向对象方法等满足了地质灾害信息获取的时效性, 但大都离不开高精度数据的支持。高精度数据因获取难度较大, 成本较高, 阻碍了这些方法的大范围应用。汶川地震后, 大量研究利用遥感技术, 以高分辨率遥感影像或者高分辨率航片作为数据源[9,10,11], 对汶川地震地质灾害展开了遥感调查解译与应急评估。仍然存在解译工作量大、大量的中分辨率影像资源未得到充分使用的问题。

遗传算法因自组织、自适应、并行性和鲁棒性等特征, 对一些大型复杂非线型系统, 它更能表现出独特和优越的性能[12], 在图像处理过程中得到广泛应用[13,14,15]。它可对传统遥感图像特征选择算法进行优化, 得到更高精度的解译结果[16];也能在背景复杂、受噪声点干扰的图像中提取各种主干道路[17]和对遥感图像中土地覆盖类型进行快速分类[18];还能很好的支持中低分辨率遥感影像的处理[19]。本文以地震引起的滑坡作为研究对象, 选择岷江河谷汶川段为研究区, 充分利用中分辨率遥感影像, 采用C#语言进行遗传算法的设计, 快速、大面积地进行地质灾害专题信息提取。结果表明, 该方法可行, 精度优于常规最大似然法。可为其余地区的地质灾害信息提取提供一定的参考。

2 研究区概况和数据源

研究区位于岷江河谷汶川段, 坐标103°17′25″~103°40′18″E, 30°51′22″~31°30′05″N, 面积977.11km2。区内地势自西北向东南倾斜, 断层发育, 构造复杂。基岩挤压破碎严重, 地层稳定性差, 从新生界的第四系到元古界的黄水河群均有表露。岷江上游主要为古生界泥盆系浅海相碳酸盐建造, 部分为中生界三叠系砂页岩及第四系松散堆积物。

研究数据来源于2008年12月的中巴卫星影像, 空间分辨率为19.5m。结合笔者实地调查威州至映秀段336个地质灾害记录资料, 1:1万汶川县震后影像图等局部高精度影像数据, 汶川地震灾害遥感图集、地质灾害影像图集进行结果验证[20,21]。

3 遗传算法的地质灾害专题信息提取

3.1 染色体编码

以信息提取过程中滑坡信息光谱阈值作为对象, 利用遗传算法进行搜索寻优。遗传算法优化过程中具有随机性, 为避免过多的逻辑判断 (如:0≦阈值下界≦阈值上界≦255等) , 达到优化代码的目的, 文中以各波段的上下阈值偏离样本聚类中心的偏移量作为解进行编码。基因编码通常有实数编码和二进制编码两种方式。本文采用二进制编码, 这种方式可以在初始化种群时, 根据样本聚类中心的大小确定编码长度, 避免上下阈值越界导致算法崩溃。

3.2 适宜度函数

遗传算法寻优过程中, 通过适宜度函数判断种群中个体的优劣程度。针对所需解决问题, 选择合适的适宜度函数能够缩短算法收敛时间、提高算法精度。本文中适宜度函数采用提取结果的类内离散度和样本聚类中心与结果聚类中心间距离作为判断条件。样本点聚类中心与提取结果的聚类中心的距离越小, 提取结果与样本越接近, 提取结果的可靠性也就越高, 则适宜度越高;提取结果的类内离散度越小, 适宜度越高[22]。

样本聚类中心与提取结果的聚类中心之间的距离, 采用欧式距离进行度量。

式 (1) 中, D表示样本聚类中心与提取结果的聚类中心的欧式距离。 (R1, G1, B1) 为样本聚类中心, (R2, G2, B2) 为提取结果聚类中心。

提取结果中各像元点到聚类中心的距离的标准差作为类内离散度, 用于度量适宜度的优劣。提取结果的类内离散度的计算公式如下:

S表示类内离散度, n表示提取结果中滑坡的像元个数, D[i]表示提取结果中滑坡的像元到聚类中心的欧式距离, i的取值范围是[1, n], Davg表示平均距离。

3.3 选择算子

遗传算法运算过程中, 高适宜度的个体有更高的概率参与后代的繁殖, 适宜度低的个体则容易被淘汰, 不会参与新种群的生成。本文中选择算子采用轮赌算法, 根据预设种群的大小, 进行相应次数的选择, 最终组成新的种群, 产生下一代。

式 (3) 为适宜度总和计算公式。其中Sumfit表示种群中适宜度的总和, n为种群大小, fit[i]表示种群中第i个个体的适宜度, i的取值范围为[1, n]。

式 (4) 为累积概率计算公式。其中P[i]表示种群中第i个个体的累积概率, fit[i]表示种群中第i个个体的适宜度, i的取值范围为[1, n], n为种群大小。

3.4 自适应交叉算子

种群经过选择, 在保留下来的个体间进行交叉运算产生新个体。交叉算法实现种群中个体间的基因材料交换和信息交换, 促进算法对解空间的搜索。文中采用单点交叉的方式, 交叉概率采用自适应概率。标准遗传算法采用固定的交叉概率, 交叉概率过大或者过小均不利于算法的择优过程。与其相比, 自适应交叉算法具有自适应交叉概率。高适宜度的个体具有较低的交叉概率, 低适宜度的个体具有较高的交叉概率。自适应交叉概率, 保证优秀个体能够顺利产生下一代, 而劣势个体能尽快分解消亡。

自适应概率的计算公式如下:

其中, fmax为种群中最大适宜度值, favg为平均适应度值, F为两个交叉个体中最大的适宜度值。0≤k1≤k2≤1, 为常数。Pc为自适应交叉概率值。

在交叉过程中, 通过公式 (5) 计算自适应交叉概率值。大于平均适宜度的个体赋予较低的交叉概率, 小于平均适宜度的个体赋予较高的交叉概率。随机设定交叉点进行交叉运算。个体交叉过程促进解的空间搜索, 防止算法过早收敛, 使算法更具健壮性。交叉过程如图1, 2所示。

3.5 自适应变异算子

变异算法体现了自然界中基因突变的思想, 受环境的影响基因组成会发生突变。变异算子使种群产生新的基因组合, 同交叉算子, 变异算子同样采用自适应概率和单点变异的方式。个体差异度不大时, 变异概率大;个体差异大时, 变异概率小。

式 (6) 为自适应交叉概率计算公式。其中fmax为种群中最大适宜度值, favg为平均适宜度值, F为两个交叉个体中最大的适宜度值。0≤k1≤k2≤1, 为常数。Pv为自适应变异概率值。

在变异过程中, 适宜度高于种群平均适应度的个体, 赋予较低的变异概率, 把优秀基因组合遗传给下一代。适宜度低于种群平均适宜度的个体, 赋予较高的变异概率, 使经受不起自然选择的劣势基因组合尽快分解消亡。通过公式 (6) 计算个体的自适应变异概率, 并随机设定变异基因位。文中算法采用二进制编码, 变异操作采用直接翻转的方式完成。如图3。

3.6 种群初始化

种群初始化, 需对种群大小和基因编码长度进行设定。种群大小根据实际情况进行设定, 文中设定种群大小为10。基因编码长度根据输入的样本训练结果决定。在基因编码长度设定过程中, 首先, 提取样本各波段聚类中心的大小, 计算其相对于0的偏移量作为阈值下界的解空间, 计算其相对于255的偏移量作为阈值上界的解空间。分别求出3个波段的阈值上下界解空间, 并将其转换为二进制数, 获取其长度。最终基因编码的长度就是这些二进制数长度的总和。确定种群大小和个体基因编码长度以后, 即可随机产生初始化种群。

3.7 结果分析

经本算法对地质灾害信息提取得到的结果如图4。

由 (图4) 可知, 滑坡主要发生在岷江干流的两侧, 北起雁门南至映秀镇为滑坡地质灾害的重灾区。此外, 草坡河映秀段也有滑坡发生。而汶川南部的漩口、水磨、三江等乡镇受灾程度较小。

为精确检验遗传算法提取结果的精度, 采用软件生成随机检验点的方式进行精度校验。校验过程中, 通过叠加高精度遥感影像和实地调查的经验判断提取结果的正确性。检验正确的精度达到83.96%, 相比常规的最大似然法分类精度提高了17%, 结果表明遗传算法能较好的达到地质专题信息提取的目的。

4 结语

本文基于C#平台, 采用遗传算法作为滑坡等地质灾害信息光谱阈值的寻优算法, 实现对该类信息的大面积、快速提取。以汶川地震引发的滑坡等地质灾害作为研究对象, 采用中分辨率遥感影像 (CBERS) 影像为数据源, 成本较低, 适用于大范围区域研究。遗传算法对滑坡信息的提取精度达到83.96%。与常规最大似然法相比, 遗传算法精度更高。

汶川地震中, 崩塌、滑坡等次生地质灾害导致的交通瘫痪, 对救灾工作影响巨大;作为成都重要的蔬菜来源地, 灾害的发生导致耕地大面积地减少, 对当地经济影响较大;滑坡等地质灾害频发, 对灾后的生态重建和恢复也是一大考验。利用本算法能达到对滑坡灾害信息快速、大面积、有效提取的目的, 可为后期的灾害评估和减灾防灾工作提供重要的参考。

提高信息提取 篇4

摘要:本文以高考试题为例,从提取信息不全面和不准确两个角度剖析了学生在历史有效信息提取能力方面的缺陷,进而从重视审题训练、加强语言文字的训练和加强对非文字信息源的关注三个方面提出了如何培养学生提高历史有效信息的提取能力。

关键词:高考;试题;有效信息;缺陷;提取能力;新一轮课程改革

“从历史材料中最大限度地获取有效信息,分析问题,提炼观点,或从中选取某些有效信息支持特定观点。”这是高考考试能力的基本要求。根据上述要求,近年来在全国高考各种模式试卷的历史试题中,考查考生信息提取能力的试题频繁出现。如:2003年全国高考文科综合卷第36题就是典型的一例。该题第二则材料引用了4幅《嘉峪关地区魏晋墓砖壁画》,该题第2问直接提出了信息提取能力的要求:“嘉峪关魏晋墓砖壁画生动地反映了当时河西地区的经济发展与社会风貌,透过材料二你获得了什么重要历史信息?”因此,我们在平时的教学中要有针对性培养学生这方面的能力。

一、学生在历史有效信息提取能力方面的缺陷

1.提取信息不全面

●浅尝辄止,一叶障目。

由于年龄的缘故,中学生普遍具有浅尝辄止、一叶障目的毛病,看到一段材料、一则试题,往往得到一点信息就以为全面理解了。2003年全国高考上海历史卷第3题与1998年全国高考历史试卷第7题就用几乎相同的图片内容命题:“图中犁耕方式开始于何时?”部分学生不仔细观察就选择了A项(春秋战国),因为牛耕最早出现于春秋时期。但是图片反映的是一种比较先进的牛耕方式二牛一人犁耕法,这种方法却是西汉时期农业生产技术进步的主要表现。

●只见树木,不见森林。

目前,全国高考历史试题中出示的材料往往为一组,但学生最容易出现的问题是孤立地分析每则材料,而无法将所有材料联系起来进行整体思考。2003年全国高考上海历史试卷第36题要求“以世界眼光观察与理解”6幅图片材料,自拟题目,写一篇小论文。这一试题对材料的整体思考提出了较高的要求,因为每则材料既有一个标题,又有一个说明,如第5则材料是“1972年周恩来与尼克松在宴会上”的照片,照片的说明文字是“跨越太平洋的碰杯”。该题的注意事项第2条明确提出“应突出一个主题,并涉及本题提供的所有材料”。因此,要想很好地回答这一问题,就应该对题示所有的6则材料的主题进行提炼,要从整体上考虑所有6则材料所反映的核心问题。

●只见表面,不见实质。

2002年全国高考上海历史卷第28题要求从“秦砖汉瓦”中提取有效信息,并在题干中作了如下提示:“人们从商周青铜器不仅看到了那一时期的各种器皿、兵器和工具,而且了解到当时的冶炼技术、生产水平、文字、艺术和社会生活等各种情况。”这段提示提醒考生,不仅应注意表面现象(即显性信息),如“各种器皿、兵器和工具”,而且要深入思考善于发现表面现象背后的深层问题(即隐性信息),如“冶炼技术、生产水平、文字、艺术和社会生活等各种情况”,遗憾的是学生却无法从秦砖汉瓦所显示出的文字看出中国文字的变化(由小篆向隶书的变化),无法从秦砖汉瓦中看出秦汉时期的建筑技术的进步。

●只见主体,不及其余。

在目前的全国高考历史试题信息源中,既有文字又有图表和图片;既有材料正文还有一些辅助信息,如材料来源、材料提示语、图片和表格标题。在答题时,有的学生往往只注意材料正文而忽视其他信息源。如2003年全国高考上海历史卷第28题,该题在题干中“观察下列关于唐代妇女的三彩陶俑照片”的字样对图片作了重要补充,它透露出以下信息:时间属唐代;主要对象是妇女,原素材唐三彩是彩陶且为陶俑(俑是古代的一种殉葬品,往往与当时的现实生活有着密切的联系)。从学生的回答来看,许多学生忽视了唐三彩为彩陶这一重要信息,没能得出当时的“陶瓷工艺具有较高水平”这样的结论。

2.提取信息不准确

●不能理解喻意。

1995年全国高考上海历史卷第45题是一道值得借鉴的高考试题:“西方某学者说:‘美国没有童年,只有青壮年’。这一说法你是否同意?请简要解释你的回答。”在此,我们只能从其材料的喻意角度来分析该题,这里西方某学者所言并非本意,“美国没有童年”并不是说在美国没有小孩子,而是喻指美国历史没通常所说的原始社会、奴隶社会和封建社会,美国“只有青壮年”则喻指的是美国一建国就确立了成熟的资本主义制度。此题如果不能理解其喻意,根本无法解答。在该题出现多年后,我将这一问题用于课堂练习,发现许多同学仍对此题颇感迷惘。

●不能排除无效信息。

在部分材料尤其是表格材料中,有的信息起到一种迷惑作用。2003年全国高考文科综合卷第41题第2小题引用了4幅饼状图表,要求从中概括出2001年我国跨省流动人口的主要流向,图表中的“其他”事实上就是起到干扰作用的无效信息。中国有34个省级行政机构,表中四川、安徽、湖南、江西、河南、湖北6省占流出人口的59.3%,而其他28个省级行政机构合计流出人口才占40.7%,这足以说明流动人口以前述6省为主,而这6个省处于中国内地,相对东部沿海地区而言属经济欠发达地区,至此结论已经可以得出。另一组图即“流动人口城乡结构”同样属无效信息,对解答该题不起决定性作用,因为这一组能提取的信息是人口由乡村流向城市但选项中却没有类似的表述。

●不能结合特定的语言环境准确理解材料的真实意思。

在阅读历史材料时,囿于年龄和经验,学生往往忽视特定的历史条件,从而作出错误的判断。1992年全国高考历史卷中“人说惠王”一题就需要结合特定的历史条件才能作出正确的判断。该题题干为“孝公死,惠王代后。人说惠王曰:‘大臣太重者国危,左右太亲者身危,今天下妇女儿童皆言商君之法莫言大王之法,是商君反为君大王更为臣也。’”然后问文中的“人”代表了哪个阶级的利益。这里的“人”对惠王说的这段话的真实意思是什么,是肯定商鞅变法还是否定商鞅变法呢?材料已经提供了一定的历史条件“孝公死,惠王代后”,即支持商鞅变法的秦孝公已逝,新的秦王刚刚即位,在这种新旧交替的时候,“人”委婉地说商鞅已经对惠王构成威胁(“大王更为臣”),其真实意图是借惠王之手中止商鞅变法,由此可见此“人”代表的是商鞅变法触犯了其既得利益的没落的奴隶主贵族的利益。

二、如何培养学生提高历史有效信息的提取能力

1.重视审题训练

在审题训练中,我强调审时间、审地点、审关键词句、审提示语、审材料来源、审问题(根据材料提出的问题,这些问题有时又可以反过来给考生以提示),这些都可以作为信息提取能力培养的基本方法,如果我们将这些方法用之于信息提取能力的训练,就可起到事半功倍的效果。

2.加强语言文字的训练

目前的一些重要考试对一些问题的关键词都采取加着重号(或加粗、或用不同字体表示)的方式,为考生避免犯审题的错误而发挥出真实水平提供了便利条件。但此举也养成了部分学生的依赖心理,他们认为考试中既然已经给了我们提示,就没有必要再多费心思。但是目前全国高考试卷中信息源尤其是非文字信息源的大量采用,着重号无法标注,这往往使得平时缺乏训练的考生手足无措。因此,平时训练中我们应该在语言和文字方面加强训练。文字训练时应该重点隐含,即对关键词不作标注。语言训练时教师可以故意用平淡的语气来叙说重点字词。正常情况下我们可以用停顿、加重、放慢等语气来突出重点,但训练时则恰恰相反,各种可能突出重点的方法全部隐含,模拟考场上无人提示的情况。

3.加强对非文字信息源的关注

高寒山区植被信息的提取研究 篇5

对于植被遥感的研究先后经历了从利用各种植被指数进行植被宏观监测以及生物量估算-包括作物估产、森林蓄积量估算、草场蓄草量估算等, 发展到近些年的定量化、实用化的植被遥感, 人们对植被遥感正层层深入, 取得的成果也越来越喜人。

此次研究高寒山区植被信息的提取, 却有着与以往大多数研究不同的目的, 本次研究的目的是为利用遥感影像提取矿化蚀变信息剔除植被干扰因素而服务的。众所周知, 利用遥感影像提取矿化蚀变对矿物勘探有着重要的实际意义。而遥感影像中的矿化蚀变信息是一种“弱信息”, 要想准确提取这种信息必须要排除一些重要的干扰因素, 这其中植被信息就是一种重要的干扰因素。因此, 本次研究针对新疆西天山巴音布鲁克一带高寒山区的植被, 提出有效的植被信息提取方法, 为后期进行这一地区的遥感矿化蚀变信息准确提取做准备工作。

一、研究数据和方法

(一) 研究区地质概况

本次研究区实地选在了新疆西天山中部的和静县巴仑台———巩乃斯以北, 该区域具有深切割中高山的地形特点, 海拔一般都在3500~3800米, 高山区常年降雪, 气候寒冷。2900米以下多为高山草甸型植被, 基岩裸露区风化强烈, 山顶、山脊基岩裸露, 山坡多为残积坡积物, 山底多被植被覆盖。根据已做过的地质调查研究状况, 认为在石炭纪期间, 本区属于博罗科努石炭纪活动陆缘带, 分布有大面积的钙碱性火山岩套和钙碱性花岗岩, 该活动陆缘带形成于伊连哈比尔尕古洋盆向南侧的B形俯冲过程, 俯冲带的位置大体上位于以巴音沟蛇绿岩套为代表的北天山蛇绿岩带所在的位置。在二叠纪期间, 天山地区出现了后碰撞伸展环境下的裂谷化过程, 产生了数量较多的双峰式火山岩和A型花岗岩。研究区内构造活动强烈, 火山机构十分发育, 成矿地质条件十分有利。本区矿产资源丰富, 是寻找与火山活动有关的岩浆型和火山热液型铁铜多金属矿床和斑岩型铜矿最有利地区之一。

(二) 方法和数据预处理

本次研究所用的遥感影像来自美国马里兰大学的免费ETM+数据, 考虑了植被的光谱特征, 实验中只选用1, 2, 3, 4, 5, 7六个多光谱波段, 成像时间是2000年8月7号, 正值当地植被最为茂盛的时间, 选用的影像为144/30这一景, 影像中心位置的地理坐标是:43°11'22"N, 85°9'56"E, 使用影像原始的UTM地图投影, 影像成像质量满足要求。

对于植被遥感, 植被指数是首选的用来定性和定量评价植被覆盖及其生长活力的方法。但由于植被光谱受周边各种环境的混合复杂的影响, 以及包括植被本身变化的多样性, 导致对植被的光谱研究一直是遥感应用界的一个难题, 人们很早就建立了矿物的光谱库, 但却始终无法建立起植被的光谱库, 因此基于植被光谱特征的植被指数也没有一个普适性很好的值。但人们研究结果普遍表明, 利用在轨卫星的红光和红外波段的不同组合进行植被研究能取得非常好的效果。而红光对应ETM+的是第三波段, 红外波段对应的是ETM+的第四波段。因此, 本次研究就是针对研究区的具体植被情况, 基于对植被光谱特征的分析研究, 提出切实有效的植被信息提取方法, 为后期的蚀变信息提取做准备。

由于本次研究所使用的ETM+是种宽波段的遥感数据, 通过对研究区部分地区的实地考察所掌握的植被情况, 此次研究我们为了使图像具有了明确的物理意义, 将遥感数据从原始的灰度值图像转变为地表反射率图像。采用了常用的转化公式:

其中: (1) 式中的L为地物在大气顶部的辐射亮度, DN是像元灰度值, 增益 (gain) 和偏移值 (bias) 可从原始数据的头文件中得到, ρ是地物反射率, ds为日地天文单位距离, E0为大气顶部的太阳辐照度, θ为成像时的太阳天顶角, 这些信息都可以从图像的头文件中获取。

(三) 植被信息提取

利用遥感影像进行信息的提取的主要依据是地物在遥感影像上所表现出的波谱特性, 这与地物本身性质和遥感影像的特点都有着紧密的关系。对于植被在ETM+影像上的波普特征主要是:在二波段上有一个小反射峰, 而在三波段是强吸收, 四波段是强反射。我们对研究区的部分实地做了调查分析, 发现研究区内的植被主要是高山草甸型植被和少量的常年绿叶的高大松树林等, 如图1和图2所示。

1. 训练样本的选取

本次研究我们主要采用监督分类和非监督分类的多种方法进行比较研究, 分析出最为合理可行的方法来。在进行监督分类提取植被信息前, 重要的一项工作是要选取可靠的训练样本, 训练样本选取的质量将对信息提取的精度产生重要的影响。根据李小文、王锦地的观点, 由于测量尺度的不同, 地物波谱数据分为:材料波谱、端元波谱和遥感像元波谱。地物的非均一性导致了有的地物波谱虽然名称一样, 其所表征的地物并不相同。因此, 为了消除一些复杂的影响因素, 此次试验我们直接从遥感影像中选取了训练样本。我们根据野外实地调查时用手持GPS机实地测定的植被位置, 然后再在遥感影像上找到相对应的地理坐标位置的影像像素作为训练样本。由于两者都采用的都是WGS-84椭球, UTM投影, 对于本次研究可以认为定位的精度达到了要求。图3就是在影像上选取的40处训练样本然后求的平均值的反射波谱。从波谱曲线可以明显的看出, 研究区的植被在ETM+数据的2波段上有个弱反射, 这与实际观察到的植被本身的绿色实际情况相符, 并且由于植被所含叶绿素和植被结构的光谱特性, 导致植被在3波段有较低的反射率, 而在4波段有着较高的反射率。

2. 植被信息提取

本次研究我们分别采用了监督分类中的最大似然法、波谱角制图法、支持向量机法和非监督分类中的NDVI指数法、Iso Data法、K-Means法, 通过多种方法来比较研究针对研究区的植被信息提取效果。图4为ETM+321合成的真彩色遥感影像图, 图5为采用最大似然法提取植被的结果, 相似概率阈值选择的为0.1, 其中红色部分为植被信息。图6是采用波谱角制图法提取植被信息的结果, 其中通过反复试验发现最大角度阈值选择为0.25效果最佳。图7为采用支持向量机法提取的植被信息结果, 核函数选择的为径向基函数, 通过实验反复比较, 其中σ参数取0.167, 惩罚参数C取100, 分类概率阈值取0.001时能取得最佳的提取效果。图8为采用NDVI植被指数法提取的结果, 图9为采用的Iso Data法提取的结果, 图10为采用K-Means法提取的结果, 三种方法中都采用了最优密度分割法来确定提取信息阈值区间, 其中NDVI法中确定的阈值范围是0.5142~0.9094为最佳效果。

二、结果分析

对于此次研究试验的结果, 我们通过对比分析了试验所提取的植被信息结果与已有的研究区部分区域野外实际调查成果, 发现本次植被信息提取的结果是:总体上监督分类法提取的效果要好于非监督分类法。在监督分类法中, 波谱角制图法的效果最好, 支持向量机法的效果最差;而在非监督分类法中, NDVI法效果较好, 但也有“过提取”的现象, Iso Data法和K-Means法的效果差别不大, 都有“漏提取”的情况。

因此, 由以上的分析可以看到, 本次针对新疆西天山高寒山区植被信息的提取采用波谱角制图法能取得较好的效果, 这也实现了本次研究的目的。

三、结语

本次研究我们通过大量的实验证明, 有着充分数据源的ETM+多光谱遥感数据对在一些高寒山区提取植被信息有着重要的研究价值, 对今后类似地区的植被信息提取, 本次所得的方法研究也有着重要的参考价值。

摘要:从遥感影像中准确的提取植被信息有着重要的理论和现实意义。本文中, 作者利用ETM+多光谱数据, 针对新疆西天山地区特殊的高寒山区特点, 实验对比了最大似然法、波谱角制图法、支持向量机法、NDVI指数法、IsoData法、K-Means法等多种方法, 最终确定波谱角制图法在研究区进行植被信息提取能达到理想的效果。

关键词:遥感,植被,波谱角制图

参考文献

[1]赵英时等.遥感应用分析原理与方法[M].北京:科学出版社, 2003.

[2]邹林, 杨自安, 朱谷昌等.多光谱遥感蚀变信息提取新方法研究[J].地质与勘探, 2006.

基于遥感影像的城市绿地信息提取 篇6

城市绿地不仅具有改善城市生态环境和文教游憩功能,而且具有景观功能。传统的绿地资源调查方法不仅投入的人力、物力大,而且调查的数据准确性低,耗时,也不便于综合分析评价。遥感技术能够快速、准确地提取城市绿地信息,为城市绿地的规划建设提供基础资料。

1 研究区概况及数据源

1.1 研究区概况

太原市是山西省省会城市,整体地形北高南低,东西横跨为144 km,南北纵跨约为107 km。全市区辖古交、清徐、阳曲、娄烦四个县及万柏林区、迎泽区、杏花岭区、尖草坪区、小店区和晋源区六个主城区,全市区总面积为6 959 km2,总人口425.65万人(2012年)。太原地区于2010年获“全国优秀旅游城市”“国家园林城市”称号。太原市绿地面积为6 434 m2,其中公共绿地面积约2 270 m2。

1.2 数据源

本研究选用2013年5月28日的TM5影像。多光谱波段的分辨率为30 m,热红外波段的分辨率为120 m。太原市第18级Google地图、太原市Auto CAD图。

2 数据预处理

2.1 影像的几何校正与配准

利用ENVI4.8对TM影像几何校正与配准。受传感器高度和运行姿态的变化、地球曲率、地形起伏、大气折光以及传感器介质的均匀程度等因素影响,在获取遥感影像信息时会使得获取的遥感信息变形。本研究采用2008年TM影像图为基准影像对2013年TM影像进行几何配准。选取明显地物特征点作为地面控制点。依据选好的控制点,对2013年遥感影像进行空间数据变换。

2.2 辐射大气校正

本研究采用遥感数据处理软件ENVI4.8中的FLAASH功能进行大气校正。经大气校正后,很好地消除大气对影像数据的影响。

2.3 影像增强

原始影像的清晰度不是很好,我们可以通过一些技术措施来提高清晰度。比如对比度拉伸、波段组合等。

1)对比度拉伸。

影像的清晰度影响着解译的效果。线性、非线性拉伸是提高对比度的两种方法,本研究用线性拉伸[1]。

2)波段组合。

多光谱遥感数据最佳波段选择是色彩增强的重要部分,波段组合应选择信息量大的,波段间相关性小,使地物之间容易区分。研究表明145波段组合信息量最为丰富,其波段间相关性小,可以把它作为提取绿地信息的波段组合[2]。

2.4 研究数据的裁剪

在ENVI4.8中利用太原市的矢量边界图切割影像数据,首先要将矢量边界作为感兴区域,然后切割影像图。

3 城市绿地信息提取

3.1 非监督与监督分类

非监督分类是不需要先验理论,通过计算机对图像进行集聚统计分析的方法,把有相似性的像元归为一类。其中比较成熟的是K-means和ISODATA算法。它们的优点是聚类比其他方法准确、客观[3]。

监督分类事先需要样本训练区。即根据训练区的特征,计算机自己建立判别规则,然后对影像进行分类。这就要求训练区清晰可辨。比较常用的算法有最大相似法等。

3.2 主成分分变换

遥感多光谱影像的波段多信息量大,图像处理时,常常耗费大量内存,实际上存在很多冗余信息。主成分分析法就是要去除多余的信息。主成分分变换(PCA)是一种线性变换,是建立在统计特征基础上的变换。主成分分变换是利用坐标轴的旋转使得数据的方差达到最大,通过变换矩阵进行线性组合,进而输出互不相关的波段,即重新产生具有相同波段的多光谱影像[4]。变换的表达式如下:

其中,X为原始影像的DN值;Y为新生成的影像DN值;A为n×n阶的变换矩阵。

3.3 缨帽变换

缨帽变换也被称为K-T变换。其变换公式如下:

其中,X为原始多光谱空间的像元值;Y为新坐标空间的像元值;A为变换矩阵。

3.4 归一化差异水体指数

归一化差异水体指数MNDWI能很好的将水体提取出来,其表达式为MNDWI=(GREEN-MIR)/(Green+MIR)。其中,MIR为中红外波段的灰度值[5]。

3.5 归一化植被指数

归一化植被指数能很好的提取出植被信息。研究表明可以利用影像波段计算来提取信息,其表达式如下:NDVI=(band4-band3)/(band4+band3)。其中band3,band4分别为对应TM影像的第三波段和第四波段。

3.6 归一化差异建筑指数

归一化差异建筑指数NDBI是以杨山提出的归一化植被指数为基础,硬化建筑与指数之间有密切联系。计算公式如下:NDBI=(band5-band4)/(band5+band4)。其中,band5为TM影像第五波段;band4为影像的第四波段。

3.7 决策树

决策树算法可以处理不同空间尺度的数据,被广泛应用于遥感影像的分类中。决策树方法建立在对训练样本进行归纳学习的基础上。根据训练样本进行决策学习建立决策树,然后依据属性的取值对样本进行分类[4]。

3.8 城市绿地分类及遥感特征

城市中的绿地被分为六大类,分别为公园绿地、生产绿地、防护绿地、居住区绿地、附属绿地、生态景观绿地,其中每类大类中又包括许多小类[6]。在遥感影像中,公园绿地的颜色主要为棕绿色,种植植物集中的绿地颜色呈绿色,居住区、附属绿地等一般是碎片化的点状。从纹理特征来说,公园绿地纹理较复杂,因为植被比较复杂;纹理均匀的是防护绿地、生产绿地,因为它们结构比较单一[7]。

3.9 各类用地特征分析

在ENVI中利用位置、纹理特征提取各类用地的特征,然后绘制了图1的波段信息曲线。从图1中可以看出PC1,PC2,PC3可以很好的将各类地物区别开来。

3.1 0 提取绿地信息

1)非监督提取绿地。用非监督分类把绿地和非绿地区分开来。王延飞研究表明对遥感影像进行归一化植被指数后,通过无监分类后提取绿地信息是一种有效而快速的方法。

2)决策树分类法提取绿地。依据地物光谱曲线图构建决策树规则,然后执行决策树,将提取出的绿地信息导入gis中,绘制城市绿地信息。

4 结语

利用基于归一化植被指数的非监督分类法和决策树分类法分别提取了太原市的城市绿地信息。前者比较简单、易操作,后者花费的时间较长,但准确度较好。后者提取的绿地占整个用地30.70%,最接近2008年的城市绿地率。从空间分布上来说,也更能体现城市绿地格局的水平。

摘要:介绍了太原市的基本情况,通过选取某遥感影像,分析了数据预处理技术,并探讨了基于遥感影像的城市绿地信息提取方法,指出遥感技术能够快速准确地提取城市绿地信息。

关键词:遥感影像,城市绿地信息,数据源,决策树

参考文献

[1]赵鹏祥.基于RS的绿地信息提取方法的研究——以延安市及环城地区为例[J].西北林学院学报,2003,18(2):91-94.

[2]郭娜.TM遥感影像植被信息提取的最佳波段组合选择——以福建省松溪至建瓯高速公路为例[J].福建师范大学学报(自然科学版),2012,28(1):103-107.

[3]赵春霞.遥感影像监督分类与非监督分类的比较[J].河南大学学报(自然科学版),2004,34(3):90-93.

[4]王飞红.基于决策树和混合像元分解的城市绿地信息的提取[D].太原:中北大学,2014:64.

[5]徐涵秋.利用改进的归一化差异水体指数(MNDWI)提取水体信息的研究[J].遥感学报,2005(5):589-595.

[6]Wang,X..城市园林绿地规划[M].北京:气象出版社,2009.

注:本文为网友上传,旨在传播知识,不代表本站观点,与本站立场无关。若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:66553826@qq.com

上一篇:精油的提取及应用现状 下一篇:社科类文章如何提取关键词