数据矢量化

关键词: 矢量化 运用 过程

数据矢量化(精选十篇)

数据矢量化 篇1

1. 在Adobe Photoshop中拼接扫描图

由于地图幅面较大,一般地图都是分幅扫描的,所以就存在着接边问题,在处理接边问题上,我们可以把扫描好的几幅地图拼接好再进行数字化,也可以分幅数字化以后再进行接边,前者的优点是操作简便,但文件较大对计算机的配置要求较高;后者在分幅数字化以后存在的接边问题较复杂,也会增加数字化的工作量,但对于大型的图幅避免了计算机运行不畅等问题同时也可以分摊工作量,几个人同时数字化再拼接起来[2],本文采用第一种接边方法在Adobe Photoshop中拼接扫描图,如果选用第二种拼接方式,可以参照本文参考文献[2]所述的方法。

运用Photoshop拼接扫描图的具体步骤:

1)在目标文件夹下找到需要拼接的六幅内蒙古地质图,并在Photoshop中将其全部打开;

2)查看图像大小,建立新图版,将新图版的图像大小建立成可以包含整幅地质图,并分别选中扫描图将其复制到新建图版中;

3)运用Photoshop“移动工具”进行粗略拼接;

4)运用Photoshop“缩放工具”放大图像到实际像素,配合使用“巨型选择工具”、“剪切工具”和“移动工具”等进行精细拼接,确保接缝处大部分图斑线条相接且过度圆滑;

5)将拼接好的整幅地图命名为nmgdzt并保存。图1是拼接好的内蒙古地质图。

2. ArcMap中影像图配准

2.1 加载数据和影像配准工具,输入控制点

空间配准是通过控制点的选取,对扫描后的栅格数据进行坐标匹配和几何校正。经过配准后的栅格数据具有地理意义,在此基础上采集得到的矢量数据才具有一定地理空间坐标,才能更好地描述地理空间坐标,解决实际空间问题。配准的精度直接影响到采集空间数据的精度。因此,栅格配准是进行地图扫描矢量化的关键环节。所有图件扫描后都必须经过扫描配准,对扫描后的栅格图进行检查,以确保矢量化工作顺利进行。具体操作步骤如下:

1)打开A r c M a p,打开Georeferencing工具栏;

2)把需要进行配准的影像增加到ArcMap中,会发现“影像配准”工具栏中的工具被激活;

3)在校正过程中需要知道一些特殊点的坐标,即控制点。可以是经纬线网格的交点、公里网格的交点或者一些典型地物的坐标,可以从图中均匀地取几个点,一般在实际中,这些点应该能够均匀分布;

4)将“影像配准”工具栏中的Auto Adjust命令取消选中状态;

5)在Georeferencing工具栏上单击Ad d Co ntro l Po in t按钮;

6)使用该工具在影像上精确的寻找一个控制点并单击,然后右击,在弹出的快捷菜单中选择Enter Coordinates命令,在打开的Enter Coordinates对话框输入该点的实际坐标位置的值;

7)用相同的方法,在影像上增加多个控制点,输入它们的实际坐标值;

8)选择View>Lin k Tab le菜单命令,打开Link Table对话框检查各控制点残差及均方差根据上述原则对控制点进行修改,直到符合要求;

9)增加所有控制点后,在Georeferencing下拉菜单中单击Updata Display命令,更新后,将更新后的影像另存[3]。

2.2 设定数据框属性

1)执行菜单命令,视图>数据框属性, 设定数据框属性;

2)出现Data Frame Proerties对话框,点击“General”选项,设置图像实际单位和显示单位;

3)在Data Frame Proerties对话框中,点击“Coordinate System”选项,设置与扫描地地图的坐标系一致的实际坐标系统;

4)点击“确定”后更新为真实的坐标。

2.3 矫正并从采样栅格生成新的栅格文件

在“影像配准”菜单下,点击“矫正”对配准的影像根据设定的变换公式从新采样,另存为一个新的图像文件。加载从新采样后得到的栅格文件,并将原始的栅格文件从数据框中删除。

通过上面的操作,已经完成扫描图像的配准工作,下面将使用配准后的图像进行分层矢量化。

3. 矢量化过程

对于ArcGIS的矢量化,我们可以采用Arcscan工具完成矢量化,但对扫描图件的质量有较高的要求,同时也需要在P HO TOS H OP中将不要的线段去除掉。本文采用直接跟踪要素数字化。具体步骤如下:

3.1 利用ArcCatalog新建数据层,之后再加载到ArcMap中.

1)点击T o o l sA r c C a t a l o g进入ArcCatalog模块,在ArcCatalog中选择要建立的数据层所在目录后,点击右键,选择new>shapefile;

2) 输入数据层名称, 选择要素类型为Polygon, 点击Edit>select>Geographic Coordinate Systemsse>Asia>Beijing1954.prj选择空间参考系;

3)将新建的数据层加载到ArcMap中的Layers中。

3.2 使用Edit工具编辑线文件

1)打开“编辑器”工具栏,在“编辑器”下拉菜单中执行“开始编辑命令”利用编辑工具就可以开始数字化;

2)选择前面要创建的要编辑的要素类Create New Feature, 设置Target图层为Dizituline;

3)将地图放大到合适的比例下,沿着线段中心跟踪一条图斑边框线,当完成线段矢量化操作后,在图层任意一点处点击鼠标右键,选择Finish Sketch提交;

3.3 线段(Polyline)--面(Polygon)转化

1) 在A r c M a p中添加线文件 (Polyline) , 打开“ArcToolbox”, 选择Data Management Tools>Features>Feature To Polygon;

2)在弹出的Feature To Polygon对话框,选择输入文件(Input features),指定输出文件存储目录和文件名(Output F e a t u r e C l a s s),点“O K”;

3)生成的面文件叠加在原先线文件之上,但有许多空白之处,这是因为图斑线段存在拓扑错误造成。放大欲修正错误的空白图斑。检查线段是否闭合、是否存在盲点等错误。修复所有错误后结束编辑状态,重新执行Feature To Polygon,生成面图图斑;

4)数字化完成。

4. 结论

地图扫描数字化是目前较为先进的地图数字化方式,随着地理信息系统的发展和GIS建库的需要,为了将现有的纸质图、薄膜图转化为计算机能够处理的电子地图,扫描矢量化现有的大量纸质图,将绘图人员从传统的数字化仪描图板前解放出来,同时利用了计算机高速智能化处理能力,从而使之成为目前国际上流行的一种全新的数据采集手段[3]。

通过运用ArcGIS9.0 ArcMap数字化内蒙古地质图与以往运用ILWIS软件进行数字化地图相比较,ILWIS软件具有友好、快捷的用户管理界面,操作方便;ArcGIS9.0具有数字化精度高、实用、作业效率高等特点,由于ArcGIS9.0具有强大的空间数据可视化功能、地理分析和定制应用开发的能力以及简便易用,所以能够广泛应用于各个领域中。

参考文献

[1].刘鸿剑.基于ArcGIS的矢量图形接边方法的探讨[J].科技广场.2007.11

[2].吴秀芹.ArcGIS9地理信息系统应用与实践[M].北京:清华大学出版社.2007.6

运用数据驱动的量化方法管理 篇2

设想这样一个情景,你在晚上看电视,一款液晶电视的广告吸引了你的注意。两天以后,当你在网上察看天气预报时,看到了另外一个品牌的液晶电视广告。当天晚些时候,你去访问一个你最喜欢的电器超市的网上商城并开始比较你看到的这两个品牌的性能和价格。这是挺贵的东西,所以你不想在网上购买,而是去离你最近的商店去看看。在离开家之前,你想起要带着你信箱里收到的商店优惠券,然后你去商店买回了你喜欢的液晶电视。

对消费者来说这是一个很不错的购物过程,对市场营销者来说这却是一个多渠道营销管理的难题。

如何管理多渠道营销

You can’t manage what you don’t measure。

在上面的情景中,市场营销者如何会知道最初的电视广告是否对最终的销售产生了作用呢?如何能把访问网上商城的行为和在店面的购买联系起来呢?或者分析产生了这次销售的各种渠道的次序,将其作为为类似消费者服务的标杆呢?或者是否会把客户对这次网上商城的访问看作是失败,而事实上这却是客户购买决定的重要一步呢?

如果我们有足够充足的市场预算和时间,我们可以不去回答这些问题。我们仍然可以凭借自己的感觉去尝试各种渠道,进行粗放或低效的管理。

今天的消费者没有什么渠道规则,

相反,他们会在商店、网站、呼叫中心或其它渠道间跳来跳去,来不断获取信息,并最终购买。市场营销者必须更深入地理解客户的购买行为,才能管理好多渠道营销的过程。

“You can’t manage what you don’t measure”。这句经典的管理格言对多渠道营销同样重要。一些在多渠道营销中先行一步的企业总结了以下宝贵的经验:

1.在试验中学习。一些新的渠道可能是你所缺少经验的,可以把一些线下的直复营销经验运用到线上,更需要在试验中学习。

2.收集客户的反应数据。通过某种渠道进行的沟通效果怎么样,对哪些细分客户群更有效?要很好地回答这些问题,需要收集每个沟通对象的“反应”,他们是否进行了实际购买,或者进一步同品牌进行了联系?

3.将多渠道的客户数据整合起来。只有把多渠道的客户数据整合起来,建立唯一的的客户视图,才能深入地认识客户,深入地理解各个渠道在客户购买决定中发挥的作用。这往往需要一个易于市场营销者使用的客户管理的软件平台,并需要很好地维护来自各个渠道的数据质量。

4.明确如何度量多渠道营销的结果。多渠道营销的量化目标是什么?有了量化的目标,就可以试验各种营销组合方案的效果,并在一定的成本约束条件下进行多渠道营销的优化。

5.基于客户细分开展多渠道营销。对不同的细分客户群,采取不同的渠道组合,投入不同的成本和资源。

在理想的世界中,企业可以通过各种渠道同消费者进行一致的沟通,理解各种渠道的关联,产生完美的客户体验。在现实的世界中,市场营销者却发现在市场活动中优化组合各种渠道变得越来越困难。多渠道营销使营销活动变得更复杂,那些更早运用数据驱动的量化方法的企业将会树立自己的竞争优势。

三维环境矢量数据可视化研究 篇3

关键词:三维环境矢量数据 可视化 数据匹配 坐标转换

中图分类号:P208 文献标识码:A 文章编号:1674-098X(2014)08(b)-0094-01

1 研究现状

从地图学发展过程来看,二维GIS发展成熟,在数据结构、存储、管理、空间查询及分析等方面具有无可比拟的巨大优势。而三维GIS在人机交互,实时渲染等方面有很好的效果。但两者皆有其缺点,二维GIS由于其符号的抽象性,无法表现出逼真的的地形环境,三维GIS出现时间短,发展不够完善,不能够实现较高层次的信息查询,基于拓扑关系的分析及相关属性方面的管理,目前,将二维GIS强大功能和三维GIS直观显示进行有机结合主要有以下三种模式:

(1)二三维切换模式。

(2)二三维联动模式。

(3)基于紧密型二三维结合GIS。

2 矢量数据可视化分析

2.1 矢量数据可视化符号论基础

在传统二维地图上,视觉变量包括形状、尺寸、亮度、密度、色彩,而到了三维环境中,视觉变量有了新变化。三维地图符号的视觉参量与二维地图符号的视觉参量存在差异,由状态、动态变化和操作3个方面的视觉参量组成。状态方面的参量与平面地图的静态视觉参量类似,然而,由于表达手段、技术的不同,参量描述与传统静态视觉参量也略有差异,主要包括形状、尺寸、色彩、亮度、纹理、空间造型等6个方面的参量。

2.2 二维环境与三维环境的差异

传统二维平面地图的认知方式是通过对地图的阅读获取关于地理实体的位置、大小、距离、方向、相互关系等空间信息,主要运用表象形式进行编码和解译。使用地图时,读者对空间信息的定位是使用外部参考框架,方向固定,。二维地图是对地理空间的简化和再现,然而二维平面地图不够生动;用户对二维地图的认知主要依靠人的视觉;VR技术在空间信息可视化中的应用为我们提供了一种新的认知环境——虚拟地理环境,是地图在数字化时代的延伸和拓展, 是数字地图支持下的一种新的空间认知工具。具体说来,三维环境与二维环境有如下几个方面的不同。

(1)投影方式不同,把三维场景中图形显示到二维平面多进行透视投影,而在二维场景中,一般只是进行简单的正交投影即可。

(2)绘制引擎不同,二维场景绘制时一般只要用GDI或GDI+二维引擎即可,而三维场景绘制时多采用OpenGL、OSG、D3D等三维引擎。

(3)漫游方式不同,在二维场景中,只能进行简单的近大远小缩放和上下左右漫游,到了三维场景中,观察方式变得更加丰富,如可以进行翻转、旋转等。

(4)应用环境不同,二维环境多应用于二维GIS或二维电子地图显示,三维场景多应用于三维GIS或逼真的虚拟环境表达。

(5)坐标系不同,二维环境中使用的X-Y坐标,三维环境中使用X-Y-Z坐标;

(6)数据模型不同,二维环境中多使用矢量数据和栅格数据,三维环境多使用DEM与纹理。

正因为两者环境存在差异,将矢量数据在三维环境中可视化必须解决二三维环境下一体化的问题,如坐标的转换问题、数据匹配问题等。

2.3 矢量数据可视化图形学基础

计算机图形学为我们在理论上提供了大量的算法理论,具体包括以下几点。

(1)线型生成技术为线状要素建模提供了有力支撑。

计算机图形学中的平行线生成算法、虚线生成算法可以为线状要提供很好的借鉴作用,规则曲线和自由曲线生成为线状要素显示提供了很大帮助。

(2)面域填充算法为面状要素建模提供了很好的思路。

面域填充算法包括扫描线填充算法、种子填充算法、图案填充算法等,尤其是图案填充算法为面状要素建模提供了很好的算法基础。

(3)几何变换特别是三维图形几何变换为矢量数据在三维场景中的显示起了很大作用。

2.4 矢量数据可视化思路

由前面的符号论分析可知,二维地图符号在三维可视化过程中并未过时,相反,还对三维符号发展起到借鉴作用,二维地图符号在三维环境下仍然可以使用;同时三维环境下地图视觉变量有了新的变化,如增加了纹理、空间造型等,这也启示我们可以在三维环境下使用新的视觉变量,比如,使用纹理进行矢量地图符号建模。

二维与三维环境存在差异,在认知上,二维环境相对于三维环境而言,不够生动,缺乏进入感等,这也是将矢量数据在三维环境中进行可视化的必要性。二三维环境的主要差异有投影方式、漫游方式、坐标系及数据模型,投影方式不同会导致显示效果不同,漫游方式不同会导致符号绘制后不同视角会有不同的显示,如图1所示,各类符号在不同视角下显示有明显不同,以视点逼近为例,点状符号将逐渐占据整个屏幕;同样,线状符号不同线型之间距离拉大;面状符号随着视点的变化其内部填充的图案也变得十分稀疏;这些变化都影响了人的空间认知,而这都是可视化需要解决的问题;坐标系不同则必须要考虑统一坐标系,以及不同坐标下的坐标转换;数据模型的不同则还需要考虑数据模型的匹配问题。

计算机图形学提供了大量的成熟的算法和理论知识,可以为符号建模、要素显示提供思路,OSG的强大功能可以减少工作量。

综上所述,矢量数据可视化思路如下。

(1)综合运用各种视觉变量,实现点状要素、线状要素、面状要素建模。

(2)根据图形学相关算法,解决地图符号在三维环境中的应用问题。

(3)利用相关技术(如RTT技术),解决各要素在不同三维场景中的匹配问题,如三维平面,三维球面,三维地形。

参考文献

[1] 危拥军.二维地图与三维可视化的关系[J].测绘科学技术学报,2007(12).

[2] 徐智勇.三维地图符号视觉参量研究[J].武汉大学信息学报,2006(6).

[3] 游雄.空间数据可视化[D].中国人民解放军信息工程大学,2007.

数据矢量化 篇4

地理信息系统的一个重要部分就是数据。在GIS工程里, 空间数据的获取占有很重要的地位。实际上, 整个地理信息系统都是围绕空间数据的采集、加工、存储、分析和表现来展开的。为了充分利用已有的数据, 降低成本, 实现信息资源的共享, 在GIS工程实施过程中, 经常需要利用不同来源的各种空间数据。

由于GIS软件的多样性, 每种软件都有自己特定的数据模型, 造成数据存储格式和结构的不同。从数据结构上来说, 矢量和栅格是地理信息系统中两种主要的空间数据结构。在数据的使用过程中, 由于数据来源、结构和格式的不同, 需要采用一定的技术方法, 才能将他们合并在一起使用, 这就产生了数据的融合问题。数字制图是GIS的重要组成部分, 也是GIS的主要表现和输出形式。本文讲的空间数据的融合涉及GIS和数字制图, 但侧重于在数字制图中, 将同一地区相同坐标系统, 相同比例尺的多种不同来源或不同格式的空间数据根据需要合并成一种新的空间数据。从需求分析上讲, 需要进行数据融合的情况一般为对数据信息进行更改、更新、增加或者为了某种特定的需要。随着因特网的发展和GIS应用的日益广泛, 多源数据的融合已成为迫切需要解决的问题。

2 栅格、矢量数据结构的概念

基于栅格模型的数据结构简称为栅格数据结构, 是指将空间分割成有规则的网格, 在各个网格上给出相应的属性值来表示地理实体的一种数据组织形式;而矢量数据结构是基于矢量模型, 利用欧几里得 (EUCLID) 几何学中的点、线、面及其组合体来表示地理实体的空间分布。对于空间数据而言, 栅格数据包括各种遥感数据、航测数据、航空雷达数据、各种摄影的图像数据, 以及通过网格化的地图图像数据。如, 地质图、地形图和其他专业图像数据。从类型上看, 又分为:二值图、灰度图、256色索引和分类图 (单字节图) 、64K的高彩图 (索引图、分类图和整数专业数据) (双字节图) 、RGB真彩色图 (3字节图) 、RGBP透明真彩色叠加图等等。常用的数据格式的有TIFF、JPEG、BMP、PCX、GIF等。而矢量数据就更多, 几乎所有的GIS软件都有自己特定格式的矢量数据。目前, 最常用的矢量数据格式有Arc/info的Coverage、e00, 方正智绘的mrg, Mapinfo的mif, AutoDesk的dxf、dwg, Intergraph的dgn等等。在GIS和数字制图中, 同种数据结构本身以及两种数据结构之间的融合构成了空间数据融合问题的主要内容。

3 栅格数据之间的融合

在数字制图中和GIS工程中, 经常用到不同来源、不同精度、不同内容的栅格图像数据进行复合而生成新的栅格图像。目前, 使用的各种多源图像处理与分析系统为栅格型地理信息系统的实现开辟一条新的途径, 可实现栅格数据的各种融合。而在数字制图中, 多源栅格图像数据之间的融合已经非常普遍。

3.1 融合方法

在数字制图中, 图像融合涉及色彩、光学等领域, 在专业的图像处理软件 (如, ERDAS、PCI、PHOTOMAPPER) 或一般的图像处理软件 (如, PHOTOSHOP) 都可进行, 主要是通过图像处理的方式透明地叠加显示各个图层的栅格图。一般要经过图像配准、图像调整、图像复合等环节。具体过程如下:

(1) 图像配准。各种图像由于各种不同原因会产生几何失真, 为了使两幅或多幅图像所对应的地物吻合, 分辨率一致, 在融合之前, 需要对图像数据进行几何精度纠正和配准, 这是图像数据融合的前提。

(2) 图像调整。为了增强融合后的图像效果和某种特定内容的需要, 进行一些必要的处理, 如, 为改善图像清晰度而做的对比度、亮度的改变, 为了突出图像中的边缘或某些特定部分而做的边缘增强 (锐化) 或反差增强, 改变图像某部分的颜色而进行的色彩变化等。

(3) 图像复合。对于两幅或多幅普通栅格图像数据的叠加, 需要对上层图像做透明处理, 才能显示各个图层的图像, 透明度就具体情况而定。在遥感图像的处理中, 由于其图像的特殊性, 他们之间的复合方式相对复杂而且多样化, 其中效果最明显、应用最多的是进行彩色合成。

4 矢量数据之间的融合

矢量数据是GIS和数字制图中最重要的数据源。目前, 很多GIS软件都有自己的数据格式, 每种软件都有自己特定的数据模型, 而正是这些软件的多样性, 导致矢量数据存储格式和结构的不同。要进行各系统的数据共享, 必须对多源数据进行融合。矢量数据之间的融合是应用最广泛的空间数据融合形式, 也是空间数据融合研究的重点。目前, 对矢量数据的融合方法有多种, 其中最主要的、应用最广泛的方法是先进行数据格式的转换即空间数据模型的融合, 然后是几何位置纠正, 最后是重新对地图数据各要素进行的重新分类组合、统一定义。

4.1 数据模型的融合

由于各种数据格式各有自己的数据模型, 格式转换就是把其他格式的数据经过专门的数据转换程序进行转换, 变成本系统的数据格式, 这是当前GIS软件系统共享数据的主要办法。如, Arc/Info和MapInfo之间的融合, 需要经过格式转换, 统一到其中的一种空间数据模型。该方法一般要通过交换格式进行。许多GIS软件为了实现与其他软件交换数据, 制订了明码的交换格式, 如, Arc/Info的E00格式、ArcView的Shape格式、MapInfo的Mif格式等。通过交换格式可以实现不同软件之间的数据转换。在这种模式下, 其他数据格式经专门的数据转换程序进行格式转换后, 复制到当前系统中的数据中。目前得到公认的几种重要的比较常用的空间数据格式有:ESRI公司的Arc/Info Coverage、ArcShape Files、E00格式;AutoDesk的DXF格式和DWG格式;MapInfo的MIF格式;Intergraph的dgn格式等等。

4.2 几何位置纠正

对于相同坐标系统和比例尺的数据而言, 由于技术、人为或者经频繁的数据转换甚至是由于不同软件的因素, 数据的精度会有差别。在融合过程中, 需要进行几何位置的统一。如, 对精度要求不高, 为了提高工作效率, 在允许范围内, 应该以当前系统的数据精度为准, 对另一种或几种数据的几何位置进行纠正。如, 为了获得较高的精度, 应以精度高的数据为准, 对精度低的数据进行纠正。

4.3 地图数据要素重新统一定义

融合后的空间矢量数据, 应重新对要素分层、编码、符号系统、要素取舍等问题进行综合整理, 统一定义。

(1) 统一分类分层、编码。

对于空间数据, 一般都按地图要素进行分层, 如水系、交通、地形地貌、注记等, 而每层又可根据需要分为点、线、面三类, 并采用编码的方式来表述其属性。对融合到当前系统的数据, 应根据地图要素或具体需要, 以当前数据为标准或重新制定统一的要素层和要素编码。

(2) 统一符号系统。

这是目前矢量数据转换的一个难点, 由于各GIS软件对符号的定义不同, 在符号的生成机制上可能差别很大, 经转换后的数据在符号的统一上有一定难度, 而且在符号的准确性上可能与原数据有差距。

(3) 数据的综合取舍。

同一区域不同格式的空间矢量数据, 要涉及到相同要素的重复表示问题, 应综合取舍。一般有以下原则:详细的取代简略的, 精度高的取代精度低的, 新的取代旧的等等, 但有时为了突出某种专题要素, 或为了适应某种需要, 应视具体情况综合取舍。

数据转换模式的弊病是显而易见的, 由于缺乏对空间对象统一的描述方法, 转换后很难完全准确地表达原数据的信息, 经常性地造成一些信息丢失, 如, Arc/Info数据的拓扑关系, 经过格式转换后可能已经不复存在了。

5 矢量数据和栅格数据的融合

空间数据的栅格结构和矢量结构是模拟地理信息的截然不同的两种方法。过去人们普遍认为这两种结构互不相容。原因是栅格数据结构需要大量的计算机内存来存储和处理, 才能达到或接近与矢量数据结构相同的空间分辨率, 而矢量结构在某些特定形式的处理中, 很多技术问题又很难解决。栅格数据结构对于空间分析很容易, 但输出的地图精确度稍差;相反矢量数据结构数据量小, 且能够输出精美的地图, 但空间分析相当困难等等。目前两种格式数据的融合已变得可能而且在广泛应用。在GIS工程中, 很多的GIS系统已经集成化, 能够对矢量和栅格结构的空间数据进行统一管理。而在数字制图中, 两种数据结构的融合也在广泛应用。

5.1 栅格图象与线划矢量图融合

这是两种结构数据简单的叠加, 是GIS里数据融合的最低层次。如, 遥感栅格影像与线划矢量图叠加, 遥感栅格影像或航空数字正射影像作为复合图的底层。线划矢量图可全部叠加, 也可根据需要部分叠加, 如, 水系边线、交通主干线、行政界线、注记要素等等。这种融合涉及到两个问题, 一是如何在内存中同时显示栅格影像和矢量数据, 并且要能够同比例尺缩放和漫游;二是几何定位纠正, 使栅格影像上和线划矢量图中的同名点线相互套合。如果线划矢量图的数据是从该栅格影像上采集得到, 相互之间的套合不成问题;如果线划矢量图数据由其他来源数字化得到, 栅格影像和矢量线划就难以完全重合。这种地图具有一定的数学基础, 有丰富的光谱信息和几何信息, 又有行政界线和其他属性信息, 可视化效果很好。如, 目前的核心要素DLG与DOM套合的复合图已逐渐成为一种主流的数字地图。

5.2 遥感图像与DEM的融合

这是目前生产数字正射影像地图DOM常用的一种方法。在JX4A、VIRTUOZO等数字摄影测量系统中, 利用已有的或经影像定向建模获取的DEM, 对遥感图像进行几何纠正和配准。因为, DEM代表精确的地形信息, 用它来对遥感、航空影像进行各种精度纠正, 可以消除遥感图像因地形起伏造成图像的像元位移, 提高遥感图像的定位精度;DEM还可以参与遥感图像的分类, 在分类过程中, 要收集与分析地面参考信息和有关数据, 为了提高分类精度, 同样需要用DEM对数字图像进行辐射校正和几何纠正。

6 结语

GIS是上世纪60年代才发展起来的一门新技术, 由于发展水平较低, 很多技术都不太成熟, 如, 建设成本过高、实用性不强、理论研究滞后等。特别是建设成本高居不下, 严重影响GIS的发展前景。由于GIS处理的数据对象是空间对象, 有很强的时空特性, 周期短、变化快, 具有动态性;而获取数据的手段也复杂多样, 这就形成多种格式的原始数据, 再加上GIS应用系统很长一段时间处于以具体项目为中心孤立发展状态中, 很多GIS软件都有自己的数据格式, 造成GIS在基础图形数据的共享与标准化方面严重滞后, 这是制约GIS发展的一个主要瓶颈。以目前的发展水平, 各种空间数据的融合是GIS降低建设成本最重要的一种办法, 但其中很多的技术问题还需要解决, 还需要进一步深入研究。

摘要:地理信息系统的迅速发展和广泛应用导致了空间多源数据的产生, 给数据的集成和信息共享带来不便。多数据格式是多源空间数据融合的主要原因, 本文对矢量、栅格两种地理信息系统中的主要空间数据结构的融合问题进行初步探讨, 并展望了多源数据融合的发展方向。

关键词:空间数据,栅格结构,矢量结构,数据融合,展望

参考文献

[1]黄杏元, 马劲松, 汤勤.地理信息系统概论[M].高等教育出版社, 2001, 12.

[2]邬伦, 张晶, 赵伟.地理信息系统[M].电子工业出版社, 2002, 5.

[3]陆守一, 唐小明, 王国胜.地理信息系统实用教程 (第2版) [M].中国林业出版社, 2000, 1.

数据矢量化 篇5

栅格、矢量结构在空间数据融合中的应用初探

文章对矢量、栅格两种地理信息系统中的主要空间数据结构的.融合问题进行了初步探讨,并展望了多源数据融合的发展方向.

作 者:满占东  作者单位:内蒙古自治区有色地质勘查局,五一二队,内蒙古,包头,014040 刊 名:内蒙古科技与经济 英文刊名:INNER MONGOLIA SCIENCE TECHNOLOGY AND ECONOMY 年,卷(期): “”(7) 分类号:P208 关键词:空间数据   栅格结构   矢量结构   数据融合   展望  

数据矢量化 篇6

关键词:数据简化矢量曲线 多波束测深

中图分类号:TB565文献标识码:A文章编号:1674-098X(2011)05(c)-0079-02

1 簡介

多波束测深仪具有几百到上千个波束,一次扇区(ping)扫描能获得成百上千个测深数据,可对水下地形地貌进行大范围、全覆盖的测量,极大地提高了测量的精度和效率,现已广泛应用于河道测量、港湾测量、浅海测量、深海测量等领域[1]。如此巨大的数据在实际应用中,存在很大的冗余性,也为数据的后处理和存储带来庞大负担[3]。因此,在进行数据存储、应用前,有必要在保持测区地形特征的前提下,对数据进行一定的精简。

2 基于ping的简化方法

2.1 ping数据抽取

多波束测深数据是沿测线逐ping记录和存储的部分有序、均匀分布数据,因此其数据后处理可以ping为单位进行。每ping中的数据邻点相连,就形成了一条三维曲线段,然后采用基于矢量曲线的简化方法进行简化处理。

ping数据的抽取方法有两种:(1)曲率判定法,根据当前点与前后数据点在x,y平面上相连接的直线曲率差值来确定;(2)距离确定法,通过计算当前点与前一点的平面距离来确定。

2.2 常用的矢量简化方法

常用的曲线简化方法有以下几种:步长法、线段过滤法、垂距限值法、道格拉斯-普克法(Douglas-Peucker,简称DP)等等[4]。在实际的数据简化应用中,使用较为广泛的是垂距限值法和道格拉斯-普克法。

2.2.1 垂距限值法

从第一点开始逐点筛选特征点。首先以第一点为起点,计算第二点到第一、第三点所构直线的距离,若大于某一阈值,则保留第二点,并以该点作为新起点,计算第三点到第二、第四点所构直线的距离;否则,去掉第二点,仍以第一点为起点,计算第三点到第一、第四点所构直线的距离。依此类推,直至曲线上最后一点。该方法的阈值一般取相应地物最大允许误差或更小。

垂距限值法简化结果具有较好的精度、算法简单、易于编程和计算机处理,所以在曲线简化中应用较广。缺点是它没有考虑到曲线各点的斜率,即不能完全保证特征点不被删减。

2.2.2 道格拉斯-普克法

DP算法是一次对整条曲线段进行考虑。首先连接曲线段两端点,计算线段内各点(称中间点)到两端点所构直线的距离。若最大距离值小于某一阈值,则保留两端点,舍去所有中间点;若大于阈值,则保留对应中间点,并以此点将线段分为前后两段,再分别对这两段重复上述过程,直到没有点需要被舍去为止。

DP法在简化精度方面较垂距限值法有显著的提高。但由于DP算法中用到了较多的循环和递归,在编程的难易程度和计算机处理速度方面逊于垂距限值法。

2.3 简化性能评价

数据简化算法的效果可以从三个方面来度量[5]:(1)精度,即利用简化后数据重构的曲面与由原始数据所构曲面之间的误差;(2)简度,也称简化率,即简化前后数据点个数的比值;(3)速度,即计算机进行简化处理的时间。实际上,任何一种简化算法要想同时在以上三个方面都具有优秀的表现是很困难的,很多算法只能达到其中一个或两个要求,对于海量的多波束测深数据来说更是如此。

3 简化实例

对某实测多波束测深数据分别采用垂距限值法和DP法进行简化处理(原始测深数据见图1),垂距限值均选取0.05m。精度评定采用反距离平方加权内插法。两种方法简化效果见图2、图3、图4、图5(图中五角星标定点为简化后保留点),简化性能情况见表1。

由图2、图3、图4、图5及表1可见,经过简化后的数据均较好地保留了原始数据的地形特征点,且数据量得到了较大地减少。从精度上讲,两种算法的简化精度均远小于0.1m,满足《水道观测规范》要求;从简度上看,两种方法在满足精度要求的前提下,都达到了50%以上的简化率,大大地减小了原始数据量;从速度上比较,垂距限值法比DP法快,这是由于DP法的迭代循环增加了处理时间。

4 结语

从文中实例应用分析可得,虽然垂距限值法和DP法在矢量曲线数据简化中均具有较好的简化效果,但因为DP法在编程中采用迭代计算,增加了编程的难度及数据处理时间,因此,综合算法的精度、简度、速度及算法实现难易度,垂距限值法在海量多波束测深数据的简化处理中更具适用性。

参考文献

[1]郑庆涛.多波束与单频测深技术应用比较[J].水利水文自动化,2007,(1):25~29.

[2]Kammerer E.Charlot D.,Guillaudeux S.Michaux P.Comparative study of shallow water multibeam imagery for cleaning bathymetry sounding errors[C].Oceans Conference Record (IEEE), v4,2001:2124~2128.

[3]周绿,林亨,钟约先,等.曲面重构中测量点云的精简方法的研究[J].中国制造业信息化,2004,33(5):102~104.

[4]刘彦花,叶国华.矢量曲线抽稀算法分析[J].城市勘测,2001,(4):1~4.

无序数据集的向量化编码 篇7

当今是一个海量信息的社会,从海量信息中挖掘出有价值的、有预见性的信息是数据挖掘的首要任务。目前,数据挖掘的研究热点集中于欧氏空间范畴,也即所观测到的数据是单个向量,欧式空间既有线性结构又有内积结构,因此各种各样的数学工具在数据挖掘中都等得到充分的应用。但是,现实中并不是所有的观测数据都是向量形式,甚至可以是非线性结构,例如图像数据,文本数据等,这些数据的本身都不具备线性结构,但是为了数学工具有所用,研究的第一步就是采取各种各样的方法将观测到的数据转化为向量,使之具备线性结构。因此,非线性结构数据的向量化编码问题的研究兼具理论和实用双重价值。

无序数据集的数据挖掘指的是,每次观测到的数据不是一个向量,而是一个有限点集,研究的任务是:从大量的有限点集中挖掘出有用的信息。在实际中应用前景广阔[1,2],可是诸如支撑向量机、神经网络[4]等强有力的工具难以直接使用,因为它们都是基于输入数据是向量的前提,因此,考虑无序数据集的向量化编码问题意义重大。遗憾的是,因其研究难度较大,国内研究甚少。

1 向量化编码

设χ={x1,x2,…,xm|xi∈Rn},向量化编码的任务就是:找一个欧式空间Ω,并建立χ与Ω间的一种对应关系f,使之尽可能地满足如下的编码条件:(1)f是映射;(2)f是单射;(3)f是连续映射;(4)f是可逆映射。

称f是χ到Ω的编码映射,f的像称为码。条件1是编码映射的必备条件,每一个观测数据均必须有唯一对应的码;条件2指的是不同的观测数据的码必须不一样,这样的话,才能从码的信息中复原原始观测信息;条件3指的是编码映射的抗干扰能力;条件4指的是编码映射的解码能力,对原始的数据进行向量化编码,同时进行数据挖掘,最后必须将结论还原给原始数据,因此解码能力至关重要。若{xi}mi=1奂R,则可定义f({xi}mi=1)=(a0,a1,…,am),其中(a0,a1,…,am)是多项式(x-x1)(x-x2)…(x-xm)的系数,可证该编码映射满足条件1-4,但是该方法的计算量相当大,同时很难推广到高维空间的情况。目前,还没有满足所有条件且易于计算的编码方法。本文考虑Ω=Rn×m。

2 范德蒙矩阵方法

2001年,P.Courrieu提出了无序数据集的范德蒙矩阵方法,该方法计算简单,故实用性较强,但是该编码映射并不具备可逆性:只有当数据存在可分指标时,才能解码[{xi}mi=1奂R存在可分指标指的是:存在k∈{1,2,…,n}使xki≠xkj(i,j=1,2,…,m)]。可是绝大部分的实际问题并不一定存在可分指标。故下文给出该方法的一种改进策略,保证计算简单的同时,使之是可逆映射。

定理1

(1)设覬是U到V的可逆映射,φ是V到U的一个映射,满足条件坌X∈Rn×m,坌Y∈R(n+1)×m,P是任意m阶置换矩阵,覬(XP)=覬(X)P,φ(YP)=覬(Y),其中U奂Rn×m,V奂R(n+1)×m,则φ·覬(XP)=φ·覬(X)。

再令S=(g1(t1),…,gm(tm))是一个可逆矩阵,其中gi是R到Rm的连续映射(i=1,2,…,m),(t1,…,tm)是Y的第1行。

定义φ:R(n+1)×m→Rn×m,则φ(Y)=Y(2:n+1,:)ST,则φ(YP)=φ(Y),其中Y(i,:)表示Y的第i行向量(Matlab符号)。

(3)φ·覬满足条件1-4。

证明:(1)易知;

(2)故任给m阶置换阵P,Y→YP,S→SP,Y(2:n+1,:)→Y(2:n+1,:)P,故φ(YP)=(YP)(2:n+1,:)P(SP)T=(YP)(2:n+1,:)PPTST=φ(Y);

(3)由(1)知条件1成立;因S是可逆矩阵,故φ是可逆映射,从而φ·覬满足条件4;

由条件4可推知条件2成立;由gi是R到Rm的连续映射(i=1,2,…,m)可推知条件3成立。证毕。

设x,y∈Rn,如果存在s∈{0,1,…,n-1}使得xs+1<ys+1则称xi=yi(i=1,2,…,s)则称x刍y。易知若且x刍y且y刍x,则x=y,故当中没有相同的数据点时,总可以对它进行排序,使得{xi}mi=1奂Rn中没有相同的数据点时,总可以对它进行,使得其中xi1刍…刍xim,其中,x1…,xm是1,…,m的一个置换。以下总假设{xi}mi=1奂Rn中没有相同的数据点时,这在实际中是很合理的假设。

基于定理1,给出如下的编码算法

算法(范德蒙矩阵编码方法):步1.给定无序数据集{xi}mi=1⊂Rn,将其排序,使得xi1<…<xim;步2.任选t1<…<tm,令yj=(tj,x Ttj)T(j=1,…,m),Y=(y1,…,ym);步3.选定连续的实值函数g1,…,gm(R→Rm),使得S是可逆矩阵,其中S=(g1(t1),…,gm(tm));步4.令f({x1,…,xm})=Y(2:n+1,:)ST,此即无序数据集{xi}mi=1的向量化编码。

摘要:改进了由P.Courrieu于2001年提出的基于范德蒙矩阵的无序数据集的向量化编码方法,证明该编码具备可逆性。

关键词:无序数据集,向量化编码,范德蒙矩阵

参考文献

[1]P.Courrieu.Two methods for encoding clusters[J],Neural Network,2001,14,175-183.

[2]J.Baratgin,P.Courrieu,T.Ripoll,E.Laurent and H.Ripoll.Similarityjudgment on basket-ball configurations by experts and novices:a model andsome experimental tests[J].http://www.ergos-perf.com/Docs/Model_pSE.pdf.

[3]D.Husmeier and J.G.Taylor,Neural networks for predicting conditionalprobability desities:improving training scheme combining EM and RVFL[J].Neural Networks,1998,11:89-116.

数据矢量化 篇8

1 传统土地面积计算及统计的办法

传统进行土地的面积计算及统计通常选用CAD及南方CASS软件, 把需要测量的界限和二调数据加以裁剪, 随之对不同地块逐一展开面积标注, 之后对各个地块儿的总面积加以统计。在小区域内, 地块类型相对比较单一的可以采用上述办法, 对大批量、大面积的项目而言, 大多工期比较紧, 上述方法过于繁琐、费时费力, 基本不能适应生产的需求。基于这种情况, 运用地理信息软件展开统计与计算显得尤为重要。

2 采用ARCGIS进行矢量数据土地面积计算及统计的步骤

在此次土地项目中采用ARCGIS软件进行土地的计算及统计, 该软件具有强大的空间分析能力, 是一款相互性良好的软件。在实际进行土地项目相关的测量及制图工作之中, 使用频繁的是CASS及CAD, 这两款软件比较重视项目线形及图形的质量, 不太重视实体之间的拓扑关系。ARCGIS这一款的地理信息系统软件重视实体之间的拓扑及空间数据的情况, 从而轻松达到计算与统计的要求。选用ARCGIS软件对矢量数据进行土地面积计算及统计步骤如下:

2.1 实施土地数据预处理

对土地进行面积计算与分类的时候, 会牵涉到地块边界及第二次全国土地调查数据 (以下简称“二调”数据) 成果, “二调”数据一般以中国地大MAPGIS格式的数据库形式存在, 因此先采用MAPGIS的格式转换功能, 将“二调”数据转换为ARCGIS软件能识别的文件格式 (*.shp) 。另外, 采用CAD或CASS软件对土地的边界数据提取到单独的一个图层之中, 进行单独的存盘, 进而把其与那些没有关系的图层进行分离, 消除没有关系的数据图层也进行转换。最后用ARCGIS导入工具把存储的图斑数据加载到软件, 将图层数据的坐标系定义成二调成果数据的坐标系统, 便于后续工作的处理。

2.2 对勘测边界及成果数据进行相交分析

打开ARCGIS软件中的Arc Tool Box工具箱, 选择工具箱之中的identity或intersect工具可以快速完成两者之间的空间叠加分析工作。这一步骤与传统办法中的重叠、剪切、闭合相对应。进行勘测边界及成果数据的空间叠加分析是由电脑自动工作完成, 比较适合规模较大的项目进行验算。

土地面积的计算。把上述的相交分析导入形成一个单独的图层文件 (*.shp) , 之后打开图层文件的, 点击下方的OPTIONS按钮, 在出现的菜单中选择ADD FIELD新建一个双精度浮点格式的属性字段, 存储整个图层文件不同土地类型的面积数据。之后根据属性表内CACULATE GEOMETRY功能自动计算出所求的面积。在运用ARCGIS软件进行面积的计算时, 若项目规定所求出的面积必须取整数或保留两位小数, 要在属性表中再创建一项双精度浮点数据的属性字段, 右击刚创建的属性字段FIELD CACULATOR, 在弹出的窗口输入四舍五入计算函数round ([**], **) , 即可得到所需结果。

2.3 土地面积计算及统计

采用属性表中的SELECT BY ATTRIBUTES功能选取某个土地类的编码数据, 再通过STATISTICS功能对所选的数据行进行面积的统计计算, 即可得到该类土地的面积结果。随后, 对各个地类的统计面积进行求取, 把统计得出的结果输入EXCEL表格或CASS之中。和传统计算土地面积及统计的办法相比较, 该办法准确性更高, 可以简便、快速的获取结果。

3 地类图斑面积计算的情况

要进行地类图斑净面积计算, 首先必须建立线状地物的拓扑结构, 处理线状地物的数据。其次, 计算各种地类图斑的扣除面积, 最后把地类图斑的净面积进行逐一计算。对地类图斑各个图层的要素进行批处理分析, 根据地类图斑的净面积计算公式算出净面积数值。

3.1 准备数据

进行土地图斑面积计算牵涉到零星地物数据层 (XZLW) 、地类图斑数据层 (XZTB) 及线状地物数据层 (XZXW) 这3个图层方面。进行净面积的计算主要是对地类图斑数据层 (XZTB) 展开的, 而进行图斑净面积计算之前要对线状地物要素加以处理, 所处理的内容包括:建立拓扑结构、进行线状地物面积的计算及扣除系数确定情况等。建立拓扑结构指的是线状地物及地类图斑之间的空间联系, 线状地物横跨地类图斑边界的时候, 必须断开, 如生成拓扑关系采用软件中的ARCTOOLBOX或ARCGIS WORKSTSTION这些命令来完成。进行线状地物面积计算相对较为简单, 具体的公式如下:

进行扣除系数确定原则为:如果线状地物处在地类图斑的内部, 需要扣除的系数是1.0.如果线状地物处在地类图斑边界则扣除的系数是0.5。该规则可根据线状地物及地类边界空间的情况来进行判定。具体步骤为:选取线状地物的几何中心点位置, 以此点作为中心, 微小值视为半径, 形成圆或矩形。选择该圆或矩形与地类图斑要层相互交集之处, 如果结果为2个地类图斑则扣除系数为0.5, 如果是两个地类图斑则扣除1.0的系数。进行计算的方法如图1所示。

3.2 进行地类图斑净面积的计算

进行地类图斑净面积计算按照公式:图斑净面积=图斑毛面积—零星地物面积—线状地物面积—田坎面积, 从而算出净面积结构。想要算出农田净面积, 必须具备地类图斑、线状地物及零星地物三个层面的数据。进行零星地物面积计算的思路为:判定零星地物是不是已经落入地类图斑之内, 如果是, 就对该零星地物面积辅定相对应的地类图斑。其算法如图2所示。

进行线状地物计算的基本思路为:对线状五与不同图斑之间的空间关系进行判定, 如果两者相交, 可以把此次的线状地物面积当做需要扣除的地类图斑面积, 不然不当做是扣除面积。地类图斑及相关零星地物的面积情况, 随之把这些此段存入到KLWM之中;第二步对地类图斑的面积进行计算, 包含图斑边界的线状物把结果存入到KSXM之中, 根据线状地物面积、零星地物面积及田坎计算公式所处结果并存入KKSM之中。第三步依照净面积计算公式算出各个地类图斑的面积结果。各个地类图斑其计算办法相同, 可以采用地类图斑毛面积计算结果减去零星地物面积和线状地物面积, 在减去田坎面积, 从而在属性表之中采用FIELD CACULATOR工具得出想要的数值。

4 采用ARCGIS进行土地面积及统计计算的不足之处及改进办法

在进行GIS和CASS两者数据转换的时候会发生信息损失的情况, 尤其是带有曲线及圆弧的数据信息, GIS数据转换为折线数据的过程中, 信息缺失的情况也很严重。有些数据所进行的相交分析结果输出在CASS之中, 图形之间可能产生约为0.1mm的细缝, 这是因为数据存储的精度情况造成的。如果遇到曲线及圆弧等这类不规则图形数据损失的情况, 可以选用ARCGIS中的人工修正效果加以还原, 从而包导入的数据加以再次编辑。基于相交成果图形之中出现的细缝。通常情况下, 勘测定界图可以忽略不计, 如果必须进行改正, 可以采用CASS事物修改检查及人工修改功能来完成此项操作。

5 结语

综上所述, 采用ARCGIS软件对土地进行面积的计算及统计, 可以消除传统方法的繁琐、易出错的情况, 可以实现大范围的项目计算, 准确性、可靠性较高。采用ARCGIS软件与有些软件进行合理结合, 可以优化勘测的工作流程, 从而提升工作效率, 避免重复工作的情况。

摘要:土地面积的计算及统计是土地整治项目中一项重要的工作内容, 它直接影响着土地整治项目的可行性以及各项具体要求的落实情况。快速准确地计算出矢量数据的面积, 有利于及时发现、解决项目存在的问题, 推动土地整治项目的进度, 并为全面掌握项目投资金额等基本情况及合理分配资金提供了依据。文中从传统土地面积计算及统计的办法入手, 简述采用ARCGIS矢量数据进行土地面积计算及统计的步骤, 介绍地类图斑面积计算的情况, 分析采用ARCGIS进行土地面积统计计算的不足之处并提出改进的方法。

关键词:ARCGIS矢量数据,面积计算,应用

参考文献

[1]钟远达, 张丽.基于ARCGIS的土地勘测定界中土地分类及其面积计算与统计的应用[J].中国科技博览, 2012, (14) :208-208.

[2]王康, 何俊仕, 于德浩等.采用Arc GIS平台的地势起伏度自动提取技术研究[J].沈阳理工大学学报, 2013, 32 (2) :63-67.

[3]邹斌文, 马维峰, 龙昱, 等.基于Arc GIS的条带剖面提取方法在地貌分析中的应用[J].地理与地理信息科学, 2011, 27 (3) :42-44.

[4]刘美娥, 乐晶, 叶明珠, 等.ARCGIS在农村土地整治项目土方计算中的应用[J].金色年华 (下) , 2011, (7) :204, 39.

[5]毕育学, 颜虹.基于Arc GIS的数字地图制作技术[J].中国卫生统计, 2011, 28 (5) :602-603.

[6]秦昆, 朱文锋, 吴欢, 等.基于Arc GIS的房产测绘信息系统的设计与实现[J].智能计算机与应用, 2012, 2 (6) :67-70.

数据矢量化 篇9

近年来以C2C为主要形式的中国网络购物发展迅速,截止到2009年12月,网络购物用户规模增长了45.9%,中国网络购物市场交易规模达到2500亿,其中近90%是网民在C2C网站上的购物支出[1]。C2C之所以在近年来能够蓬勃发展,价格是重要的影响因素之一。对拥有81.5%网购用户的淘宝网,CNNIC的调查显示用户对网购商品价格低廉的满意度较高,而C2C购物网站采用品类丰富、低价优惠的模式更适宜目前用户的偏好[2]。在淘宝网中,一口价是很多网络卖家选择的定价方式[3,4,5],由于网店的低门槛和消费者的低询价成本,网上商家之间的价格竞争激烈 [6],价格作为消费者进行在线购物决策的重要考虑因素,突出地影响着交易成果,这就需要卖家必须把自己商品的价格定价为最有竞争力的价格。为了获得最有竞争力的定价,在线商家除了考虑:进货数量和价格、成色和质量、信用度、商品稀缺程度[4]等自身因素外,还特别关心商品价格在什么区间成交量比较好,以及消费者对商品价格的敏感程度,即价格敏感度的量化问题。虽然很多学者的研究表明了一口价价格与成交量成负相关关系,即价格越低,成交量越高[3,7,8],却很少进行商品价格对成交结果影响的量化研究。如何对消费者价格敏感度进行量化不仅是在线商家考虑的问题,也是电子商务领域研究的一个重要问题。

本文通过分析淘宝网的在线交易数据,以价格及其他影响因素作为控制变量,实证研究了商品价格对商品成交量的影响,以及消费者对商品价格区间的敏感程度,并进行了商品价格与信用度偏相关分析,最后提出了相应建议。

二、文献综述

商品价格是影响网上消费者购物决策行为的主要因素之一[9,10],消费者对商品价格的敏感程度直接决定了交易行为。国外研究表明,电子商务市场作为一个典型的信息不对称市场,网络消费者价格敏感度不仅取决于消费者搜索产品质量信息成本及对商品价格变动了解程度[11],还与自身受教育程度和收入水平等因素有关[12]。此外,网络消费者对价格的敏感度也可以从网上产品价格的离散程度[13,14]及企业对产品的定价[15]这些侧面体现出来。

对于C2C在线拍卖市场, D.Lucking-Reiley(1999)[16]和R.Katkar(2000)[17]通过构造在线拍卖市场实验研究方式,P.Bajari(2003)[18]、S.Anwar(2004)[19]和D.Lucking-Reiley(2000)[20]则通过调查、收集eBay网站的在线拍卖数据实证研究方式得出了商家所采用的不同拍卖方式对网络消费者价格敏感度有影响。随着C2C在线拍卖在中国的迅速发展,网上产品价格作为影响顾客满意度的一个很重要的原因[21]也引起了国内许多学者广泛关注:

有的学者基于问卷调查方法,得出价格是消费者在进行网购时,作为稍次于产品功能的第二重要考虑因素[22] ,而且与消费者选择店铺的态度显著负相关[23]。

有的学者利用网上拍卖数据实证研究价格对成交结果影响。崔香梅等(2010)[3]、彭赓等(2008)[7]对淘宝网实际交易数据、李先国等(2009)[8]对eBay易趣网站的实际交易记录,及岑薇(2009)[24]通过模拟网购实验得出的数据研究均得出了一口价价格对成交概率有显著负向影响的结果。

有的学者着重研究了哪些因素对网上产品成交价有影响。邓之宏等(2009)[25]从市场声誉的角度出发对淘宝网交易数据进行实证分析,得出卖家信用和卖家是否为专卖店对成交价具有显著的正向影响,而卖家差评数和卖家受到惩罚具有显著的负面影响。吕巍等(2006)[26]通过对eBay网络Mp3竞拍的实证分析得到了是否具有网络参考价、卖家的信用及经验信息、网络支付手段的安全性对成交价有较大影响。李原(2008)[27]通过观察淘宝网手机行业69个手机型号的价格分布发现,消费者介入度、市场中竞争进数目、进入市场时间也可以影响价格成交价。

王元华(2006)[28] 则利用数学方法,通过构建模型证明推导得出价格、质量与成交量的关系:如果价格提高的幅度大于质量提高的幅度,或者价格降低的幅度小于质量降低的幅度,都会导致成交量降低。李彦霞(2009)[10]也通过构建消费者购物决策模型,利用消费者效用函数分析推导得出价格对消费者购物决策的影响。

综合来看,学者进行了大量的实验研究和实证研究,得到了许多具有理论价值和实践价值的结论。现如今,在国内如淘宝这样的在线销售方式中,一口价定价方式占到了很大的比重。然而在国外,较少有学者进行一口价方式的在线拍卖研究。虽然很多国内学者进行了大量的相关研究,但大都侧重于价格对拍卖结果影响的研究上,很少有学者在研究商品价格对成交结果的量化研究上,针对商品价格对拍卖成果造成影响的研究,而对消费者对价格敏感度的量化研究就更少了。

三、理论假设

根据对国内外文献的研究结果,针对一口价交易方式,笔者对商品价格、信用等因素对交易笔数的影响作出6个假设。

价格是消费者首先考虑的因素,也是比较敏感因素,因此,提出如下假设:

假设1:一口价价格对成交量有负向影响。

用户对许多商品往往存在一个可接受的价格范围,若超出此范围,价格就会变得非常敏感[29],因此,提出如下假设:

假设2:超出一定的价格区间上限时,价格与成交量负相关;低于一定的价格区间下限时,价格与成交量正相关。

电子商务市场是一个典型的信息不对称市场,在线交易过程中,买卖双方之间相互不见面,所以卖家在过去交易中所获得的信用度和好评率往往成为交易成功是否的重要因素。另外,由于本文采用淘宝网上较为贵重的商品——手机作为研究对象,发票作为消费者向销货方要求调换、退货、修理商品的重要依据,商家是否提供发票以及是否提供商品保修服务,都会降低买家的风险,提高产品成交率。因此,提出如下假设:

假设3:商家信用度对成交量有正向影响。

假设4:商家好评率对成交量有正向影响。

假设5:是否开具发票对成交量有正向影响。

假设6:是否保修对成交量有正向影响。

四、数据收集及计量分析

(一)数据收集

为了有效地研究消费者对商品价格的敏感程度,应尽可能选取同质的数据样本,以避免由产品不同质带来的问题。本文选取淘宝网上交易比较活跃的,以一口价方式竞拍的基本同质的诺基亚手机作为研究样本,利用自编的SPIDER程序在淘宝网上观察2009年1-2月期间的交易,以架上期间作为时间周期,收集交易结束时交易数量及其他变量信息将近4万余条。同时,为了保证数据的真实性,对数据进行了筛选,剔除了一些非全新商品及成交量为0的数据,对好评率为0或信用度4以下的数据进行删除,原因主要是:一是因为这些卖家交易行为不够成熟,缺乏代表性;二是即使有交易,也可能存在虚假行为。最终得到了近3 000条有效样本。数据分析使用SPSS16.0统计分析软件,采用如下分类线性回归分析模型:

Y=Xβ+C+ε;E(ε)=0;Cov (ε) =σ2I

其中Y为成交量,X为一口价价格、信用度、好评率、有无发票和是否保修等(变量描述见表1)。当然,成交量还受其它多种因素的影响,如商家是否加入消保、商家的产品推广力度、线下交易等。因此,本模型只能在一定程度上解释商品价格、信用度、好评率、有无发票和是否保修对成交量的影响。

(二)数据分类初始化

在进行分类回归数据分析时,本文首先对数据中的成交价格、信用度、好评率、有无发票及是否保修进行了分类处理。各个变量的处理方法如下:

1.成交价格。由于数据样本涉及10类不同型号的诺基亚手机,每款手机的价格都不一样,因此,本文首先对每一款手机进行大量的线上线下考察,得出每一款手机网上合理价位,并以此价位作为基点,然后通过大量访谈,确定以200元作为每类间的梯度,对价格进行分类初始化。

2.发票与保修。笔者作了如下定义:1代表无发票或无保修;2代表有发票或有保修。

3.信用度按淘宝网采用的分级方法分为了20个等级。

(三)分类回归结果及分析

用SPSS16软件进行模型验证和参数检验,回归结果如表2所示:

从分类回归结果可知F=40.878,P<0.0001,表明模型有统计学意义。商品价格对成交量有显著的负向影响,商品价格越低成交量越高,说明进行网购的消费者对价格具有较高的价格敏感度,他们更喜欢在商品价格低的店铺浏览和购买商品,这与以前学者的研究成果是完全一致的。由回归系数可知,在其他因素不变的情况下,商品价格每降低一个价格区间,成交量会上升12.7%。

商家的信用度对成交量有显著的正向影响,且影响较大,说明在网络这种虚拟空间中信用度高的商家更容易得到买家的信任,从而增加商家产品的成交概率。好评率在0.05显著性水平上相关,对此的解释是淘宝网上大多数买家的中评数和差评数保持在很低的水平,导致商家的好评率普遍较高。

有无发票变量统计上显著,这与预期假设相符。说明对于手机这种消费水平较高的产品来说,发票可以降低在线交易的风险,提高成交量。商家是否提供保修服务无统计学意义,这与预期假设不相符。对此的解释是:一方面:商家所提供的产品保修证明与发票有较强的相关性,都是发生在商品成交基础上由商家随产品一并发出的。另一方面,由于网上交易的产品价格比线下要低,有部分买家会因价格而甘愿承担一定的无保修服务等这样的风险。

(四)相关性分析

本文主要研究消费者对价格的敏感性,但鉴于信用对成交量的显著影响,因此在做相关性分析时主要选取了价格和信用二个变量,以进一步查看变量之间的相关关系。分析结果(见表3)显示,成交量与成交价格、信用度均有显著的相关性。成交价格与交易呈负相关关系,信用度与成交量呈正相关关系,这说明价格越低和信用度高的卖家都可以提高成交概率,这与预期假设相符。

(五)用户敏感度价格区间

詹姆斯·恩格尔等人指出:由于顾客对许多产品往往不注意它们的精确价格,因而在许多情况下,可能存在一个可接受的价格范围。如果产品落入这个范围,价格就可能不被作为一个尺度,然而若价格超出可接受范围的上限或下限,价格就变得很重要,同时有问题的产品被拒绝[29]。因此,为了进一步验证用户敏感度的价格区间,现对成交量和分类处理后的价格作分析研究。

**在0.01显著性水平上相关(2-tailed)。

由于每一型号的手机均是按实际考察价格加减100元作为中间分类号4,并以200元为价格梯度依次分为7类价格区间,这样做就可以排除因不同型号手机价格不一致带来的问题,达到初步研究用户敏感度价格区间的目的。

在研究过程中首先对实证数据中不同型号但具有相同分类号的成交量进行分类汇总,得到每一价格区间的交易总量;然后对每一价格区间交易量占总成交量百分比进行分析,结果如表4和图1所示。

分析结果表4中可以看出,网上交易时分类号为4的价格区间成交量最多,占到了总成交量的65.6%,而分类号为4的价格区间正是我们以网上手机实际考察价格加减100元所得出的价格区间。分类号为3和5的价格区间成交量相比分类号为4的价格成交量有大幅度降低,分别为:9.5%和11.9%。也就是说,买家对手机价格在超出实际考察价格的正负100元时变得比较敏感,成交量会急剧降低。

图1中还可以看出,以分类号4的价格区间为中心,成交价格与成交量基本成倒“U”型结构,这与假设2相符。也就是说,以某一个价格区间为中心,在左边,成交量随着价格的降低而降低,而在右边,成交量随着价格的升高而降低。随着价格的升高成交量降低,这和上面分类回归结果及相关性分析结果是一致的。而在某一个价格点的左边,成交量却随着价格的降低而降低,我们对此的解释是,手机作为一类相对贵重的商品,消费者在网上进行交易时,一般会预先进行相关信息收集,但由于网上交易存在信息不对称现象:如产品质量及因双方身份难以确定而引起的网张诈骗等[30],因此,随着价格的降低,买家会对卖家的商品质量等方面产生不信任,从而导致了成交量的下降。即消费者在线上进行交易时,当价格超过一定的价格区间时,消费者商家会因为商品太贵而放弃购买,而当价格低于某一价格区间时,又会因为对质量产生怀疑及其他因素而放弃购买。

五、结论与建议

本文通过对淘宝网手机一个拍卖周期实际交易数据分析,研究了网购用户对价格敏感度的量化问题,验证了相关假设(见表5),得出商品价格对成交量有显著的负向影响,价格越低成交量越高。在其他因素不变的情况下,而且商品价格每降低一个价格区间(以200元作为价格梯度),成交量会上升12.7%。研究还表明,成交价格与成交量基本成倒“U”型结构,商品价格并不是越低成交量就越高,当价格超过一定的价格区间时,消费者商家会因为商品太贵而放弃购买,而当价格低于某一价格区间时,又会因为对质量产生怀疑及其他因素而放弃购买。买家对商品价格在超出实际考察价格的正负100元时变得比较敏感,成交量会急剧降低;超过正负300元时,成交量就变得相当少。这就要求卖家在对商品定价时,找到这个合适的价格区间,并结合自身的具体条件如:信用度等多方面因素综合思考,以期获得更大收益。

数据矢量化 篇10

图形是一种比较自然的信息表达方式, 图形对象可以理解为一幅具体画面中的一个部件或实际存在的基本图形元素。图形对象的类结构可用下列集合表达式表达:总类一{文本类, 图形类}。

图形类一{基本图形类, 组合图形类, 复杂图形类, 图元类基本图形类一{点, 直线, 矩形, 圆, …};

组合图形类一{子图类, 合图类};

图元类={普通图元类, 广义图元类, 属性类};

普通图元类一{立体图元类, 平面图元类};

属性类={色彩, 线型, 填充方式, …}。

图形对象是本系统数据结构中最基本的对象, 是使用面向对象方法设计图形编辑系统的基础, 它可以用一个五元组表示为:GN, 是图形对象的名字或标识;CN是图形类的名字或标识;DS是图形对象的图形数据集;SA是图形对象的状态参数;OA是图形对象的操作参数。

2 图元模型

图元在SVG中的表示必须既包含几何形状的信息, 又要包含实际的应用属性信息。根据这些要求, 图元可以用BNF描述表示如下[]:<图元) ::=<几何形状定义) [<应用属性定义) <交互事件定义>];

<几何形状定义>::=<几何信息>[<风格样式><动画效果>];

<几何信息>::一<基本图形>[{<基本图形>}];

<基本图形>::=<图形类型><坐标位置>[<坐标单位>];

<应用属性定义>::一<应用属性>[{<应用属性>}];

<应用属性>::={=<属性值>};

<交互事件定义>::=<交互事件>[{<交互事件>}];

<交互事件>::={<事件名>=<响应函数>}。

由此可见, 图元的SVG表示可由几何形状、应用属性和交互事件组成。图元的几何形状可以表示为图元所包含的基本图形的组合。

3 SVG文档的解析模型

由于SVG文档是一个基于XML的文本文件, 在对SVG文档进行加载和保存时必须借助XML语法解析器。根据对文档的不同处理方式, XML解析器可分为基于DOM的解析和基于SAX的解析。本系统采用DOM接口对SVG文档进行解析。

D0M是一种树状模型。利用DOM接口对SVG文档进行分析之后, 其中的信息都会被转化成一棵对象节点树。在这颗节点树中, 有一个根结点即Document节点, 所有其他节点都是根结点的后代节点。节点树生成后, 就可以通过E0M接口访问、修改、添加或删除树中的节点和内容。我们以下面的Test.svg文件为例, 其文档可用图1所示的D0M树表示。

< xmlversion=“1.1”standalone~“no”?>

http:}}.w3.org/TR/2003/CR—SVG一20030114DTD/svg一20030114.dtd”>

hello

在这棵D0M树中, SVG文档的所有内容都用节点表示。一个节点又可以包含其他节点, 节点本身也可以包含些属性信息, 如节点名、节点值、节点类型等。

本文所述的矢量图形编辑系统提供了一个对SVG文件进行可视化编辑的人机交互环境, 它可以直接读取保存在本机或服务器上的SVG文件, 经过解析以图形界面的形式显示在屏幕上, 从而可方便地进行可视化编辑, 还可以通过预先定义好的图元库来提高绘制效率。此外, 该系统编辑好的SVG图形文件可存放在数据库服务器中供Web页面直接调用显示, 大大提高了编程效率, 具有很重要的推广应用价值。

参考文献

注:本文为网友上传,旨在传播知识,不代表本站观点,与本站立场无关。若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:66553826@qq.com

上一篇:电流矢量型变频器设置管理论文 下一篇:矢量水听器