随着网络技术的不断发展,越来越多的信息资源可以通过网络得到更广泛的利用,同时,许多行业、单位和部门都根据自身需要构建了许多相互独立的信息系统,这些由不同技术构建的信息系统形成了“信息孤岛”。“信息孤岛”现象造成系统中存在大量冗余数据、垃圾数据,无法保证数据的一致性,从而降低了信息的利用率,严重地影响了企业的发展[1]。我们有必要研究一种高效的方式以实现对异构数据源的透明访问。近年来,X M L作为应用之间的数据传递媒介,已经作为数据交换的主要技术越来越广泛的应用于各个领域中。
1 相关技术介绍
1.1 XML技术
XML语言(Extensible Markup Language)是1982年2月由W3C组织制定的一种通用语言规范,它没有复杂的语法和数据定义。X M L具有易扩展、结构性强、语义性强、纯文本、易于处理、与平台无关等特点。XML的自描述性使其非常适用于不同应用间的数据交换。XML作为数据传输的中介格式,为异构数据源提供了一层理想的缓冲,从而使异构数据源之间保持透明。XML作为独立于平台和设备的结构化数据表达方式,可以有效地实现异构数据源的集成。
1.2 异构数据交换
数据交换是实现数据共享的一种技术,因此通过数据交换,实现各系统间的数据共享、互联互通、业务协同是解决目前“信息孤岛”现象的关键途径。
目前常见的异构数据交换技术可分为电子数据交换方式、中介层方式、数据仓库方式、中间数据方式,但都还存在不足[2]。基于X M L的数据交换技术具有良好的通用性,扩展性,可移植性和自治性,同时满足一定的实时性要求,从而它弥补了以上数据交换方法的缺点,提高了数据交换系统的兼容性和扩展性,在一定程度上提高了数据交换系统的开发效率。
2 系统设计
2.1 系统结构设计
数据交换平台主要由数据提取、数据读/写、数据分析、数据转换几部分构成。
2.2 数据提取部分
在进行数据交换时数据提取部分根据用户的指令将需要进行交换的数据从数据库中提取出来。数据提取的数据源主要有:(1)文本文件:主要指部门自定义的特定格式的文件;(2)数据库:主要指专业用于存储数据的各种关系数据库系统;(3)X M L文档,它是一种简单、灵活的文档,可对结构化数据提供透明的组织及交换的方法[3]。
2.3 数据读/写部分
数据读/写部分负责对数据源的读写操作,具体包括从源数据中读取要进行交换的数据及把转换后的数据写入目标数据。数据读/写部分根据不同的数据采用不同的读写方式:(1)对文本文件,通过字符输入/输出流依次读/写文本中的字符来实现;(2)对数据库,利用数据库连接驱动(如J D B C)来实现;(3)对X M L数据文件,通过调用X M L解析器的读/写接口加载整个XML文件来实现。
2.4 数据分析部分
数据分析部分负责解决数据映射的问题,并构建出异构数据之间进行数据转换的映射文件。此处主要针对异构关系数据库之间的数据交换进行研究,为了在数据库与X M L文档之间传递数据,必须在X M L文档结构和数据库结构之间建立映射关系。在设计时应考虑:(1)数据类型:为了匹配关系型数据库严格的数据类型,本系统采用X M L Schema数据类型。(2)主键/外键:在进行基于XML的双向数据转换时,要将源表中的主键/外键信息保留下来。(3)空数据:当将XML文档与异构数据库进行双向转换时,要注意那些可为空的列。(4)数据结构:在进行基于XML的双向数据转换时,要保留源数据的结构,可将XML文档设计成两部分,一部分存放结构信息;另一部分存放数据信息。结合以上要求,定义异构数据库双向数据交换的中间数据模型如下:
2.5 数据转换部分
在数据分析的基础上,数据转换部分负责源数据和目的数据之间的转换操作,其中包括源数据到中间数据的转换及中间数据到目标数据的转换。异构数据之间的转换方法有两种:基于模板的转换方法和基于模型的转换方法[4]。鉴于本系统要实现XML文档与其他格式数据的双向转换,采用基于模型的转换方法。
基于模型的数据转换方法用事先定义好的数据模型来映射XML文档结构与其他格式数据的结果之间的关系(如图2)。
3 系统实施
该系统在Windows Server 2003平台上开发,使用Oracle9i数据库、S Q L Server 2000数据库。系统采用Java技术实现,XML是独立于平台的标记语言,而Java是与平台无关的计算机语言,XML与Java的结合能够最大限度地体现系统平台的无关、应用无关性[5]。该系统具有如下特点:(1)基于开放的标准技术,具有良好的可扩展性;(2)类模块架构设计,效率高;(3)Java和XML结合,可以跨越多种平台。
4 结语
数据交换是X M L的重要应用之一,XML使得不同应用系统间能够方便地交换数据,实现异构系统的集成。本文的创新在于构建了一个新的基于X M L的数据交换模型,该模型能有效地解决企业各部门之间资源共享问题。
摘要:“信息孤岛”现象的存在造成的资源浪费、数据不一致等严重影响了企业的发展。对数据交换问题的研究将有利于消除“信息孤岛”现象。本文首先介绍了XML技术及其在数据交换中的应用,接着针对异构数据库数据交换问题进行了研究,并提出了一个基于XML的数据交换模型,讨论了模型的总体结构及各模块的功能实现,最后给出了系统实施的可行性及优越性分析,此系统运行效率高,能跨越多种平台,具有很好的可扩展性。模型的研究将对实际的交换系统开发工作起到指导作用,从而有效地解决企业各部门之间资源共享问题。
关键词:XML,数据交换,异构数据,数据转换
参考文献
[1] 徐俊杰.基于XML的数据交换模型研究[D].哈尔滨:哈尔滨工程大学,2007.
[2] 李雯,谢辅雯,邹道.XML数据交换技术的应用与研究[J].计算机与现代化,2008(1):91~93.
[3] 刘敏.基于XML和JMS的数据交换模型的设计及应用[D].沈阳:东北大学,2005.
[4] 刘立华.基于XML的异构数据库之间的数据交换[D].武汉:华中科技大学,2005.
[5] 陈兵,万晖.基于XML的Web数据交换[J].计算机工程,2002(2):112~114.
[6] 王大刚,谢荣传.基于XML Schema的数据匹配方法的研究[J].计算机科学与技术,2008(6):28~31.
[7] L.Seligman,A.Roenthal.XML’s im-pact an databases and data sharing[J].Computer,2001,34(6):59~67.
[8] Maria Arigeles.The challenges thatXML faces[J].Computer,2001,34(10):15~18.
[9] Fernandez M,Tan W-C,Suciu D.SilkRoute.Trading between Relationsand XML.Computer Networks,2000(33):723~745.
相关文章:
基于价值链的企业知识管理模型研究02-19
基于大数据的宽带用户预测模型研究02-19
基于时间序列模型的PM2.5研究02-19
基于FAVAR模型通货膨胀的成因研究02-19
基于组织学习的企业技术创新模型研究02-19
软件开发工程师能力层次模型02-19
基于结构洞理论的石化企业监管分离模型研究02-19
基于Logistic模型的养老机构服务项目定价研究02-19
基于“信息系统三大能力”框架的系统分析02-19
基于某扶贫政策的MOA模型分析研究02-19