企业信息化下的XML与数据集成

点赞:28376 浏览:131447 近期更新时间:2024-01-16 作者:网友分享原创网站原创

摘 要:研究实现基于XML的数据集成技术,探讨XML的主要技术以及XML 应用.XML是eXtensible Markup Language(可扩展的标记语言)的缩写,标记是指计算机所能理解的信息符号,通过此种标记,计算机之间可以处理包含各种信息的文章等.并从XML主要技术、XML应用来阐述.同时XML应用从支持数据交换、在异构数据库集成中的关键技术作用、存储数据、支持以文档为中心和以数据为中心的应用、定义新的标记语言.

关 键 词 :XML;数据集成;数据交换

中图分类号:F270 文献标志码:A 文章编号:1673-291X(2014)03-0015-02

一、XML 概述

XML是eXtensible Markup Language(可扩展的标记语言)的缩写,标记是指计算机所能理解的信息符号,通过此种标记,计算机之间可以处理包含各种信息的文章等.如何定义这些标记,既可以选择国际通用的标记语言,比如HTML,也可以使用像XML这样由相关人士自由决定的标记语言,这就是语言的可扩展性.用XML作为相似度检测格式,就不再需要知道对方内部的资料存储格式,某个系统内部的变更,也不再会涉及和它往来的其他系统.因此,XML成为定义一种互联网上交换数据的标准.XML为大家提供了理想的缓冲,并逐步成为Inter上数据表示和交换的标准.

企业信息化下的XML与数据集成参考属性评定
有关论文范文主题研究: 关于数据库的论文范文资料 大学生适用: 硕士毕业论文、研究生论文
相关参考文献下载数量: 43 写作解决问题: 怎么撰写
毕业论文开题报告: 文献综述、论文总结 职称论文适用: 技师论文、职称评初级
所属大学生专业类别: 怎么撰写 论文题目推荐度: 经典题目

1.XML 与HTML .HTML 作为标记的集合并不能揭示标记中内容的含义,在XML文档中能够清楚地反映数据内容和数据结构之间的关系(如图1所示).XML实际上是一种定义语言,即使用者可以定义无穷无尽的标记来描述文件中的任何数据元素,从而突破了HTML固定标记集合的约束,使文件的内容更丰富更复杂并组成一个完整的信息体系,在WEB上有着很旺盛的生命力.


XML 在使用上,很多地方还离不开HTML 的帮助.只是在HTML 标准中可能不会再增加新的功能,对新功能的支持可能都会放在XML 标准中.

设计XML 的目的不是取代HTML,而是与HTML 合作以扩展网站网页的功能.如传输任意形式的文件、以尽可能合理的方式来排序、筛选、重组、搜寻以及管理信息、使信息呈现出高度的结构化.

目前XML 的最大的不足在于所有的执行细节还是没有完全制订出来,语法格式还有可能再变动.

2.XML主要技术.W3C最近发布处理的一个就是关于Web Services的研究和XML的更新机制.其中关于XML有三个关键要素:Schema(模式)、XSL,可扩展样式语言)和XLL(eXtensible Link Language,可扩展链接语言).

Schema规定了XML文件的逻辑结构,定义了XML文件中的元素,元素的属性以及元素和元素的属性之间的关系,它可以帮助XML的分析程序校验XML文件标记的合法性.

文档类型定义(DTD)和XML Schema都是用来定义XML文档结构的语言.当XML文档与特定的DTD或是XML Schema结合在一起,能够验证XML文档中的数据结构是否符合DTD或是XML Schema中对数据结构定义的要求.

XSL提供了一种叠式页面CSS的功能,使开发者构造出具有表达层次结构的Web页面来,以有别于XML的数据结构.XSL也能和HTML一起构造叠式页面.

XLL是XML的链接语言,它与HTML的链接相似,但功能更强大.XLL支持可扩展的链接和多方向的链接.它打破了HTML只支持超级文本概念下最简单的链接限制,能支持独立于地址的域名、双向链路、环路、多个源的集合链接等.XLL链接可不受文档制约,完全按用户要求来指定和管理.

二、XML 应用

Inter 上的怎么写作器与怎么写作器之间、怎么写作器与浏览器之间有大量的数据需要交换.所有被交换的数据,都要求对数据的内容和表现方式有所说明,用标准语言担当的该重任是再合适不过的了.因此XML是实现数据集成的核心技术.

1.支持数据交换.作为一个建立在现有Inter协议基础上的标准,XML是第一个能在现有Inter基础架构上传输纯数据的国际标准.因此XML一出现,就立即被很多应用领域采用作为数据交换的标准,XML已经成为众多在Intra和Inter上运行的应用程序的数据交换标准.

2.在异构数据库集成中的关键技术作用.由于开发的管理系统时间不同、开发工具不同、数据库不同,各个网络节点所依赖的硬件平台、操作系统平台、网络怎么写作器平台、数据库平台都可能是互不相同的.正是由于这些差异,目前Inter上的数据库系统往往是分布的、异构的,构成了我们常说的异构平台、异构数据库系统,形成一个个“信息孤岛”.

针对各个异构信息系统的特点,采用现代最新技术,对管理系统异构数据库实现集成,以支持对各异构数据库之间灵活的信息交换和共享,如何实现这个目标,已成为当前亟待解决的问题.而 XML技术正是实现网络环境下异构数据库间集成的关键技术.

通过为各商务网站现有的不同数据库系统提供一个XML接口,外界就可以借助XML实现对任何平台上的现有数据库的访问,并将访问结果以XML的形式输出到其他平台,从而实现了异构数据库间的信息交换和共享.

传递数据的理想方式就是利用XML进行.对于传统的数据库系统,存在着异质或异构的数据库,可以用XML来实现这些数据源有效地集成.

3.存储数据.为了使基于XML的业务数据交换成为可能,就必须实现数据库的XML数据存取,并且将XML数据同应用程序集成,XML能把数据存储在文档或是数据库中.

4.支持以文档为中心和以数据为中心的应用.XML能被用于对所交换信息的数据格式和数据结构要求不严格的应用程序之间进行数据交换.这就是以文档为中心(Document-centric)的应用,例如报刊杂志的发行就是如此,其中内容的组成没有固定的结构.这种文档的结构是半结构化的数据结构.与以文档为中心相对应的是以数据为中心(Data-centric).以数据为中心的应用是指处理的XML文档是完整、结构良好并且符合Schemas精确结构定义的文档.

5.定义新的标记语言.XML作为一种原语言,是一种可以定义其他语言的语言.这个特点有利于各个应用领域根据自己的需要定义一整套领域内使用的标准数据表达标签.这对推动各个行业的标准化进程起到了巨大作用.

三、小结

随着企业信息化的逐步深入,企业内部及企业之间存在着大量的异构数据,数据集成问题是企业信息化建设所面临的问题之一.它提供了一个理想的缓冲层,使得异构数据源之间可以保持互相透明,不再需要知道对方的内部存储格式,某个数据源内部的变更,也不会影响其他数据源.基于XML的数据集成问题,已经成为数据库研究领域中一个重要的研究方向.