数据库新技术的发展综述 下载本文

内容发布更新时间 : 2024/6/16 13:30:26星期一 下面是文章的全部内容请认真阅读。

数据库技术的现状

及发展趋势

院系:数学科学学院 学号:20121014401

姓名:徐高扬 班级:统计122

数据库技术的现状与发展趋势

关键词:数据库;面向对象数据库;演绎面向对象数据库;数据仓库;

数据挖掘;发展;主流数据库新技术

1、引言

自从计算机问世以后,就有了处理数据、管理数据的需求,由此,计算机技术新的研究分支数据库技术应运而生。随着计算机应用领域的不断拓展和多媒体技术的发展,数据库已是计算机科学技术中发展最快、应用最广泛的重要分支之一。从20世纪60年代末开始,数据库系统已从第一代层次数据库、网状数据库,第二代的关系数据库系统,发展到第三代以面向对象模型为主要特征的数据库系统。关系数据库理论和技术在70~80年代得到长足的发展和广泛而有效地应用,80年代,关系数据库成为应用的主流,几乎所有新推出的数据库管理系统(DataBaseManagementSystem,DBMS)产品都是关系型的,他在计算机数据管理的发展史上是一个重要的里程碑,这种数据库具有数据结构化、最低冗余度、较高的程序与数据独立性、易于扩充、易于编制应用程序等优点,目前较大的信息系统都是建立在关系数据库系统理论设计之上的。但是,这些数据库系统包括层次数据库、网状数据库和关系数据库,不论其模型和技术上有何差别,却主要是面向和支持商业和事务处理应用领域的数据管理。然而,随着用户应用需求的提高、硬件技术的发展和InternetIntranet提供的丰富多彩的多媒体交流方式,促进了数据库技术与网络通信技术、人工智能技术、面向对象程序设计技术、并行计算技术等相互渗透,互相结合,成为当前数据库技术发展的主要特征,形成了数据库新技术。目前,数据库技术已相当成熟,被广泛应用于各行各业中,成为现代信息技术的重要组成部分,是现代计算机信息系统和计算机应用系统的基础和核心。

2、数据库技术的现状及发展趋势

1980年以前,数据库技术的发展,主要体现在数据库的模型设计上。进入90年代后,计算机领域中其它新兴技术的发展对数据库技术产生了重大影响。数据库技术与网络通信技术、人工智能技术、多媒体技术等相互渗透,相互结合,使数据库技术的新内容层出不穷。数据库的许多概念、应用领域,甚至某些原理都有了重大的发展和变化,形成了数据库领域众多的研究分支和课题,产生了一系列新型数据库。分析目前数据库的应用情况,可以发现:经过多年的积累,企业和部门积累的数据越来越多,许多企业面临着“数据爆炸”可知识缺乏的困境。如何解决海量数据的存储管理、如何挖掘大量数据中包含的信息和知识,已成为目前的急待解决的问题。所以,数据库技术除了核心问题的研究外,市场的需求导致了以下几种数据库的发展及一些研究热点:

2.1.分布式数据库 80年代,研制了许多分布式数据库的原型系统,攻克了分布式数据库中许多理论和技术难点。90年代开始,主要的数据库厂商对集中式数据库管理系统的核心加以改造,逐步加入分布处理功能,向分布式数据库管理系统发展。目前,分布式数据库开始进入实用阶段。现有的分布式数据库技术尚不能解决异构数据和系统的许多问题。虽然已有很多数据库研究单位在进行异构系统集成问题的探索,并且已有一些系统宣称在一定程度上实现了异构系统的互操作,但是异构分布式数据库技术还未成熟。

2.2. 并行数据库

并行数据库系统是在并行机上运行的具有并行处理能力的数据库系统。最近,一些著名的数据库厂商开始在数据库产品中增加并行处理能力,试图在并行计算机系统上运行。他们

2

只是使用并行数据流方法对原有系统加以简单的扩充,既没有使用并行数据操作算法,也没有并行数据查询优化的能力,都不是真正的并行数据库系统。目前,并行数据库的研究工作集中在体系结构、并行算法与查询优化等。

2.3. 主动数据库

主动数据库是相对于传统数据库的被动性而言的。许多实际的应用领域,如计算机集成制造系统、管理信息系统、办公室自动化系统中常常希望数据库系统在紧急情况下能根据数据库的当前状态,主动适时地做出反应,执行某些操作,向用户提供有关信息。传统数据库系统是被动的系统,它只能被动地按照用户给出的明确请求执行相应的数据库操作,很难充分适应这些应用的主动要求,因此在传统数据库基础上,结合人工智能技术和面向对象技术提出了主动数据库。主动数据库的主要目标是提供对紧急情况及时反应的能力,同时提高数据库管理系统的模块化程度。主动数据库通常采用的方法是在传统数据库系统中嵌入!\(即事件—条件—动作)规则,在某一事件发生时引发数据库管理系统去检测数据库当前状态,看是否满足设定的条件,若条件满足,便触发规定动作的执行。

2.4. 知识库

知识数据库系统的功能是如何把由大量的事实、规则、概念组成的知识存储起来,进行管理,并向用户提供方便快速的检索、查询手段。因此,知识数据库可定义为:知识、经验、规则和事实的集合。知识数据库系统应具备对知识的表示方法;对知识系统化的组织管理;知识库的操作;库的查询与检索;知识的获取与学习;知识的编辑;库的管理等功能。知识数据库是人工智能技术与数据库技术的结合。

2.5. 多媒体数据库

随着多媒体技术的发展,多媒体应用逐步深入,多媒体应用涉及大量的多媒体信息,它们包括图形、文本、图像、声音、视频等信息。多媒体信息系统的建立强烈地呼唤着管理多媒体的数据库技术,在这样的背景下,产生了多媒体数据库技术。多媒体数据库应具备的功能要求为:能表示和理解多媒体数据,能刻画、管理和表现各种媒体数据的特性和相互关系;具备物理数据独立性、逻辑数据独立性和媒体数据独立性,媒体类型可扩展;提供更为灵活的模式定义和修改功能,支持模式进化与演变,具备某些长事务处理的能力;提供多媒体访问的多种手段,近似性查询,混合方式访问等。多媒体数据管理系统在多媒体应用中非常重要,它为多媒体应用提供了基本数据支撑。多媒体数据库的研究始于80年代中期,在多年的技术研究和系统开发中,获得了很大的成果。但目前还没有功能完善、技术成熟的多媒体数据库管理系统。

2.6 XML数据库

经过近几年业界同仁的共同努力,XML数据库技术取得了很大的进展,已经有若干种XML数据库产品问世并服务于社会生活的各个方面。但是,XML数据库的事业才刚刚开始,还有很多问题等待着我们去解决。 未来几年,XML数据库技术有可能在下述方面取得进展:异构数据源的集成;底层索引结构; 并发加锁协议。XML模式规范化是一个值得关注的方向。一旦取得突破,将会使我们可以像在关系库中那样方便地设计XML数据库的结构,消除数据的冗余和不一致现象。目前,这一领域已经成为学术界关注的热点。但是,完整的、为业界所公认的理论体系尚未建立。

2.7. 模糊数据库

模糊数据库是在一般数据库系统中引入”模糊”概念,进而对模糊数据、数据间的模糊关系与模糊约束实施模糊数据操作和查询的数据库系统。模糊数据库系统中的研究内容涉及模糊数据库的形式定义、模糊数据库的数据模型、模物数据库语言设计、模糊数据库设计方法及模糊数据库管理系统的实现。近年来,也有许多工作是对关系之外的其它效据模型进行模糊扩展,如模糊E-R(实体—关系)、模糊多媒体数据库等。当前,科研人员在模糊数据

3

库的研究、开发与应用系统的建立方面都做了不少工作,但是,摆在人们面前的问题是如何进一步研究与开发大型适用的模糊数据库商业性系统。

2.8. 数据仓库和联机分析处理(OLAP) 为了有效地支持决策分析,近几年人们提出了数据仓库的概念。数据仓库就是从不同的源数据中抽取数据,将其整理转换成新的存储格式,为决策目的将数据聚合在一种特殊的格式中,这种支持管理决策过程的、面向主题的、集成的、稳定的、不同时的数据聚合称为数据仓库(Data Warehouse)。数据仓库中数据的组织方式有虚拟存储、基于关系表的存储和多维数据库存储3种存储方式。整个仓库系统可分为数据源、数据存储与管理、分析处理3个功能部分。由于数据仓库是集成信息的存储中心,由数据存储管理器收集整理源信息的数据成为仓库系统使用的数据格式和数据模型,并自动监测数据源中数据的变化,反映到存储中心,对数据仓库进行更新维护。而联机分析处理(OLAP)是数据仓库上的最重要应用,是决策分析的关键。数据仓库是为了有效地支持决策分析,而从操作数据库中提取并经过加工后所得到的数据集合,是一个特殊的数据库。数据仓库也需要由一个数据库管理系统支持,它有关系型和多维型两类数据库管理系统。

2.9. 数据挖掘

数据挖掘(Data Mining)又称数据开采,就是从大量的、不全的、有噪声的、模糊的、随机的数据中提取隐含在其中的人们事先不知道的、但又是潜在有用的信息和知识的过程,提取的知识表现为概念(Concepts)、规则(Rules)、规律模式约束等形式。在人工智能领域又习惯称其为数据库中知识发现(KDD,即Knowledge Discovery in Database)。其本质类似于人脑对客观世界的反映,从客观的事实中抽象成主观的知识,然后指导客观实践,数据挖掘就是从客体的数据库中概括抽象提取规律性的东西以供决策支持系统的建立和使用。

数据开采以数据库中的数据为数据源,整个过程可分为数据集成、数据选择、预处理、数据开采、结果表达和解析等过程。开采的范围可针对多媒体数据库、数据仓库、Web数据库、主动型数据库、时间型及概率型数据库等。采用的技术有人工神经网络、决策树、遗传算法、规则归纳、分类、聚类、减维、模式识别、不确定性处理等。发现的知识有广义型知识、特征型知识、差异型知识、关联型知识、预测型知识、偏离型知识。目前数据采掘的研究和应用所面临的主要挑战是:对大型数据库的数据采掘方法;对非结构和无结构数据库中的数据采掘操作;用户参与的交互采掘;对采掘得到的知识的证实技术;知识的解释和表达机制;由于数据库的更新,原有知识的修正;采掘所得知识库的建立、使用和维护。

3

、数据库的未来

3.1. 微型数据库

在下一个10 年中,将有亿万个微型信息设备连接到Web上,每个微型信息设备都可能配置一个数据库,我们称其为微型数据库。微型数据库系统在两个方面与传统的数据库不同。一是微型数据库必须具有自调节和自适应能力。这就需要全部取消需要用户设置的系统参数,使它在没有程序员的情况下,具有自动调节的能力。二是随时保持与Web的连接,以快速、准确地获取Web上的大量信息。

3.2. 未来的联邦数据库系统 目前,许多大型企业为了管理分布在大量分散系统中的资源,需要建立大规模的联邦数据库系统。在未来的10 年中,Internet上将有几亿个Web 客户端访问几百万个数据库。Web本身也可看成是一个大规模联邦系统。于是,人们面临着一个重要的研究问题,即如何集成分布在数百万个数据库中的信息,建立起有数百万个数据库构成的大规模联邦数据库系统。为此,人们需要研究新的大规模联邦数据库的查询优化方法,需要研究大规模联邦数据库查询的语义和执行等问题。

4

3.3. 未来数据库的体系结构

为了支持越来越多的数据库应用,各种各样的计算机机群并行计算系统,已经被提到议事日程上来。如共享主存储器计算机机群系统、共享磁盘计算机机群系统、无共享硬件资源的计算机机群系统等。计算机机群系统具有很高的I/O 并行性和很高的性价比,是支持并行数据库系统和大规模数据库应用的重要并行计算环境。目前,基于无共享硬件资源计算机机群系统的并行数据库系统已取得了很大进展。但基于由大量计算机构成的大规模计算机机群系统的并行数据库的研究还进展甚小,需花大力气。此外,程序逻辑和数据统一管理、结构化和半结构化数据的集成,也是今后数据库研究的方向。

3.4 演绎面向对象数据库

演绎面向对象数据库是未来数据库系统的基本特征,如何把面向对象与演绎的概念有机集合并应用到数据库,主要牵涉到数据模型。目前,实现演绎面向对象数据模型的方法有:

1、面向对象语言与逻辑语言并用。通常采用面向对象功能语言定义对象结构,用逻辑语言说明对象的服务(即操作)。该方法是一种快速有效的方法。

2、扩充逻辑程序设计系统,引入方法、类型及对象等概念,使用户同时就有面向对象和演绎的概念。该方法美中不足的是实现效率较低。

3、面向对象的逻辑,把面向对象的特点与逻辑语言充分结合。该方法使得对象与逻辑结合最紧密。

参考文献

[1] 聂哲.数据库发展新技术[M].

[2] 吴绪略,曹强. 浅述数据库的现状与未来[M].山东电子 [3] 郭 晔.数据库新技术浅析[M].现代电子技术

[4] 苏 啸.新一代数据库技术应用和前景[M].萍乡高等专科学校学报

[5] 王珊 ,萨师煊 ,数据库系统概论 高等教育出版社 第四版

5