内容发布更新时间 : 2024/12/26 2:13:11星期一 下面是文章的全部内容请认真阅读。
第5章 空间数据组织与管理
空间信息技术包括空间数据获取、空间数据处理和空间数据应用技术三个部分,而空间数据管理必将成为上述三种技术的基础和核心。在数据获取过程中,空间数据库用于存贮和管理空间信息及非空间信息;在数据处理系统中,它既是资料的提供者,也可以是处理结果的归宿处;在检索和输出过程中,它是形成绘图文件或各类地理数据的数据源。然而,空间数据以其惊人的数据量及其空间上的复杂性,使得空间数据的组织与管理给传统数据库系统带来巨大挑战。本章主要介绍空间数据库在数据管理组织方式、空间索引、空间查询语言等方面的技术和特点。
5.1空间数据库概述
通用数据库作为文件管理的高级阶段,是建立在结构化数据基础上的。而空间数据具有其自身的特殊性,这就使得通用数据库管理系统在管理空间数据时表现出较多不相适应的地方,从而空间数据库应运而生。
5.1.1 数据库基础
数据库是在应用需求推动下、在计算机软硬件下基础上,经历了人工管理阶段和文件管理阶段之后发展而来的。
数据是描述事物的符号记录,可以是数字形式,也可以是文字、图形、图像、声音、语言等多种表现形式。人们收集并抽取出应用所需的大量数据后,将其保存起来以供进一步加工处理,抽取有用信息。随着科学技术飞速发展,人们的视野越来越广,对数据的需求量急剧增加。过去人们把数据存放在文件柜里,现在借助计算机和数据库技术就能保存和管理大量复杂的数据。数据库是长期储存在计算机内的、有组织的、可共享的数据集合。数据库中的数据按一定的数据模型组织、描
述和储存,具有较小的冗余度、较高的数据独
文件系统 立性和易扩展性,并可为各种用户共享。
目前,数据库领域中最常用的数据模型有四种:层次模型(Hierarchical Model)、网状模型(Network Model)、关系模型(Relational
网状数据库管理系统 层次数据库管理系统 Model)和面向对象模型(Object Oriented Model)。其中层次模型和网状模型统称为非关系模型。非关系模型的数据库系统在20世
面向对象数据库管理系统 关系数据库管理系统 纪70年代至80年代非常流行,在数据库系统
产品中占据了主导地位,现在已逐渐被关系模型的数据库系统取代。20世纪80年代以来,面向对象的方法和技术在计算机各个领域,包
对象关系数据库管理系统 括程序设计语言、软件工程、信息系统设计、
计算机硬件设计等各方面都产生了深远的影. 图5.1 数据模型演化
响,也促进数据库中面向对象数据模型的研究
和发展。数据库数据模型发展如图5.1所示。
5.1.2空间数据库
地理信息系统的数据库(简称空间数据库或地理数据库)是某一区域内关于一定地理要素特征的数据集合;是地理信息系统在计算机物理存储介质存储的与应用相关的地理空间数据的总和,一
般是以一系列特定结构的文件的形式组织在存储介质之上的。换句话说,空间数据库是地理信息系统中用于存储和管理空间数据的场所。空间数据库系统在整个地理信息系统中占有极其重要的地位,是地理信息系统发挥功能和作用的关键,主要表现在:用户在决策过程中,通过访问空间数据库获得空间数据,在决策过程完成后再将决策结果存储到空间数据库中。空间数据库的布局和存储能力对地理信息系统功能的实现和工作的效率影响极大。如果在组织的所有工作地点都能很容易地存取各种数据,则能使地理信息系统快速响应组织内决策人员的要求;反之,就会妨碍地理信息系统的快速反应。如果获取空间数据很困难,就不可能进行及时的决策,或者只能根据不完全的空间数据进行决策,其结果都可能导致地理信息系统不能得出正确的决策结果,可见空间数据库在地理信息系统的意义是不言而喻的。
空间数据库与一般数据库相比,具有以下特点:
⑴ 数据量特别大,地理信息系统是一个复杂的综合体,要用数据来描述各种地理要素,尤其是要素的空间位置和空间关系等,其数据量往往很大;
⑵ 不仅有地理要素的属性数据(与一般数据库中的数据性质相似),还有大量的空间数据,即描述地理要素空间分布位置的数据,并且这两种数据之间具有不可分割的联系;
⑶ 数据应用广泛,例如地理研究、环境保护、土地利用和规划、资源开发、生态环境、市政管理、道路建设等。
空间数据库的组成,从类型上分有栅格数据库和矢量数据库两类,其中栅格数据包括航空遥感影像数据和DEM数据;矢量数据则包括各种空间实体数据(图形和属性数据)。如图5.2所示。
空间数据库
数字影 空间对象 高程 模型 像
图形 属性
图5.2 空间数据库组成
5.2 空间数据管理
5.2.1 空间数据的基本特征
1. 空间特征
每个空间对象都具有空间坐标,即空间对象隐含了空间分布特征。这意味着在空间数据组织方
面,要考虑它的空间分布特征。除了通用性数据库管理系统或者文件系统关键字的索引和辅关键字索引外,一般都需要建立空间索引。 2. 非结构化特征
在当前关系数据库管理系统中,数据记录中每条记录都是定长的(结构化),数据项不能再分,不允许嵌套记录。而空间数据不能满足这种定长(结构化)要求。若将一条记录表达一个空间对象,其数据项可能是变长的,例如一条弧段的坐标,其长度是不可限定的,可能是两对坐标,也可能是成百上千对坐标;另一方面,一个对象可能包含另外的一个或多个对象,例如一个多边形,可能含有多条弧段。若一条记录表示一条弧段,则该多边形的记录就可能嵌套多条弧段的记录,故它不满足关系数据模型的结构化要求,从而使得空间图形数据难以直接采用通用的关系数据管理系统。 3. 空间关系特征
空间数据除了空间坐标隐含了空间分布关系外,还通过拓扑数据结构表达了多种空间关系。这种拓扑数据结构一方面虽然方便了空间数据查询和空间分析,但另一方面也给空间数据的一致性和
完整性维护增加了复杂度。特别是有些几何对象,没有直接记录空间坐标的信息,如拓扑的面状实体仅记录组成它的弧段标识,因而进行查找、显示和分析操作时都需要操纵和检索多个数据文件。 4. 多尺度与多态性
不同观察比例尺具有不同的尺度和精度,同一地物在不同情况下也会有形态差异。如,城市在空间上占据一定的范围,在较大比例尺中可以作为面状空间实体对象,而在较小比例尺中,则是作为点状空间对象来处理的。 5. 分类编码特征
一般情况下,每个空间对象都有一个分类编码,这种分类编码往往是按照国家标准,或者行业标准、地区标准来应用的,每一种地物类型在某个GIS中的属性项个数是相同的。因而在许多情况下,一种地物类型对应一个属性数据表文件。当然,如果几种地物类型的属性项相同,也可以多种地物类型共用一个属性数据表文件。 6. 海量数据特征
GIS中数据量非常庞大,远大于一般的通用数据库,可称之为海量数据。一个城市地理信息系统数据量可达几十GB,如果考虑影像数据的存储,可能达到几百个GB。这样的数据量在城市管理的其他数据库中是很少见的。由此,需要在二维空间上划分块或图幅,在垂直方向上划分层来进行组织。
由于空间数据存在非结构化特征、空间关系特征,使得通用数据库管理系统在管理空间数据时,面临较多问题。
⑴ GIS需要一些复杂的图形功能,一般的DBMS不能支持。
⑵ DBMS一般都难以实现对空间数据的关联、连通、包含、叠加等基本操作。 ⑶ 地理信息表达复杂,表达单个地理实体需多个文件、多条记录,或许包括大地网、特征坐标、拓扑关系、空间特征量测值、属性数据的关键字以及非空间专题属性等,一般的DBMS也难以支持。
⑷ 具有高度内部联系的GIS数据记录需要更复杂的安全性维护系统,为了保证空间数据库的完整性,保护数据文件的完整性,保护系列必须与空间数据一起存储,否则一条记录的改变就会使其他数据文件产生错误。这是一般的DBMS都难以保证的。
⑸ GIS中空间数据记录是变长的(存储的坐标点的数目随空间对象的变化而变化),而一般数据库都只允许把记录的长度设定为固定长度。另外,在存储和维护空间数据拓扑关系方面,DBMS也存在着严重的缺陷。因而,一般要对通用的DBMS增加附加的软件功能。
5.2.2 矢量数据的管理
对于矢量数据,其位置数据和属性数据通常是分开组织的。这一特点使得在管理时需要同时顾及空间位置数据和属性数据,其中属性数据很适合用关系数据库来管理,空间位置数据则不太适合用关系数据库管理。空间数据管理方式与数据库发展是密不可分的,按照发展的过程,对矢量数据的管理有文件/关系数据库混合管理、全关系管理、对象关系数据库管理等方式。
1. 文件-关系数据库混合管理
由于空间数据的非结构化持征,早期关系型数据库难以满足空间数据管理的要求。因此,传统GIS软件采用文件与关系数据库混合方式管理空间数据,比较典型的是ArcInfo,有的系统也采用纯文件方式管理空间数据,如MapInfo;即用文件系统管理几何图形数据,用商用关系型数据库管理属性数据,两者之间通过目标标识或内部连接码进行连接,如图5.3所示。
在这一管理模式中,除通过OID(object,ID)连接之外,图形数据和属性数据几乎是完全独立组织、管理与检索的。其中图形系统采用高级语言(如C语言,Delphi等)编程管理,可以直接操纵数据文件,因而图形用户界面与图形文件处理是一体的,两者中间没有逻辑裂缝。但由于早期的数据库系统不提供高级语言的接口,只能采用数据库操纵语言,因此图形用户界面和属性用户界面是分开的。在GIS工作过程中,通常需要同时
图形用户界面 属性用户界面 启动图形文件系统和关系数据库系统,甚至两个系统来回切换,使用起来很不方便。如图5.4所示。 图形处理 DBMS
图形文件库 属性数据库 图5.4 图形数据和属性数据的连接方式