第三节 数据库简介

数据库技术是管理信息系统的核心技术。从信息系统的概念中,我们知道:计算机信息系统是以提供信息服务为目的人机交互的应用系统,管理信息系统从狭义上来说,是信息系统的用途分类的一种,无论何种信息系统,其最终目的都是提供信息服务。

信息系统如何提供信息服务呢?用最简单或直白的说法就是,用户向系统输入原始数据,操作命令并获得结果信息。在这个过程中,由于计算机是一种基于二进制运算的信息处理机器,任何需要由计算机进行处理的信息,都必须进行一定程度的形式化,并表示成二进制编码的形式:数据。 无论何种信息系统,都离不开对数据的管理。

在20世纪60年代中期以前,数据主要是用文件系统进行管理,但这种管理方式受到文件系统局限性的限制,当时的信息系统主要为单项应用服务,其主要功能也只是代替人做一些事务性操作。因此,自60年代中后期开始,以数据的集中管理和共享为特征的数据库系统逐步取代了文件系统,成为数据管理的主要形式。因而,为一个单位或更大范围的多项应用服务的综合信息系统出现了,其功能也从单纯的事务处理扩大到规划,分析,预测和决策等领域,这是信息系统的重要发展。就当前的信息技术、信息系统架构而言,数据库技术是管理信息系统的核心技术。

一、关系数据库概述

数据库技术的萌芽可以追溯到20世纪60年代中期。60年代计算机在管理中的应用更加广泛,数据量急剧增大,对数据共享的要求越来越迫切; 同时, 大容量磁盘已经出现, 联机实时处理业务增多;硬件价格大幅下降,软件价格在系统中的比重日益上升,编制和维护应用软件所需成本相对增加。在这种情况下, 为了解决多用户、多应用共享数据的需求,以便数据为尽可能多的应用程序服务,出现了数据库系统,数据库是以一定的组织方式存储在一起的相关数据的集合,它能以最佳的方式,最少的数据冗余为多种应用服务,程序与数据具有较高的独立性。

60年代未到70年代初数据库技术日益成熟,具有了坚实的理论基础。1970年,IBM公司San Jose研究实验室研究员E.F.Codd发表了题为"大型共享数据库数据的关系模型"论文,提出了数据库的关系模型,开创了关系方法和关系数据研究,为关系数据库的发展奠定了理论基础。1981年IBM公司San Jose实验室宣布具有System R 全部特性的数据库产品SQL/DS问世。与此同时,加州大学伯克利分校研制成功关系数据库实验系统INGRES,接着又实现了INGRES商务系统,使关系方法从实验室走向社会。

20世纪80年代以来,几乎所有新开发的数据库系统都是关系型的。微型机平台的关系数据库管理系统也越来越多,功能越来越强,其应用已经遍及各个领域。

其特点是:

(1)面向全组织的复杂数据结构。数据库中的数据结构不仅描述了数据自身,而且描述了整个组织数据之间的联系,实现了整个组织数据的结构化。

(2)数据冗余度小,易于扩充。由于数据库从组织的整体来看待数据,数据不再是面向某一特定的应用,而是面向整个系统,减少了数据冗余和数据之间不一致现象。在数据库系统下,可以根据不同的应用需求选择相应的数据加以使用,系统易于扩充。

(3)数据与程序独立。数据库系统提供了数据的存储结构与逻辑结构之间的映射功能及总体逻辑结构与局部逻辑结构之间的映射功能,从而使得当数据的存储结构改变时;逻辑结构保持不变,或者当总体逻辑结构改变时,局部逻辑结构可以保持不变,从而实现了数据的物理独立性和逻辑独立性,把数据的定义和描述与应用程序完全分离开。

(4)统一的数据控制功能。数据库系统提供了数据的安全性控制 (Security和完整性控制 (Integrity),允许多个用户同时使用数据库资源。数据库的上述特点, 使得信息系统的研制从围绕加工数据的以程序为中心转移到围绕共享的数据库来进行,实现了数据的集中管理,提高了数据的利用率和一致性,从而能更好地为决策服务。因此,数据库技术在信息系统应用中正起着越来越重要的作用。

数据库系统由计算机系统、数据、数据库管理系统和有关人员组成的具有高度组织的总体。数据库系统的主要组成部分有:

1.计算机系统。计算机系统指用于数据库管理的计算机硬软件系统。数据库需要大容量的主存以存放和运行操作系统、数据库管理系统程序、应用程序以及数据库、目录、系统缓冲区等,辅存方面,则需要大容量的直接存取设备。此外,系统应具有较高的网络功能。

2.数据库。数据库既有存放实际数据的物理数据库,也有存放数据逻辑结构的描述数据库。

3.数据库管理系统 (DBMS)。数据库管理系统是一组对数据库进行管理的软件, 通常包括数据定义语言及其编译程序数据操纵语言及其编译程序以及数据管理例行程序。

二、数据库系统市场现状

数据库系统市场主要有三家公司的主流商用数据库,它们分别是微软公司的SQL Server、IBM公司的DB2和甲骨文公司的Oracle。此外还有以MySQL 代表的开源数据库。

SQL Server只能在Windows 上运行,安全性和伸缩性是非常有限的。

Oracle能在所有主流平台上运行(包括 Windows)。完全支持所有的工业标准。采用完全开放策略。可以使客户选择最适合的解决方案。如果Windows NT不能满足需要, 用户可以把数据库移到UNIX中。

DB2能在所有主流平台上运行(包括Windows)。最适于海量数据。DB2在企业级的应用最为广泛,在全球的500家最大的企业中,几乎85%以上用DB2数据库服务器。

Mysql是开源软件、支持多种硬件平台,比较适合UNIX操作系统。速度很快,但是功能较弱,常常用做网站后台。2009年5月oracle公司收购了Mysql。

根据2007的调查统计,数据库市场仍然以 Oracle、IBM 和微软三大商用数据库厂商为主导,但随着 MySQL 等开源厂商的加入,其他数据库厂商的既有市场份额正在 Oracle、IBM、微软三家的技术优势和开源数据库的成本优势双重挤压下进一步萎缩。从市场份额看,根据 IDC 公布的数据库市场份额,Oracle 排名第一,市场总量份额比紧随其后的 IBM 和微软的总和还要高,这种情况已经持续数年;从使用情况看,76.4%的公司使用了 SQL Server,该比例超过 Oracle、IBM 和My SQL。

从数据应用的热点领域——商务智能角度看,高端领域仍以IBM(DB2 和 Informix)、Oracle、Teradata和微软为主,MySQL 等一批中小厂商也开始逐步进入数据分析领域;从数据库运行的操作系统平台看,Linux异军突起,虽然总量上相对Unix和Windows而言还有不小差距,但增幅很大。

三、数据库产品的选择

在数据库应用上,随着各大数据库厂商的产品线越拉越长,客户可以根据需要穿插选择每个厂家技术、成本、服务优势相对明显的产品来集成,而不是单一的选择某家产品的全套数据库产品套件;另外,开源社区贡献的很多成熟产品也为客户提供了更多选择。

随着企业信息化的普及和用户数据库应用水平的提高, 很多时候是客户自己根据项目特点、规模理智的选择最“有性价比”的产品。尤其在近两年 SOA 概念的宣传下,客户认识到数据库更多只是管理信息资源的一种技术手段而非业务目标, 一味跟随厂商被动升级自己的信息系统,不如根据自己业务目标的需要采取更主动的姿态,自主选择产品。