1、1.1.1 1.1.1 数据的概念数据的概念1.1.2 1.1.2 信息的概念信息的概念1.1.3 1.1.3 数据与信息的关系数据与信息的关系1.1.4 1.1.4 数据管理与处理数据管理与处理1.1.5 1.1.5 数据管理的三个阶段数据管理的三个阶段v数据是数据库中存贮的基本对象数据是数据库中存贮的基本对象。它包括:数字、文字、符号、图形、图像、声音、视频等。所以数据是描述事数据是描述事物的符号记录物的符号记录。v数据数据不等同不等同于数字于数字,数字只是一种最简单的数据,是对数据的一种传统和狭义的理解。v数据有多种表现形式数据有多种表现形式,但都可以经过数字化后存入计算机。计算机的存贮
2、介质和处理过程中的数据是以二进制二进制的形式存在的。v能够输入到计算机中,可以供计算机处理的各种符号、能够输入到计算机中,可以供计算机处理的各种符号、图形、声音和图像等图形、声音和图像等。什么是信息?信息的概念:信息的概念:v信息信息是关于现实世界事物的存在状态存在状态或运动方式运动方式的反映。v信息信息是经过处理的,能够反映现实世界状态状态及物理特性物理特性的数据。v信息信息是一种被加工为特定形式的数据。v信息信息是当前和将来的决策者进行判断和决策的依据。信息的特点:信息的特点:v信息源于物质和能量v信息可以被感知v信息可以存储、加工、传递、处理和再生数据与信息的关系?v数据是信息的符号表示
3、,数据是信息的载体。v信息是数据的内涵,是对数据的语义解释。v很多专业和领域所从事的工作可以概括为一个过程,即。v数据处理是将数据转换成信息的过程:v数据是原料,是输入,而信息是产出,是输出结果。“信息处理”应该是为了产生信息而处理数据的过程。数据数据处理信息数据处理与管理v数据处理:数据处理:是将数据转换成信息的过程。它包括对数据的收集、存储、加工和传播等一系列活动。其目的是从大量的原始数据中抽取和推导出有价值的信息,作为决策的依据。v数据管理:数据管理:对数据的组织、分类、编码、存储、检索和维护。数据处理的中心问题是数据管理。随着计算机硬件和软硬件和软件件的发展,数据管理经历了三个发展阶段
4、:v人工管理阶段,人工管理阶段,5050年代中期以前;年代中期以前;v文件系统阶段,文件系统阶段,5050年代后期至年代后期至6060年代中期;年代中期;v数据库系统阶段,数据库系统阶段,6060年代后期开始。年代后期开始。人工管理阶段人工管理阶段 应用背景(应用背景(5050年代中期以前年代中期以前)n这一阶段计算机主要用于科学计算。n硬件中的外存只有卡片、纸带、磁带,没有磁盘等直接存取设备。n软件只有汇编语言,没有操作系统和管理数据的软件。n数据处理的方式基本上是批处理。人工管理阶段人工管理阶段 四个特点:四个特点:1.1.数据不保存数据不保存:因为当时计算机主要用于科学计算,对于数据保存
5、的需求尚不迫切。2.2.没有管理数据的软件系统没有管理数据的软件系统:应用程序不仅要考虑数据的逻辑结构,还要设计其存储结构、存取方法和输入输出方式3.3.数据不共享数据不共享:数据是面向程序的,一组数据只能对应一个程序。多个应用程序涉及某些相同的数据时,也必须各自定义,因此程序之间有大量的冗余数据程序之间有大量的冗余数据。4.4.数据不具有独立性数据不具有独立性:程序依赖于数据,如果数据的类型、格式、或输入输出方式等逻辑结构或物理结构发生变化,必须对应用程序做出相应的修改。人工管理阶段人工管理阶段 应用程序与数据之间的关系:应用程序与数据之间的关系:应用程序应用程序1数据集数据集1应用程序应用
6、程序2数据集数据集2数据集数据集3应用程序应用程序3 人工管理阶段人工管理阶段文件系统阶段文件系统阶段n这一阶段,计算机硬件、软件都有了很大的发展:n硬件方面,有了磁盘磁盘、磁鼓磁鼓等直接存储设备。n软件方面,出现了高级语言高级语言和操作系统操作系统。操作系统中有了专门管理数据的软件,一般称为文件管理系统文件管理系统。n处理方式有批处理,也有联机处理。n计算机不仅用于科学计算科学计算,还大量用于信息管理信息管理。因而大量的数据存储、检索和维护成为紧迫的需求。应用背景(应用背景(50年代后期至年代后期至60年代中期年代中期)文件系统阶段文件系统阶段1.数据以文件形式可以长期保存数据以文件形式可以
7、长期保存:用户可随时对文件进行查询、修改和增删等处理。2.数据文件由记录组成(记录由数据组成)数据文件由记录组成(记录由数据组成):数据的存取以记录为单位。按文件名访问,按记录存取。数据的逻辑结构由使用数据的应用程序掌握。.程序与数据间有一定独立性程序与数据间有一定独立性:由专门的软件即文件系统进行数据管理,应用程序通过文件系统提供的存取方法对数据进行使用和维护,数据的物理结构(存储方式)由文件系统控制,数据存储结构发生变化不会影响应用程序的运行。.文件形式多样化文件形式多样化:由于有了直接存取的存储设备,也就有了索引文件、链接文件和直接存取文件等文件形式。文件系统阶段文件系统阶段数据文件n应
8、用程序1应用程序2应用程序n数据文件1数据文件2 文件系统阶段文件系统阶段文件系统阶段文件系统阶段 与人工管理阶段相比,文件系统阶段对数据的管理有了很大的进步,但一些根本性问题仍没有彻底解决,主要表现在三个方面:n数据独立性低数据独立性低:数据和程序相互依赖,一旦改变数据的逻辑结构,必须修改相应的应用程序。而应用程序发生变化,如改用另一种程序设计语言来编写程序,也需修改数据结构。n数据冗余度大数据冗余度大:各数据文件之间没有有机的联系,一个文件基本上对应于一个应用程序,数据不能共享。n数据一致性差数据一致性差:由于相同数据的重复存储、各自管理,在进行更新操作时,容易造成数据的不一致性。数据库系
9、统阶段数据库系统阶段n上世纪60年代后期,计算机应用于管理计算机应用于管理的规模更加庞大,数据量急剧增加;n硬件方面出现了大容量磁盘大容量磁盘,使计算机联机存取大量数据成为可能;n硬件价格下降,而软件价格上升,使开发和维护系统软件的成开发和维护系统软件的成本增加本增加。n文件系统的数据管理方法已无法满足开发应用系统的需要。n为解决多用户、多个应用程序共享数据的需求,出现了统一管理数据的专门软件系统,即数据库管理系统数据库管理系统。数据库系统阶段数据库系统阶段1、整体数据结构化整体数据结构化n人工管理阶段,数据没有结构;n文件系统阶段,数据文件是等长同格式的记录的集合,记录内部有结构,记录之间无
10、联系;n数据库系统实现整体数据的结构化整体数据的结构化,不但记录内部结构化,而且记录之间建立了关联。数据库系统阶段数据库系统阶段2 2、数据共享性高、冗余少、易扩充、数据共享性高、冗余少、易扩充:n数据库系统从整体角度看待和描述数据,数据不再面向某个应用而是面向整个系统,因此,数据可以被多个用户、多个应用共享使用。n共享可以大大减少数据冗余,节约存储空间。n共享还可以避免数据的不一致性和不相容性。n不同的应用系统可以取整体数据的各种子集,当应用需求改变或增加时,只要重新选取不同子集或加上一部分数据便可以满足新的需求。所以说数据库系统弹性大,易于扩充。数据库系统阶段数据库系统阶段3 3、数据具有
11、很高的独立性:、数据具有很高的独立性:n数据的独立性是指用户的应用程序与数据库中数据是相互独立的,即当数据的物理结构和逻辑结构发生变化时,不影响应用程序对数据的使用。n数据的独立性是由DBMS的二级映象功能来保证的(以后介绍)。n数据与程序的独立,把数据的定义从程序中分离出去,加上数据的存取由DBMS负责,从而简化了应用程序的编制,大大减少了应用程序的维护与修改的工作量。数据库系统阶段数据库系统阶段4 4、具有高度的数据控制能力、具有高度的数据控制能力:n数据由DBMS统一管理和控制,保证了数据的安全性安全性和完完整性整性;nDBMS对访问数据库的用户进行身份及其操作的合法性检查,保证了数据库
12、中数据的安全性;nDBMS自动检查数据的一致性、相容性,保证数据应符合完整性约束条件;nDBMS提供并发控制手段,能有效控制多个用户程序同时对数据库数据的操作。保证共享及并发操作。nDBMS具有数据库恢复功能,当数据库遭到破坏时DBMS能自动使数据库从错误状态恢复到正确状态。数据库系统阶段数据库系统阶段应用程序应用程序1应用程序应用程序2应用程序应用程序n数数 据据 库管库管理系理系统统 数据库数据库数据库系统阶段数据库系统阶段数据管理三阶段小结数据管理三阶段小结应用程序1数据集1应用程序2数据集2应用程序n数据集n人工管理阶段人工管理阶段应用程序1应用程序2应用程序n数 据 库管理系统数据库
13、数据库系统阶段数据库系统阶段三个阶段应用程序与数据的关系图三个阶段应用程序与数据的关系图应用程序1数据文件1应用程序2数据文件2存取方法应用程序n数据文件n文件系统阶段文件系统阶段人工管理人工管理文件系统文件系统DataBase数据库系统数据库系统1)数据不保存在机器)数据不保存在机器中;中;1)数据可以长期保存)数据可以长期保存在磁盘上;在磁盘上;1)数据结构化;)数据结构化;2)没有管理数据的软)没有管理数据的软件;件;2)文件系统管理数据;)文件系统管理数据;2)数据由)数据由DBMS统一统一控制。控制。3)数据无共享;)数据无共享;3)数据共享性差,冗)数据共享性差,冗余大;余大;3)
14、高共享,低冗余;)高共享,低冗余;4)数据不具有独立性。)数据不具有独立性。4)数据独立性差。)数据独立性差。4)数据独立性高;)数据独立性高;数据管理三阶段小结数据管理三阶段小结三个阶段应用程序与数据管理的工作任务划分示意图三个阶段应用程序与数据管理的工作任务划分示意图数据的物理结构数据的物理结构数据的逻辑结构数据的逻辑结构数据维护(增、数据维护(增、删、改及重组等)删、改及重组等)数据的存取数据的存取及控制及控制数据的应用数据的应用文件系统文件系统数数据据库库管管理理系系统统文件文件系统系统阶段阶段的应的应用程用程序序数据库系统阶数据库系统阶段的应用程序段的应用程序人工人工管理管理阶段阶段
15、的应的应用程用程序序人工管理阶段人工管理阶段文件系统阶段文件系统阶段数据库系统阶段数据库系统阶段背景应用背景科学计算科学计算、管理大规模管理硬件背景无直接存取存储设备磁盘、磁鼓大容量磁备盘软件背景没有操作系统有文件系统有数据库管理系统处理方式批处理联机实时处理、批处理联机实时处理、分布处理、批处理特点数据的管理者用户(程序员)文件系统数据库管理系统数据面向的对象某一应用程序现实世界数据的共享程度无共享,冗余度极大共享性差,冗余度大共享性高,冗余度小数据的独立性不独立,完全依赖于程序独立性差具有高度的物理独立性和一定的逻辑独立性数据的结构化无结构记录内有结构,整体无结构整体结构化,用数据模型描述数据控制能力应用程序自己控制应用程序自己控制由数据库管理系统提供数据安全性、完整性、并发控制和恢复能力数据管理三阶段小结数据管理三阶段小结数据管理三个阶段的比较数据管理三个阶段的比较