交通运输信息管理课件.ppt

上传人(卖家):三亚风情 文档编号:3356298 上传时间:2022-08-23 格式:PPT 页数:88 大小:1.30MB
下载 相关 举报
交通运输信息管理课件.ppt_第1页
第1页 / 共88页
交通运输信息管理课件.ppt_第2页
第2页 / 共88页
交通运输信息管理课件.ppt_第3页
第3页 / 共88页
交通运输信息管理课件.ppt_第4页
第4页 / 共88页
交通运输信息管理课件.ppt_第5页
第5页 / 共88页
点击查看更多>>
资源描述

1、交交通通工工程程学学院院崔崔书书堂堂主主讲讲第二章信息系统第二章信息系统数据库数据库 2.1 2.1 数据库系统基础知识数据库系统基础知识 2.2 2.2 信息系统中的关系数据库信息系统中的关系数据库2.3 运输信息系统中的数据仓库运输信息系统中的数据仓库 2.4 数据库设计数据库设计交通运输信息管理交通运输信息管理 2.1 数据库系统基础知识 数据库是关于数据管理的技术,是计算机科数据库是关于数据管理的技术,是计算机科学的重要分文。随着数据库技术的成熟相信息应学的重要分文。随着数据库技术的成熟相信息应用的普及,人类积累的信息量正在迅速增长,数用的普及,人类积累的信息量正在迅速增长,数据库已经

2、成为企业存储信息、管理信息的重要技据库已经成为企业存储信息、管理信息的重要技术手段,成为企业管理的基本组成部分。术手段,成为企业管理的基本组成部分。1 1什么是数据库什么是数据库 数据库就是利用计算机存储和管理数据所建立的数据集合,数据库就是利用计算机存储和管理数据所建立的数据集合,是由一个互相关联的数据集合和一组用以访问这些数据的程序是由一个互相关联的数据集合和一组用以访问这些数据的程序组成。它是数据库系统的重要组成部分。组成。它是数据库系统的重要组成部分。数据库管理的基本目标是提供一个方便地、有效地存取和数据库管理的基本目标是提供一个方便地、有效地存取和管理大量数据信息的环境。管理大量数据

3、信息的环境。一、一、数据库的基本概念数据库的基本概念数据库的核心是数据管理,数据库的核心是数据管理,数据管理数据管理是指对各种形式的数据进行收集、分是指对各种形式的数据进行收集、分类、组织、编码、存储、检索和维护等一系列活动的总和。其目的:类、组织、编码、存储、检索和维护等一系列活动的总和。其目的:1 1)从大量的、原始的数据中抽取、推导出对人们有价值的信息作为决策依)从大量的、原始的数据中抽取、推导出对人们有价值的信息作为决策依据;据;2 2)借助计算机科学地保存和管理复杂的大量的数据,以便人们能方便而充)借助计算机科学地保存和管理复杂的大量的数据,以便人们能方便而充分地利用这些宝贵的信息资

4、源。分地利用这些宝贵的信息资源。数据库是反映数据本身的内容而且反映数据之间的联系。为什么要设计数据库?l 保存数据l 扩展人们的记忆,共享信息;l 帮助人们控制与之相关的事物 因此,数据库往往不是孤立的,通常是一个更大的信息控制系统的部分。2.1 数据库系统基础知识 2 2、数据库系统、数据库系统l 数据库系统是由计算机系统、数据、数据库管理系统和有关人员组成的数据库系统是由计算机系统、数据、数据库管理系统和有关人员组成的具有高度组织的总体。具有高度组织的总体。l 主要组成部分:主要组成部分:计算机系统计算机系统 数据库数据库 数据库管理系统(数据库管理系统(DNMS)DNMS)人员人员 (1

5、)(1)数据库管理员。数据库管理员。(2)(2)系统程序员。系统程序员。(3)(3)用户。用户。2.1 数据库系统基础知识 把数据库比做图书馆一个图书馆要想很好地为读者服务,必须完成以下工作:(1)建立完善的书卡(2)图书应有组织地存放在书库中 (3)规定借阅权限 (4)建立周密的借阅管理制度 2.1 数据库系统基础知识 对数据库来说,也要完成类似于图书馆的上述工作(1)建立数据模型 数据模型是对客观事物及其联系的数据描述反映各种数据之间的内在联系。数据库不仅要存储这些数据,更重要的是根据需求建立数据之间的联系模型,其目的就是方便用户利用数据,使用户可以根据数据模型快速访问数据库中的数据(如查

6、询检索、增加、修改和删除)。(2)有组织地存储数据 数据库中的数据是有组织地存放在存储设备上的,并建立数据模型到物理存储位置的对应表(这种对应称为映射),这样数据库管理系统就能够按照用户的访问请求,快速找到被访问的数据,而不必关心数据在数据库中的物理存储位置,就像读者可以按书卡填写借书单,而不用顾及书籍存放在书库的具体位置一样。2.1 数据库系统基础知识 (3)设定访问权限 用户对数据库的访问是受访问权限控制的。数据库设计者首先根据使用用户设定合法用户标识(用户名和口令),然后依据席同用户身份规定用户不同的访问权限和级别并授权。当一个用户访问数据库时,数据库管理系统首先要检查用户身份,合法用户

7、才能进入数据库系统,当用户对数据库执行操作时,系统检查用户权限,检变通过后才执行允许的操作。(4)建立完善的数据管理体系 设立“数据库系统“的目的是为了管理大量信息。对数据的管理既涉及数据存储结构的定义,又涉及信息操作机削的提供。此外,数据库系统还必须提供信息的安全性、完整性保证,数据库系统的并发控制、灾难恢复等管理机制。完善的数据管理体系是数据库最重要的特征之一,也是衡量数据库性能的一个重要指标。2.1 数据库系统基础知识 2数据库的发展 20世纪60年代早期,文件系统是数据管理的主要技术,用户的数据文件主要存储在磁带上,它的组织方式是顺序的,数据的访问是通过Io设备的输入输出完成的,一组数

8、据对应一个程序,如图61所示。2.1 数据库系统基础知识 0世纪60年代中后期,直接存储设备磁鼓、磁盘,特别是硬盘的广泛应用极大地改变了数据处理的情况。文件的逻辑结构与物理存储结构由系统进行转换,程序与数据有了一定的独立性。数据管理软件中还增加了一些安全、保密检查机构,部分系统允许用户之间以文件为单位共享数据,如图所示。2.1 数据库系统基础知识 突出的问题是:(1)数据和程序缺乏独立性(2)数据冗余度大 由于相同数据的重复存储,各自管理,给数据的修改和维护带来了困难、容易造成数据的不一致件。(3)数据访问困难 文件系统中数据访问是以特定的程序而向特定的作用的,没有通用的能对变化的需求做出快速

9、反应的数据检索系统,因此,不同的数据访问需要编写不问的应用程序。2.1 数据库系统基础知识 20世纪60年代末期数据库管理技术应运而生。最初的数据库主要是网状数据库和层次数据库。它们可以创建和操作表或树这样的数据结构。20世纪助年代,关系数据库占据了数据库系统的主导地位。在关系数据库中,几乎所有处理数据底层的细节工作都由数据库自动完成,关系模型的简单性和能够对程序员隐藏所有实现细节的能力使关系数据库迅速发展起来。在20世纪80年代人们还对并行和分布式数据库进行了许多研究,面向对象的数据库也开始出现。20世纪90年代末,随着互联网爆炸式的发展,使数据库比以前有了更广泛的应用。现在的数据库必须支持

10、很高的事物处理速度,而且还要有很高的可靠性和24x 7的可用性(一天24小时,一周7天都可用,也就是没有进行维护的停机时间)。数掘库系统还必须支持网络接口。2.1 数据库系统基础知识 3数据库的特征()数据和程序的独立性较高(2)数据冗余度小,共享度高,易扩充l 可以大大减小数据的冗余度,既节约存储空间,减少存取时间又可避免数据之间的不相容性和不一致性。(3)数据结构化l 数据库在描述数据时不仅要求描述数据本身,还要求描述数据之间的联系,即建立数据模型。这样,数据库中的数据便结构化厂,数据的结构化是数据库的重要特征之一。2.1 数据库系统基础知识 (4)统一的数据控制功能 数据库是系统中各用户

11、的共享资源。计算机的共享一般是并发的,许多用户同时使用数据库,因此系统必须提供以下三方而的控制功能。A 数据的安全性控制 数据的安全性是指保护数据以防止不合法的使用所造成数据的泄密和破坏。B 数据的完整性 数据的完整性指数据的正确性、有效性与相容性。系统提供必要的功能,保证数据库中的数据在输入、修改过程中始终符合原来的定义和规定。2.1 数据库系统基础知识 C 并发控制 当多个用户的并发进程同时存取、修改数据库时,可能会发生互相干扰而得到错误的结果并使数据库完整性遭到破坏,因此必须对多用户的并发操作加以控制、协调。数据库系统的程序和数据的关系如图所示。2.1 数据库系统基础知识 数据库是通用的

12、综合的数据集合。它可以供各种用数据库是通用的综合的数据集合。它可以供各种用户共享且具有最小冗余度和较高的数据与程序的独立户共享且具有最小冗余度和较高的数据与程序的独立性。由于多种程序并发地位用数据库,数据库提供安性。由于多种程序并发地位用数据库,数据库提供安全性、完整性等控制。全性、完整性等控制。数据库管理系统数据库管理系统(DBMS)(DBMS)在建立、使用和维护数据时在建立、使用和维护数据时对数据库进行统一控制。对数据库进行统一控制。2.1 数据库系统基础知识 二、二、数据模型数据模型 数据库是企业或部门所涉及的数据的综合,不仅反数据库是企业或部门所涉及的数据的综合,不仅反映数据本身的内容

13、,而且反映数据之间的联系,数据库映数据本身的内容,而且反映数据之间的联系,数据库结构的基础是数据模型。结构的基础是数据模型。数据模型是对客观事物及其联数据模型是对客观事物及其联系的数据描述,是描述数据、数据联系、数据语义以及系的数据描述,是描述数据、数据联系、数据语义以及一致性约束的概念工具的集合。一致性约束的概念工具的集合。数据模型给出了一种逻数据模型给出了一种逻辑层的数据库设计方法,在这部分我们概述目前常用的辑层的数据库设计方法,在这部分我们概述目前常用的两种数据模型:两种数据模型:实体一联系模型实体一联系模型 关系模型。关系模型。2.1 数据库系统基础知识 1实体一联系模型 为了用数据库

14、来模拟现实世界中的客观对象,人为了用数据库来模拟现实世界中的客观对象,人们需要将现实世界的这些对象经过选择、命名、分类、们需要将现实世界的这些对象经过选择、命名、分类、整理等活动抽象为一种信息结构。这个过程常用的方整理等活动抽象为一种信息结构。这个过程常用的方法是建立客观对象的实体一联系(法是建立客观对象的实体一联系(E ER)R)数据模型。数据模型。现实世界是由一组称为现实世界是由一组称为实体实体的基本对象及这些对的基本对象及这些对象间的联系组成。象间的联系组成。E ER R模型力图表达数据的意义模型力图表达数据的意义,可以可以将现实世界事实的含义和相互关系映射成概念模式,此将现实世界事实的

15、含义和相互关系映射成概念模式,此模型的提出是为了有助于数据库的设计,通过定义数据模型的提出是为了有助于数据库的设计,通过定义数据模式来实现数据库的全局逻辑结构的设计。模式来实现数据库的全局逻辑结构的设计。2.1 数据库系统基础知识 E-R模型所采用的三个主要概念是:实体集、联系集和属性。(1)实体集l 实体实体(entity):(entity):是指明客观存在并相互区别的事物。是指明客观存在并相互区别的事物。实体可以是具体对象。实体可以是具体对象。l 例。一本书、一个工厂、一种材料等。例。一本书、一个工厂、一种材料等。实体也可以是抽象的概念和联系。实体也可以是抽象的概念和联系。l 例。学生的一

16、次选课、一次借书等。例。学生的一次选课、一次借书等。l 实体集实体集(entity set):(entity set):具有相同性质的同类实体的具有相同性质的同类实体的集合。集合。l 例。所有教师、所有选课等。例。所有教师、所有选课等。2.1 数据库系统基础知识 (2)属性l属性属性(attribute)(attribute):实体具有许多特性,每一个特性称为属性。:实体具有许多特性,每一个特性称为属性。实体是通过属性来表示。属性实体是通过属性来表示。属性是实体集中每个成员具有的描述性性质。是实体集中每个成员具有的描述性性质。l例。学生的实体可由学号、姓名、性别、年龄、系别等属性组成例。学生的

17、实体可由学号、姓名、性别、年龄、系别等属性组成。l每个属性有一个取值范围,即值域。每个属性有一个取值范围,即值域。l例。性别的取值范围是例。性别的取值范围是“男男”或或“女女”。对某个客户实体,它的客户号的编码是对某个客户实体,它的客户号的编码是0 00101,客,客户名称的值是东方电机,地址是上海徐汇区。户名称的值是东方电机,地址是上海徐汇区。l一般来说、每个实体集中要创建或分配包含一个或几个属性的属性子集一般来说、每个实体集中要创建或分配包含一个或几个属性的属性子集惟一标识实体惟一标识实体,这,这个属性子集被称为该实体集的个属性子集被称为该实体集的主关键字主关键字。又叫。又叫主键主键(ke

18、y)(key):惟一标识实体的属性集。:惟一标识实体的属性集。l举例。学生实体的学号可作为学生实体的主键。举例。学生实体的学号可作为学生实体的主键。l下表所示为运输管理信息系统中运输管理数据库的一部分,其中有两个实体集:客户实体集下表所示为运输管理信息系统中运输管理数据库的一部分,其中有两个实体集:客户实体集(表表6 62)2)和订单实体集和订单实体集(表表6 63)3),主关键字以下划线表示,主关键字以下划线表示。2.1 数据库系统基础知识 客户实体集 2.1 数据库系统基础知识 订单实体集 2.1 数据库系统基础知识 (3)联系集 联系是指多个实体间的相互关联。联系是指多个实体间的相互关联

19、。两个实体集两个实体集A A和和B B之间的联系可分为四类:之间的联系可分为四类:一对一。一对一。A A中的一个实体至多同中的一个实体至多同B B中的一个实体相联系,如图中的一个实体相联系,如图(a)(a)所示。所示。一对多。一对多。A A中的一个实体可以同中的一个实体可以同B B中的任意数目的实体相联系,而中的任意数目的实体相联系,而B B中的一个实中的一个实体至多同体至多同A A中的一个实体相联系如图中的一个实体相联系如图(b(b所示。所示。多对一。多对一。A A中的一个实体至多同中的一个实体至多同B B中的一个实体相联系,而中的一个实体相联系,而B B中的一个实体可以中的一个实体可以同同

20、A A中的任意数目的实体相联系,如图中的任意数目的实体相联系,如图(c)(c)所示。所示。多对多。多对多。A A中的一个实体可以同中的一个实体可以同B B中的任意数目的实体相联系中的任意数目的实体相联系B B中的一个实体中的一个实体也可以同也可以同A A中的任意数目的实体相联系,如图中的任意数目的实体相联系,如图(d)(d)所示。所示。2.1 数据库系统基础知识 2.1 数据库系统基础知识 2.1 数据库系统基础知识 l 一对一联系,记为一对一联系,记为1:11:1。l 例。工厂与厂长之间,科研任务与课题组长之例。工厂与厂长之间,科研任务与课题组长之间都是间都是1:11:1联系。联系。l 一对

21、多联系,记为一对多联系,记为1:N1:N。l 例。一个学校有若干学生,而每个学生都在一例。一个学校有若干学生,而每个学生都在一个学校学习,学校与学生之间是一对多的联系。个学校学习,学校与学生之间是一对多的联系。l 多对多联系,记为多对多联系,记为M:NM:N。l 例。课程与学生之间,一个学生可选多门课程,例。课程与学生之间,一个学生可选多门课程,而每一门课程可有多个学生选修,课程与学生之间而每一门课程可有多个学生选修,课程与学生之间是多对多的联系。是多对多的联系。(4)实体一联系图 数据库的实体一联系模型可以用E一R图做图形化表示。这种图形化表示技术的简单性及其图示的清晰性是E一R模型被广泛使

22、用的重要原因。ER图中包括如下几个主要组件:矩形,表示实体集。椭圆,表示属性。菱形,表示联系。线段,将属性连接到实体集或将实体集连接到联系集中,并在直线上标注联系的种类,如:1:1表示1对l的联系。1:n表示1对多的联系。M:1表示多对1的联系。n:m表示多对多的联系。一个表示仓储管理中供货联系的ER图如图所示。2.1 数据库系统基础知识 ER模型是一个很好的方法,但现有数据库中没有一个能直接接受ER模型。主要因为ER只能说明实体以及实体间语义的联系,还不能进一步说明详细的数据结构。一般在解决实际问题中,总是先设计一个ER模型转换成计算机能实现的数据模型。2.1 数据库系统基础知识 2关系模型

23、 关系模型是建立在数学概念基础上的,用表的集合来表示关系模型是建立在数学概念基础上的,用表的集合来表示数据和数据间的联系。所以,关系模型是通过表格数据来表示数据和数据间的联系。所以,关系模型是通过表格数据来表示实现和实体间联系。实现和实体间联系。关系模型的几个术语:关系模型的几个术语:关系:一张表对应于一个关系,表名即关系名。关系:一张表对应于一个关系,表名即关系名。元组:表中的一行称为一个元组或记录。元组:表中的一行称为一个元组或记录。属性:表中的一列称为属性,列名即属性名。属性:表中的一列称为属性,列名即属性名。主码主码(主关键字主关键字):表中的某个属性组,它们的值惟:表中的某个属性组,

24、它们的值惟域:属性的取值范围。域:属性的取值范围。分量:元组中的一个属性值。分量:元组中的一个属性值。一个运输管理系统的货品关系表如表所示。一个运输管理系统的货品关系表如表所示。2.1 数据库系统基础知识 2.1 数据库系统基础知识 关系数据库是一种共享的数据知识库,是目前信息系统产最常用的一种数据库,运输信息系统的数据库基本上都是关系数据库。关系数据库其核心部分是关系模型。2.2 信息系统中的关系数据库信息系统中的关系数据库 2.2 信息系统中的关系数据库信息系统中的关系数据库 一、一、关系数据库的基本摄念关系数据库的基本摄念1数据结构关系数据库的数据结构单一,是二维表的结构,如表65、66

25、所示2.2 2.2 信息系统中的关系数据库信息系统中的关系数据库2基本术语(1)关键字或码。在关系的诸属性中,惟一能够用来标识元组的属性(或属性的组合)称为关键字或码。在一个关系中,关键字的值不能为空,也不能重复。(2)候选关键字或候选码。如果在一个关系中存在多个属性(或组合)能用来惟一标识该关系的元织,则这些属性或(组合)就称为该关系的候选关键字或候选码。(3)主关键字或主码。在一个关系的若干个候选关键字中指定作为关键字的属性。(4)非主属性。其他的属性。2.2 信息系统中的关系数据库信息系统中的关系数据库(5)外部关键字或外外键键。当关系中的某个属性(或组合)虽个是该关系的关键宇或只是非关

26、键字的一部分,却是另一个关系的关键字时,称该属性为这个关系的外键。如学生关系中的学部号虽不是关键字,却是教学部关系的关键字,所以,学部号为学生关系的外键。(6)主表与从表。主表与从表是与外键相关联的两个表,以外键为主键的表为主表,外键所在的表为从表。如上面的学生关系是从表,教学部关系是主表。需要注意的是,关系模式是稳定的但随着数据库中数据的不断更新,是随时间不断变化的。2.2 信息系统中的关系数据库信息系统中的关系数据库 二、关系数据库的数据完整性和安全性二、关系数据库的数据完整性和安全性1完整性 数据库的数据完整性是指数据库中数据的正确性、相一致性。数据库的数据完整性是指数据库中数据的正确性

27、、相一致性。在数在数据库中定义数据的完整性约束是为了保证授权用户对数据库进行修改时不据库中定义数据的完整性约束是为了保证授权用户对数据库进行修改时不会破坏数据的一致性。防止对数据库的会破坏数据的一致性。防止对数据库的意外破坏意外破坏。为了维护数据中数据的正确性和一致性,在对关系数据库进行插入、为了维护数据中数据的正确性和一致性,在对关系数据库进行插入、删除和修改时,必须遵循删除和修改时,必须遵循下述三类完整性下述三类完整性原则。原则。(1)(1)实体完整性规则。实体完整性规则。这条规则要求关系中元组的主控属性不能有空值。如这条规则要求关系中元组的主控属性不能有空值。如果出现空值,主键就起不了惟

28、一标识的作用。果出现空值,主键就起不了惟一标识的作用。(2)(2)引用完整性规则。引用完整性规则。这条规则要求不允许引用不存在的元组。这条规则要求不允许引用不存在的元组。(3)(3)用自定义的完整性规则。用自定义的完整性规则。这是针对某一具体数据的约束条件,由应用环这是针对某一具体数据的约束条件,由应用环境决定。境决定。2.2 信息系统中的关系数据库信息系统中的关系数据库 2安全性 除了完整性约束保护意外引入的不一致性之外,数据库除了完整性约束保护意外引入的不一致性之外,数据库个存储的数据还要防止个存储的数据还要防止未经授权的访问和蓄意的破坏或修改未经授权的访问和蓄意的破坏或修改。数据库安全性

29、指保护数据库不受恶意访问。数据库安全性指保护数据库不受恶意访问。绝对杜绝对绝对杜绝对数据库的恶意滥用是不可能的,但可以使那些企图在没有适数据库的恶意滥用是不可能的,但可以使那些企图在没有适当授权情况下访问数据库的代价足够高,以阻止绝大多数这当授权情况下访问数据库的代价足够高,以阻止绝大多数这样的访问企图。样的访问企图。2.2 信息系统中的关系数据库信息系统中的关系数据库 为了保护数据库,我们必须在几个层次上采取安全性措施:(1)(1)数据库系统层次数据库系统层次。数据库系统的某些用户获得的授权可能只允许他访问数据。数据库系统的某些用户获得的授权可能只允许他访问数据库中的有限部分,而另外一些用户

30、获得的授权可能允许他提出杏询,但不允库中的有限部分,而另外一些用户获得的授权可能允许他提出杏询,但不允许他修改数据。保证这样的授权限制不被违反是数据库系统的责任。许他修改数据。保证这样的授权限制不被违反是数据库系统的责任。(2)(2)操作系统层次操作系统层次。不管数据库多安全、搽作系统安全性方面的弱点总是可能成。不管数据库多安全、搽作系统安全性方面的弱点总是可能成为对数据库进行未经授权访问的一种手段。为对数据库进行未经授权访问的一种手段。(3)(3)网络层次网络层次。由于几乎所有的数据库系统都允许通过终端或网络进行远程访问。由于几乎所有的数据库系统都允许通过终端或网络进行远程访问,网络软件的软

31、件层安全性和物理安全性一样重要,不管在互联网上还是在私网络软件的软件层安全性和物理安全性一样重要,不管在互联网上还是在私有的网络内。有的网络内。(4)(4)物理层次物理层次。计算机系统所位于的结点。计算机系统所位于的结点(一(一个或多个个或多个)必须在物理必须在物理层层受到保护,受到保护,以防止入侵者强行进入或暗中潜入。以防止入侵者强行进入或暗中潜入。(5)(5)人员层次人员层次。对用户的授权必须格外小心以减少授权用户接受贿赔或其他好。对用户的授权必须格外小心以减少授权用户接受贿赔或其他好处而给入侵者提供访问机会的可能性。处而给入侵者提供访问机会的可能性。2.3 信息系统中的数据仓库信息系统中

32、的数据仓库(自学自学)数据仓库作为近些年来发展迅速的一种数据仓库作为近些年来发展迅速的一种新兴技术,将记录业务活动的数据库数据经新兴技术,将记录业务活动的数据库数据经过再加工,形成一个综合并面向分析的环境,过再加工,形成一个综合并面向分析的环境,实现业务信息的增值服务,运输数据仓库已实现业务信息的增值服务,运输数据仓库已经成为运输管理中数据分析和联机分析处理经成为运输管理中数据分析和联机分析处理日趋重要的平台。日趋重要的平台。2.3 信息系统中的数据仓库信息系统中的数据仓库(自学自学)一、数据仓库的基本概念一、数据仓库的基本概念1 1数据仓库定义数据仓库定义 数据仓库是计算机和运输等数据应用发

33、展到一定阶段的必然产物。数数据仓库是计算机和运输等数据应用发展到一定阶段的必然产物。数据仓库的目的是为了建立一种体系化的数据存储环境,将分析决策所需的大据仓库的目的是为了建立一种体系化的数据存储环境,将分析决策所需的大量数据从传统的操作环境中分离出来,使分散、不一致的操作数据转换成集量数据从传统的操作环境中分离出来,使分散、不一致的操作数据转换成集成、统一的信息。企业内不同单位、不同角色的成员都可以在此单一环境之成、统一的信息。企业内不同单位、不同角色的成员都可以在此单一环境之下,通过运用其中的数据与信息,发现全新的视野和新的问题、新的分析与下,通过运用其中的数据与信息,发现全新的视野和新的问

34、题、新的分析与思维进而发展出制度化的决策支持系统,并获取更多的经营效益。要实现思维进而发展出制度化的决策支持系统,并获取更多的经营效益。要实现这个目的必须获取大量的历史数据和汇总数据。这个目的必须获取大量的历史数据和汇总数据。完整的数据仓库应包括完整的数据仓库应包括3 3个方面的技术内容:个方面的技术内容:数据仓库技术、联机分析数据仓库技术、联机分析处理处理(OLAP)(OLAP)技术和数据挖掘技术和数据挖掘(DM)(DM)技术,技术,它是一个十分庞大的系统。目前已有它是一个十分庞大的系统。目前已有许多商品化的数据仓库软件,如:许多商品化的数据仓库软件,如:IBMIBM等有实力的公司相继推出了

35、自三的数等有实力的公司相继推出了自三的数据仓库解决方案。据仓库解决方案。2.3 信息系统中的数据仓库信息系统中的数据仓库(自学自学)数据仓库的定义数据仓库的定义:“数据仓库是一个面向主题的、集成的、稳定的、不同时间的数据仓库是一个面向主题的、集成的、稳定的、不同时间的数据集合,支持管理中的决策制定过程数据集合,支持管理中的决策制定过程。”数据仓库具有数据仓库具有如下特征如下特征,(1)(1)面向主题面向主题 主题主题是一个面向抽象的慨念,是在较高层次上将企业信息系统中的数据是一个面向抽象的慨念,是在较高层次上将企业信息系统中的数据综合、归类后进行分析利用的抽象。数据仓库是为决策支持提供服务的,

36、因综合、归类后进行分析利用的抽象。数据仓库是为决策支持提供服务的,因此数据的组织应是围绕着主题的,如:此数据的组织应是围绕着主题的,如:顾客、供应商、产品和销售组织顾客、供应商、产品和销售组织。数。数据仓库关注决策者的数据建模与分析,而不是集中于组织机构的日常操作相据仓库关注决策者的数据建模与分析,而不是集中于组织机构的日常操作相事务处理。因此,数据仓库具有排除对决策无用的数据、提供特定主题的简事务处理。因此,数据仓库具有排除对决策无用的数据、提供特定主题的简明特征。明特征。(2)(2)数据是集成的数据是集成的 数据仓库的数据并不是原有数据的简单拷贝,必须经过综合、计算,抛数据仓库的数据并不是

37、原有数据的简单拷贝,必须经过综合、计算,抛弃分析处理不需要的数据项增加一些可能涉及的外部数据。使用数据清理弃分析处理不需要的数据项增加一些可能涉及的外部数据。使用数据清理和数据集成技术,确保命名约定、编码结构等的一致性,以保证数据的质量。和数据集成技术,确保命名约定、编码结构等的一致性,以保证数据的质量。对源数据的集成是数据仓库建设中最关键也是最复杂的一步。对源数据的集成是数据仓库建设中最关键也是最复杂的一步。(3)(3)稳定性稳定性 从数据的使用上看,数据仓库的数据是稳定的,不可更改的。即最从数据的使用上看,数据仓库的数据是稳定的,不可更改的。即最终用户只能通过分析进行查询和分析而不能修改。

38、终用户只能通过分析进行查询和分析而不能修改。从数据的内容上看,数据仓库存储的是企业当前和历史的数据,因从数据的内容上看,数据仓库存储的是企业当前和历史的数据,因此,也可以说数据仓库在一定时间间隔内是稳定的。此,也可以说数据仓库在一定时间间隔内是稳定的。(4)(4)数据的时变性数据的时变性 数据仓库的数据稳定、不可更改是针对应用而言的,但并不是说,数据仓库的数据稳定、不可更改是针对应用而言的,但并不是说,数据从进入数据仓库中就永远不变,这些数据是随时间变化而定期更新数据从进入数据仓库中就永远不变,这些数据是随时间变化而定期更新的。每隔一段时间,数据仓库就将运行数据库系统中产生的数据进行转的。每隔

39、一段时间,数据仓库就将运行数据库系统中产生的数据进行转换,集成到数据仓库中。换,集成到数据仓库中。(5)(5)支持决策分析支持决策分析 建立数据仓库并不是取代原有的运行数据库系统,其目的是为了将建立数据仓库并不是取代原有的运行数据库系统,其目的是为了将企业多年来已经收集到的信息按一个统一且一致的企业级视图组织并存企业多年来已经收集到的信息按一个统一且一致的企业级视图组织并存储。然后对这些数据进行分析,从中得出有关企业经营状况、客户需求、储。然后对这些数据进行分析,从中得出有关企业经营状况、客户需求、对手情况以及以后发展趋势等有用信息。帮助企业及时、正确把握机会、对手情况以及以后发展趋势等有用信

40、息。帮助企业及时、正确把握机会、以求公激烈的竞争中获得更大的利益。以求公激烈的竞争中获得更大的利益。2.3 信息系统中的数据仓库信息系统中的数据仓库(自学自学)2数据仓库与传统数据库的区别 传统的关系型数据库遵循一致的关系模型,其中的数据以表格的方式传统的关系型数据库遵循一致的关系模型,其中的数据以表格的方式存储,并且能用统一的结构化查询语言存储,并且能用统一的结构化查询语言sQLsQL进行数据查询,数据库系进行数据查询,数据库系统的主要任务是执行联机事务和查询处理,通常,这类系统被称为统的主要任务是执行联机事务和查询处理,通常,这类系统被称为联机联机事务处理事务处理(OLTP)(OLTP),

41、其重点在于完成业务处理,及时给予用户响应,它涵其重点在于完成业务处理,及时给予用户响应,它涵盖了企业的大部分日常操作,如购买、库存、制造盖了企业的大部分日常操作,如购买、库存、制造h h银行、工资、注册、银行、工资、注册、记账等这类系统用于创建操作数据。记账等这类系统用于创建操作数据。当数据库系统应用到一定阶段时,企业家们便发现仅依赖拥有数据库当数据库系统应用到一定阶段时,企业家们便发现仅依赖拥有数据库系统已经不足以获得市场竞争的优势。他们需要对自身业务的运行以及系统已经不足以获得市场竞争的优势。他们需要对自身业务的运行以及整个市场相关行业的态势进行分析,需要根据客户、卖主和产品等主题整个市场

42、相关行业的态势进行分析,需要根据客户、卖主和产品等主题进行组合,回答决策者的问题,如进行组合,回答决策者的问题,如“在过去的季度里,咨询哪三样产品在过去的季度里,咨询哪三样产品的热线电话最多的热线电话最多?”?”,根据分析结果,做出有利的决策。这些决策需要对,根据分析结果,做出有利的决策。这些决策需要对大量的业务数据,包括历史业务数据,进行分析,数据仓库就是基于对大量的业务数据,包括历史业务数据,进行分析,数据仓库就是基于对业务数据进行决策分析而创建的数据管理系统。因此,这类系统一般地业务数据进行决策分析而创建的数据管理系统。因此,这类系统一般地是用于是用于联机分析处理系统联机分析处理系统(O

43、LAP)(OLAP)。2.3 信息系统中的数据仓库信息系统中的数据仓库(自学自学)OLTPOLTP数据库与数据仓库的主要区别概述如下:数据库与数据仓库的主要区别概述如下:(1 1)用户和系统的面向性:)用户和系统的面向性:OLTPOLTP数据库是面向顾客的,用于数据库是面向顾客的,用于记录相处理业务员、客户的业务过程和查询处理,数据仓库是面记录相处理业务员、客户的业务过程和查询处理,数据仓库是面向市场的,用于知识工人向市场的,用于知识工人(包括经理、主管和分忻人员包括经理、主管和分忻人员)的数据分的数据分析。析。(2)(2)数据内容:数据内容:OLTPOLTP数据库主要用于管理当前发生的数据,

44、通数据库主要用于管理当前发生的数据,通常,这种数据太琐碎,难以用于决策;数据仓库主要用于管理大常,这种数据太琐碎,难以用于决策;数据仓库主要用于管理大量历史数据,提供汇总和聚集机制,并在不同的综合级别上存储量历史数据,提供汇总和聚集机制,并在不同的综合级别上存储和管理信息。和管理信息。(3)(3)数据库设计:通常,数据库设计:通常,OLTPOLTP数据库系统采用实体一联系数据库系统采用实体一联系(E(ER)R)模型和面向应用的数据库设计;而数据仓库系统通常采用星型或模型和面向应用的数据库设计;而数据仓库系统通常采用星型或葵花模型和面向主题的数据库设计。葵花模型和面向主题的数据库设计。2.3 信

45、息系统中的数据仓库信息系统中的数据仓库(自学自学)(4)(4)视图:视图:OLTPOLTP数据库系统主要关注一个企业或部门内部的数据库系统主要关注一个企业或部门内部的当前数据,面不涉及历史数据或不同组织的数据;相比之当前数据,面不涉及历史数据或不同组织的数据;相比之下,由于组织的变化,数据仓库系统常常跨越数据库模式下,由于组织的变化,数据仓库系统常常跨越数据库模式的多个版本,并处理来自不同组织的信息,是由多个数据的多个版本,并处理来自不同组织的信息,是由多个数据存储集成的信息。由于数据量巨大,数据仓库的数据也常存储集成的信息。由于数据量巨大,数据仓库的数据也常存放在多个存储介质上。存放在多个存

46、储介质上。(5)(5)访问模式:访问模式:OLTPOLTP数据系统访问主要是由各种可变的操作数据系统访问主要是由各种可变的操作组成,这种系统需要并行控制和恢复机制;然而,对数据组成,这种系统需要并行控制和恢复机制;然而,对数据仓库系统的访问大部分是用于查询分析对话操作。仓库系统的访问大部分是用于查询分析对话操作。2.3 信息系统中的数据仓库信息系统中的数据仓库(自学自学)l 总之,数据仓库并非是一个仅仅存储数据的简单总之,数据仓库并非是一个仅仅存储数据的简单信息库,它实际上是一个信息库,它实际上是一个“以大型数据管理信息以大型数据管理信息系统为基础,附加在这个数据库系统之上并存储系统为基础,附

47、加在这个数据库系统之上并存储了企业所有业务数据库中获取的综合数据并能利了企业所有业务数据库中获取的综合数据并能利用这些综合数据为用户提供经过处理后的有用信用这些综合数据为用户提供经过处理后的有用信息的应用系统息的应用系统”。数据仓库更多的是一种管理技。数据仓库更多的是一种管理技术,它将企业网络中分布的商业数据集成到术,它将企业网络中分布的商业数据集成到起、起、为决策者提供各种类型的数据分析,对企业领导为决策者提供各种类型的数据分析,对企业领导者起到决策支持智囊团的作用为决策支持系统者起到决策支持智囊团的作用为决策支持系统提供提供个新的途径个新的途径。2.3 信息系统中的数据仓库信息系统中的数据

48、仓库(自学自学)二、数据仓库的数据模型二、数据仓库的数据模型l 实体一联系数据模型广泛用少关系数据库设汁。在那里,数据库模式由实体的集合和它们之间的联系组成。这种数据模型适用于联机事务处理(oLTP)。然而数据仓库需要简明的、面向主题的模式便于联机数据分析。l 最流行的数据仓库数据模型是多维数据模型。此外,还有星型数据模型和雪花型数据模型。2.3 信息系统中的数据仓库信息系统中的数据仓库(自学自学)1多维数据模型 数据模型是数据仓库研究的重点问题。在多维数据模型中,把数据集合的属性分为度和维两类,度类数据反映的是数据的数字测量值(如:销售量、投资额及收入等),它们是依赖于一组“维”的、这些维类

49、数据提供了测量值的关联关系。例如销售量与城市、产品名称和销售的时间有关,这组相关的维惟一地决定了销售量这个测量值。因此,多维数据模型就是把测量的值放在这样一些有层次的维构成的多维空间中。下图中的小格内存储的数据可以假设为商品的销售量。该模型包括商品、城市、日期等多维。2.3 信息系统中的数据仓库信息系统中的数据仓库(自学自学)图 多维数据模型 2.3 信息系统中的数据仓库信息系统中的数据仓库(自学自学)多维数据模型的另一个特点是对一维或多维所做的结多维数据模型的另一个特点是对一维或多维所做的结合运算,例如对总销售量按城市进行汁算和排序,这些运合运算,例如对总销售量按城市进行汁算和排序,这些运算

50、包括对同样维所限定的测量值比较算包括对同样维所限定的测量值比较(如销售量与预算如销售量与预算)。一般来说时间维是一个有特殊意义的维,它对决策中的一般来说时间维是一个有特殊意义的维,它对决策中的趋势分析很重要。趋势分析很重要。针对多维模型产生的针对多维模型产生的0W0W分析方法,分析方法,一般有以下几种一般有以下几种。(1)(1)旋转。即将表格的横、纵坐标交换旋转。即将表格的横、纵坐标交换(X(X,Y)Y)(Y(Y,x)x)。(2)(2)上钻和下钻。即根据维的层次提升所关心的数据或降低上钻和下钻。即根据维的层次提升所关心的数据或降低观察层次。观察层次。(3)(3)切片。主要根据维的限定做投影、选

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(交通运输信息管理课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|