1、1 数据库原理与应用数据库原理与应用 主讲教师:梁主讲教师:梁 平平 2 第第1 1章章 数据库概述数据库概述 3 本章概要本章概要 在本章中,首先回顾数据管理技术在本章中,首先回顾数据管理技术 的三个发展阶段及各阶段的主要特的三个发展阶段及各阶段的主要特 点。点。 掌握数据库系统的组成及各部分的掌握数据库系统的组成及各部分的 主要功能。主要功能。 4 1.1 数据管理的发展数据管理的发展 一、以数据为中心应用系统的特点一、以数据为中心应用系统的特点 以数据为中心应用系统的特点以数据为中心应用系统的特点 随着计算机的普及和信息量的不断增加,随着计算机的普及和信息量的不断增加, 在众多的计算机应
2、用的发展中,数据密集型的在众多的计算机应用的发展中,数据密集型的 应用发展非常迅速。它具有如下三个特点:应用发展非常迅速。它具有如下三个特点: 涉及的数据量大涉及的数据量大 数据不随程序的结束而消失数据不随程序的结束而消失 数据可以被多个应用程序共享数据可以被多个应用程序共享 5 人工管理阶段人工管理阶段 文件管理系统阶段文件管理系统阶段 数据库管理系统阶段数据库管理系统阶段 三个阶段各自的优缺点三个阶段各自的优缺点 数据管理的发展数据管理的发展 6 二、人工管理阶段二、人工管理阶段 2020世纪世纪5050年代以前年代以前,计算机主要用于,计算机主要用于数值计算数值计算。 这一时期的数据,数
3、据量小,无结构,由用户直接管这一时期的数据,数据量小,无结构,由用户直接管 理,且数据间缺乏逻辑组织,由于是面向应用程序理,且数据间缺乏逻辑组织,由于是面向应用程序 的,数据缺乏独立性,应用程序与其处理的数据结合的,数据缺乏独立性,应用程序与其处理的数据结合 成一个整体。成一个整体。 (1)(1)硬件:外存只有纸带、卡片、磁带,并没有磁硬件:外存只有纸带、卡片、磁带,并没有磁 盘等直接存取的存储设备。盘等直接存取的存储设备。 (2)(2)软件:当时还未形成软件的整体概念,这一时软件:当时还未形成软件的整体概念,这一时 期,没有操作系统和管理数据的软件。期,没有操作系统和管理数据的软件。 7 (
4、3 3)特点:)特点: 数据不保存数据不保存 应用程序管理数据应用程序管理数据 应用程序承担设计数据的逻辑结构和物理应用程序承担设计数据的逻辑结构和物理 结构任务。结构任务。 数据不能共享数据不能共享 一组数据只能对应一个程序。一组数据只能对应一个程序。 数据不具有独立性数据不具有独立性 数据的逻辑或物理结构改变,应用程序随数据的逻辑或物理结构改变,应用程序随 之改变。之改变。 8 2020世纪世纪5050年代后期到年代后期到6060年代中后期年代中后期 (1)(1)硬件:磁盘、磁鼓等直接存取存储设备。硬件:磁盘、磁鼓等直接存取存储设备。 (2)(2)软件:操作系统中有了专门的数据管理软件:操
5、作系统中有了专门的数据管理 软件软件-文件系统文件系统。 三、文件管理系统三、文件管理系统 9 图图1-1 文件管理系统示例文件管理系统示例 学生信息管理学生信息管理 学生选课管理学生选课管理 应用程序应用程序A1 学生基本学生基本 信息文件信息文件 F1 课程基本课程基本 信息文件信息文件 F2 学生选课学生选课 信息文件信息文件 F3 应用程序应用程序A2 10 文件管理系统管理数据的缺点:文件管理系统管理数据的缺点: 编写应用程序不方便编写应用程序不方便 数据冗余不可避免数据冗余不可避免 应用程序有依赖性应用程序有依赖性 不支持对文件的并发访问不支持对文件的并发访问 数据间联系弱数据间联
6、系弱 难以按不同用户需求表示数据难以按不同用户需求表示数据 无安全控制功能无安全控制功能 11 四、数据库管理系统四、数据库管理系统 2020世纪世纪6060年代后期至今年代后期至今 (1)(1)硬件:大容量磁盘,价格下降。硬件:大容量磁盘,价格下降。 (2)(2)软件:出现了统一管理数据的专门软件:出现了统一管理数据的专门 软件软件-数据库管理系统数据库管理系统。 12 图图1-2 数据库管理系统实现示例数据库管理系统实现示例 应用程序应用程序A1 学生管理学生管理 学生学生 有关的有关的 数据库数据库 应用程序应用程序A2 学生选课学生选课 管理管理 数据库数据库 管理系统管理系统 13
7、差别:差别: 在文件系统中,应用程序直接访问存在文件系统中,应用程序直接访问存 储数据的文件;储数据的文件; 而在数据库系统中,应用程序则是通而在数据库系统中,应用程序则是通 过数据库管理系统(过数据库管理系统(DataBase DataBase Management System,Management System,简称简称DBMSDBMS)来访问)来访问 数据。数据。 14 数据库系统带来的优点:数据库系统带来的优点: 将相互关联的数据集成在一起将相互关联的数据集成在一起 较少的数据冗余较少的数据冗余 程序与数据相互独立程序与数据相互独立 保证数据的安全可靠保证数据的安全可靠 最大限度地保
8、证数据的正确性最大限度地保证数据的正确性 数据可以共享并能保证数据的一致性数据可以共享并能保证数据的一致性 15 数据库具备如下特征:数据库具备如下特征: 数据库是相互关联的数据的集合,它用综合数据库是相互关联的数据的集合,它用综合 的方法组织数据,具有较小的数据冗余,可的方法组织数据,具有较小的数据冗余,可 供多个用户共享,具有较高的数据独立性,供多个用户共享,具有较高的数据独立性, 具有安全控制机制,能够保证数据的安全、具有安全控制机制,能够保证数据的安全、 可靠,允许并发地使用数据库,能有效、及可靠,允许并发地使用数据库,能有效、及 时地处理数据,并能保证数据的一致性和完时地处理数据,并
9、能保证数据的一致性和完 整性。整性。 16 五、数据独立性五、数据独立性 包含两个方面:包含两个方面:逻辑独立性逻辑独立性和和物理独立性物理独立性。 物理独立性是指当数据的存储结构发生 变化时,不影响应用程序的特性。 逻辑独立性是指当表达现实世界的信息 内容发生变化时,也不影响应用程序的 特性。 17 因此因此,数据独立性的提出主要是一数据独立性的提出主要是一 种客观应用的要求种客观应用的要求。数据独立性可描述数据独立性可描述 为:为:应用程序不因物理表示和访问技术应用程序不因物理表示和访问技术 的改变而改变的改变而改变,即应用程序不依赖于任即应用程序不依赖于任 何特定的物理表示和访问技术何特
10、定的物理表示和访问技术。 18 1.2 什么是数据库系统什么是数据库系统 应用程序应用程序1 应用程序应用程序2 应用程序应用程序n 数据库管理系统数据库管理系统 (DBMS) 数据库数据库 图图1-3 数据库系统简图数据库系统简图 19 数据库:数据库:是数据的汇集,它以一定的组是数据的汇集,它以一定的组 织形式存于存储介质上。织形式存于存储介质上。 DBMSDBMS:是管理数据库的系统软件,它实是管理数据库的系统软件,它实 现数据库系统的各种功能。是数据库系现数据库系统的各种功能。是数据库系 统的核心。统的核心。 应用程序:应用程序:指以数据库为基础的应用程指以数据库为基础的应用程 序。序
11、。 20 数据库系统数据库系统的人员的人员 系统管理员系统管理员 应用程序开发人员应用程序开发人员 最终用户最终用户 21 1.3 使用数据库系统的考虑使用数据库系统的考虑 及数据库应用的未来及数据库应用的未来 使用数据库系统的原因使用数据库系统的原因 因为数据库系统因为数据库系统为数据提供了共享、稳定、为数据提供了共享、稳定、 安全的保障体系安全的保障体系。 要判断是否需要使用数据库系统,要看被管要判断是否需要使用数据库系统,要看被管 理的数据是否有结构、数据之间是否有联系、数理的数据是否有结构、数据之间是否有联系、数 据的取值是否有约束,如果数据有这些特征,则据的取值是否有约束,如果数据有
12、这些特征,则 应该使用数据库系统。应该使用数据库系统。 22 数据库应用的未来数据库应用的未来 目前数据库系统已经应用到医学诊断、计目前数据库系统已经应用到医学诊断、计 算机辅助设计、计算机辅助工程、图书馆管算机辅助设计、计算机辅助工程、图书馆管 理、天气预报、交通预订、旅馆预订等许多领理、天气预报、交通预订、旅馆预订等许多领 域。数据库系统的发展主要是为了满足共享信域。数据库系统的发展主要是为了满足共享信 息用户的需求,随着在线信息的增加,以及越息用户的需求,随着在线信息的增加,以及越 来越多的用户希望访问在线信息,今后还会开来越多的用户希望访问在线信息,今后还会开 发出更多的面向应用的数据
13、库系统。发出更多的面向应用的数据库系统。 第第2 2章章 数据库系统结构数据库系统结构 2.1 数据和数据模型数据和数据模型 2.2 概念层数据模型概念层数据模型 2.3 组织层数据模型组织层数据模型 2.4 数据库系统的结构数据库系统的结构 23 2.1 2.1 数据和数据模型数据和数据模型 一、数据一、数据 数据数据是用物理符号把信息按一定格式记载下是用物理符号把信息按一定格式记载下 来的有意义符号组合。来的有意义符号组合。 如如( (张三,张三,99121019912101,男,男,19811981,计算机系,计算机系, 应用软件应用软件) ) 数据有一定的格式。数据有一定的格式。 数据
14、是信息存在的一种形式,只有通过解释数据是信息存在的一种形式,只有通过解释 或处理才能成为有用的信息。或处理才能成为有用的信息。 24 数据的两个特征:数据的两个特征: 数据的静态特征数据的静态特征 包括数据的基本结构、数据间的联系和对包括数据的基本结构、数据间的联系和对 数据取值范围的约束。数据取值范围的约束。 数据的动态特征数据的动态特征 指对数据进行的操作及操作规则,对数据指对数据进行的操作及操作规则,对数据 库数据的操作主要有查询数据、更改数据(插库数据的操作主要有查询数据、更改数据(插 入、删除、修改数据)。入、删除、修改数据)。 25 二、二、 数据模型数据模型 模型模型是对事物、对
15、象、过程等客观系统中感是对事物、对象、过程等客观系统中感 兴趣的内容的模拟和抽象表达,是理解系统的兴趣的内容的模拟和抽象表达,是理解系统的 思维工具。思维工具。 数据模型数据模型(Data Model)(Data Model) 也是一种模型,它是对现实世界数据特征也是一种模型,它是对现实世界数据特征 的抽象。的抽象。 数据模型一般应满足三个要求:数据模型一般应满足三个要求: 第一:要能够比较真实地模拟现实世界;第一:要能够比较真实地模拟现实世界; 第二:要容易被人们理解;第二:要容易被人们理解; 第三:要能够很方便地在计算机上实现。第三:要能够很方便地在计算机上实现。 26 根据模型应用的不同
16、目的,可将这些根据模型应用的不同目的,可将这些 模型分为两大类,它们分别属于两个模型分为两大类,它们分别属于两个 不同的层次。不同的层次。 第一类是概念层模型 另一类是组织层数据模型 27 概念层模型概念层模型 从数据的从数据的应用语义视角应用语义视角来抽取模型并来抽取模型并 按用户的观点来对数据和信息进行建按用户的观点来对数据和信息进行建 模。模。 这类模型主要用在这类模型主要用在数据库的设计阶段数据库的设计阶段 它与具体的数据库管理系统无关。它与具体的数据库管理系统无关。 28 组织层数据模型组织层数据模型 从从计算机系统的观点计算机系统的观点出发对数据进行建模出发对数据进行建模 指用什么
17、样的结构来组织数据指用什么样的结构来组织数据 主要用于主要用于DBMSDBMS的实现的实现 主要包括:主要包括: 层次模型(用树型结构组织数据) 网状模型(用图型结构组织数据) 关系模型(用简单二维表结构组织数据) 对象关系模型(用复杂表格及其他结构 组织数据) 29 为了把现实世界中的为了把现实世界中的 具体事物抽象、组织为某具体事物抽象、组织为某 一具体一具体DBMSDBMS支持的数据模支持的数据模 型,型,通常首先将现实世界通常首先将现实世界 抽象为信息世界,然后再抽象为信息世界,然后再 将信息世界转换为机器世将信息世界转换为机器世 界。界。即:首先把现实世界即:首先把现实世界 中的客观
18、对象中的客观对象抽象抽象为某一为某一 种信息结构,然后再把概种信息结构,然后再把概 念级模型念级模型转换转换为计算机上为计算机上 的的DBMSDBMS支持的数据模型,支持的数据模型, 也就是组织层数据模型。也就是组织层数据模型。 现实世界现实世界 人的认识抽象人的认识抽象 信息世界:概念模型信息世界:概念模型 机器世界:具体的机器世界:具体的DBMS 支持的组织模型支持的组织模型 30 2.2 2.2 概念层数据模型概念层数据模型 一、基本概念一、基本概念 实际上是现实世界到机器世界的一个实际上是现实世界到机器世界的一个中间层次中间层次。 概念层模型:概念层模型:是指抽象现实系统中有应用价值的
19、是指抽象现实系统中有应用价值的 元素及其关联关系,反映现实系统中有应用价值元素及其关联关系,反映现实系统中有应用价值 的信息结构,并且不依赖于数据的组织结构。的信息结构,并且不依赖于数据的组织结构。 概念数据模型是面向用户、面向现实世界的数据 模型,它与具体的DBMS无关。 常用的概念模型有实体-联系(Entity- Relationship,简称E-R)模型、语义对象模型。 31 二、实体二、实体-联系模型联系模型 1 1、实体、实体 实体实体是具有公共性质的可相互区别的现实世是具有公共性质的可相互区别的现实世 界对象的集合。界对象的集合。 实体可以是具体的,也可以是抽象的概念或实体可以是具
20、体的,也可以是抽象的概念或 联系。联系。如学生、课程,学生的选课、订货等如学生、课程,学生的选课、订货等。 在在E E- -R R图中用图中用矩形框矩形框表示具体的实体,把实表示具体的实体,把实 体名写在框内。体名写在框内。 实体中的每个具体的记录值(一行数据),实体中的每个具体的记录值(一行数据), 称之为实体的一个称之为实体的一个实例实例。比如学生实体中的每比如学生实体中的每 个具体的学生。个具体的学生。 32 2 2、属性、属性 属性属性就是描述实体或者联系的性质或特征的就是描述实体或者联系的性质或特征的 数据项。属于一个实体的所有实体实例都具有数据项。属于一个实体的所有实体实例都具有
21、共同的性质,在共同的性质,在E E- -R R模型中,这些性质或特征模型中,这些性质或特征 就是属性。就是属性。 属性在属性在E E- -R R图中用图中用圆角矩形圆角矩形表示,在矩形框表示,在矩形框 内写上属性的名字,并用连线将属性矩形框与内写上属性的名字,并用连线将属性矩形框与 它所描述的实体联系起来。它所描述的实体联系起来。 33 3 3、联系、联系 实体内部的联系通常是指组成实体的各属实体内部的联系通常是指组成实体的各属 性之间的联系,实体之间的联系通常是指性之间的联系,实体之间的联系通常是指 不同实体之间的联系。不同实体之间的联系。 联系是数据之间的关联集合,是客观存在联系是数据之间
22、的关联集合,是客观存在 的应用语义链。联系用的应用语义链。联系用菱形框菱形框表示,框内表示,框内 写上联系名,并用写上联系名,并用连线连线将联系框与它所关将联系框与它所关 联的实体连接起来。联的实体连接起来。 34 实体型之间的联系分为三类:实体型之间的联系分为三类: 一对一联系一对一联系:如果实体:如果实体A A中中 的每个实例在实体的每个实例在实体B B中至多有中至多有 一个(也可以没有)实例与一个(也可以没有)实例与 之关联,反之亦然,则称实之关联,反之亦然,则称实 体体A A与实体与实体B B具有一对一联系,具有一对一联系, 记作:记作:1 : 11 : 1。 例如,部门和经理(假设一
23、例如,部门和经理(假设一 个部门只有一个经理)、系个部门只有一个经理)、系 和正系主任(假设一个系只和正系主任(假设一个系只 有一个正主任)都是一对一有一个正主任)都是一对一 联系。联系。如图(如图(a a)所示。)所示。 经理经理 部门部门 管理管理 1 1 (a) 35 一对多联系一对多联系:如果实体:如果实体A A中中 的每个实例在实体的每个实例在实体B B中有中有n n个个 实例(实例(n0n0)与之联系,而)与之联系,而 实体实体B B中每个实例在实体中每个实例在实体A A中中 只有一个实例与之联系,则只有一个实例与之联系,则 称实体称实体A A与实体与实体B B是一对多联是一对多联
24、 系,记作:系,记作:1 : n1 : n。 例,假设一个部门有若干职例,假设一个部门有若干职 工,而一个职工只在一个部工,而一个职工只在一个部 门工作,则部门和职工之间门工作,则部门和职工之间 就是一对多联系。就是一对多联系。如图(如图(b b) 所示。所示。 职工职工 部门部门 工作工作 n 1 (b) 36 多对多联系多对多联系:如果对于实体:如果对于实体A A中的每个实中的每个实 例,实体例,实体B B中有中有n n个实例(个实例(n0n0)与之联系,)与之联系, 而实体而实体B B中的每个实例,在实体中的每个实例,在实体A A中也有中也有m m个个 实例(实例(m0m0)与之联系,则
25、称实体)与之联系,则称实体A A与实体与实体B B 的联系是多对多的,记为的联系是多对多的,记为m : n m : n 。 例如学生和课程,一个学生可以选修多门例如学生和课程,一个学生可以选修多门 课程,一门课程也可以被多个学生选修,因课程,一门课程也可以被多个学生选修,因 此学生和课程之间是多对多的联系。此学生和课程之间是多对多的联系。如图如图 (c c)所示。)所示。 n 37 学生学生 选课选课 m 学号学号 姓名姓名 性别性别 成绩成绩 课程课程 课程号课程号 课程名课程名 学分学分 n (c) 38 E E- -R R图不仅能描述两个实体之间的联系,而且还能描图不仅能描述两个实体之间
26、的联系,而且还能描 述两个以上实体之间的联系。述两个以上实体之间的联系。比如有顾客、商品、售比如有顾客、商品、售 货员三个实体,并且有语义:每个顾客可以从多个售货员三个实体,并且有语义:每个顾客可以从多个售 货员那里购买商品,并且可以购买多种商品;每个售货员那里购买商品,并且可以购买多种商品;每个售 货员可以向多名顾客销售商品,并且可以销售多种商货员可以向多名顾客销售商品,并且可以销售多种商 品;每种商品可由多个售货员销售,并且可以销售给品;每种商品可由多个售货员销售,并且可以销售给 多名顾客。描述三者之间的关联关系的多名顾客。描述三者之间的关联关系的E E- -R R图如下图所图如下图所 示
27、,这里联系被命名为销售。示,这里联系被命名为销售。 售货员售货员 顾客顾客 商品商品 销售销售 m n p 39 2.3 2.3 组织层数据模型组织层数据模型 组织层数据模型组织层数据模型是从数据的是从数据的组织方式组织方式 的角度来描述信息。目前,在数据库领域的角度来描述信息。目前,在数据库领域 中最常用的组织层数据模型有四种,它们中最常用的组织层数据模型有四种,它们 是:是:层次模型层次模型、网状模型网状模型、关系模型关系模型和和面面 向对象模型向对象模型。 组织层数据模型是按存储数据的逻辑组织层数据模型是按存储数据的逻辑 结构来命名的。结构来命名的。 40 层次模型层次模型 层次模型用层
28、次模型用树形结构树形结构来表示实体及其之间的来表示实体及其之间的 联系,如行政机构、家族关系等。特点:联系,如行政机构、家族关系等。特点: 1 1)有一个结点没有父亲结点有一个结点没有父亲结点,称为根结点称为根结点。 2 2)其它结点有且仅有一个父亲结点其它结点有且仅有一个父亲结点。 每个结点表示一个记录类型每个结点表示一个记录类型,记录类型之间记录类型之间 的联系用结点间的连线的联系用结点间的连线( (有向边有向边) )表示表示,这种实体这种实体 之间的联系是之间的联系是1 1: :M M联系联系(包括包括1 1: :1 1联系联系)。 41 系编号 系名 办公地点 学号 姓名 成绩 教研室
29、编号 教研室 职工号 姓名 研究方向 教员教员-学生数据库模型学生数据库模型 系系 教研室教研室 学生学生 教员教员 42 教员学生层次数据库的一个值教员学生层次数据库的一个值 43 层次模型存储结构层次模型存储结构 邻接法、链接法邻接法、链接法 层次模型优点:层次模型优点: 层次清晰、构造简单、易于实现层次清晰、构造简单、易于实现1:11:1和和1:N1:N 的实体联系。的实体联系。 层次模型有两个缺点:层次模型有两个缺点: 只能表示只能表示1:N1:N联系,虽然系统有多种辅助手联系,虽然系统有多种辅助手 段实现段实现M:NM:N联系但较复杂,用户不易掌握联系但较复杂,用户不易掌握 由于层次
30、顺序的严格和复杂,引起数据的查由于层次顺序的严格和复杂,引起数据的查 询和更新操作很复杂,因此应用程序的编写也询和更新操作很复杂,因此应用程序的编写也 比较复杂。比较复杂。 44 网状模型网状模型 是用以实体型为结点的是用以实体型为结点的有向图有向图来表示各实体来表示各实体 及其之间的联系及其之间的联系。特点:特点: 1 1) 可以有一个以上的结点无父亲可以有一个以上的结点无父亲。 2 2) 至少有一个结点有多于一个的父亲至少有一个结点有多于一个的父亲。 能表示能表示 M M: :N N 联系联系。 缺点:编写应用程序复杂,模型结构复杂。缺点:编写应用程序复杂,模型结构复杂。 45 C D B
31、 E A 46 学生学生/选课选课/课程的网状数据模型课程的网状数据模型 47 一、关系模型的数据结构一、关系模型的数据结构 关系数据模型源于数学,它用关系数据模型源于数学,它用二维表二维表 来组织数据,而这个二维表在关系数据库来组织数据,而这个二维表在关系数据库 中就称为中就称为关系关系。关系数据库就是表或者说。关系数据库就是表或者说 是关系的集合。关系系统要求只让用户所是关系的集合。关系系统要求只让用户所 感觉的数据库就是一张张表。在关系系统感觉的数据库就是一张张表。在关系系统 中,表是中,表是逻辑结构逻辑结构而不是物理结构。而不是物理结构。 48 1 1、关系关系 关系就是二维表,它满足
32、如下两个条件: 关系表中的每一列都是不可再分的基本属性。 表中各属性不能重名。 表中的行、列次序并不重要。 2 2、元组元组 表中的每一行数据称作是一个元组表中的每一行数据称作是一个元组 3 3、属性属性 表中的每一列是一个属性值集,列可以命名,称为表中的每一列是一个属性值集,列可以命名,称为 属性名属性名 4 4、主码主码(主键或主关键字)(主键或主关键字) 是表中的属性或属性组,用于惟一地确定一个元组是表中的属性或属性组,用于惟一地确定一个元组 5 5、域域 属性的取值范围就称为域属性的取值范围就称为域 49 二、二、 关系模型的数据操作关系模型的数据操作 关系模型的操作对象是关系模型的操
33、作对象是集合集合,而不是,而不是 行。也就是操作的数据以及操作的结果都是行。也就是操作的数据以及操作的结果都是 完整的表完整的表(是包含行集的表,而不只是单(是包含行集的表,而不只是单 行)。因此,行)。因此,集合处理能力集合处理能力是关系系统区别是关系系统区别 于其他系统的一个重要特征。于其他系统的一个重要特征。 关系数据模型的数据操作主要包括四种:关系数据模型的数据操作主要包括四种: 查询查询、插入插入、删除删除和和修改修改数据。数据。 50 关系代数关系代数 关系代数的运算按运算符的不同主要分为关系代数的运算按运算符的不同主要分为 两类:两类: 传统的集合运算传统的集合运算:运算是从关系
34、:运算是从关系行的角度行的角度进进 行的行的。包括包括并并、差差、交交和和乘积乘积( (笛卡尔积笛卡尔积) )等运等运 算算。 专门的关系运算专门的关系运算:不仅涉及:不仅涉及行运算行运算,也涉及也涉及 列运算列运算,这种运算是为数据库的应用而引进的这种运算是为数据库的应用而引进的 特殊运算特殊运算。包括包括选取选取、投影投影、连接连接和和求商求商等运等运 算算。 51 (1 1)合并合并(Union)(Union)运算运算 运算符:运算符: 运算表达式:运算表达式: R R1 1RR2 2 将关系将关系R2R2中与关系中与关系R1R1中不相同的元组中不相同的元组 插入到关系插入到关系R1R1
35、中中 (2 2)求差求差(Difference)(Difference)运算运算 运算符:运算符: 运算表达式:运算表达式: R R1 1R R2 2 将关系将关系R1R1中与关系中与关系R2R2中相同的元组删除中相同的元组删除 关系关系R1R1和和R2R2具有相同具有相同 的的n n个属性,相应的个属性,相应的 属性取自同一个域属性取自同一个域 52 A B C a1 b1 c1 a1 b1 c2 a2 b2 c1 A B C a1 b1 c1 a2 b2 c1 a2 b3 c2 A B C a1 b1 c1 a1 b1 c2 a2 b2 c1 a2 b3 c2 R S R S R-S A
36、B C a1 b1 c2 53 (3 3)乘积()乘积(Cartesian ProductCartesian Product)运算)运算 严格地讲应该是广义的笛卡尔积严格地讲应该是广义的笛卡尔积 R: R: n n目关系,目关系,k k1 1个元组个元组 S: S: m m目关系,目关系,k k2 2个元组个元组 R RS S 列:(列:(n n+ +m m)列元组的集合)列元组的集合 元组的前元组的前n n列是关系列是关系R R的一个元组的一个元组 后后m m列是关系列是关系S S的一个元组的一个元组 行:行:k k1 1k k2 2个元组个元组 R RS S = = t tr r t ts
37、 |s |t tr r R R t ts s S S 54 A B C A B C a1 b1 c1 a1 b1 c1 a1 b1 c1 a2 b2 c1 a1 b1 c1 a2 b3 c2 a1 b1 c2 a1 b1 c1 a1 b1 c2 a2 b2 c1 a1 b1 c2 a2 b3 c2 a2 b2 c1 a1 b1 c1 a2 b2 c1 a2 b2 c1 a2 b2 c1 a2 b3 c2 RS 55 (4 4)选择)选择(Selection)(Selection)运算运算 运算符:运算符: 运算表达式:运算表达式: F F(R)(R) 从关系从关系R R中选出满足条件表达式中选
38、出满足条件表达式F F的那些元组构的那些元组构 成的关系成的关系 A B C a1 b1 c1 a1 b1 c2 a2 b2 c1 A B C a1 b1 c1 a1 b1 c2 R B=b1(R) 56 (5 5)投影投影(ProjectionProjection)运算运算 运算符:运算符: 运算表达式:运算表达式:A1 , A2 , A1 , A2 , , An(R), An(R) 从从R R中选择出若干属性列中选择出若干属性列(A1 , A2 , (A1 , A2 , , An), An) 组成新的关系组成新的关系 A B C a1 b1 c1 a1 b1 c2 a2 b2 c1 A C
39、 a1 c1 a1 c2 a2 c1 R A,C(R) 57 (6 6)连接)连接 从两个关系的笛卡尔积中选取属性间满足一定从两个关系的笛卡尔积中选取属性间满足一定 条件的元组条件的元组 记作:记作: R SR S -A A和和B B:分别为分别为R R和和S S上度数相等且可比的属性组上度数相等且可比的属性组 - :比较运算符:比较运算符 - 连接运算从连接运算从R R和和S S的广义笛卡尔积的广义笛卡尔积R RS S中选取中选取 (R R关系)在关系)在A A属性组上的值与(属性组上的值与(S S关系)在关系)在B B 属性组上值满足比较关系属性组上值满足比较关系的元组的元组 AB 58
40、两个重要的连接:两个重要的连接: 等值连接等值连接 为为=,是从关系是从关系R R和和S S的广义笛卡尔积的广义笛卡尔积 中选取中选取A A,B B属性值相等的那些元祖属性值相等的那些元祖。 自然连接自然连接 是一种特殊的等值连接是一种特殊的等值连接,它要求两个关系它要求两个关系 中进行比较的分量必须是相同的属性组中进行比较的分量必须是相同的属性组,并且并且 在结果中把重复的属性列去掉在结果中把重复的属性列去掉。 59 A B C a1 b1 2 a1 b2 4 a2 b3 6 a2 b4 8 B C b1 5 b2 6 b3 7 b3 8 A R.B C S.B D a1 b1 2 b1 5
41、 a1 b2 4 b2 6 a2 b3 6 b3 7 a2 b3 6 b3 8 R S 等值连接等值连接(R.B=S.B) 自然连接自然连接 A B C D a1 b1 2 5 a1 b2 4 6 a2 b3 6 7 a2 b3 6 8 60 等值连接与自然连接的区别:等值连接与自然连接的区别: 等值连接中不要求相等属性值的属性名相同等值连接中不要求相等属性值的属性名相同, 而自然连接要求相等属性值的属性名必须相而自然连接要求相等属性值的属性名必须相 同同,即两关系只有在同名属性才能进行自然即两关系只有在同名属性才能进行自然 连接连接。 等值连接不将重复属性去掉等值连接不将重复属性去掉,而自然
42、连接去而自然连接去 掉重复属性掉重复属性,也可以说也可以说,自然连接是去掉重自然连接是去掉重 复列的等值连接复列的等值连接。 61 (7 7)商操作商操作 运算符:运算符: 运算表达式:运算表达式:R RS S R R和和S S是两个关系是两个关系,Z Z是是R R的属性集合的属性集合,X X是是S S的的 属性集合属性集合,X X是是Z Z的子集的子集,Y=ZY=Z- -X X。R R除以除以S S的商为:的商为: R RS=S=Y Y(R)(R)- -Y Y(Y Y(R) (R) S S) )- -R)R) 62 A B C D a b c d a b e f b c e f e d c
43、d e d e f a b d e C D c d e f A B a b e d 关系关系R 关系关系S RS 63 关系演算的表达能力与关系代数等价,它关系演算的表达能力与关系代数等价,它 是以数理逻辑中的谓词演算为基础的。是以数理逻辑中的谓词演算为基础的。 根据关系演算中变量的不同,可将关系演根据关系演算中变量的不同,可将关系演 算分为算分为: : 基于元组变量的关系演算 (简称元组关系演算) 基于域变量的关系演算 (简称域关系演算) 关系演算关系演算 64 三、关系模型的数据完整性约束三、关系模型的数据完整性约束 数据完整性数据完整性是指数据库中存储的数据是指数据库中存储的数据 是有意
44、义的或正确的。数据完整性约束主是有意义的或正确的。数据完整性约束主 要包括三大类:要包括三大类: 实体完整性 参照完整性 用户定义的完整性 65 1、实体完整性 指关系数据库中的所有表都必须有主码,而且 表中不允许存在如下的记录: 无主码值的记录 主码值相同的记录 关系模型中使用主码作为记录的惟一标识,主 码所包含的属性称为关系的主属性,其他的非 主码属性称为非主属性。在关系数据库中主属 性不能取空值。关系数据库中的空值是特殊的 标量常数,它代表未定义的(不适用的)或者 有意义但目前还处于未知状态的值。 66 2、参照完整性 参照完整性有时也称为引用完整性。 参照完整性是描述实体之间的联系的。
45、 参照完整性一般是指多个实体或表之间的关 联关系。限制一个表中某列的取值受另一个 表的某列的取值范围约束的特点就称为参照 完整性。在关系数据库中用外码(Foreign key,有时也称为外部关键字或外键)来实 现参照完整性。 外码一般在联系实体中,用于表示两个 或多个实体之间的关联关系。 67 例1:学生实体和专业实体可以用下面的关系表示。 学生(学号,姓名,性别,专业号,出生日期) 专业(专业号,专业名) 例2:学生、课程以及学生与课程之间的选课关系可 以用如下三个关系表示: 学生(学号,姓名,性别,专业号,出生日期) 课程(课程号,课程名,学分) 选课(学号,课程号,成绩) 68 3 3、用户定义的完整性、用户定义的完整性 用户定义的完整性也称为用户定义的完整性也称为域完整性或语义域完整性或语义 完整性完整性。用户定义的完整性就是。用户定义的完整性就是针对某一具体针对某一具体 应用领域定义的数据库约束条件应用领域定义的数据库约束条件。 用户定义的完整性实际上就是指明关系中用户定义的完整性实际上就是指明关系中 属性的属性的取值范围取值范围,也就是,也就是属性的域属性的域,即限