1、第第1章章 数据库系统概论数据库系统概论本章要点本章要点 计算机数据管理技术 数据库系统 数据模型 关系的基本概念 关系的规范化理论 数据库的设计方法1.1.1 数据和数据管理数据和数据管理1.数据和信息数据和信息数据是人们用于记录事物情况的物理符号。信息是数据中所包含的意义,是经过加工处理并对人类社会实践和生产活动产生决策影响的数据。数据是信息的载体,但并非任何数据都能成为信息;信息是加工处理后的数据,是数据所表达的内容。信息不随表示它的数据形式而改变,它是反映客观现实世界的知识;而数据则具有任意性,用不同的数据形式可以表示同样的信息。1.1 计算机数据管理技术计算机数据管理技术2.数据处理
2、和数据管理数据处理和数据管理数据处理是指将数据转换成信息的过程,它包括对数据的收集、存储、分类、计算、加工、检索和传输等一系列活动。计算机是一个具有程序执行能力的数据处理工具。数据管理是指数据的收集、组织、存储、检索和维护等操作,这些操作是数据处理的中心环节,是任何数据处理业务中不可缺少的部分。1.人工管理阶段人工管理阶段20世纪50年代中期以前,数据管理是以人工管理方式进行的。数据管理的特点如下:(1)数据不保存。(2)由应用程序管理数据。(3)数据有冗余,无法实现共享。(4)数据对应用程序不具有独立性。1.1.2 计算机数据管理技术的发展计算机数据管理技术的发展2.文件管理阶段文件管理阶段
3、20世纪50年代后期至60年代后期,计算机开始大量用于数据管理。数据处理应用程序利用操作系统的文件管理功能,将相关数据按一定的规则构成文件,通过文件系统对文件中的数据进行存取和管理,实现数据的文件管理方式。其特点可概括为如下两点。数据可以长期保存。数据对应用程序有一定的独立性。当数据量增加、使用数据的用户越来越多时,文件管理便不能适应更有效地使用数据的需要了,其症结表现在3个方面。(1)数据的共享性差、冗余度大,容易造成数据不一致。(2)数据独立性差。(3)数据之间缺乏有机的联系,缺乏对数据的统一控制和管理。3.数据库管理阶段数据库管理阶段20世纪60年代后期,数据管理技术在文件管理的基础上发
4、展到数据库管理。数据库(Database,DB)是按一定的组织方式存储起来的、相互关联的数据集合。在数据库管理阶段,由一种叫做数据库管理系统(Database Management System,DBMS)的系统软件来对数据进行统一的控制和管理。在应用程序和数据库之间保持较高的独立性,数据具有完整性、一致性和安全性高等特点,并且具有充分的共享性,有效地减少了数据冗余。数据库技术的发展先后经历了层次数据库、网状数据库和关系数据库。层次数据库和网状数据库可以看作第1代数据库系统,关系数据库可以看作第2代数据库系统。实际应用中涌现出的许多问题,促使数据库技术不断向前发展,出现了许多不同类型的新型数据
5、管理技术。(1)分布式数据库系统。(2)面向对象数据库系统。(3)多媒体数据库系统。(4)数据仓库技术。(5)大数据技术。1.2.1 数据库系统的组成数据库系统的组成数据库系统是由计算机系统、数据库及其描述机构、数据库管理系统和有关人员组成的具有高度组织性的整体。1计算机硬件系统计算机硬件系统计算机硬件是数据库系统的物质基础,是存储数据库及运行数据库管理系统的硬件设备,主要包括中央处理器(CPU)、存储设备、输入/输出设备及计算机网络环境。1.2 数据库系统数据库系统2计算机软件系统计算机软件系统计算机软件系统包括操作系统、数据库管理系统、系统开发工具及数据库应用程序等。操作系统是所有软件的核
6、心和基础,是其他软件运行的环境和平台。数据库管理系统在操作系统的支持下工作,是数据库系统的核心软件。系统开发工具是指各种数据库应用程序的编程工具。数据库应用系统是指系统开发人员利用某种开发工具开发出来的、面向某一类实际应用的软件系统。3数据库数据库数据库是指数据库系统中按照一定的方式组织的、存储在外部存储设备上的、能被多个用户共享的、与应用程序相互独立的相关数据集合。它不仅包括描述事物的数据本身,而且还包括相关事物之间的联系。4数据库系统的有关人员数据库系统的有关人员数据库系统的有关人员主要有3类:最终用户、数据库应用系统开发人员和数据库管理员(Database Administrator,D
7、BA)。数据库领域公认的标准结构是三级模式结构及二级映射,三级模式包括外模式、概念模式和内模式,二级映射则分别是概念模式到内模式的映射及外模式到概念模式的映射。这种三级模式与二级映射构成了数据库的结构体系,如图所示。1.2.2 数据库的三级模式结构数据库的三级模式结构1数据库的三级模式数据库的三级模式(1)概念模式概念模式又称逻辑模式,或简称为模式,对应于概念级。它是由数据库设计者综合所有用户的数据按照统一的观点构造的全局逻辑结构,是对数据库中全部数据的逻辑结构和特征的总体描述,是所有用户的公共数据视图(全局视图)。(2)外模式外模式又称子模式或用户模式,对应于用户级。它是某个或某几个用户所看
8、到的数据库的数据视图,是与某一应用有关的数据的逻辑表示。外模式是从概念模式导出的一个子集,包含概念模式中允许特定用户使用的那部分数据。(3)内模式内模式又称存储模式或物理模式,对应于物理级。它是数据库中所有数据的内部表示或底层描述,是数据库最低一级的逻辑描述,它描述了数据在存储介质上的存储方式和物理结构,对应着实际存储在外存储介质上的数据库。2三级模式间的二级映射三级模式间的二级映射为了实现这3个抽象级别的联系和转换,数据库管理系统在三级模式之间提供了二级映射,正是这二级映射保证了数据库中的数据具有较高的物理独立性和逻辑独立性。(1)概念模式/内模式的映射(2)外模式/概念模式的映射1数据结构
9、化数据结构化在数据库系统中,每一个数据库都是为某一应用领域服务的,这些应用彼此之间都有着密切的联系。因此,在数据库系统中不仅要考虑某个应用的数据结构,还要考虑整个组织(多个应用)的数据结构。这种数据组织方式使数据结构化了,这就要求在描述数据时不仅要描述数据本身,还要描述数据之间的联系。1.2.3 数据库系统的特点数据库系统的特点2数据共享性高、冗余度低数据共享性高、冗余度低数据共享是指多个用户或应用程序可以访问同一个数据库中的数据,而且数据库管理系统提供并发和协调机制,保证在多个应用程序同时访问、存取和操作数据库数据时,不产生任何冲突,从而保证数据不遭到破坏。数据冗余既浪费存储空间,又容易产生
10、数据不一致等问题。3具有较高的数据独立性具有较高的数据独立性数据独立性是指应用程序与数据库的数据结构之间相互独立。在数据库系统中,因为采用了数据库的三级模式结构,保证了数据库中数据的独立性。在数据存储结构改变时,不影响数据的全局逻辑结构,这样保证了数据的物理独立性。在全局逻辑结构改变时,不影响用户的局部逻辑结构及应用程序,这样就保证了数据的逻辑独立性。4有统一的数据控制功能有统一的数据控制功能数据库管理系统提供了一套有效的数据控制手段,包括数据安全性控制、数据完整性控制、数据库的并发控制和数据库的恢复等,增强了多用户环境下数据的安全性和一致性保护。在数据库技术中,用数据模型(Data Mode
11、l)来对现实世界中的数据进行抽象和表示。1.3 数据模型数据模型数据结构、数据操作及数据的完整性约束也被称为数据模型的3个组成要素。1.3.1 数据模型的组成要素数据模型的组成要素1数据结构数据结构数据结构研究数据之间的组织形式(数据的逻辑结构)、数据的存储形式(数据的物理结构)及数据对象的类型等。存储在数据库中的对象类型的集合是数据库的组成部分。在数据库系统中,通常按照其数据结构的类型来命名数据模型。例如,层次结构、网状结构和关系结构的数据模型分别命名为层次模型、网状模型和关系模型。2数据操作数据操作数据操作用于描述系统的动态特性,是指对数据库中的各种数据所允许执行的操作的集合,包括操作及有
12、关的操作规则。数据库主要有查询和更新(包括插入、删除和修改等)两大类操作。数据模型必须定义这些操作的确切含义、操作符号、操作规则(如优先级)及实现操作的语言。3数据的完整性约束数据的完整性约束数据的完整性约束是一组完整性规则的集合。数据模型应该反映和规定数据必须遵守的、基本的、通用的完整性约束。此外,数据模型还应该提供定义完整性约束条件的机制,以反映具体所涉及的数据必须遵守的、特定的语义约束条件。1.3.2 数据抽象的过程数据抽象的过程数据模型是对现实世界进行抽象和转换的结果,这一过程如图所示。1对现实世界的抽象对现实世界的抽象计算机处理的对象是现实世界中的客观事物,在对其实施处理的过程中,首
13、先应了解和熟悉现实世界,从对现实世界的调查和观察中抽象出大量描述客观事物的事实,再对这些事实进行整理、分类和规范,进而将规范化的事实数据化,最终实现由数据库系统存储和处理。2观念世界中的概念模型观念世界中的概念模型概念模型的特征是按用户需求观点对数据进行建模,表达了数据的全局逻辑结构,是系统用户对整个应用项目涉及的数据的全面描述。概念模型主要用于数据库设计,它独立于实现时的数据库管理系统。概念模型的表示方法很多,目前较常用的是E-R模型。3机器世界中的逻辑模型和物理模型机器世界中的逻辑模型和物理模型在选定数据库管理系统后,就要将E-R图表示的概念模型转换为具体的数据库管理系统支持的逻辑模型。通
14、常,也把数据的逻辑模型直接称为数据模型。数据库系统中主要的逻辑模型有层次模型、网状模型和关系模型。物理模型是对数据最底层的抽象,用以描述数据在物理存储介质上的组织结构,与具体的数据库管理系统、操作系统和硬件有关。1实体与实体集实体与实体集实体(Entity)是现实世界中任何可以相互区分和识别的事物,它可以是能触及的客观对象,还可以是抽象的事件。性质相同的同类实体的集合称为实体集(Entity Set)。1.3.3 概念模型概念模型2属性属性每个实体都具有一定的特征或性质,这样才能区分一个个实体。实体的特征称为属性(Attribute),一个实体可用若干属性来描述,能唯一标识实体的属性或属性集称
15、为实体标识符。3类型与值类型与值属性和实体都有类型(Type)和值(Value)之分。属性类型就是属性名及其取值类型,属性值就是属性所取的具体值。属性类型是个变量,属性值是变量所取的值,而值域是变量的取值范围。实体类型就是实体的结构描述,通常是实体名和属性名的集合。具有相同属性的实体,有相同的实体类型。实体值是一个具体的实体,是属性值的集合。4实体间的联系实体间的联系(1)一对一联系如果对于实体集A中的每一个实体,实体集B中最多只有一个实体与之联系,反之亦然,则称实体集A与实体集B具有一对一联系,记为1 1。(2)一对多联系如果对于实体集A中的每一个实体,实体集B中可以有多个实体与之联系,反之
16、,对于实体集B中的每一个实体,实体集A中至多只有一个实体与之联系,则称实体集A与实体集B有一对多联系,记为1 n。(3)多对多联系如果对于实体集A中的每一个实体,实体集B中可以有多个实体与之联系,而对于实体集B中的每一个实体,实体集A中也可以有多个实体与之联系,则称实体集A与实体集B之间有多对多联系,记为m n。5E-R图图E-R图是用一种直观的图形方式建立现实世界中实体及其联系模型的工具,也是数据库设计的一种基本工具。E-R图用矩形框表示现实世界中的实体,用菱形框表示实体间的联系,用椭圆形框表示实体和联系的属性。下图用来表示读者实体和图书实体的多对多联系模型。1层次模型层次模型层次模型(Hi
17、erarchical Model)用树形结构来表示实体及其之间的联系。根据树形结构的特点,建立数据的层次模型需要满足如下两个条件。有一个结点没有父结点,这个结点即根结点。其他结点有且仅有一个父结点。1.3.4 逻辑模型逻辑模型2网状模型网状模型网状模型(Network Model)用以实体类型为结点的有向图来表示各实体及其之间的联系。其特点如下。可以有一个以上的结点无父结点。至少有一个结点有多于一个的父结点。3关系模型关系模型关系模型(Relational Model)用二维表格来表示实体及其相互之间的联系。在关系模型中,把实体集看成一个二维表,每一个二维表称为一个关系。每个关系均有一个名字,
18、称为关系名。1)元组二维表格的每一行在关系中称为元组(Tuple),相当于表的一条记录(Record)。二维表格的一行描述了现实世界中的一个实体。2)属性二维表格的每一列在关系中称为属性(Attribute),相当于记录中的一个字段(Field)或数据项。每个属性有一个属性名,一个属性在其每个元组上的值称为属性值,因此,一个属性包括多个属性值,只有在指定元组的情况下,属性值才是确定的。同时,每个属性有一定的取值范围,称为该属性的值域。3)关系模式关系模型是由若干个关系组成的,关系用关系模式(Relational Schema)来描述。关系模式就相当于前面提到的实体类型,它代表了关系的结构,也就
19、是二维表格的框架(表头)。对于教师关系可以表示为:教师(编号,姓名,性别,出生日期,职称,基本工资,研究方向)4)关键字关系中能唯一区分、确定不同元组的单个属性或属性组合,称为该关系的一个关键字。关键字又称为键或码(Key)。单个属性组成的关键字称为单关键字,多个属性组合的关键字称为组合关键字。需要强调的是,关键字的属性值不能取“空值”,因为“空值”无法唯一地区分、确定元组。所谓“空值”,就是“不知道”或“不确定”的值。关系中能够作为关键字的属性或属性组合可能不是唯一的。凡在关系中能够唯一区分、确定不同元组的属性或属性组合,称为候选关键字(Candidate Key)。在候选关键字中选定一个作
20、为关键字,称为该关系的主关键字或主键(Primary Key)。关系中主关键字是唯一的。5)外部关键字如果关系中某个属性或属性组合是另一个关系的关键字,则称这样的属性或属性组合为本关系的外部关键字或外键(Foreign Key)。在关系数据库中,用外部关键字表示两个表之间的联系。1.4.1 关系的数学定义关系的数学定义1关系的性质关系的性质通常将一个没有重复行、重复列,并且每个行列的交叉点只有一个基本数据的二维表格看成一个关系。二维表格包括表头和表中的内容,相应地,关系包括关系模式和记录的值,表包括表结构(记录类型)和表的记录,而满足一定条件的规范化关系的集合,就构成了关系模型。1.4 关系的
21、基本概念关系的基本概念关系是一种规范化了的二维表格。在关系模型中,对关系作了种种规范性限制,关系具有以下6条性质。关系必须规范化,每一个属性都必须是不可再分的数据项。每一列中的分量是同一类型的数据,来自同一个域。在同一关系中不允许出现相同的属性名。关系中不允许有完全相同的元组。在同一关系中元组的次序无关紧要。在同一关系中属性的次序无关紧要。2.关系的集合表示关系的集合表示利用集合论的观点,关系是元组的集合,每个元组包含的属性数目相同,其中属性的个数称为元组的维数。将关系与二维表进行比较可以看出两者存在简单的对应关系,关系模式对应一个二维表的表头,而关系的一个元组就是二维表的一行,所有元组组成的
22、集合就是二维表的内容。例如,职工关系R(E1,张一,女),(E2,王二,男),(E3,李三,男),(E3,成四,女),相应的二维表格表示形式如表所示。编号姓名性别E1张一女E2王二男E3李三男E4成四女职工关系职工关系R1传统的关系运算传统的关系运算(1)并(Union)设R和S同为n元关系,且相应的属性取自同一个域,则R和S的并也是一个n元关系,记作RS。RS包含了所有分属于R和S或同属于R和S的元组。因为集合中不允许有重复元素,因此,同时属于R和S的元组在RS中只出现一次。1.4.2 关系运算关系运算(2)差(Difference)设R和S同为n元关系,且相应的属性取自同一个域,则R和S的
23、差也是一个n元关系,记作RS。RS包含了所有属于R但不属于S的元组。(3)交(Intersection)设R和S同为n元关系,且相应的属性取自同一个域,则R和S的交也是一个n元关系,记作RS。RS包含了所有同属于R和S的元组。实际上,交运算可以通过差运算的组合来实现,如ABA(AB)或B(BA)。(4)广义笛卡尔积设R是一个包含m个元组的j元关系,S是一个包含n个元组的k元关系,则R和S的广义笛卡尔积是一个包含mn个元组的jk元关系,记作RS,并定义RS(r1,r2,rj,s1,s2,sk)|(r1,r2,rj)R且s1,s2,skS即RS的每个元组的前j个分量是R中的一个元组,而后k个分量是
24、S中的一个元组。例1-1 设R(a1,b1,c1),(a1,b2,c2),(a2,b2,c1),S(a1,b2,c2),(a1,b3,c2),(a2,b2,c1),求RS,RS,RS,RS。根据运算规则,有如下结果。RS(a1,b1,c1),(a1,b2,c2),(a2,b2,c1),(a1,b3,c2)RS(a1,b1,c1)RS(a1,b2,c2),(a2,b2,c1)RS(a1,b1,c1,a1,b2,c2),(a1,b1,c1,a1,b3,c2),(a1,b1,c1,a2,b2,c1),(a1,b2,c2,a1,b2,c2),(a1,b2,c2,a1,b3,c2),(a1,b2,c2,
25、a2,b2,c1),(a2,b2,c1,a1,b2,c2),(a2,b2,c1,a1,b3,c2),(a2,b2,c1,a2,b2,c1)RS是一个包含9个元组的6元关系。2专门的关系运算专门的关系运算(1)选择(Selection)设RR(A1,A2,An)是一个n元关系,F是关于元组的一个条件,R中所有满足F条件的元组组成的子关系称为R的一个选择,记作F(R),并定义F(R)(a1,a2,an)|(a1,a2,an)R且(a1,a2,an)满足条件F简言之,对R关系按一定规则筛选一个子集的过程就是对R施加了一次选择运算。)()(m21iii1miA2iA1iAAAARR,miiiAAA,2
26、1)()(21RmiiiAAA,(2)投影(Projection)设RR(A1,A2,An)是一个n元关系,i1,i2,im是1,2,n的一个子集,并且i1i2im,定义属性上的一个投影,即是R在是R中只保留属性miiiAAA,21的新的关系。(3)连接(Join)连接是从两个关系的笛卡尔积中选取属性间满足一定条件的元组,记作其中A和B分别为R和S上维数相等且可比的属性组,是比较运算符。连接运算从R和S的笛卡尔积RS中选取(R关系)在A属性组上的值与(S关系)在B属性组上值满足比较关系的元组。RS连接运算中有两种最为重要也最为常用的连接,一种是等值连接,另一种是自然连接。为“”的连接运算称为等
27、值连接,它是从关系R与S的笛卡尔积中选取A和B属性值相等的那些元组。自然连接是一种特殊的等值连接,它要求在结果中把重复的属性去掉。一般的连接操作是从行的角度进行运算,但自然连接还需要取消重复列,所以是同时从行和列的角度进行运算。例1-2 一个关系数据库由职工关系E和工资关系W组成,关系模式如下。E(编号,姓名,性别)W(编号,基本工资,标准津贴,业绩津贴)写出实现以下功能的关系运算表达式。查询全体男职工的信息。查询全体男职工的编号和姓名。查询全体职工的基本工资、标准津贴和业绩津贴。在关系模型中,数据完整性包括实体完整性(Entity Integrity)、参照完整性(Referential I
28、ntegrity)及用户自定义完整性(User defined Integrity)3种。1.4.3 关系的完整性约束关系的完整性约束1实体完整性实体完整性现实世界中的实体是可区分的,即它们具有某种唯一性标识。相应地,关系模型中以主关键字作为唯一性标识。实体完整性就是指关系的主属性不能取“空值”,并且不允许两个元组的关键字值相同。也就是一个二维表中没有两个完全相同的行,因此实体完整性也称为行完整性。2参照完整性参照完整性设F是关系R的一个或一组属性,但不是关系R的关键字,如果F与关系S的主关键字Ks相对应,则称F是关系R的外部关键字,并称关系R为参照关系(Referencing Relatio
29、n),关系S为被参照关系(Referenced Relation)或目标关系(Target Relation)。参照完整性规则就是定义外部关键字与主关键字之间的引用规则,即对于R中每个元组在F上的值必须取“空值”或等于S中某个元组的主关键字值。3用户自定义完整性用户自定义完整性实体完整性和参照完整性适用于任何关系数据库系统。除此之外,不同的关系数据库系统根据其应用环境的不同,往往还需要一些特殊的约束条件,用户自定义完整性就是针对某一具体关系数据库的约束条件,它反映某一具体应用所涉及的数据必须满足的语义要求,如规定关系中某一属性的取值范围。1.5 关系的规范化理论关系的规范化理论供应商代码供应商
30、名称联系人商品名称订货数量单价S001 华科电子有限公司施宾彬笔记本计算机109800.00S001 华科电子有限公司施宾彬激光打印机52800.00S002 湘江计算机外设公司方胜力笔记本计算机510200.00S003 韦力电子实业公司周昌 喷墨打印机5480.00S003 韦力电子实业公司周昌 交换机28500.00一个不好的关系模式一个不好的关系模式表中关系存在如下3方面的问题。插入异常 删除异常 数据冗余与更新异常 1.5.1 函数依赖的基本概念函数依赖的基本概念定义定义1 设有关系模式R(A1,A2,An)(A1,A2,An是关系R的属性),且XA1,A2,An,YA1,A2,An
31、,即X和Y是R的两个属性组,又r是R的任一具体关系,如果对r的任意两个元组t1、t2,如果当t1(X)t2(X)成立时,总有t1(Y)t2(Y),则称X函数决定Y,或Y函数依赖于X,记为XY。1.5.1 函数依赖的基本概念函数依赖的基本概念定义定义2 R、X、Y如定义1所设,如果XY成立,但对X的任意真子集X1,都有X1Y不成立,称Y完全函数依赖于X,否则,称Y部分函数依赖于X。定义定义3 设X、Y、Z是关系R的不同属性集,若XY(但YX不成立),YZ,称X传递决定Z,或称Z传递函数依赖于X。1.5.2 关系模式的范式关系模式的范式1.1.主属性与非主属性主属性与非主属性1)1)候选关键属性和
32、关键属性候选关键属性和关键属性定义定义4 设关系模式R(A1,A2,An),A1,A2,An是R的属性,X是R的一个属性组,如果(1)X(A1,A2,An)。(2)对于X的任意真子集X1,X1(A1,A2,An)不成立。则称属性组X是关系模式R的一个候选关键属性。2)2)主属性和非主属性主属性和非主属性定义定义5 设Ai是关系R的一个属性,若Ai属于R的某个候选关键属性,称Ai是R的主属性,否则,称Ai为非主属性。1.5.2 关系模式的范式关系模式的范式2.2.第第1 1范式范式定义定义6 当关系模式R的所有属性都不能分解为更基本的数据单位时,称R是满足第1范式的,简记为1NF。例如,如果员工
33、的关系中有一个工资属性,而工资又由更基本的两个数据项基本工资和岗位工资组成,则这个员工的关系模式就不满足1NF。3.3.第第2 2范式范式定义定义7 如果关系模式R满足第1范式,并且R的所有非主属性都完全依赖于R的每一个候选关键属性,称R满足第2范式,简记为2NF。1.5.2 关系模式的范式关系模式的范式4.4.第第3 3范式范式定义定义8 如果关系R满足第1范式,且R的所有非主属性都不传递函数依赖于R的每一个候选关键字,那么称R满足第3范式,简记为3NF。定理定理1 若关系模式R符合3NF条件,则R一定符合2NF条件。5.Boyce-Codd5.Boyce-Codd范式范式定义定义9 如果关
34、系R满足第1范式,且R的所有属性都不传递函数依赖于R的每一个候选关键字,那么称R满足Boyce-Codd范式,简记为BCNF。BCNF是比3NF更强的规范。定理定理2 若关系R符合BCNF条件,则R一定符合3NF条件,但反过来却不一定成立。1.5.3 关系模式的分解关系模式的分解1.1.关系模式分解的一般问题关系模式分解的一般问题所谓关系模式的分解,就是对原有关系在不同的属性上进行投影,从而将原有关系分解为两个或两个以上的含有较少属性的多个关系。2.3NF2.3NF分解分解(1)如果R不满足1NF条件,先对其分解,使其满足1NF。对R进行1NF分解的方法不是采用投影,而是直接将其复合属性进行分
35、解,用分解后的基本属性集取代原来的属性,以获得1NF。1.5.3 关系模式的分解关系模式的分解例例1-3 将R(员工号,姓名,工资)进行分解,使其满足1NF条件。假定R的工资属性由基本工资和岗位工资组成,直接用属性集(基本工资,岗位工资)取代工资属性,得到新关系R_NEW(员工号,姓名,基本工资,岗位工资),R_NEW满足1NF。(2)R符合1NF条件但不符合2NF条件时,分解R使其满足2NF。1.6.1 数据库设计的基本步骤数据库设计的基本步骤考虑数据库及其应用系统开发全过程,可以将数据库设计分为6个阶段:需求分析、概念设计、逻辑设计、物理设计、数据库实施、数据库运行和维护。1需求分析阶段需
36、求分析阶段需求分析的任务是通过详细调查现实世界要处理的对象(组织、部门、行业等),充分了解用户单位目前的工作状况,明确用户的各种需求,然后在此基础上确定新系统的功能。1.6 数据库的设计方法数据库的设计方法2概念设计阶段概念设计阶段将需求分析得到的用户需求抽象为信息结构即概念模型的过程就是概念设计,它是整个数据库设计的关键。在需求分析阶段所得到的应用需求应该首先抽象为概念模型,以便更好、更准确地用某一数据库管理系统实现这些需求。概念模型是各种逻辑模型的共同基础,它比逻辑模型更独立于机器、更抽象,从而更加稳定。描述概念模型的有力工具是E-R图。3逻辑设计阶段逻辑设计阶段数据库逻辑设计是将概念模型
37、转换为逻辑模型,也就是被某个数据库管理系统所支持的数据模型,并对转换结果进行规范化处理。关系数据库的逻辑结构由一组关系模式组成,因而,从概念模型结构到关系数据库逻辑结构的转换就是将E-R图转化为关系模型的过程。4物理设计阶段物理设计阶段数据库在物理设备上的存储结构与存取方法称为数据库的物理结构,它依赖于给定的计算机系统。为一个给定的逻辑模型选取一个最适合应用要求的物理结构的过程,就是数据库的物理设计。5数据库实施阶段数据库实施阶段完成数据库的物理设计之后,就要用数据库管理系统提供的数据定义语言和其他实用程序将数据库逻辑设计和物理设计结果严格地描述出来,成为数据库管理系统可以接收的源代码,再经过
38、调试产生目标代码,然后就可以组织数据入库了,这就是数据库实施阶段。数据库实施阶段包括两项重要的工作,一是数据的载入,二是应用程序的编码和调试。6数据库运行和维护阶段数据库运行和维护阶段数据库系统经过试运行合格后,数据库开发工作就基本完成,即可投入正式运行了。在数据库系统的运行过程中,对数据库设计进行评价、调整、修改等维护工作是一个长期的任务,也是设计工作的继续和提高。在数据库运行阶段,对数据库经常性的维护工作主要是由数据库管理员完成的,它包括数据库的转储和恢复、数据库的安全性与完整性控制、数据库性能的分析和改造、数据库的重组织与重构造。1.1 1联系的转换联系的转换1.6.2 从概念模型到关系模型的转化从概念模型到关系模型的转化2.1 n联系的转化联系的转化3.m n联系的转化联系的转化某大学教学管理系统的E-R图如图所示。1.6.3 数据库设计实例数据库设计实例将5个实体及2个m n联系转化成7个关系模式,具体结构如下。学生(学号,姓名,性别,出生日期,专业名称)课程(课程编号,课程名称,学分)选课(学号,课程编号,平时成绩,考试成绩,总评成绩)教师(教师编号,姓名,性别,职称,学院名称)授课(教师编号,课程编号,评价等级)学院(学院名称,网址,教师人数)专业(专业名称,成立年份,专业简介)