1、v 学生学生-课程模式课程模式 S-T:学生表:学生表:student(Sno,Sname,Ssex,Sage,Sdept)课程表:课程表:Course(Cno,Cname,Cpno,Ccredit)学生选课表:学生选课表:SC(Sno,Cno,Grade改为:改为:学生表:学生表:student(Sno,Sname,Ssex,Sage,Sdept,Cno,Grade)课程表:课程表:Course(Cno,Cname,Cpno,Ccredit)请大家比较这请大家比较这2个数据库的关系模式个数据库的关系模式 西北工业大学明德学院西北工业大学明德学院数据库系统概论数据库系统概论An Introdu
2、ction to Database System第七章第七章 关系数据库的规范化理论关系数据库的规范化理论第第六六章章 关系数据理论关系数据理论6.1 问题的提出问题的提出6.2 规范化规范化6.3 数据依赖的公理系统数据依赖的公理系统*6.4 模式的分解模式的分解6.5 小结小结6.1 问题的提出问题的提出关系数据库逻辑设计关系数据库逻辑设计 针对具体问题,如何构造一个针对具体问题,如何构造一个适合于适合于它的它的数据模式数据模式 数据库逻辑设计的工具数据库逻辑设计的工具关系数据库的关系数据库的规范化理论规范化理论主要内容:主要内容:一、概念回顾(关系模式的形式化定义)一、概念回顾(关系模式
3、的形式化定义)二、什么是数据依赖二、什么是数据依赖三、数据依赖对关系模式影响三、数据依赖对关系模式影响一、概念回顾(关系模式的形式化定义)关系模式的形式化定义)关系模式由五部分组成,即它是一个五元组:关系模式由五部分组成,即它是一个五元组:R(U,D,DOM,F)R:关系名关系名U:组成该关系的属性名集合组成该关系的属性名集合D:属性组属性组U中属性所来自的域中属性所来自的域DOM:属性向域的映象集合属性向域的映象集合F:属性间数据的依赖关系集合属性间数据的依赖关系集合二、什么是数据依赖二、什么是数据依赖1.完整性约束的表现形式完整性约束的表现形式v 限定属性取值范围:例如学生成绩必须在限定属
4、性取值范围:例如学生成绩必须在0-100之间之间v 定义属性定义属性值值间的相互关连(主要体现于值的间的相互关连(主要体现于值的相等与相等与否否),这就是数据依赖,它是),这就是数据依赖,它是数据库模式设计的关键数据库模式设计的关键什么是数据依赖(续)什么是数据依赖(续)2.数据依赖数据依赖v一个关系内部一个关系内部属性与属性属性与属性之间的约束关系之间的约束关系v现实世界属性间相互联系的抽象现实世界属性间相互联系的抽象v数据内在的性质数据内在的性质v语义语义的体现的体现什么是数据依赖(续)什么是数据依赖(续)3.数据依赖的类型数据依赖的类型v函数依赖(函数依赖(Functional Depe
5、ndency,简记为简记为FD)v多值依赖(多值依赖(Multivalued Dependency,简记为简记为MVD)三、三、数据依赖对关系模式的影响数据依赖对关系模式的影响例例1建立一个描述学校教务的数据库:建立一个描述学校教务的数据库:学生的学号(学生的学号(Sno)、)、所在系(所在系(Sdept)系主任姓名(系主任姓名(Mname)、)、课程号(课程号(Cno)成绩(成绩(Grade)单一单一的关系模式的关系模式:Student U Sno,Sdept,Mname,Cno,Grade 数据依赖对关系模式的影响(续)数据依赖对关系模式的影响(续)属性组属性组U上的一组函数依赖上的一组函
6、数依赖F:F Sno Sdept,Sdept Mname,(Sno,Cno)Grade SnoCnoSdeptMnameGrade关系模式关系模式Student中存在的问题中存在的问题1 1、数据冗余太大:系负责人的名字,重复出现的次数跟、数据冗余太大:系负责人的名字,重复出现的次数跟每个学生每一门功课出现的次数一样多。每个学生每一门功课出现的次数一样多。2 2、插入异常:一个系如果还没有学生,则无法将这个系、插入异常:一个系如果还没有学生,则无法将这个系及其负责人的信息存入数据库及其负责人的信息存入数据库3 3、删除异常:一个系所有的学生都毕业了的话,学生删、删除异常:一个系所有的学生都毕业
7、了的话,学生删除后,有关系及其负责人的信息也全部被删除。除后,有关系及其负责人的信息也全部被删除。数据依赖对关系模式的影响(续)数据依赖对关系模式的影响(续)结论:结论:nStudent关系模式不是一个好的模式。关系模式不是一个好的模式。n“好好”的模式:的模式:不会发生插入异常、删除异常、更新异常,不会发生插入异常、删除异常、更新异常,数据冗余应尽可能少数据冗余应尽可能少原因:原因:由存在于模式中的由存在于模式中的某些数据依赖某些数据依赖引起的引起的解决方法:解决方法:通过通过分解分解关系模式来消除其中不合适关系模式来消除其中不合适 的数据依赖的数据依赖分解关系模式分解关系模式v把这个单一模
8、式分成把这个单一模式分成3个关系模式:个关系模式:S(Sno,Sdept,Sno Sdept);SC(Sno,Cno,Grade,(,(Sno,Cno)Grade);DEPT(Sdept,Mname,Sdept Mname)6.2 规范化规范化 规范化理论规范化理论正是用来改造关系模式,通过分解关系模式来正是用来改造关系模式,通过分解关系模式来消除其中不合适的数据依赖,以解决插入异常、删除异常、消除其中不合适的数据依赖,以解决插入异常、删除异常、更新异常和数据冗余问题。更新异常和数据冗余问题。6.2 规范化规范化6.2.1 函数依赖函数依赖6.2.2 码码6.2.3 范式范式6.2.4 2NF
9、6.2.5 3NF6.2.6 BCNF6.2.7 多值依赖多值依赖6.2.8 4NF6.2.9 规范化小结规范化小结6.2.1 函数依赖函数依赖v函数依赖函数依赖v平凡函数依赖与非平凡函数依赖平凡函数依赖与非平凡函数依赖v完全函数依赖与部分函数依赖完全函数依赖与部分函数依赖v传递函数依赖传递函数依赖一、函数依赖一、函数依赖定义定义6.1:设:设R(U)是一个属性集是一个属性集U上的关系模式,上的关系模式,X和和Y是是U的子集。的子集。若对于若对于R(U)的的任意任意一个可能的关系一个可能的关系r,r中不可能存在两中不可能存在两个元组在个元组在X上的属性值相等,上的属性值相等,而在而在Y上的属性
10、值不等,上的属性值不等,则称则称“X函数确定函数确定Y”或或 “Y函数依赖于函数依赖于X”,记作记作XY。说明说明 1.所有关系实例所有关系实例均要满足均要满足2.语义范畴语义范畴的概念的概念如:年龄函数依赖于姓名,只有在没有重名的语义如:年龄函数依赖于姓名,只有在没有重名的语义前提下。前提下。3.数据库设计者可以对现实世界作强制的规定数据库设计者可以对现实世界作强制的规定二、平凡函数依赖与非平凡函数依赖二、平凡函数依赖与非平凡函数依赖在关系模式在关系模式R(U)中,对于中,对于U的子集的子集X和和Y,如果如果XY,但,但Y X,则称则称XY是是非平凡的函数依赖非平凡的函数依赖若若XY,但,但
11、Y X,则称则称XY是是平凡的函数依赖平凡的函数依赖v 例:在关系例:在关系SC(Sno,Cno,Grade)中,中,非平凡函数依赖:非平凡函数依赖:(Sno,Cno)Grade 平凡函数依赖:平凡函数依赖:(Sno,Cno)Sno (Sno,Cno)Cno平凡函数依赖与非平凡函数依赖(续)平凡函数依赖与非平凡函数依赖(续)若若XY,则,则X称为这个函数依赖的决定属性组,也称为这个函数依赖的决定属性组,也称为决定因素(称为决定因素(Determinant)。若若XY,YX,则记作,则记作XY。若若Y不函数依赖于不函数依赖于X,则记作,则记作XY。三、完全函数依赖与部分函数依赖三、完全函数依赖与
12、部分函数依赖定义定义6.2 在在R(U)中,如果中,如果XY,并且对于并且对于X的任何一个真的任何一个真子集子集X,都有都有X Y,则称则称Y对对X完全函数依赖完全函数依赖,记,记作作 X F Y。(。(X必为主码或候选码)必为主码或候选码)若若XY,但,但Y不完全函数依赖于不完全函数依赖于X,则称则称Y对对X部分函数部分函数依赖依赖,记作,记作X P Y。完全函数依赖与部分函数依赖(续)完全函数依赖与部分函数依赖(续)例例1 中中(Sno,Cno)Grade是完全函数依赖是完全函数依赖,(Sno,Cno)Sdept是部分函数依赖是部分函数依赖 因为因为Sno Sdept成立,且成立,且Sno
13、是(是(Sno,Cno)的真子集的真子集 FP四、传递函数依赖四、传递函数依赖定义定义6.3 在在R(U)中,如果中,如果XY,(Y X),YX YZ,则称则称Z对对X传递函数依赖传递函数依赖。记为:记为:X Z 注注:如果如果YX,即即XY,则,则Z直接依赖于直接依赖于X。例例:在关系在关系Std(Sno,Sdept,Mname)中,有:中,有:Sno Sdept,Sdept Mname Mname传递函数依赖于传递函数依赖于Sno传递6.2 规范化规范化6.2.1 函数依赖函数依赖6.2.2 码码6.2.3 范式范式6.2.4 2NF6.2.5 3NF6.2.6 BCNF6.2.7 多值依
14、赖多值依赖6.2.8 4NF6.2.9 规范化小结规范化小结6.2.2 码码定义定义6.4 设设K为为R中的属性或属性组合。若中的属性或属性组合。若K U,则则K称为称为R的的侯选码侯选码(Candidate Key)。)。若候选码多于一个,则选定其中的一个做为若候选码多于一个,则选定其中的一个做为主码主码(Primary Key)。)。F码(续)码(续)v 主属性与非主属性主属性与非主属性 包含在任何一个候选码中的属性包含在任何一个候选码中的属性,称为主属性(,称为主属性(Prime attribute)不包含在任何码中的属性称为非主属性(不包含在任何码中的属性称为非主属性(Nonprime
15、 attribute)或非码属性()或非码属性(Non-key attribute)v 全码全码 整个属性组是码,称为全码(整个属性组是码,称为全码(All-key)码(续)码(续)例例2 关系模式关系模式S(Sno,Sdept,Sage),单个属性,单个属性Sno是码,是码,SC(Sno,Cno,Grade)中,()中,(Sno,Cno)是码)是码例例3 关系模式关系模式R(P,W,A)P:演奏者:演奏者 W:作品:作品 A:听众:听众 一个演奏者可以演奏多个作品一个演奏者可以演奏多个作品 某一作品可被多个演奏者演奏某一作品可被多个演奏者演奏 听众可以欣赏不同演奏者的不同作品听众可以欣赏不同
16、演奏者的不同作品 码为码为(P,W,A),即,即All-Key 外部码外部码定义定义6.5 关系模式关系模式 R 中属性或属性组中属性或属性组X 并非并非 R的码,但的码,但 X 是另一个关系模式的码,则称是另一个关系模式的码,则称 X 是是R 的的外部码外部码(Foreign key)也称外码也称外码v 如在如在SC(Sno,Cno,Grade)中,)中,Sno不是码,但不是码,但Sno是关系模式是关系模式S(Sno,Sdept,Sage)的码,则)的码,则Sno是关系模式是关系模式SC的外部码的外部码 v 主码与外部码一起提供了表示关系间联系的手段主码与外部码一起提供了表示关系间联系的手段
17、6.2 规范化规范化6.2.1 函数依赖函数依赖6.2.2 码码6.2.3 范式范式6.2.4 2NF6.2.5 3NF6.2.6 BCNF6.2.7 多值依赖多值依赖6.2.8 4NF6.2.9 规范化小结规范化小结6.2.3 范式范式v 范式是符合某一种级别的关系模式的集合范式是符合某一种级别的关系模式的集合v 关系数据库中的关系必须满足一定的要求。满足不同程度关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式要求的为不同范式v 范式的种类:范式的种类:第一范式第一范式(1NF)第二范式第二范式(2NF)第三范式第三范式(3NF)BC范式范式(BCNF)第四范式第四范式(4
18、NF)第五范式第五范式(5NF)6.2.3 范式范式v各种范式之间存在联系:各种范式之间存在联系:v某一关系模式某一关系模式R为第为第n范式,可简记为范式,可简记为RnNF。v 一个低一级范式的关系模式,通过一个低一级范式的关系模式,通过模式分解模式分解可以转换为若可以转换为若干个高一级范式的关系模式的集合,这种过程就叫干个高一级范式的关系模式的集合,这种过程就叫规范化规范化 NF5NF4BCNFNF3NF2NF16.2 规范化规范化6.2.1 函数依赖函数依赖6.2.2 码码6.2.3 范式范式6.2.4 2NF6.2.5 3NF6.2.6 BCNF6.2.7 多值依赖多值依赖6.2.8 4
19、NF6.2.9 规范化小结规范化小结6.2.4 2NFv数据库设计的目标就是要设计合适的数据模式,数据库设计的目标就是要设计合适的数据模式,并将数据存放在一个并将数据存放在一个最佳位置最佳位置。v例:在组织人员的电话号码、邮件地址这样的信例:在组织人员的电话号码、邮件地址这样的信息时,应该确保将其保存在合适的位置,如通讯息时,应该确保将其保存在合适的位置,如通讯录中。设想如果将朋友的信息放在菜谱里,则只录中。设想如果将朋友的信息放在菜谱里,则只有在查找菜谱时才会找到信息。有在查找菜谱时才会找到信息。6.2.4 2NFv 1NF的定义的定义如果一个关系模式如果一个关系模式R的所有属性都是的所有属
20、性都是不可分的基本数据项不可分的基本数据项,则则R1NFv 第一范式是对关系模式的第一范式是对关系模式的最起码最起码的要求。不满足第一范式的要求。不满足第一范式的数据库模式不能称为关系数据库的数据库模式不能称为关系数据库v 但是满足第一范式的关系模式并不一定是一个好的关系模但是满足第一范式的关系模式并不一定是一个好的关系模式式2NF(续)(续)(Sno,Cno)F Grade Sno Sdept (Sno,Cno)P Sdept Sno Sloc (Sno,Cno)P Sloc Sdept Sloc例例4 关系模式关系模式 S-L-C(Sno,Sdept,Sloc,Cno,Grade),其中其
21、中Sloc为学生住处,假设每个系的学生住在同一个地方。为学生住处,假设每个系的学生住在同一个地方。函数依赖包括哪些:函数依赖包括哪些:?2NF(续)(续)v S-L-C的码为的码为(Sno,Cno)v S-L-C满足第一范式。满足第一范式。v 非主属性非主属性Sdept和和Sloc部分函数依赖于码部分函数依赖于码(Sno,Cno)SnoCnoGradeSdeptSlocS-L-CS-L-C不是一个好的关系模式(续)不是一个好的关系模式(续)1 1、数据冗余太大:系宿舍信息,重复出现的次数跟每个学、数据冗余太大:系宿舍信息,重复出现的次数跟每个学生每一门功课出现的次数一样多。生每一门功课出现的次
22、数一样多。2 2、插入异常:一个系如果还没有学生,则无法将这个系及、插入异常:一个系如果还没有学生,则无法将这个系及其负责人的信息存入数据库其负责人的信息存入数据库3 3、删除异常:一个系所有的学生都毕业了的话,学生删除、删除异常:一个系所有的学生都毕业了的话,学生删除后,有关系及其负责人的信息也全部被删除。后,有关系及其负责人的信息也全部被删除。S-L-C不是一个好的关系模式(续)不是一个好的关系模式(续)v 原因原因 Sdept、Sloc部分函数依赖于码。部分函数依赖于码。v 解决方法解决方法 S-L-C分解为两个关系模式,以消除这些部分函数依赖分解为两个关系模式,以消除这些部分函数依赖
23、SC(Sno,Cno,Grade)S-L(Sno,Sdept,Sloc)2NF(续)(续)函数依赖图函数依赖图:SnoCnoGradeSCS-LSnoSdeptSlocv关系模式关系模式SC的码为(的码为(Sno,Cno)v关系模式关系模式S-L的码为的码为Snov这样非主属性对码都是完全函数依赖这样非主属性对码都是完全函数依赖 2NF(续)(续)v2NF的定义的定义定义定义7.6 若若R1NF,且每一个,且每一个非主属性完全非主属性完全函数依赖于函数依赖于码,则码,则R2NF。例:例:S-L-C(Sno,Sdept,Sloc,Cno,Grade)1NF S-L-C(Sno,Sdept,Slo
24、c,Cno,Grade)2NF SC(Sno,Cno,Grade)2NF S-L(Sno,Sdept,Sloc)2NF 2NF(续)(续)v 采用投影分解法将一个采用投影分解法将一个1NF的关系分解为多个的关系分解为多个2NF的关系,可以在一定的关系,可以在一定程度上减轻原程度上减轻原1NF关系中存在的插入异常、删除异常、数据冗余度大、关系中存在的插入异常、删除异常、数据冗余度大、修改复杂等问题。修改复杂等问题。v 将一个将一个1NF关系分解为多个关系分解为多个2NF的关系,并不能完全消除关系模式中的的关系,并不能完全消除关系模式中的各种异常情况和数据冗余。还存在:各种异常情况和数据冗余。还存
25、在:1 1、插入异常:一个系如果还没有学生,则无法将这个系及其宿舍的信息存、插入异常:一个系如果还没有学生,则无法将这个系及其宿舍的信息存入数据库入数据库2 2、删除异常:一个系所有的学生都毕业了的话,学生删除后,有关、删除异常:一个系所有的学生都毕业了的话,学生删除后,有关“系系”及其宿舍的信息也全部被删除。及其宿舍的信息也全部被删除。v 2NF消除了非主属性对码的部分函数依赖消除了非主属性对码的部分函数依赖6.2 规范化规范化6.2.1 函数依赖函数依赖6.2.2 码码6.2.3 范式范式6.2.4 2NF6.2.5 3NF6.2.6 BCNF6.2.7 多值依赖多值依赖6.2.8 4NF
26、6.2.9 规范化小结规范化小结 6.2.5 3NFv3NF的定义的定义定义定义6.7 关系模式关系模式R 中若不存在这样的码中若不存在这样的码X、属性、属性组组Y及非主属性及非主属性Z(Z Y),使得使得XY,YZ成立,成立,Y X,则称,则称R 3NF。n若若R3NF,则每一个,则每一个非主属性非主属性既不部分依赖既不部分依赖于码于码也不也不传递依赖传递依赖于码。于码。3NF(续)(续)例:例:2NF关系模式关系模式S-L(Sno,Sdept,Sloc)中中 函数依赖:函数依赖:SnoSdept Sdept Sno SdeptSloc 可得:可得:SnoSloc,即,即S-L中存在非主属性
27、对码的传递函数依中存在非主属性对码的传递函数依 赖,赖,S-L 3NF传递 3NF(续)(续)函数依赖图:S-LSnoSdeptSloc3NF(续)(续)v 解决方法解决方法 采用投影分解法,把采用投影分解法,把S-L分解为两个关系模式,以消分解为两个关系模式,以消除传递函数依赖:除传递函数依赖:S-D(Sno,Sdept)D-L(Sdept,Sloc)S-D的码为的码为Sno,D-L的码为的码为Sdept。分解后的关系模式分解后的关系模式S-D与与D-L中不再存在传递依赖中不再存在传递依赖 3NF(续)(续)S-D的码为的码为Sno,D-L的码为的码为SdeptSnoSdeptS-DSdep
28、tSlocD-Lv S-L(Sno,Sdept,Sloc)2NF S-L(Sno,Sdept,Sloc)3NF S-D(Sno,Sdept)3NFD-L(Sdept,Sloc)3NF3NF(续)(续)v 采用投影分解法将一个采用投影分解法将一个2NF的关系分解为多个的关系分解为多个3NF的关系,可以在一的关系,可以在一定程度上解决原定程度上解决原2NF关系中存在的插入异常、删除异常、数据冗余度关系中存在的插入异常、删除异常、数据冗余度大、修改复杂等问题。大、修改复杂等问题。v 将一个将一个2NF关系分解为多个关系分解为多个3NF的关系后,仍然不能完全消除关系的关系后,仍然不能完全消除关系模式中
29、的各种异常情况和数据冗余。模式中的各种异常情况和数据冗余。v 3NF消除了非主属性对码的传递函数依赖消除了非主属性对码的传递函数依赖6.2 规范化规范化6.2.1 函数依赖函数依赖6.2.2 码码6.2.3 范式范式6.2.4 2NF6.2.5 3NF6.2.6 BCNF6.2.7 多值依赖多值依赖6.2.8 4NF6.2.9 规范化小结规范化小结 6.2.6 BC范式(范式(BCNF)v定义定义6.8 关系模式关系模式R1NF,若,若XY且且Y X时时X必含有码,则必含有码,则R BCNF。v等价于:每一个决定属性因素都包含码等价于:每一个决定属性因素都包含码BCNF(续)(续)v若若RBC
30、NF 所有非主属性对每一个码(所有非主属性对每一个码(候选码候选码)都是完全函数依赖)都是完全函数依赖 所有的主属性对每一个不包含它的码,也是完全函数依所有的主属性对每一个不包含它的码,也是完全函数依赖赖 没有任何属性完全函数依赖于非码的任何一组属性没有任何属性完全函数依赖于非码的任何一组属性vR BCNF R 3NF充分不必要BCNF(续)(续)例例5 关系模式关系模式C(Cno,Cname,Pcno)C3NF CBCNF例例6 关系模式关系模式S(Sno,Sname,Sdept,Sage)n 假定假定S有两个码有两个码Sno,Snamen S3NF。n S BCNFBCNF(续)(续)例例
31、7关系模式关系模式SJP(S,J,P),),S表示学生,表示学生,J表示课表示课程,程,P表示学生该门课的排名(假设无并列名次)表示学生该门课的排名(假设无并列名次)。n函数依赖:(函数依赖:(S,J)P;(J,P)Sn(S,J)与()与(J,P)都可以作为候选码)都可以作为候选码,属性相交属性相交nSJP3NF,nSJPBCNFn实际上全是主属性实际上全是主属性 BCNF(续)(续)例例8在关系模式在关系模式STJ(S,T,J)中,中,S表示学生,表示学生,T表表示教师,示教师,J表示课程。表示课程。函数依赖:函数依赖:(S,J)T,(S,T)J,TJ(S,J)和和(S,T)都是候选码都是候
32、选码SJTSTSTJ中的函数依赖中的函数依赖JBCNF(续)(续)vSTJ3NF 没有任何非主属性对码传递依赖或部分依赖没有任何非主属性对码传递依赖或部分依赖 vSTJBCNF T是决定因素,是决定因素,T不包含码不包含码BCNF(续)(续)v解决方法:将解决方法:将STJ分解为二个关系模式:分解为二个关系模式:ST(S,T)BCNF,TJ(T,J)BCNF 没有没有任何属性任何属性对码的部分函数依赖和传递函数依赖对码的部分函数依赖和传递函数依赖SJSTTJTJ3NF与与BCNF的关系的关系vR BCNF R 3NFv如果如果R3NF,且,且R只有一个候选码只有一个候选码 R BCNF R 3
33、NFBCNF消除了主属性对码的部分函数依赖和传递函数依赖消除了主属性对码的部分函数依赖和传递函数依赖充分不必要充分必要6.2 规范化规范化6.2.1 函数依赖函数依赖6.2.2 码码6.2.3 范式范式6.2.4 2NF6.2.5 3NF6.2.6 BCNF6.2.7 多值依赖多值依赖6.2.8 4NF6.2.9 规范化小结规范化小结6.2.7 多值依赖多值依赖例例9 学校中某一门课程由多个教师讲授,他们使用相同的一套参考书。学校中某一门课程由多个教师讲授,他们使用相同的一套参考书。每个教员可以讲授多门课程,每种参考书可以供多门课程使用。每个教员可以讲授多门课程,每种参考书可以供多门课程使用。
34、课课 程程 C教教 员员 T参参 考考 书书 B 物理物理数学数学 计算数学计算数学李李 勇勇王王 军军 李李 勇勇张张 平平 张张 平平 周周 峰峰 普通物理学普通物理学光学原理光学原理 物理习题集物理习题集数学分析数学分析微分方程微分方程高等代数高等代数数学分析数学分析.普通物理学普通物理学光学原理光学原理物理习题集物理习题集普通物理学普通物理学光学原理光学原理物理习题集物理习题集数学分析数学分析微分方程微分方程高等代数高等代数数学分析数学分析微分方程微分方程高等代数高等代数李李 勇勇李李 勇勇李李 勇勇王王 军军王王 军军王王 军军李李 勇勇李李 勇勇李李 勇勇张张 平平张张 平平张张
35、平平 物物 理理物物 理理物物 理理物物 理理物物 理理物物 理理数数 学学数数 学学数数 学学数数 学学数数 学学数数 学学 参考书B教员T课程C多值依赖(续)多值依赖(续)v 用二维表表示用二维表表示Teaching多值依赖(续)多值依赖(续)v TeachingBCNFv Teaching具有唯一候选码具有唯一候选码(C,T,B),即全码即全码 多值依赖(续)多值依赖(续)Teaching模式中存在的问题模式中存在的问题(1)数据冗余度大数据冗余度大(2)插入操作复杂(例如某一门课增加一个教员,需插入多个插入操作复杂(例如某一门课增加一个教员,需插入多个元组)元组)(3)删除操作复杂(例
36、如去掉一本参考书,需删除多个元组)删除操作复杂(例如去掉一本参考书,需删除多个元组)(4)修改操作复杂修改操作复杂存在多值依赖多值依赖(续)多值依赖(续)v 定义定义6.9 设设R(U)是一个属性集是一个属性集U上的一个关系模式,上的一个关系模式,X、Y和和Z是是U的子集,并且的子集,并且ZUXY。关系模式。关系模式R(U)中中多值依赖多值依赖 XY成立,当且仅当对成立,当且仅当对R(U)的的任一关系任一关系r,给定的一对,给定的一对(x,z)值,有一组)值,有一组Y的值,这组值仅仅决定于的值,这组值仅仅决定于x值而与值而与z值无关值无关例例 Teaching(C,T,B)多值依赖(续)多值依
37、赖(续)v例例 关系模式关系模式Teaching(C,T,B)中,对于某一)中,对于某一门课程和教材的组合,门课程和教材的组合,多值依赖(续)多值依赖(续)v平凡多值依赖和非平凡的多值依赖平凡多值依赖和非平凡的多值依赖若若XY,而,而Z,则称则称 XY为为平凡的多值依赖平凡的多值依赖否则称否则称XY为为非平凡的多值依赖非平凡的多值依赖多值依赖(续)多值依赖(续)例例10关系模式关系模式WSC(W,S,C)W表示仓库,表示仓库,S表示保管员,表示保管员,C表示商品表示商品 假设每个仓库有若干个保管员,有若干种商品假设每个仓库有若干个保管员,有若干种商品 每个保管员保管所在的仓库的所有商品每个保管
38、员保管所在的仓库的所有商品 每种商品被所有保管员保管每种商品被所有保管员保管 多值依赖(续)多值依赖(续)WSCW1S1C1W1S1C2W1S1C3W1S2C1W1S2C2W1S2C3W2S3C4W2S3C5W2S4C4W2S4C5多值依赖(续)多值依赖(续)WS且且WC用下图表示这种对应用下图表示这种对应 6.2 规范化规范化6.2.1 函数依赖函数依赖6.2.2 码码6.2.3 范式范式6.2.4 2NF6.2.5 3NF6.2.6 BCNF6.2.7 多值依赖多值依赖6.2.8 4NF6.2.9 规范化小结规范化小结6.2.8 4NFv 定义定义6.10 关系模式关系模式R1NF,如果对
39、于如果对于R的每个的每个非平凡多值依赖非平凡多值依赖XY(Y X),),X都含有码,则都含有码,则R4NF。v 如果如果R 4NF,则则R BCNFn不允许不允许有非平凡且非函数依赖的有非平凡且非函数依赖的多值依赖多值依赖n允许允许的非平凡多值依赖是的非平凡多值依赖是函数依赖函数依赖4NF(续(续)例例:Teaching(C,T,B)4NF 存在非平凡的多值依赖存在非平凡的多值依赖CT,且,且C不是码不是码v 用投影分解法把用投影分解法把Teaching分解为如下两个关系模式:分解为如下两个关系模式:CT(C,T)4NF CB(C,B)4NF CT,CB是平凡多值依赖是平凡多值依赖 6.2.9
40、 规范化小结规范化小结v 关系数据库的规范化理论是数据库逻辑设计的工具关系数据库的规范化理论是数据库逻辑设计的工具v 目的:尽量消除插入、删除异常,修改复杂,数据冗余目的:尽量消除插入、删除异常,修改复杂,数据冗余v 基本思想:逐步消除数据依赖中不合适的部分基本思想:逐步消除数据依赖中不合适的部分 实质:概念的实质:概念的单一化单一化规范化小结(续)规范化小结(续)v 关系模式规范化的基本步骤关系模式规范化的基本步骤 1NF 消除非主属性对码的部分函数依赖消除非主属性对码的部分函数依赖消除决定属性消除决定属性 2NF集非码的非平集非码的非平 消除非主属性对码的传递函数依赖消除非主属性对码的传递
41、函数依赖凡函数依赖凡函数依赖 3NF 消除主属性对码的部分和传递函数依赖消除主属性对码的部分和传递函数依赖 BCNF 消除非平凡且非函数依赖的多值依赖消除非平凡且非函数依赖的多值依赖 4NF规范化小结(续)规范化小结(续)v 不能说规范化程度越高的关系模式就越好不能说规范化程度越高的关系模式就越好v 在设计数据库模式结构时,必须对现实世界的实际情况和在设计数据库模式结构时,必须对现实世界的实际情况和用户应用需求作进一步分析,确定一个合适的、能够反映用户应用需求作进一步分析,确定一个合适的、能够反映现实世界的模式现实世界的模式v 上面的规范化步骤可以在其中任何一步终止上面的规范化步骤可以在其中任
42、何一步终止第第六六章章 关系数据理论关系数据理论6.1 问题的提出问题的提出6.2 规范化规范化6.4 模式的分解模式的分解6.4 模式的分解模式的分解v 把低一级的关系模式分解为若干个高一级的关系模式的方把低一级的关系模式分解为若干个高一级的关系模式的方法不是唯一的法不是唯一的v 只有能够保证分解后的关系模式与原关系模式等价,分解只有能够保证分解后的关系模式与原关系模式等价,分解方法才有意义方法才有意义关系模式分解的标准关系模式分解的标准三种模式分解等价的定义:三种模式分解等价的定义:分解具有无损连接性分解具有无损连接性 分解要保持函数依赖分解要保持函数依赖 分解既要保持函数依赖,又要具有无
43、损连接性分解既要保持函数依赖,又要具有无损连接性模式的分解(续)模式的分解(续)定义定义6.16 关系模式关系模式R的一个分解:的一个分解:=R1,R2,Rn U=Ui,且不存在,且不存在 Ui Uj,Fi 为为 F在在 Ui 上的投影上的投影定义定义7.17 函数依赖集合函数依赖集合XY|XY F+XY Ui 的一个的一个覆盖覆盖 Fi 叫作叫作 F 在属性在属性 Ui 上的投影上的投影i=1n模式的分解(续)模式的分解(续)例:例:S-L(Sno,Sdept,Sloc)F=SnoSdept,SdeptSloc,SnoSloc S-L2NF 分解方法可以有多种:分解方法可以有多种:1、S-L
44、分解为三个关系模式:分解为三个关系模式:SN(Sno)SD(Sdept)SO(Sloc)2、SL分解为下面二个关系模式:分解为下面二个关系模式:NL(Sno,Sloc)DL(Sdept,Sloc)3、将、将SL分解为下面二个关系模式:分解为下面二个关系模式:ND(Sno,Sdept)NL(Sno,Sloc)4、将将SL分解为下面二个关系模式:分解为下面二个关系模式:NS(Sno,Sdept)DL(Sdept,Sloc)具有无损连接性的模式分解具有无损连接性的模式分解v 关系模式关系模式R的一个分解的一个分解=R1,R2,Rn 若若R与与R1、R2、Rn自然连接的结果相等,则称关系模式自然连接的
45、结果相等,则称关系模式R的这个分解的这个分解具有无损连接性(具有无损连接性(Lossless join)v 具有无损连接性的分解保证不丢失信息具有无损连接性的分解保证不丢失信息v 无损连接性不一定能解决插入异常、删除异常、修改复杂、数无损连接性不一定能解决插入异常、删除异常、修改复杂、数据冗余等问题据冗余等问题模式的分解(续)模式的分解(续)第第3种分解方法具有无损连接性种分解方法具有无损连接性 问题问题:这种分解方法没有保持原关系中的函数依赖这种分解方法没有保持原关系中的函数依赖 SL中的函数依赖中的函数依赖SdeptSloc没有投影到关系模式没有投影到关系模式ND、NL上上 保持函数依赖的
46、模式分解保持函数依赖的模式分解设关系模式设关系模式R被分解为若干个关系模式被分解为若干个关系模式R1,R2,Rn(其中其中U=U1U2Un,且不存在且不存在Ui Uj,Fi为为F在在Ui上的上的投影),若投影),若F所逻辑蕴含的函数依赖一定也由分解得到的某所逻辑蕴含的函数依赖一定也由分解得到的某个关系模式中的函数依赖个关系模式中的函数依赖Fi所逻辑蕴含,则称关系模式所逻辑蕴含,则称关系模式R的的这个分解是保持函数依赖的(这个分解是保持函数依赖的(Preserve dependency)模式的分解(续)模式的分解(续)第第4个方法、将个方法、将SL分解为下面二个关系模式:分解为下面二个关系模式:
47、ND(Sno,Sdept)DL(Sdept,Sloc)这种分解方法就保持了函数依赖这种分解方法就保持了函数依赖模式的分解(续)模式的分解(续)v 如果一个分解具有无损连接性,则它能够保证不丢失信息如果一个分解具有无损连接性,则它能够保证不丢失信息v 如果一个分解保持了函数依赖,则它可以减轻或解决各种异如果一个分解保持了函数依赖,则它可以减轻或解决各种异常情况常情况v 分解具有无损连接性和分解保持函数依赖是两个互相独立的分解具有无损连接性和分解保持函数依赖是两个互相独立的标准。具有无损连接性的分解不一定能够保持函数依赖;同标准。具有无损连接性的分解不一定能够保持函数依赖;同样,保持函数依赖的分解
48、也不一定具有无损连接性。样,保持函数依赖的分解也不一定具有无损连接性。模式的分解(续)模式的分解(续)第第1种分解方法既不具有无损连接性,也未保持函数依赖,种分解方法既不具有无损连接性,也未保持函数依赖,它不是原关系模式的一个等价分解它不是原关系模式的一个等价分解第第2种分解方法保持了函数依赖,但不具有无损连接性种分解方法保持了函数依赖,但不具有无损连接性第第3种分解方法具有无损连接性,但未持函数依赖种分解方法具有无损连接性,但未持函数依赖第第4种分解方法既具有无损连接性,又保持了函数依赖种分解方法既具有无损连接性,又保持了函数依赖v 举例:举例:v 建立一个关于系、学生、班级、学会等诸信息的
49、关系数据库。建立一个关于系、学生、班级、学会等诸信息的关系数据库。v 学生:学号、姓名、出生年月、系名、班号、宿舍区。学生:学号、姓名、出生年月、系名、班号、宿舍区。v 班级:班号、专业名、系名、人数、入校年份。班级:班号、专业名、系名、人数、入校年份。v 系:系名、系号、系办公地点、人数。系:系名、系号、系办公地点、人数。v 学会:学会名、成立年份、办公地点、人数。学会:学会名、成立年份、办公地点、人数。v 语义如下:一个系有若干专业,每个专业每年只招一个班,每个班有语义如下:一个系有若干专业,每个专业每年只招一个班,每个班有若干学生。一个系的学生住在同一宿舍区。每个学生可参加若干学会,若干
50、学生。一个系的学生住在同一宿舍区。每个学生可参加若干学会,每个学会有若干学生。学生参加某学会有一个入会年份。每个学会有若干学生。学生参加某学会有一个入会年份。v 请给出关系模式,写出每个关系模式的极小函数依赖集,指出是请给出关系模式,写出每个关系模式的极小函数依赖集,指出是否存在传递函数依赖,对于函数依赖左部是多属性的情况讨论函数依否存在传递函数依赖,对于函数依赖左部是多属性的情况讨论函数依赖是完全函数依赖,还是部分函数依赖。指出各关系模式的候选码、赖是完全函数依赖,还是部分函数依赖。指出各关系模式的候选码、外部码,有没有全码存在外部码,有没有全码存在?v解:解:(1)关系模式如下:关系模式如