1、Database Principles数据库原理数据库原理Database Principles第十一章第十一章 关系数据库设计理论关系数据库设计理论Database Principles问题的提出问题的提出关系数据库逻辑设计n针对具体问题,如何构造一个适合于它的数据模式n数据库逻辑设计的工具关系数据库的规范化理论Database Principles问题的提出问题的提出一、概念回顾二、关系模式的形式化定义Database Principles一、概念回顾一、概念回顾n关系:描述实体、属性、实体间的联系。n从形式上看,它是一张二维表,是所涉及属性的笛卡尔积的一个子集。n关系模式:用来定义关系。
2、n关系数据库:基于关系模型的数据库,利用关系来描述现实世界。n从形式上看,它由一组关系组成。n关系数据库的模式:定义这组关系的关系模式的全体。Database Principles二、关系模式的形式化定义二、关系模式的形式化定义关系模式由五部分组成,即它是一个五元组:R(U,D,DOM,F)R:关系名U:组成该关系的属性名集合D:属性组U中属性所来自的域DOM:属性向域的映象集合F:属性间数据的依赖关系集合Database Principles第十一章第十一章 关系数据库设计理论关系数据库设计理论11.1 数据依赖对关系模式的影响11.2 函数依赖11.3 范式11.4 多值依赖与第四范式(4
3、NF)11.5 关系模式的规范化11.6 数据依赖的公理系统11.7 小结Database Principles11.1 数据依赖对关系模式的影响数据依赖对关系模式的影响1.完整性约束的表现形式n限定属性取值范围:例如学生成绩必须在0-100之间n定义属性值间的相互关连(主要体现于值的相等与否),这就是数据依赖,它是数据库模式设计的关键Database Principles什么是数据依赖(续)什么是数据依赖(续)2.数据依赖n是通过一个关系中属性间值的相等与否体现出来的数据间的相互关系n是现实世界属性间相互联系的抽象n是数据内在的性质n是语义的体现Database Principles什么是数
4、据依赖(续)什么是数据依赖(续)3.数据依赖的类型n函数依赖(Functional Dependency,简记为FD)n多值依赖(Multivalued Dependency,简记为MVD)n其他Database Principles关系模式的简化表示关系模式的简化表示关系模式R(U,D,DOM,F)简化为一个三元组:R(U,F)当且仅当U上的一个关系r 满足F时,r称为关系模式 R(U,F)的一个关系Database Principles数据依赖对关系模式的影响数据依赖对关系模式的影响例:描述学校的数据库:学生的学号(Sno)、所在系(Sdept)系主任姓名(Mname)、课程名(Cname
5、)成绩(Grade)单一的关系模式:Student U Sno,Sdept,Mname,Cname,Grade Database Principles数据依赖对关系模式的影响(续)数据依赖对关系模式的影响(续)学校数据库的语义:一个系有若干学生,一个学生只属于一个系;一个系只有一名主任;一个学生可以选修多门课程,每门课程有若干学生选修;每个学生所学的每门课程都有一个成绩。Database Principles数据依赖对关系模式的影响(续)数据依赖对关系模式的影响(续)属性组U上的一组函数依赖F:F Sno Sdept,Sdept Mname,(Sno,Cname)Grade SnoCnameS
6、deptMnameGradeDatabase Principles关系模式关系模式Student中存在的问题中存在的问题 数据冗余太大n浪费大量的存储空间 例:每一个系主任的姓名重复出现 更新异常(Update Anomalies)n数据冗余,更新数据时,维护数据完整性代价大。例:某系更换系主任后,系统必须修改与该系学生有关的每一个元组Database Principles关系模式关系模式Student中存在的问题中存在的问题 插入异常(Insertion Anomalies)n该插的数据插不进去 例,如果一个系刚成立,尚无学生,我们就无法把这个系及其系主任的信息存入数据库。删除异常(Dele
7、tion Anomalies)n不该删除的数据不得不删例,如果某个系的学生全部毕业了,我们在删除该系学生信息的同时,把这个系及其系主任的信息也丢掉了。Database Principles数据依赖对关系模式的影响(续)数据依赖对关系模式的影响(续)结论:Student关系模式不是一个好的模式。“好”的模式:不会发生插入异常、删除异常、更新异常,数据冗余应尽可能少。原因:由存在于模式中的某些数据依赖引起的解决方法:通过分解关系模式来消除其中不合适 的数据依赖。Database Principles第十一章第十一章 关系数据库设计理论关系数据库设计理论11.1 数据依赖对关系模式的影响11.2 函
8、数依赖11.3 范式11.4 多值依赖与第四范式(4NF)11.5 关系模式的规范化11.6 数据依赖的公理系统11.7 小结Database Principles11.2 函数依赖函数依赖 规范化理论正是用来改造关系模式,通过分解关系模式来消除其中不合适的数据依赖,以解决插入异常、删除异常、更新异常和数据冗余问题。Database Principles11.2.1 函数依赖函数依赖一、函数依赖二、平凡函数依赖与非平凡函数依赖三、完全函数依赖与部分函数依赖四、传递函数依赖Database Principles一、函数依赖一、函数依赖定义11.1 设R(U)是一个属性集U上的关系模式,X和Y是U
9、的子集。若对于R(U)的任意一个可能的关系r,r中不可能存在两个元组在X上的属性值相等,而在Y上的属性值不等,则称“X函数确定Y”或 “Y函数依赖于X”,记作XY。X称为这个函数依赖的决定属性集(Determinant)。Y=f(x)Database Principles说明:说明:1.函数依赖不是指关系模式R的某个或某些关系实例满足的约束条件,而是指R的所有关系实例均要满足的约束条件。2.函数依赖是语义范畴的概念。只能根据数据的语义来确定函数依赖。例如“姓名年龄”这个函数依赖只有在不允许有同名人的条件下成立3.数据库设计者可以对现实世界作强制的规定。例如规定不允许同名人出现,函数依赖“姓名年
10、龄”成立。所插入的元组必须满足规定的函数依赖,若发现有同名人存在,则拒绝装入该元组。Database Principles函数依赖(续)函数依赖(续)例:Student(Sno,Sname,Ssex,Sage,Sdept)假设不允许重名,则有:Sno Ssex,Sno Sage,Sno Sdept,Sno Sname,Sname Ssex,Sname SageSname Sdept但Ssex Sage若XY,并且YX,则记为XY。若Y不函数依赖于X,则记为XY。Database Principles二、平凡函数依赖与非平凡函数依赖二、平凡函数依赖与非平凡函数依赖在关系模式R(U)中,对于U的子
11、集X和Y,如果XY,但Y X,则称XY是非平凡的函数依赖若XY,但Y X,则称XY是平凡的函数依赖例:在关系SC(Sno,Cno,Grade)中,非平凡函数依赖:(Sno,Cno)Grade 平凡函数依赖:(Sno,Cno)Sno (Sno,Cno)CnoDatabase Principles平凡函数依赖与非平凡函数依赖(续)平凡函数依赖与非平凡函数依赖(续)n于任一关系模式,平凡函数依赖都是必然成立的,它不反映新的语义,因此若不特别声明,我们总是讨论非平凡函数依赖。Database Principles三、完全函数依赖与部分函数依赖三、完全函数依赖与部分函数依赖定义11.2 在关系模式R(U
12、)中,如果XY,并且对于X的任何一个真子集X,都有 X Y,则称Y完全函数依赖于X,记作X Y。若XY,但Y不完全函数依赖于X,则称Y部分函数依赖于X,记作X P Y。Database Principles完全函数依赖与部分函数依赖(续)完全函数依赖与部分函数依赖(续)例:在关系SC(Sno,Cno,Grade)中,由于:Sno Grade,Cno Grade,因此:(Sno,Cno)Grade Database Principles四、传递函数依赖四、传递函数依赖定义11.3 在关系模式R(U)中,如果XY,YZ,且Y X,YX,则称Z传递函数依赖于X。注:如果YX,即XY,则Z直接依赖于X
13、。例:在关系Std(Sno,Sdept,Mname)中,有:Sno Sdept,Sdept Mname Mname传递函数依赖于SnoDatabase Principles11.2.2 码码定义11.4 设K为关系模式R中的属性或属性组合。若K U,则K称为R的一个侯选码(Candidate Key)。若关系模式R有多个候选码,则选定其中的一个做为主码(Primary key)。n主属性与非主属性nALL KEYDatabase Principles外部码外部码定义11.5 关系模式 R 中属性或属性组X 并非 R的码,但 X 是另一个关系模式的码,则称 X 是R 的外部码(Foreign k
14、ey)也称外码n主码又和外部码一起提供了表示关系间联系的手段。Database Principles第十一章第十一章 关系数据库设计理论关系数据库设计理论11.1 数据依赖对关系模式的影响11.2 函数依赖11.3 范式11.4 多值依赖与第四范式(4NF)11.5 关系模式的规范化11.6 数据依赖的公理系统11.7 小结Database Principles11.3 范式范式n范式是符合某一种级别的关系模式的集合。n关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式。n范式的种类:第一范式(1NF)第二范式(2NF)第三范式(3NF)BC范式(BCNF)第四范式(4NF)第
15、五范式(5NF)Database Principles范式范式(续续)n各种范式之间存在联系:n某一关系模式R为第n范式,可简记为RnNF。NF5NF4BCNFNF3NF2NF1Database Principles11.3.1 1NFn定义11.6如果一个关系模式R的所有属性都是不可分的基本数据项,则R1NF。n第一范式是对关系模式的最起码的要求。不满足第一范式的数据库模式不能称为关系数据库。n但是满足第一范式的关系模式并不一定是一个好的关系模式。Database Principles1NF(续续)例:关系模式 SLC(Sno,Sdept,Sloc,Cno,Grade)Sloc为学生住处,假
16、设每个系的学生住在同一个地方。n函数依赖包括:(Sno,Cno)f Grade Sno Sdept (Sno,Cno)P Sdept Sno Sloc (Sno,Cno)P Sloc Sdept SlocDatabase Principles1NF(续续)nSLC的码为(Sno,Cno)nSLC满足第一范式。n 非主属性Sdept和Sloc部分函数依赖于码(Sno,Cno)SnoCnoGradeSdeptSlocSLCDatabase PrinciplesSLC不是一个好的关系模式不是一个好的关系模式(1)插入异常假设Sno95102,SdeptIS,SlocN的学生还未选课,因课程号是主属性
17、,因此该学生的信息无法插入SLC。(2)删除异常 假定某个学生本来只选修了3号课程这一门课。现在因身体不适,他连3号课程也不选修了。因课程号是主属性,此操作将导致该学生信息的整个元组都要删除。Database PrinciplesSLC不是一个好的关系模式不是一个好的关系模式(3)数据冗余度大 如果一个学生选修了10门课程,那么他的Sdept和Sloc值就要重复存储了10次。(4)修改复杂 例如学生转系,在修改此学生元组的Sdept值的同时,还可能需要修改住处(Sloc)。如果这个学生选修了K门课,则必须无遗漏地修改K个元组中全部Sdept、Sloc信息。Database Principles
18、 1NF(续续)n原因 Sdept、Sloc部分函数依赖于码。n解决方法 SLC分解为两个关系模式,以消除这些部分函数依赖 SC(Sno,Cno,Grade)SL(Sno,Sdept,Sloc)Database Principles11.3.2 2NF函数依赖图:SnoCnoGradeSCSLSnoSdeptSlocDatabase Principles 2NF(续续)n2NF的定义定义11.7 若关系模式R1NF,并且每一个非主属性都完全函数依赖于R的码,则R2NF。例:SLC(Sno,Sdept,Sloc,Cno,Grade)1NF SLC(Sno,Sdept,Sloc,Cno,Grade
19、)2NF SC(Sno,Cno,Grade)2NF SL(Sno,Sdept,Sloc)2NFDatabase Principles 第二范式(续第二范式(续)n采用投影分解法将一个1NF的关系分解为多个2NF的关系,可以在一定程度上减轻原1NF关系中存在的插入异常、删除异常、数据冗余度大、修改复杂等问题。n将一个1NF关系分解为多个2NF的关系,并不能完全消除关系模式中的各种异常情况和数据冗余。Database Principles 11.3.3 3NF例:2NF关系模式SL(Sno,Sdept,Sloc)中n函数依赖:SnoSdept SdeptSloc SnoSlocSloc传递函数依赖
20、于Sno,即SL中存在非主属性对码的传递函数依赖。Database Principles 3NF(续续)函数依赖图:SLSnoSdeptSlocDatabase Principles 3NF(续续)n解决方法 采用投影分解法,把SL分解为两个关系模式,以消除传递函数依赖:SD(Sno,Sdept)DL(Sdept,Sloc)SD的码为Sno,DL的码为Sdept。Database Principles 3NF(续续)SD的码为Sno,DL的码为Sdept。SnoSdeptSDSdeptSlocDLDatabase Principles 3NF(续续)n3NF的定义定义11.8 关系模式R 中若
21、不存在这样的码X、属性组Y及非主属性Z(Z Y),使得XY,Y X,YZ,成立,则称R 3NF。例,SL(Sno,Sdept,Sloc)2NF SL(Sno,Sdept,Sloc)3NF SD(Sno,Sdept)3NF DL(Sdept,Sloc)3NFDatabase Principles 3NF(续续)n若R3NF,则R的每一个非主属性既不部分函数依赖于候选码也不传递函数依赖于候选码。n如果R3NF,则R也是2NF。n采用投影分解法将一个2NF的关系分解为多个3NF的关系,可以在一定程度上解决原2NF关系中存在的插入异常、删除异常、数据冗余度大、修改复杂等问题。n 将一个2NF关系分解为
22、多个3NF的关系后,并不能完全消除关系模式中的各种异常情况和数据冗余。Database Principles 11.3.4 BC范式(范式(BCNF)n定义11.9 设关系模式R1NF,如果对于R的每个函数依赖XY,若Y不属于X,则X必含有候选码,那么RBCNF。若RBCNF n每一个决定属性集(因素)都包含(候选)码nR中的所有属性(主,非主属性)都完全函数依赖于码nR3NF(证明)n若R3NF 则 R不一定BCNFDatabase Principles BCNF(续续)例:在关系模式STJ(S,T,J)中,S表示学生,T表示教师,J表示课程。n每一教师只教一门课。每门课由若干教师教,某一学
23、生选定某门课,就确定了一个固定的教师。某个学生选修某个教师的课就确定了所选课的名称:(S,J)T,(S,T)J,TJDatabase PrinciplesBCNF(续续)SJTSTJSTJDatabase PrinciplesBCNF(续续)STJ3NF n(S,J)和(S,T)都可以作为候选码 nS、T、J都是主属性STJBCNFnTJ,T是决定属性集,T不是候选码Database PrinciplesBCNF(续续)解决方法:将STJ分解为二个关系模式:SJ(S,J)BCNF,TJ(T,J)BCNF 没有任何属性对码的部分函数依赖和传递函数依赖SJSTTJTJDatabase Princi
24、ples3NF与与BCNF的关系的关系n如果关系模式RBCNF,必定有R3NFn如果R3NF,且R只有一个候选码,则R必属于BCNF。Database PrinciplesBCNF的关系模式所具有的性质的关系模式所具有的性质 所有非主属性都完全函数依赖于每个候选码 所有主属性都完全函数依赖于每个不包含它的候选码 没有任何属性完全函数依赖于非码的任何一组属性Database Principles第十一章第十一章 关系数据库设计理论关系数据库设计理论11.1 数据依赖对关系模式的影响11.2 函数依赖11.3 范式11.4 多值依赖与第四范式(4NF)11.5 关系模式的规范化11.6 数据依赖的
25、公理系统11.7 小结Database Principles11.4 多值依赖与第四范式(多值依赖与第四范式(4NF)例:学校中某一门课程由多个教师讲授,他们使用相同的一套参考书。关系模式Teaching(C,T,B)课程C、教师T 和 参考书BDatabase Principles课课 程程 C教教 员员 T参参 考考 书书 B 物理物理 数学数学 计算数学计算数学李李 勇勇王王 军军 李李 勇勇张张 平平 张张 平平周周 峰峰 普通物理学普通物理学光学原理光学原理 物理习题集物理习题集 数学分析数学分析微分方程微分方程高等代数高等代数 数学分析数学分析 表表11.3Database Pri
26、nciples普通物理学普通物理学光学原理光学原理物理习题集物理习题集普通物理学普通物理学光学原理光学原理物理习题集物理习题集数学分析数学分析微分方程微分方程高等代数高等代数数学分析数学分析微分方程微分方程高等代数高等代数李李 勇勇李李 勇勇李李 勇勇王王 军军王王 军军王王 军军李李 勇勇李李 勇勇李李 勇勇张张 平平张张 平平张张 平平 物物 理理物物 理理物物 理理物物 理理物物 理理物物 理理数数 学学数数 学学数数 学学数数 学学数数 学学数数 学学 参考书B教员T课程C用二维表表示用二维表表示Teaching Database Principles多值依赖与第四范式(续)多值依赖与
27、第四范式(续)nTeachingBCNF:nTeach具有唯一候选码(C,T,B),即全码nTeaching模式中存在的问题(1)数据冗余度大:有多少名任课教师,参考书就要存储多少次 Database Principles多值依赖与第四范式(续)多值依赖与第四范式(续)(2)插入操作复杂:当某一课程增加一名任课教师时,该课程有多少本参照书,就必须插入多少个元组例如物理课增加一名教师刘关,需要插入两个元组:(物理,刘关,普通物理学)(物理,刘关,光学原理)Database Principles多值依赖与第四范式(续)多值依赖与第四范式(续)(3)删除操作复杂:某一门课要去掉一本参考书,该课程有多
28、少名教师,就必须删除多少个元组(4)修改操作复杂:某一门课要修改一本参考书,该课程有多少名教师,就必须修改多少个元组 n产生原因存在多值依赖Database Principles11.4.1 多值依赖多值依赖n定义11.10 设R(U)是一个属性集U上的一个关系模式,X、Y和Z是U的子集,并且ZUXY,多值依赖 XY成立当且仅当对R的任一关系r,r在(X,Z)上的每个值对应一组Y的值,这组值仅仅决定于X值而与Z值无关 例 Teaching(C,T,B)对于C的每一个值,T有一组值与之对应,而不论B取何值Database Principles多值依赖多值依赖(续续)n在R(U)的任一关系r中,如
29、果存在元组t,s 使得tX=sX,那么就必然存在元组 w,v r,(w,v可以与s,t相同),使得wX=vX=tX,而wY=tY,wZ=sZ,vY=sY,vZ=tZ(即交换s,t元组的Y值所得的两个新元组必在r中),则Y多值依赖于X,记为XY。这里,X,Y是U的子集,Z=U-X-Y。t x y1 z2 s x y2 z1 w x y1 z1 v x y2 z2Database Principles多值依赖(续)多值依赖(续)n平凡多值依赖和非平凡的多值依赖n若XY,而Z,则称 XY为平凡的多值依赖n否则称XY为非平凡的多值依赖Database Principles多值依赖的性质多值依赖的性质(
30、1)多值依赖具有对称性 若XY,则XZ,其中ZUXY 多值依赖的对称性可以用完全二分图直观地表示出来。(2)多值依赖具有传递性 若XY,YZ,则XZ-YDatabase Principles多值依赖的对称性多值依赖的对称性 XiZi1 Zi2 ZimYi1 Yi2 YinDatabase Principles多值依赖的对称性多值依赖的对称性 物物 理理普通物理学普通物理学 光学原理光学原理 物理习题集物理习题集李勇李勇 王军王军Database Principles多值依赖(续)多值依赖(续)(3)函数依赖是多值依赖的特殊情况。若XY,则XY。(4)若XY,XZ,则XY Z。(5)若XY,XZ
31、,则XYZ。(6)若XY,XZ,则XY-Z,XZ-Y。Database Principles多值依赖与函数依赖的区别多值依赖与函数依赖的区别(1)有效性n多值依赖的有效性与属性集的范围有关若XY在U上成立,则在W(X Y W U)上一定成立;反之则不然,即XY在W(W U)上成立,在U上并不一定成立n多值依赖的定义中不仅涉及属性组 X和 Y,而且涉及U中其余属性Z。n一般地,在R(U)上若有XY在W(W U)上成立,则称XY为R(U)的嵌入型多值依赖Database Principles多值依赖与函数依赖的区别多值依赖与函数依赖的区别n只要在R(U)的任何一个关系r中,元组在X和Y上的值满足定
32、义5.l(函数依赖),则函数依赖XY在任何属性集W(X Y W U)上成立。Database Principles多值依赖(续)多值依赖(续)(2)n若函数依赖XY在R(U)上成立,则对于任何Y Y均有XY 成立n多值依赖XY若在R(U)上成立,不能断言对于任何Y Y有XY 成立Database Principles11.4.2 第四范式(第四范式(4NF)n定义11.11 关系模式R1NF,如果对于R的每个非平凡多值依赖XY(Y X),X都含有候选码,则R4NF。(XY)n如果R 4NF,则R BCNF 不允许有非平凡且非函数依赖的多值依赖 允许的是函数依赖(是非平凡多值依赖)Databas
33、e Principles第四范式(续第四范式(续)例:Teach(C,T,B)4NF 存在非平凡的多值依赖CT,且C不是候选码n用投影分解法把Teach分解为如下两个关系模式:CT(C,T)4NF CB(C,B)4NF CT,CB是平凡多值依赖 Database Principles第十一章第十一章 关系数据库设计理论关系数据库设计理论11.1 数据依赖对关系模式的影响11.2 函数依赖11.3 范式11.4 多值依赖与第四范式(4NF)11.5 关系模式的规范化11.6 数据依赖的公理系统11.7 小结Database Principles11.5 关系模式的规范化关系模式的规范化n关系数据
34、库的规范化理论是数据库逻辑设计的工具。n一个关系只要其分量都是不可分的数据项,它就是规范化的关系,但这只是最基本的规范化。n规范化程度可以有多个不同的级别Database Principles规范化(续)规范化(续)n规范化程度过低的关系不一定能够很好地描述现实世界,可能会存在插入异常、删除异常、修改复杂、数据冗余等问题n一个低一级范式的关系模式,通过模式分解可以转换为若干个高一级范式的关系模式集合,这种过程就叫关系模式的规范化Database Principles规范化(续)规范化(续)n关系模式规范化的基本步骤 1NF 消除非主属性对码的部分函数依赖消除决定属性 2NF集非码的非平 消除非
35、主属性对码的传递函数依赖凡函数依赖 3NF 消除主属性对码的部分和传递函数依赖 BCNF 消除非平凡且非函数依赖的多值依赖 4NFDatabase Principles规范化的基本思想规范化的基本思想n消除不合适的数据依赖n的各关系模式达到某种程度的“分离”n采用“一事一地”的模式设计原则 让一个关系描述一个概念、一个实体或者实体间的一种联系。若多于一个概念就把它“分离”出去n所谓规范化实质上是概念的单一化Database Principles规范化(续)规范化(续)n不能说规范化程度越高的关系模式就越好n在设计数据库模式结构时,必须对现实世界的实际情况和用户应用需求作进一步分析,确定一个合适
36、的、能够反映现实世界的模式n上面的规范化步骤可以在其中任何一步终止Database Principles第十一章第十一章 关系数据库设计理论关系数据库设计理论11.1 数据依赖对关系模式的影响11.2 函数依赖11.3 范式11.4 多值依赖与第四范式(4NF)11.5 关系模式的规范化11.6 数据依赖的公理系统11.7 小结Database Principles11.6 数据依赖的公理系统数据依赖的公理系统n逻辑蕴含定义11.12 对于满足一组函数依赖 F 的关系模式R,其任何一个关系r,若函数依赖XY都成立,则称 F逻辑蕴含X YDatabase PrinciplesArmstrong公
37、理系统公理系统n一套推理规则,是模式分解算法的理论基础n用途n求给定关系模式的码n从一组函数依赖求得蕴含的函数依赖Database Principles1.Armstrong公理系统公理系统 关系模式R 来说有以下的推理规则:nAl.自反律(Reflexivity):若Y X U,则X Y为F所蕴含。nA2.增广律(Augmentation):若XY为F所蕴含,且Z U,则XZYZ为F所蕴含。nA3.传递律(Transitivity):若XY及YZ为F所蕴含,则XZ为F所蕴含。注意:由自反律所得到的函数依赖均是平凡的函数依赖,自反律的使用并不依赖于FDatabase Principles定理定
38、理 11.1 Armstrong推理规则是正确的推理规则是正确的(l)自反律:若Y X U,则X Y为F所蕴含证:设Y X U 对R 的任一关系r中的任意两个元组t,s:若tX=sX,由于Y X,有ty=sy,所以XY成立.自反律得证Database Principles定理定理11.1(2)增广律:若XY为F所蕴含,且Z U,则XZYZ 为F所蕴含。证:设XY为F所蕴含,且Z U。设R 的任一关系r中任意的两个元组t,s;若tXZ=sXZ,则有tX=sX和tZ=sZ;由XY,于是有tY=sY,所以tYZ=sYZ,所以XZYZ为F所蕴含.增广律得证。Database Principles定理定
39、理11.1(3)传递律:若XY及YZ为F所蕴含,则 XZ为 F所蕴含。证:设XY及YZ为F所蕴含。对R 的任一关系 r中的任意两个元组 t,s。若tX=sX,由于XY,有 tY=sY;再由YZ,有tZ=sZ,所以XZ为F所蕴含.传递律得证。Database Principles2.导出规则导出规则1.根据A1,A2,A3这三条推理规则可以得到下面三条推理规则:n 合并规则:由XY,XZ,有XYZ。(A2,A3)n 伪传递规则:由XY,WYZ,有XWZ。(A2,A3)n 分解规则:由XY及 ZY,有XZ。(A1,A3)Database Principles导出规则导出规则2.根据合并规则和分解规
40、则,可得引理11.1 引理11.1 XA1 A2Ak成立的充分必要条件是XAi成立(i=l,2,k)。Database Principles3.函数依赖闭包函数依赖闭包定义11.12 在关系模式R中为F所逻辑蕴含的函数依赖的全体叫作 F的闭包,记为F+。定义11.13 设F为属性集U上的一组函数依赖,X U,XF+=A|XA能由F 根据Armstrong公理导出,XF+称为属性集X关于函数依赖集F 的闭包Database PrinciplesF的闭包的闭包 F=X Y,Y Z,F+计算是NP完全问题,X A1A2.An F+=X ,Y ,Z,XY ,XZ ,YZ ,XYZ ,X X,Y Y,Z
41、 Z,XY X,XZ X,YZ Y,XYZ X,X Y,Y Z,XY Y,XZ Y,YZ Z,XYZ Y,X Z,Y YZ,XY Z,XZ Z,YZ YZ,XYZ Z,X XY,XY XY,XZ XY,XYZ XY,X XZ,XY YZ,XZ XZ,XYZ YZX YZ,XY XZ,XZ XY,XYZ XZ,X ZYZ,XY XYZ,XZ XYZ,XYZ XYZ Database Principles最小依赖集最小依赖集 定义11.14 如果函数依赖集F满足下列条件,则称F为一个极小函数依赖集。亦称为最小依赖集或最小覆盖。(1)F中任一函数依赖的右部仅含有一个属性。(2)F中不存在这样的函数依
42、赖XA,使得F与F-XA等价。(3)F中不存在这样的函数依赖XA,X有真 子集Z使得F-XAZA与F等价。Database Principles最小依赖集最小依赖集例2 对于5.l节中的关系模式S,其中:U=SNO,SDEPT,MN,CNAME,G,F=SNOSDEPT,SDEPTMN,(SNO,CNAME)G 设F=SNOSDEPT,SNOMN,SDEPTMN,(SNO,CNAME)G,(SNO,SDEPT)SDEPTF是最小覆盖,而F 不是。因为:F-SNOMN与F 等价 F-(SNO,SDEPT)SDEPT也与F 等价 F-(SNO,SDEPT)SDEPT SNOSDEPT也与F 等价D
43、atabase Principles模式的分解模式的分解n把低一级的关系模式分解为若干个高一级的关系模式的方法并不是唯一的n只有能够保证分解后的关系模式与原关系模式等价,分解方法才有意义Database Principles关系模式分解的标准关系模式分解的标准三种模式分解的等价定义 分解具有无损连接性 分解要保持函数依赖 分解既要保持函数依赖,又要具有无损连接性Database Principles模式的分解(续)模式的分解(续)例:SL(Sno,Sdept,Sloc)F=SnoSdept,SdeptSloc,SnoSloc SL2NF 存在插入异常、删除异常、冗余度大和修改复杂等问题分解方法
44、可以有多种 Database Principles模式的分解(续)模式的分解(续)SL SnoSdeptSloc 95001 CS A 95002 IS B 95003 MA C 95004 IS B 95005 PH B Database Principles模式的分解(续)模式的分解(续)1.SL分解为下面三个关系模式:SN(Sno)SD(Sdept)SO(Sloc)Database Principles分解后的关系为:分解后的关系为:SN SD SO Sno Sdept Sloc 95001 CS A 95002 IS B 95003 MA C 95004 PH 95005 Databa
45、se Principles模式的分解(续)模式的分解(续)分解后的数据库丢失了许多信息 例如无法查询95001学生所在系或所在宿舍。如果分解后的关系可以通过自然连接恢复为原来的关系,那么这种分解就没有丢失信息Database Principles模式的分解(续)模式的分解(续)2.SL分解为下面二个关系模式:NL(Sno,Sloc)DL(Sdept,Sloc)分解后的关系为:NL DL Sno Sloc Sdept Sloc 95001 A CS A 95002 B IS B 95003 C MA C 95004 B PH B 95005 B Database Principles模式的分解(
46、续)模式的分解(续)NL DL Sno Sloc Sdept 95001 A CS 95002 B IS 95002 B PH 95003 C MA 95004 B IS 95004 B PH 95005 B IS 95005 B PH Database Principles模式的分解(续)模式的分解(续)NL DL比原来的SL关系多了3个元组 无法知道95002、95004、95005 究竟是哪个系的学生 元组增加了,信息丢失了Database Principles第三种分解方法第三种分解方法3.将SL分解为下面二个关系模式:ND(Sno,Sdept)NL(Sno,Sloc)分解后的关系为:
47、Database Principles模式的分解(续)模式的分解(续)ND NL Sno Sdept Sno Sloc 95001 CS 95001 A 95002 IS 95002 B 95003 MA 95003 C 95004 IS 95004 B 95005 PH 95005 B Database Principles模式的分解(续)模式的分解(续)ND NL Sno Sdept Sloc 95001 CS A 95002 IS B 95003 MA C 95004 CS A 95005 PH B 与SL关系一样,因此没有丢失信息Database Principles具有无损连接性的模
48、式分解具有无损连接性的模式分解n关系模式R的一个分解=R1,R2,Rn若R与R1、R2、Rn自然连接的结果相等,则称关系模式R的这个分解具有无损连接性(Lossless join)n具有无损连接性的分解保证不丢失信息n无损连接性不一定能解决插入异常、删除异常、修改复杂、数据冗余等问题Database Principles模式的分解(续)模式的分解(续)第三种分解方法具有无损连接性 问题:这种分解方法没有保持原关系中的函数依赖 SL中的函数依赖SdeptSloc 没有投影到关系模式ND、NL上 Database Principles保持函数依赖的模式分解保持函数依赖的模式分解设关系模式R被分解为
49、若干个关系模式R1,R2,Rn(其中U=U1U2Un,且不存在Ui Uj,Fi为F在Ui上的投影),若F所逻辑蕴含的函数依赖一定也由分解得到的某个关系模式中的函数依赖Fi所逻辑蕴含,则称关系模式R的这个分解是保持函数依赖的(Preserve dependency)。Database Principles第四种分解方法第四种分解方法 将SL分解为下面二个关系模式:ND(Sno,Sdept)DL(Sdept,Sloc)这种分解方法就保持了函数依赖。Database Principles模式的分解(续)模式的分解(续)n如果一个分解具有无损连接性,则它能够保证不丢失信息。n如果一个分解保持了函数依赖
50、,则它可以减轻或解决各种异常情况。n分解具有无损连接性和分解保持函数依赖是两个互相独立的标准。具有无损连接性的分解不一定能够保持函数依赖。同样,保持函数依赖的分解也不一定具有无损连接性。Database Principles模式的分解(续)模式的分解(续)第一种分解方法既不具有无损连接性,也未保持函 数依赖,它不是原关系模式的一个等价分解第二种分解方法保持了函数依赖,但不具有无损连 接性第三种分解方法具有无损连接性,但未持函数依赖第四种分解方法既具有无损连接性,又保持了函数 依赖Database Principles第十一章第十一章 关系数据库设计理论关系数据库设计理论11.1 数据依赖对关系