关系规范化理论课件.ppt

上传人(卖家):晟晟文业 文档编号:4749562 上传时间:2023-01-07 格式:PPT 页数:48 大小:370.50KB
下载 相关 举报
关系规范化理论课件.ppt_第1页
第1页 / 共48页
关系规范化理论课件.ppt_第2页
第2页 / 共48页
关系规范化理论课件.ppt_第3页
第3页 / 共48页
关系规范化理论课件.ppt_第4页
第4页 / 共48页
关系规范化理论课件.ppt_第5页
第5页 / 共48页
点击查看更多>>
资源描述

1、返回返回1关系数据库理论关系数据库理论(数据库设计数据库设计)返回返回24.1 规范化问题的提出4.1.1 规范化理论的主要内容v关系数据库的规范化理论最早是由关系数据库的创始人E.F.Codd提出的,后经许多专家学者作进一步深入的研究和发展,形成了一整套有关关系数据库设计的理论。v在该理论出现以前,层次和网状数据库的设计只是遵循其模型本身固有的原则,而无具体的理论依据,带有一定盲目性,可能在以后的运行和使用中发生许多预想不到的问题。返回返回3v在关系数据库系统中,数据库的设计较层次和网状模型更为重要。v如何设计一个适合的关系数据库系统,关键是关系数据库模式的设计,一个好的关系数据库模式应该包

2、括多少关系模式,而每一个关系模式又应该包括哪些属性,又如何将这些相互关联的关系模式组建一个适合的关系模型,这些工作决定了到整个系统运行的效率,也是系统成败的关键所在,所以必须在关系数据库的规范化理论的指导下逐步完成。返回返回4v关系数据库的规范化理论主要包括三个方面的内容:函数依赖范式(Normal Form)模式设计v其中,函数依赖起着核心的作用,是模式分解和模式设计的基础,范式是模式分解的标准。4.1.2 关系模式的存储异常问题v数据库的逻辑设计为什么要遵循一定的规范化理论?v不好的关系模式可能导致哪些问题?什么才算是好的关系模式?v下面通过例子进行分析:返回返回5例如,要求设计教学管理数

3、据库,其关系模式SCD如下:SCD(SNO,SN,AGE,DEPT,MN,CNO,SCORE)v其中,SNO表示学生学号,SN表示学生姓名,AGE表示学生年龄,DEPT表示学生所在的系别,MN表示系主任姓名,CNO表示课程号,SCORE表示成绩。根据实际情况,这些数据有如下语义规定:1.一个系有若干个学生,但一个学生只属于一个系;2.一个系只有一名系主任,但一个系主任可以同时兼几个系的系主任;3.一个学生可以选修多门功课,每门课程可有若干学生选修;4.每个学生学习每门课程有一个成绩。vSCD关系模式的实例 如图4.1所示。返回返回6图4.1 关系SCDSNOSNAGEDEPTMNCNOSCOR

4、ES1赵亦17计算机刘伟C190S1赵亦17计算机刘伟C285S2钱尔18信息王平C357S2钱尔18信息王平C680S2钱尔18信息王平C7 70S2钱尔18信息王平C570S3孙珊20信息王平C10S3孙珊20信息王平C270S3孙珊20信息王平C485S4李思19自动化刘伟C193返回返回7v可以看出:(SNO,CNO)是该关系模式的主关系键。但在进行数据库的操作时,会出现以下几方面的问题。1.1.数据冗余。数据冗余。每个系名和系主任的名字存储的次数等于该系的学生人数乘以每个学生选修的课程门数,同时学生的姓名、年龄也重复存储多次,数据的冗余度很大,浪费了存储空间。2.2.插入异常。插入异

5、常。v因为(SNO,CNO)是主关系键。根据实体完整性约束,主关系键的值不能为空,如果某个新系没有招生,尚无学生时,则系名和系主任的信息无法插入到数据库中。v另外,当某个学生尚未选课,即CNO未知,根据实体完整性约束规定,主关系键的值不能部分为空,同样不能进行插入操作。返回返回83.3.删除异常。删除异常。某系学生全部毕业而没有招生时,删除全部学生的记录则系名、系主任也随之删除,而这个系依然存在,在数据库中却无法找到该系的信息。另外,如果某个学生不再选修C1课程,本应该只删去C1,但C1是主关系键的一部分,为保证实体完整性,必须将整个元组一起删掉,这样,有关该学生的其它信息也随之丢失。4.4.

6、更新异常。更新异常。如果学生改名,则该学生的所有记录都要逐一修改SN;又如某系更换系主任,则属于该系的学生记录都要修改MN的内容,稍有不慎,就有可能漏改某些记录,这就会造成数据的不一致性,破坏了数据的完整性。返回返回9v由于存在以上问题,我们说,SCD是一个不好的关系模式。产生上述问题的原因,直观地说,是因为关系中“包罗万象”,内容太杂了。v那么,怎样才能得到一个好的关系模式呢?v把SCD分解为下面三个关系模式,如图4.2所示。学生关系S(SNO,SN,AGE,DEPT)选课关系SC(SNO,CNO,SCORE)系关系D(DEPT,MN)返回返回10SNOSNAGEDEPT SNOCNOSCO

7、RES1赵亦17计算机 S1C190S2钱尔18信息 S1C285S3孙珊20信息 S2C557S4李思21自动化 S2C68070 S2C7 S2C570DEPTMN S3C10计算机刘伟 S3C270信息王平 S3C485自动化刘伟 S4C193图4.2 分解后的关系模式 返回返回11v在以上三个关系模式中,实现了信息的某种程度的分离,S中存储学生基本信息,与所选课程及系主任无关;D中存储系的有关信息,与学生无关;SC中存储学生选课的信息,而与所学生及系的有关信息无关。v与SCD相比,分解为三个关系模式后,数据的冗余度明显降低。当新插入一个系时,只要在关系D中添加一条记录。当某个学生尚未选

8、课,只要在关系S中添加一条学生记录,而与选课关系无关,这就避免了插入异常。当一个系的学生全部毕业时,只需在S中删除该系的全部学生记录,而关系D中有关该系的信息仍然保留,从而不会引起删除异常。由于数据冗余度的降低,数据没有重复存储,也不会引起更新异常。返回返回12v经过上述分析,我们说分解后的关系模式是一个好的关系数据库模式。v好的关系模式应具备以下条件:1.尽可能少的数据冗余。2.没有插入异常。3.没有删除异常。4.没有更新异常。返回返回13v但要注意,一个好的关系模式并不是在任何情况下都是最优的,比如查询某个学生选修课程名及所在系的系主任时,要通过连接,而连接所需要的系统开销非常大,因此要以

9、实际设计的目标出发进行设计v如何按照一定的规范设计关系模式,将结构复杂的关系分解成结构简单的关系,从而把不好的关系数据库模式转变为好的关系数据库模式,这就是关系的规范化。v关系模式中的各属性是相互依赖、相互制约的,因此在设计关模式时,必须从语义上分析这些依赖关系。v数据库模式的好坏和关系中各属性间的依赖关系有关,因此,我们先讨论属性间的依赖关系。返回返回144.2 函数依赖4.2.1函数依赖的定义及性质v关系模式中的各属性之间相互依赖、相互制约的联系称为数据依赖。v数据依赖一般分为函数依赖、多值依赖和连接依赖。v其中,函数依赖是最重要的数据依赖。返回返回154.2.1.1函数依赖的定义定义4.

10、1设关系模式R(U,F),U是属性全集,F是U上的函数依赖集,X和Y是U的子集,如果对于R(U)的任意一个可能的关系r,对于X的每一个具体值,Y都有唯一的具体值与之对应,则称X决定函数Y,或Y函数依赖于X,记作XY。我们称X为决定因素,Y为依赖因素。当Y不函数依赖于X时,记作:X Y。当XY且YX时,则记作:X Y。v对于关系模式SCDU=SNO,SN,AGE,DEPT,MN,CNO,SCOREF=SNOSN,SNOAGE,SNODEPT v一个SNO有多个SCORE的值与其对应,即SCORE不能函数依赖于SNO,即有:SNO SCORE。v但是SCORE可以被(SNO,CNO)唯一地确定。所

11、以可表示为:(SNO,CNO)SCORE。返回返回16有关函数依赖的几点说明:1平凡的函数依赖与非平凡的函数依赖。当属性集Y是属性集X的子集时,则必然存在着函数依赖XY,这种依赖称为平凡的函数依赖。平凡的函数依赖。如果Y不是X的子集,则称XY为非平凡的函数依赖非平凡的函数依赖。若不特别声明,我们讨论的都是非平凡的函数依赖。2函数依赖是语义范畴的概念。我们只能根据语义来确定一个函数依赖,而不能按照其形式化定义来证明一个函数依赖是否成立。例如,对于关系模式S,当不存在重名的情况下,可以得到:vSNAGEvSNDEPT这种函数依赖关系,必须是在没有重名的条件下成立,否则不成立。所以函数依赖反映了一种

12、语义完整性约束。返回返回173函数依赖与属性之间的联系类型有关。(1)在一个关系模式中,如果属性X与Y有1:1联系时,则存在函数依赖XY,YX,即X Y。例如,当学生无重名时,SNO SN。(2)如果属性X与Y有1:m的联系时,则只存在函数依赖XY。例如,SNO与AGE,DEPT之间均为m:1联系,所以有SNOAGE,SNODEPT。(3)如果属性X与Y有m:n的联系时,则X与Y之间不存在任何函数依赖关系。例如,一个学生可以选修多门课程,一门课程又可以为多个学生选修,所以SNO与CNO之间不存在函数依赖关系。v所以从属性间的联系类型入手,可确定属性间的函数依赖。返回返回184函数依赖关系的存在

13、与时间无关。必须根据语义来确定属性之间的函数依赖,而不能单凭某一时刻关系中的实际数据值来判断。例如,对于关系模式S,假设没有“无重名”这语义规定,即允许重名的情况,则即使当前没有重名的情况,也不存在SNSNO,因为如果新增加一个重名的学生,函数依赖SNSNO必然不成立。所以函数依赖关系的存在与时间无关,而只与数据之间的语义规定有关。返回返回195函数依赖可以保证关系分解的无损连接性。设R(X,Y,Z),X,Y,Z为不相交的属性集合,若有XY或XZ,则R(X,Y,Z)=RX,Y*RX,Z,其中,RX,Y表示关系R在属性(X,Y)上的投影,即R等于其投影在X上的自然连接,这样便保证了关系R分解后不

14、会丢失原有的信息,称作关系分解的无损连接性。例如,对于关系模式SCD,有SNO(SN,AGE,DEPT,MN),SCD(SNO,SN,AGE,DEPT,MN,CNO,SCORE)=SCDSNO,SN,AGE,DEPT,MN*SCDSNO,CNO,SCORE,也就是说,用其投影在SNO上的自然连接可复原关系模式SCD。这一性质非常重要,在后一节的关系规范化中要用到。返回返回204.2.1.2 函数依赖的基本性质1投影性。根据平凡的函数依赖的定义可知,一组属性函数决定它的所有子集。例如,在关系SCD中,(SNO,CNO)SNO和(SNO,CNO)CNO。2扩张性。若XY且WZ,则(X,W)(Y,Z

15、)。例如,SNO(SN,AGE),DEPTMN,则有(SNO,DEPT)(SN,AGE,MN)。3合并性。若XY且XZ则必有X(Y,Z)。例如,在关系SCD中,SNO(SN,AGE),SNO(DEPT,MN),则有SNO(SN,AGE,DEPT,MN)。4分解性。若X(Y,Z),则XY且XZ。很显然,分解性为合并性的逆过程。v由合并性和分解性,很容易得到以下事实:XA1,A2,,An成立的充分必要条件是XAi(i=1,2,n)成立。返回返回214.2.2 完全函数依赖与部分函数依赖定义4.2 设关系模式R(U),U是属性全集,X和Y是U的子集,如果XY,并且对于X的任何一个真子集X,都有X Y

16、,则称Y对X完全函数依赖(Full Functional Dependency),记作 X Y。如果对X的某个真子集X,有XY,则称Y对X部分函数依赖(Partial Functional Dependency),记作X Y。例如,在关系模式SCD中,(SNOSNO,CNOCNO)SCORESCORE。因为SNO SCORE,CNO SCORE,而(SNOSNO,CNOCNO)AGEAGE。因为SNOAGE由定义4.2可知:只有当决定因素是组合属性时,讨论部分函数依赖才有意义,当决定因素是单属性时,只能是完全函数依赖。例如,在关系模式S(SNO,SN,AGE,DEPT),决定因素为单属性SNO

17、,有SNO(SN,AGE,DEPT),不存在部分函数依赖。fp fp返回返回224.2.3 传递函数依赖定义4.3 设有关系模式R(U),U是属性全集,X,Y,Z是U的子集,若XY,但Y X,而YZ(Y X,Z Y),则称Z对X传递函数依赖(Transitive Functional Dependency),记作:X Z。如果YX,则X Y,这时称Z对X直接函数依赖,而不是传递函数依赖。例如,在关系模式SCD中,SNODEPTN,但DEPTN SNO,而DEPTNMN,则有SNO MN。当学生不存在重名的情况下,有SNOSN,SNSNO,SNO SN,SNDEPTN,这时DEPTN对SNO是直

18、接函数依赖,而不是传递函数依赖。综上所述,函数依赖分为完全函数依赖、部分函数依赖和传递函数依赖三类,它们是规范化理论的依据和规范化程度的准则,下面我们将以介绍的这些概念为基础,进行数据库的规范设计。tt返回返回234.3 范式 v规范化的基本思想是消除关系模式中的数据冗余,消除数据依赖中的不合适的部分,解决数据插入、删除、更新时发生异常现象。v关系数据库的规范化过程中为不同程度的规范化要求设立的不同标准称为范式(Normal Form)。v满足最基本规范化要求的关系模式叫第一范式,v在第一范式中进一步满足一些要求为第二范式,v以此类推就产生了第三范式。等。返回返回24v范式的概念最早由E.F.

19、Codd提出。v从1971年起,Codd相继提出了关系的三级规范化形式,即第一范式(1NF)、第二范式(2NF)、第三范式(3NF)。v1974年,Codd和Boyce以共同提出Boyce-Codd范式,简称BC范式。v1976年Fagin提出了第四范式,v后来又有人定义了第五范式。v至此在关系数据库规范中建立了一个范式系列:1NF,2NF,3NF,BCNF,4NF,5NF,一级比一级有更严格的要求。v各个范式之间的联系可以表示为:5NF 4NF BCNF 3NF 2NF 1NF如图4.3所示。返回返回25图4.3 各种范式之间的关系下面逐一介绍各级范式及其规范化。返回返回264.3.1 第一

20、范式定义4.4 如果关系模式R,其所有的属性均为简单属性,即每个属性都是不可再分的,则称R属于第一范式,简称1NF,记作R1NF。满足1NF关系模式的要求:能元组确立主关键字。学生学号,姓名,成绩 1NF属性需尽量地小,即原子型的属性。职工职工号,姓名,工资,补贴 1NF不能有多值属性。关系模式R(NAME,ADDRESS,PHONE)1NF,如果一个人有多个电话号码PHONE。v在第2章讨论关系的性质时,我们把满足这个条件的关系称为规范化关系。v每个规范化的关系都属于1NF,即第一范式。返回返回27v然而,一个关系模式仅仅属于第一范式是不适用的。v在4.1节中给出的关系模式SCD属于第一范式

21、,但其具有大量的数据冗余,具有插入异常、删除异常、更新异常等弊端。v为什么会存在这种问题呢?v让我们分析一下SCD中的函数依赖关系,它的关系键是(SNO,CNO)的属性组合,所以有:(SNO,CNO)SCORESNOSN,(SNO,CNO)SNSNOAGE,(SNO,CNO)AGESNODEPT,(SNO,CNO)DEPTSNO MN,(SNO,CNO)MN fppppt返回返回28我们可以用函数依赖图表示以上函数依赖关系,如图4.4所示。SNMNSCORESNOCNOPPf由此可见,在SCD中,既存在完全函数依赖,又存在部分函数依赖和传递函数依赖。正是由于关系中存在着复杂的函数依赖,才导致数

22、据操作中出现了各种弊端。克服这些弊端的方法是用投影运算将关系分解,去掉过于复杂的函数依赖关系,向更高一级的范式进行转换。T返回返回294.3.2 第二范式4.3.2.1 第二范式的定义定义4.5 如果关系模式R1NF,且每个非主属性都完全函数依赖于R的每个关系键,则称R属于第二范式(Second Normal Form),简称2NF,记作R2NF。v在关系模式SCD中,SNO,CNO为主属性,AGE,DEPT,MN,MN,SCORE均为非主属性,经上述分析,存在非主属性对关系键的部分函数依赖,所以所以SCDSCD不属于不属于2NF2NF。v而如图4.2所示的由SCD分解的三个关系模式S,D,S

23、C,其中S的关系键为SNO,D的关系键为DEPT,都是单属性,不可能存在部分函数依赖。而对于SC,(SNO,CNO)SCORE。所以SCD分解后,消除了非主属性对关系键的部分函数依赖,S S,D D,SCSC均属于均属于2NF2NF。f返回返回30v又如在2.4.2中,讲述全码的概念时给出的关系模式TCS(T,C,S),一个教师可以讲授多门课程,一门课程可以为多个教师讲授,同样一个学生可以选听多门课程,一门课程可以为多个学生选听,(T,C,S)三个属性的组合是关系键,T,C,S都是主属性,而无非主属性,所以也就不可能存在非主属性对关系键的部分函数依赖,TCS2NF。v经以上分析,可以得到两个结

24、论:1从1NF关系中消除非主属性对关系键的部分函数依赖,则可得到2NF关系。2如果R的关系键为单属性,或R的全体属性均为主属性,则R2NF。返回返回314.3.2.2 2NF规范化v2NF规范化是指把1NF关系模式通过投影分解转换成2NF。v分解基本原则就是“一事一地”,让一个关系只描述一个实体或者实体间的联系。如果多于一个实体或联系,则进行投影分解。下面对2NF规范化作形式化的描述。v设关系模式R(X,Y,Z),R1NF,但R 2NF,其中,X是键属性,Y,Z是非键属性,且存在部分函数依赖,X Y。设X可表示为X1、X2,其中X1 Y。则R(X,Y,Z)可以分解为RX1,Y和RX,Z。pf返

25、回返回32v因为X1Y,所以R(X,Y,Z)=RX1,Y*RX1,X2,Z=RX1,Y*RX,Z,即R等于其投影RX1,Y和X,Z在X1上的自然连接,R的分解具有无损连接性。v由于X1 Y,因此RX1,Y2NF。若RX,Z 2NF,可以按照上述方法继续进行投影分解,直到将RX,Z分解为属于2NF关系的集合。fv下面以关系模式SCD为例,来说明2NF规范化的过程例4.1 将SCD(SNO,SN,AGE,DEPT,MN,CNO,SCORE)规范到2NF。由SNOSN,SNOAGE,SNODEPT,(SNO,CNO)SCORE,可以判断,关系SCD至少描述了两个实体,一个为学生实体,属性有SNO、S

26、N、AGE、DEPT、MN;另一个是学生与课程的联系(选课),属性有SNO、CNO和SCORE。根据分解的原则,将SCD分解成如下两个关系,如图4.5所示。返回返回33SD(SNO,SN,AGE,DEPT,MN),描述学生实体;SC(SNO,CNO,SCORE),描述学生与课程的联系。SD SNOSNAGEDEPTMNS1赵亦17计算机刘伟S2钱尔18信息王平S3孙珊20信息王平S4李思21自动化刘伟SCSC SNOCNOSCORES1C190S1C285S2C557S2C680S2C7 S2C570S3C10S3C270S3C485S4C193图4.5 关系SD和SC 返回返回34v对于分解

27、后的两个关系SD和SC,主键分别为SNO和(SNO,CNO),非主属性对主键完全函数依赖。因此,SD2NF,SC2NF,且这种分解没有丢失任何信息,具有无损连接性。v分解后,SD和SC的函数依赖分别如下图所示。SNOSNSNOCNOSCOREAGEDEPTMN图图4.6 SD4.6 SD中的函数依赖关系中的函数依赖关系 图图4.7 SC4.7 SC中的函数依赖关系中的函数依赖关系 返回返回35v1NF的关系模式经过投影分解转换成2NF后,消除了一些数据冗余。分析图4.5中SD和SC中的数据,可以看出,它们存储的冗余度比关系模式SCD有了较大辐度的降低。v学生的姓名、年龄不需要重复存储,一定程度

28、上避免数据不一致性的问题。v由于把学生的基本信息与选课信息分开存储,则学生基本信息因没选课而不能插入的问题得到了解决,插入异常现象得到了部分改善。v同样,如果某个学生不再选修C1课程,只在选课关系SC中删去该该学生选修C1的记录即可,而SD中有关该学生的其它信息不会受到任何影响,也解决了部分删除异常问题。v关系模式SD和SC在性能上比SCD有了显著提高。返回返回364.3.2.3 2NF的缺点v2NF的关系模式解决了1NF中的一些问题,但仍然存在着一些问题:1数据冗余。每个系名和系主任的名字存储的次数等于该系的学生人数。2插入异常。当一个新系没有招生时,有关该系的信息无法插入。3删除异常。某系

29、学生全部毕业而没有招生时,删除全部学生的记录也随之删除了该系的有关信息。4更新异常。更换系主任时,仍需改动较多的学生记录。v之所以存在这些问题,是由于在SCD中存在着非主属性对主键的传递依赖。v分析SCD中的函数依赖关系,SNOSN,SNOAGE,SNODEPT,DEPTMN,SNO MN,存在非主属性MN对主键SNO传递依赖。v对关系模式SCD进一步简化,即消除这种传递依赖,得到3NF。t返回返回374.3.3 第三范式4.3.3.1 第三范式的定义定义4.6 如果关系模式R2NF,且每个非主属性都不传递依赖于R的每个关系键,则称R属于第三范式(Third Normal Form),简称3N

30、F,记作R3NF。v第三范式具有如下性质:1如果R3NF,则R也是2NF。2如果R2NF,则R不一定是3NF。例如,由关系模式SCD分解得到的SD和SC都为2NF,其中,SC3NF,但在SD中存在着非主属性MN对主键SNO传递依赖,故SD不属于3NF。应该对于SD进一步分解,使其转换成3NF。返回返回384.3.3.2 3NF规范化v3NF规范化是指把2NF关系模式通过投影分解转换成3NF。v和2NF的规范化遵循的原则相同,即“一事一地”,让一个关系只描述一个实体或者实体间的联系。v下面以2NF关系模式SD为例,来说明3NF规范化的过程。返回返回39例4.2将SD(SNO,SN,AGE,DEP

31、T,MN)规范到3NF。分析SD的属性组成,可以判断,关系SD实际上描述了两个实体:一个为学生实体,属性有SNO,SN,AGE,DEPT;另一个是系的实体,其属性DEPT和MN。根据分解的原则,将SD分解成如下两个关系 S(SNO,SN,AGE,DEPT),描述学生实体;D(DEPT,MN),描述系的实体。如图4.8所示。返回返回40S DSNOSNAGEDEPT DEPTMNS1赵亦17计算机 计算机刘伟S2钱尔18信息 信息王平S3孙珊20信息 自动化刘伟S4李思21自动化 对于分解后的两个关系S和D,主键分别为SNO和DEPT,不存在非主属性对主键的传递函数依赖。因此,S3NF,D3NF

32、。图图4.8 4.8 关系关系S S和和D D 返回返回41v分解后,S和D的函数依赖分别如图4.9和4.10所示。SNOSNDEPTAGEDEPTMN图图4.9 S4.9 S中的函数依赖关系图中的函数依赖关系图图图4.10 D4.10 D中的函数依赖关系图中的函数依赖关系图由图看出,关系模式SD分解后,函数依赖关系变得更加简单,既没有非主属性对键的部分依赖,也没有非主属性对键的传递依赖,并且解决了2NF中存在的四个问题。返回返回421 1数据冗余降低。系主任的名字只在关系系主任的名字只在关系D D中存储一次。中存储一次。2 2不存在插入异常。当某新系没有学生时,该系的信息也可直接插入当某新系

33、没有学生时,该系的信息也可直接插入到关系到关系D D中。中。3 3不存在删除异常。可以删除学生关系可以删除学生关系S S中的学生记录,而不影响系关中的学生记录,而不影响系关系系D D中的数据。若删除某系的全部学生,仍然可以保留该系的有关信中的数据。若删除某系的全部学生,仍然可以保留该系的有关信息。息。4 4不存在更新异常。更换系主任时,只需修改关系更换系主任时,只需修改关系D D中一个相应元组的中一个相应元组的MNMN属性值,从而不会出现数据的不一致现象。属性值,从而不会出现数据的不一致现象。vSCDSCD规范到规范到3NF3NF后,所存在的异常现象已经全部消失。后,所存在的异常现象已经全部消

34、失。v但是,但是,3NF3NF只限制了非主属性对键的依赖关系,而没有限制主属性对只限制了非主属性对键的依赖关系,而没有限制主属性对键的依赖关系。键的依赖关系。v这种依赖,仍有可能存在数据冗余、插入异常、删除异常和修改异这种依赖,仍有可能存在数据冗余、插入异常、删除异常和修改异常。常。v这时,则需对这时,则需对3NF3NF进一步规范化,消除主属性对键的依赖关系,为了进一步规范化,消除主属性对键的依赖关系,为了解决这种问题,解决这种问题,BoyceBoyce与与CoddCodd共同提出了一个新范式的定义,这就是共同提出了一个新范式的定义,这就是Boyce-CoddBoyce-Codd范式,通常简称

35、范式,通常简称BCNFBCNF或或BCBC范式。它弥补了范式。它弥补了3NF3NF的不足。的不足。返回返回434.4 关系模式的规范化 v到目前为止,规范化理论已经提出了六类范式(有关5NF的内容不再详细介绍)。v各范式级别是在分析函数依赖条件下对关系模式分离程度的一种测度。v一个低一级范式的关系模式,通过模式分解转化为若干个高一级范式的关系模式的集合,这种分解过程叫作关系模式的规范化(Normalization)。4.4.1 关系模式规范化的目的和原则v规范化的目的就是使结构合理,消除存储异常,使数据冗余尽量小,便于插入、删除和更新。v规范化的基本原则就是遵从“一事一地”的原则,即一个关系只

36、描述一个实体或者实体间的联系。v若多于一个实体,就把它“分离”出来。v因此,所谓规范化,实质上是概念的单一化,即一个关系表示一个实体。返回返回441NF2NF3NFBCNF消除决定属性不是候选键的非平凡的函数依赖消除非主属性对键的部分函数依赖消除非主属性对键的传递函数依赖消除主属性对键的部分和传递函数依赖规规范范化化过过程程 一般情况下,一个不好的(有异常弊病)关系模式总是可以通过分解转换成好的关系模式。但是在分解时要全面衡量,综合考虑,视实际情况而定。如对那些只要求查询,而无插入、删除等操作的系统,几种异常现象的存在并不影响数据库的操作。这时便不宜过度分解,否则当要对整体查询时,需要更多的多

37、表连接操作,这有可能得不偿失。在实际应用中,最有价值的是3NF和BCNF,通常分解到3NF就足够了。4.4.2 关系模式规范化的步骤规范化就是对原关系进行投影,消除决定属性不是候选键的函数依赖。规范化就是对原关系进行投影,消除决定属性不是候选键的函数依赖。消除非平凡且非函数依赖的多值依赖4NF返回返回454.24 设有关系模式R(职工编号,日期,日营业额,部门名,部门经理),该模式统计商店里每个职工的日营业额,以及职工所在的部门和经理信息。如果规定:每个职工每天只有一个营业额;每个职工只在一个部门工作;每个部门只有一个经理。试回答下列问题:(1)根据上述规定,写出模式R的基本FD和关键码;(2

38、)说明R不是2NF的理由,并把R分解成2NF模式集;(3)进而分解成3NF模式集。返回返回46解:(1)基本的FD有三个:(职工编号,日期)日营业额 职工编号 部门名 部门名 部门经理 R的关键码为(职工编号,日期)。(2)R中有两个这样的FD:(职工编号,日期)(部门名,部门经理)职工编号 (部门名,部门经理)可见前一个FD是局部依赖,所以R不是2NF模式。R应分解成R1(职工编号,部门名,部门经理)R2(职工编号,日期,日营业额)此处,R1和R2都是2NF模式。(3)R2已是3NF模式。在R1中,存在两个FD:职工编号 部门名 部门名 部门经理因此,“职工编号 部门经理”是一个传递依赖,R

39、1不是3NF模式。R1应分解成R11(职工编号,部门名)R12(部门名,部门经理)这样,=R11,R12,R2 是一个3NF模式集。返回返回474.25 设有关系模式R(运动员编号,比赛项目,成绩,比赛类别,比赛主管)存储运动员比赛成绩及比赛类别、主管等信息。如果规定:每个运动员每参加一个比赛项目,只有一个成绩;每个比赛项目只属于一个比赛类别;每个比赛类别只有一个比赛主管。试回答下列问题:(1)根据上述规定,写出模式R的基本FD和关键码;(2)说明R不是2NF的理由,并把R分解成2NF模式集;(3)进而分解成3NF模式集。返回返回48解:(1)基本的FD有三个:(运动员编号,比赛项目)成绩 比

40、赛项目 比赛类别 比赛类别 比赛主管 R的关键码为(运动员编号,比赛项目)。(2)R中有两个这样的FD:(运动员编号,比赛项目)(比赛类别,比赛主管)比赛项目 (比赛类别,比赛主管)可见前一个FD是局部依赖,所以R不是2NF模式。R应分解成R1(比赛项目,比赛类别,比赛主管)R2(运动员编号,比赛项目,成绩)这里,R1和R2都是2NF模式。(3)R2已是3NF模式。在R1中,存在两个FD:比赛项目 比赛类别 比赛类别 比赛主管因此,“比赛项目 比赛主管”是一个传递依赖,R1不是3NF模式。R1应分解成R11(比赛项目,比赛类别)R12(比赛类别,比赛主管)这样,=R11,R12,R2 是一个3NF模式集。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(关系规范化理论课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|