分布式数据库系统概述课件.ppt

上传人(卖家):晟晟文业 文档编号:5013322 上传时间:2023-02-02 格式:PPT 页数:33 大小:415.50KB
下载 相关 举报
分布式数据库系统概述课件.ppt_第1页
第1页 / 共33页
分布式数据库系统概述课件.ppt_第2页
第2页 / 共33页
分布式数据库系统概述课件.ppt_第3页
第3页 / 共33页
分布式数据库系统概述课件.ppt_第4页
第4页 / 共33页
分布式数据库系统概述课件.ppt_第5页
第5页 / 共33页
点击查看更多>>
资源描述

1、分布式数据库系统概述分布式数据库系统概述2008.09目录n分布式数据库系统n为什么要建立分布式数据库n分布式数据库的概念n分布式数据库的优缺点n数据分布策略n数据分布的目的n数据分布的方式n关系分割n数据分布带来的问题nDDBS的系统结构n物理上分布、逻辑上集中DDBS n物理上分布、逻辑上也分布的DDBS 1.分布式数据库系统n为什么要建立分布式数据库 n用户需求:数据共享用户需求:数据共享n用户组织往往是由地理上分散的多个部门所组成;n许多部门可能已先后单独建立了自己的数据库;n各个部门/用户的计算机已用网络连接在一起;n业务上的联系使得各个部门/用户间需要共享数据。n集中式数据库的缺点

2、集中式数据库的缺点n建立一个集中式数据库集中式数据库,各部门/用户通过计算机网络存取数据,是一个办法;n但这有以下缺点:缺点:通信开销大、性能差、可用性差、可扩充性差、难以管理。1.分布式数据库系统部门2部门n部门1DBMSDBn集中式数据库目录n分布式数据库系统n为什么要建立分布式数据库n分布式数据库的概念n分布式数据库的优缺点n数据分布策略n数据分布的目的n数据分布的方式n关系分割n数据分布带来的问题nDDBS的系统结构n物理上分布、逻辑上集中DDBS n物理上分布、逻辑上也分布的DDBS 1.分布式数据库系统n分布式数据库的概念n分布式数据库(分布式数据库(Distributed Dat

3、abase,DDB)n分布在计算机网络上的、多个逻辑相关的数据集所构成的整体。n分布式数据库管理系统(分布式数据库管理系统(Distributed Database Management System,DDBMS)n建立、管理和维护分布式数据库的一组专门软件。n分布式数据库系统(分布式数据库系统(Distributed Database System,DDBS)n一组分布在计算机网络上的相关数据,由DDBMS进行统一管理后构成的系统。nDDBS的特点的特点n 数据在物理上是分布的;n 分布的数据在逻辑上是相关的;n 分布的数据由DDBMS统一管理。1.分布式数据库系统n分布式数据库结点2结点1

4、结 点n目录n分布式数据库系统n为什么要建立分布式数据库n分布式数据库的概念n分布式数据库的优缺点n数据分布策略n数据分布的目的n数据分布的方式n关系分割n数据分布带来的问题nDDBS的系统结构n物理上分布、逻辑上集中DDBS n物理上分布、逻辑上也分布的DDBS 1.分布式数据库系统n分布式数据库的优缺点n与集中式数据库相比,分布式数据库的优点与集中式数据库相比,分布式数据库的优点:n 有利于改善性能n 可扩充性好n 可用性好n 自治性(Autonomy)好n但但分布式数据库也有其缺点分布式数据库也有其缺点:n 数据库设计更复杂了特别是数据分布问题n 可能会面临异构(Heterogeneou

5、s)数据集成的难题目录n分布式数据库系统n为什么要建立分布式数据库n分布式数据库的概念n分布式数据库的优缺点n数据分布策略n数据分布的目的n数据分布的方式n关系分割n数据分布带来的问题nDDBS的系统结构n物理上分布、逻辑上集中DDBS n物理上分布、逻辑上也分布的DDBS 2.数据分布策略n数据分布的目的n主要目的:主要目的:提高访问的局部性访问的局部性(Locality of Reference),从而提高系统性能性能。n通过数据的合理分布,尽可能地使更多的数据能够就地存就地存取取(即访问的局部化局部化),以减少数据的远程存取远程存取(即访问的全局化全局化)。n但在任何一个分布式数据库系统

6、中,不可能做到所有数据的访问都局部化。即使通用增加数据副本数据副本的办法来提高读读的局部化,但由于必须保证多副本的同步更新,必然会同时增加更新更新的全局化。n其他目的:其他目的:均衡负荷;提高系统可用性;等。目录n分布式数据库系统n为什么要建立分布式数据库n分布式数据库的概念n分布式数据库的优缺点n数据分布策略n数据分布的目的n数据分布的方式n关系分割n数据分布带来的问题nDDBS的系统结构n物理上分布、逻辑上集中DDBS n物理上分布、逻辑上也分布的DDBS 2.数据分布策略n数据分布的方式n三种方式:三种方式:n划分式划分式(Partitioned):把全部数据看成是一个集合,按数据的来源

7、和用途,将数据划分成若干互不相交的子集,分别分布在各个不同的结点上。n全重复式全重复式(Fully Replicated):每个结点拥有全部数据的一个副本。n部分重复式部分重复式(Partially Replicated):前面两种极端的一个折衷。即根据需要,有些数据只分布在一个结点上,有些数据则分布在多个结点上。2.数据分布策略n数据分布的方式n三种方式比较 数据分布方式数据分布方式比较角度比较角度划分式划分式全重复式全重复式部分重复式部分重复式复杂性复杂性低中高灵活性灵活性小中大体现体现DDBSDDBS的特点的特点不充分中充分因数据分布而引起的问题因数据分布而引起的问题少中多实际中应用的普

8、遍程度实际中应用的普遍程度不普遍不普遍普遍目录n分布式数据库系统n为什么要建立分布式数据库n分布式数据库的概念n分布式数据库的优缺点n数据分布策略n数据分布的目的n数据分布的方式n关系分割n数据分布带来的问题nDDBS的系统结构n物理上分布、逻辑上集中DDBS n物理上分布、逻辑上也分布的DDBS 2.数据分布策略n关系分割n数据分布的单位:数据分布的单位:n 关系关系(Relation):即以整个关系(即基表)作为数据分布的单位。n 裂片裂片(Fragment):即将一个关系(称全局关系全局关系Global Relation)分割成多个小关系(称裂片裂片Fragment),以裂片作为数据分布

9、的单位。n对一个关系有下列三种分割方式三种分割方式:n水平分割水平分割(Horizontal Fragmentation):按元组(即行)分割。n垂直分割垂直分割(Vertical Fragmentation):按属性(即列)分割。n混合分割混合分割(Hybrid Fragmentation):先水平分割,再垂直分割;或反之。2.数据分布策略n关系分割n分割时,需遵守的三条准则三条准则:n完备性完备性(Completeness):分割时,全局关系的的所有数据都要分配到相应的裂片中,而不能丢失数据。n可重构性可重构性(Reconstruction):分割后,可由裂片重构全局关系。即分割前后的数据

10、库是等价的。n不相交性不相交性(Disjointness):在水平分割时,各裂片中不能有重复元组。这样,可简化管理。(注:在垂直分割时,各裂片中必须有适当的重复属性)。2.数据分布策略n关系分割水平分割水平分割n定义定义:将全局关系GR水平分割成n个裂片FR1,FR2,FRn。每个裂片FRi可由一个对全局关系的选择操作来定义:FRi=Pi(GR),其中Pi为GR上的谓词。n这个选择操作对应以下SQL查询:SELECT*FROM GR WHERE Pi;n为满足不相交性不相交性,则应有:FRi FRj=,ij即:SELECT*FROM GR WHERE(Pi Pj);=,ij即:Pi Pj =F

11、ALSE,ijn为满足完备性完备性,则应有:FR1 FR2 FRn=GR即:SELECT*FROM GR WHERE(P1 P2 Pn);=GR即:P1 P2 Pn =TRUEn显然,各裂片的并即可重构全局关系,因此,以上水平分割可确保可重构性可重构性。2.数据分布策略n关系分割垂直分割垂直分割n定义定义:将全局关系GR(U)垂直分割成n个裂片FR1,FR2,FRn。每个裂片FRi可由一个对全局关系的投影操作来定义:FRi=Ui(GR),其中Ui为U上的属性子集。n这个投影操作对应以下SQL查询:SELECT DISTINCT Ui FROM GR;n为满足完备性完备性,则应有:U1 U2 U

12、n=Un为满足可重构性可重构性,则应有:即:FR1 FR2 FRn =GR 即:U1(GR)U2(GR)Un(GR)=GRn因此,在诸Ui中应有一定的重复属性,以便于进行连接操作。一种简单的做法是让每个Ui中均含有全局关系GR的(主)键。2.数据分布策略n关系分割混合分割混合分割n定义:交替使用选择和投影操作来定义。水平垂直 FR1 FR11GR FR12 FR2 FR13n这在理论上可行,实际中很少使用,实际系统也很少支持混合分割。水 平垂垂直直目录n分布式数据库系统n为什么要建立分布式数据库n分布式数据库的概念n分布式数据库的优缺点n数据分布策略n数据分布的目的n数据分布的方式n关系分割n

13、数据分布带来的问题nDDBS的系统结构n物理上分布、逻辑上集中DDBS n物理上分布、逻辑上也分布的DDBS 2.数据分布策略n数据分布带来的问题n在分布式数据库中,由于数据的分布对数据管理带来了下列四个新问题:n保持多副本的一致性保持多副本的一致性n在数据更新时,多个副本必须进行同步更新,以保证数据的一致性。这需要一定开销(Cost)。但这换来了读的局部性。n保持分布的一致性保持分布的一致性n在水平分割中,裂片由选择的谓词来定义。数据更新时,若谓词涉及的属性值发生变化,必然须要考虑数据的重新分布问题。2.数据分布策略n数据分布带来的问题n全局查询的处理全局查询的处理n全局查询全局查询(Glo

14、bal Query):用户对全局关系提交的查询,但往往会涉及到系统中多个结点(裂片中的)数据。n在DDBS中,用户同样只需提交全局查询,而不需关心查询处理和优化。但由于数据的分布,系统(DDBMS)必须对以下问题进行处理:n全局关系是否被分割?如何被分割?关系或裂片在哪个结点上?如何在多副本中选择其一?如何将全局查询转换成可在有关结点上执行的子查询子查询(Subquery)?查询如何优化?n分布事务的管理分布事务的管理n分布事务分布事务也称全局事务全局事务(Global Transaction):存取多个结点上数据的事务。n由于在DDBS中数据是分布的,因此,事务但往往也是分布的。这对并发控制

15、、恢复等事务管理带来了新问题。2.数据分布策略n数据分布带来的问题n以上由于数据的分布带来的问题都是由DDBMS来处理,用户不必关心。这叫做DDBMS提供了分布透明性分布透明性(Distribution Transparency)。n分布透明的程度是衡量一个DDBMS好坏的重要指标。目录n分布式数据库系统n为什么要建立分布式数据库n分布式数据库的概念n分布式数据库的优缺点n数据分布策略n数据分布的目的n数据分布的方式n关系分割n数据分布带来的问题nDDBS的系统结构n物理上分布、逻辑上集中DDBS n物理上分布、逻辑上也分布的DDBS 3.DDBS的系统结构n物理上分布、逻辑上集中DDBSn系

16、统结构示意图LDBMSGDBMSGMGDDCMGDBMSLDBMSGDDCMGDBMSLDBMSGDD网络用户用户用户结点1结点2结点3LDBLDDLDDLDBLDDLDDLDBLDDLDD3.DDBS的系统结构n物理上分布、逻辑上集中DDBS 各部分的功能:各部分的功能:n全局全局DBMS(GDBMS)n提供分布式数据库系统的用户界面,进行全局查询处理,协调全局事务的执行,保证数据分布透明性和全局数据库的一致性。GDBMS可分布于网络上全部结点、部分结点或一个结点上。n全局数据字典(全局数据字典(GDD)n存放全局概念模式、裂片模式(Fragmentation Schema)和分配模式(Al

17、location Schema),以及各模式之间、全局模式与局部模式之间的映象(mapping)等。n局部局部DBMS(LDBMS)n建立和管理局部数据库(LDB),协助全局事务的执行,并执行全局DBMS分配给本结点的子事务。n通讯管理(通讯管理(CM)n执行网络上结点间的基本通讯功能。3.DDBS的系统结构n物理上分布、逻辑上集中DDBS 模式结构:模式结构:全局外模式1全局外模式2全局外模式m用户/应用用户/应用用户/应用全局概念模式裂片模式分配模式局部概念模式1局部概念模式2局部概念模式n局部内模式1局部内模式2局部内模式nLDB1LDBnLDB2映象1映象2映象3映象4映象GDBMSL

18、DBMS分布式DB增加的集中式DB原有的3.DDBS的系统结构n物理上分布、逻辑上集中DDBS 特点特点n有全局数据模式;有全局数据模式;n强调统一管理;强调统一管理;n适合于自顶向下(从零开始)设计、构造分布式数据库;适合于自顶向下(从零开始)设计、构造分布式数据库;n因受制于全局模式,数据库的集成、扩充与重构较难,因受制于全局模式,数据库的集成、扩充与重构较难,缺乏灵活性;缺乏灵活性;n大多数商品化大多数商品化DDBMS产品均属此类。产品均属此类。目录n分布式数据库系统n为什么要建立分布式数据库n分布式数据库的概念n分布式数据库的优缺点n数据分布策略n数据分布的目的n数据分布的方式n关系分

19、割n数据分布带来的问题nDDBS的系统结构n物理上分布、逻辑上集中DDBS n物理上分布、逻辑上也分布的DDBS 3.DDBS的系统结构n物理上分布、逻辑上也分布的DDBSn也称联邦式数据库系统联邦式数据库系统(Federated Database System)n模式结构及数据集成方法:模式结构及数据集成方法:n局部模式局部模式(Local Schema,LS):每个结点的局部数据库的模式。n输出模式输出模式(Export Schema,ES):每个结点中可供其他结点共享的那部分数据的模式。n输入模式输入模式(Import Schema,IS):每个结点中因共享其他结点的数据而“引进”的模式

20、。n联邦模式联邦模式(Federated Schema,FS):每个结点中的局部模式LS与输入模式IS构成该结点的联邦模式。n数据共享通过“双边协商”解决。n模式间的转换、全局查询的处理(分解、优化等)以及全局事务的执行等由DDBMS协调与维护。n各结点的LDBMS提供结点自治能力,并负责执行局部事务与子事务。3.DDBS的系统结构n物理上分布、逻辑上也分布的DDBS 系统结构 FS1 LS1ES1IS1LDB1LDBMS1 FS3 LS3ES3IS3LDB3LDBMS3FS2LS2ES2IS2LDB2LDBMS2DDBMSDDBMSDDBMS3.DDBS的系统结构n物理上分布、逻辑上也分布的DDBS 特点n无全局数据模式;n强调结点自治;n适合于自底向上集成现有的集中式数据库,从而构造分布式数据库;但异构数据源的集成(特别是语义集成)的难度较大;n数据库的重新配置、扩充与重构较灵活;n目前,商品化DDBMS产品仅提供了有限的异构数据源集成能力。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(分布式数据库系统概述课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|