1、NEC (China) Co., Ltd.NEC Technical Certification(Senior Level )n服务器系统发展与集群服务器系统发展与集群n集群系统的基本概念集群系统的基本概念nHA基本概念和工作原理基本概念和工作原理n主要主要HA集群及其对比集群及其对比nNEC ExpressCluster集群集群主要内容主要内容n服务器系统发展与集群服务器系统发展与集群n集群系统的基本概念集群系统的基本概念nHA基本概念和工作原理基本概念和工作原理n主要主要HA集群及其对比集群及其对比nNEC ExpressCluster集群集群主要内容主要内容F 传统的终端传统的终端/ /
2、主机模式主机模式- 终端功能简单,无需维护工作,在主机一端进行专门的管理与维护。但是,主机造价昂贵,终端没有处理能力。F 客户机客户机/ /服务器模式服务器模式- 该模式推进了计算产业的标准化和开放化的发展;- 分布式的网络模型提供了相当大的灵活性,但是随着分布系统规模的规模扩大,系统的维护和管理带来了巨大的开销F 浏览器浏览器/ /服务器模式服务器模式 - 由于用户端所用软件只是一个简单的浏览器,用户基本上无需 培训,用户端软件也是无需维护的; - 软件的升级与修改只在服务器端进行,对用户透明,服务器与 浏览器可处于不同的操作系统平台。计算机系统模式的演变计算机系统模式的演变企业信息化程度的
3、发展企业信息化程度的发展一、高性能运算能力的要求一、高性能运算能力的要求F SMP(Symmetric Multi Processing)Systems;F NUMA(Non Uniform Memory Access)Systems;F ccNUMA,一种变异的NUMA;F 由SMP系统组成Cluster。二、更加复杂的用户层面二、更加复杂的用户层面三、逐渐提高的管理特性三、逐渐提高的管理特性四、更快的响应时间的要求四、更快的响应时间的要求五、五、24247 7的可靠性的要求的可靠性的要求为什么需要集群为什么需要集群F 大型主机:大型主机:IBM S/390IBM S/390- 具有较强的处
4、理能力,但是专用设备的价格昂贵F 对称多处理机(对称多处理机(SMPSMP):):Sun Ultra E10000Sun Ultra E10000- 适用于中小规模的信息服务系统,受其结构的影响扩展性较差,单台SMP机器无法满足日益增长的信息服务需求F 大规模并行处理机(大规模并行处理机(MPPMPP):):IBM SP2IBM SP2- 强大的计算能力和快速的通信系统,但价格高,性能价格比不好F 非一致性内存访问技术(非一致性内存访问技术(NUMANUMA):):IBM NUMA-QIBM NUMA-Q- 由若干通过高速专用网络连接起来的独立节点构成的系统- 各个节点可以是单个CPU或是SM
5、P系统- Cache一致性可有多种解决方案- 需要操作系统和特殊软件的支持服务器系统的种类服务器系统的种类由三个由三个SMPSMP模块(每个有模块(每个有4 4个个CPUCPU)构成的)构成的NUMANUMA系系统节点(统节点(SequentSequent)服务器系统的种类服务器系统的种类F集群技术(集群技术(CLUSTERCLUSTER)- 由若干完整的计算机互联组成一个统一的计算机系统;- 计算机和高速互联硬件可以采用现成硬件或特殊硬件;- 需要特殊软件支持,例如NEC ExpressCluster等等;- 可实现单一系统映像,即操作控制、IP登录点、文件结构、存储空间、I/O空间、作业管
6、理系统等等的单一化;- 可经济地构成超级服务器、高可用性服务器等等。服务器系统的种类服务器系统的种类用集群技术构成虚拟服务器用集群技术构成虚拟服务器(集群各节点用(集群各节点用LAN/WANLAN/WAN联接)联接)n服务器系统发展与集群服务器系统发展与集群n集群系统的基本概念集群系统的基本概念nHA基本概念和工作原理基本概念和工作原理n主要主要HA集群及其对比集群及其对比nNEC ExpressCluster集群集群主要内容主要内容1 1、基于特殊硬件、基于特殊硬件F L4 Switch;F 专用Director2 2、基于操作系统、基于操作系统F SCO UnixWare7.1.1+Non
7、Stop ClusterF Microsoft Windows NT4, WIN2000+MSCS F TurboLinux+TurboHAF Legato CSBS3 3、基于数据库、基于数据库F Oracle;F DB24 4、基于应用程序、基于应用程序F SAP ERP;F Lotus Notes集群的一种分类集群的一种分类1 1、Distributed Computing SolutionsDistributed Computing SolutionsF 没有单一系统映像(SSI),没有共享文件系统;F 每台计算机拥有自己的磁盘、数据库等,只是能协同运算;F 一般用于合作运算,大型计算
8、系统,不能算是真正意义的集群;F 主要产品:Beowulf(http:/beowulf.gfsc.nasa.gov)、SETIhome2 2、IP-Spraying SolutionIP-Spraying SolutionF 没有单一系统映像(SSI),没有共享文件系统;F 不能做到真正的负载均衡;F 一般用于WWW的HTTP请求,也不能算是真正的集群;F 主要产品:TurboLinux Turbo Cluster(http:/)3 3、High Availability Clustering SolutionsHigh Availability Clustering SolutionsF 没
9、有单一系统映像(SSI),但有共享文件系统;F 解决部分的单点失效故障,如双机热备;F 主要产品:Novell Cluster Server(NCS)、Microsoft Wolfpack、Microsoft MSCS、IBM HACMP、SunCluster、HP ServiceGuard、DEC Truclusters、SCO Reliant HA;集群的另一种分类集群的另一种分类Job 1Job 2Job 3Job 4Job 5Job 6Job 7Job 8Job 9Job 10Job 11Job 12Job 13Job 14Job 15Job 16Job 17Job 18Distrib
10、uted Computing Solutions客户服务节点管理节点技术可以实现静态负载均衡,主要用于可以实现静态负载均衡,主要用于Internet服务,具服务,具备备High Availability功能,不具备动态负载均衡。功能,不具备动态负载均衡。IP-Spraying SolutionExpress 5800 120LhWindows 2003 SQL Server7100M 心跳检测心跳检测数据同步链路数据同步链路ACTIVESTANDBY有有Active/StandbyActive/Standby方方式、式、 Active/ActiveActive/Active和和N+1N+1方式
11、。方式。 Active/StandbyActive/Standby方式方式浪费一半以上投入。浪费一半以上投入。请问:互为热请问:互为热备方式存在什备方式存在什么风险?么风险?High Availability Clustering SolutionsExpress 5800 120LhWindows 2003 SQL Server7Express5800 140HdShared StorageShared StorageServerNet SwitchXYRoot File SystemData or Application File SystemCurrent root nodePotent
12、ial root nodeCVIPNetwork SwitchExpress5800 140HdTrue Clustering SolutionsInternetp 硬件负载均衡产品硬件负载均衡产品 BIG-IP、3-DNS from F5 Networkp 类硬件负载均衡产品类硬件负载均衡产品 TCS for Turbo Linuxp 软件负载均衡产品软件负载均衡产品 Microsoft NLB COM+应用服务器应用服务器(CLB)(CLB) J2EE应用服务器应用服务器 (Weblogic,Websphare,Oracle9i AS) 交易中间件交易中间件 (BEA Tuxedo ) L
13、otus domino/notes负载均衡系统分类负载均衡系统分类Weblogic Server负载均衡方案负载均衡方案Lotus Domino负载均衡方案负载均衡方案n服务器系统发展与集群服务器系统发展与集群n集群系统的基本概念集群系统的基本概念nHA基本概念和工作原理基本概念和工作原理n主要主要HA集群及其对比集群及其对比nNEC ExpressCluster集群集群主要内容主要内容可用性可用性 - - 构成系统可用性的元素构成系统可用性的元素HA集群技术产生背景集群技术产生背景广义说,一个集群是相互独立的一些系统作为一个系广义说,一个集群是相互独立的一些系统作为一个系统工作,他们构成了一
14、个组叫集群。一个客户与集群统工作,他们构成了一个组叫集群。一个客户与集群相互作用时,集群像是一个独立的服务器。相互作用时,集群像是一个独立的服务器。高可用性集群:英文原文为高可用性集群:英文原文为High Availability High Availability ClusterCluster,简称,简称HA ClusterHA Cluster或者或者HA HA 高可用性集群,是高可用性集群,是指以减少服务中断(宕机)时间为目标的服务器集群指以减少服务中断(宕机)时间为目标的服务器集群技术。技术。可用性是服务型应用中最重要的因素,是评价和衡量可用性是服务型应用中最重要的因素,是评价和衡量系统
15、的一个重要指标。系统的一个重要指标。HA集群技术基本概念集群技术基本概念v Share Disk Mode: 所有机器可以同时访问同一个磁盘空间,实现磁盘共享所有机器可以同时访问同一个磁盘空间,实现磁盘共享HA集群技术两种方式集群技术两种方式v Share Nothing Mode: 所有机器不能同时访问同一个磁盘空间,没有共享磁盘。所有机器不能同时访问同一个磁盘空间,没有共享磁盘。v例如:例如:MSCS, Co-standby等双机软件。等双机软件。HA集群技术两种方式集群技术两种方式相连的系统可以相互访问对方的资源相连的系统可以相互访问对方的资源应用的同步化和串行化应用的同步化和串行化分布
16、式锁定管理(分布式锁定管理(DLM)流量阻塞和性能下降流量阻塞和性能下降两个系统如何同时访问同一数据两个系统如何同时访问同一数据Share Disk ModeHA集群技术两种方式集群技术两种方式Share Nothing Mode各系统占有集群中某资源各系统占有集群中某资源系统故障时另一系统取代它占有资源系统故障时另一系统取代它占有资源客户请求自动被导入占有特定资源的系统客户请求自动被导入占有特定资源的系统流量阻塞、可用性和动态负载均衡问题流量阻塞、可用性和动态负载均衡问题同一时间只允许某一系统占有某一资源同一时间只允许某一系统占有某一资源HA集群工作方式集群工作方式v 主主/从方式从方式Ac
17、tive/Standby或或Active/Passivev主主/主方式主方式 Active/Active HA集群工作方式集群工作方式W2K+MSCSHBA卡卡HBA卡卡iStorage S1400心跳线心跳线LANW2K+MSCSHA集群工作原理集群工作原理W2K+MSCSHBA卡卡HBA卡卡心跳线心跳线LANW2K+MSCSiStorage S1400HA集群工作原理集群工作原理W2K+MSCSHBA卡卡HBA卡卡心跳线心跳线LANW2K+MSCSFailOveriStorage S1400HA集群工作原理集群工作原理W2K+MSCSHBA卡卡HBA卡卡心跳线心跳线LANW2K+MSCSi
18、Storage S1400HA集群工作原理集群工作原理n服务器系统发展与集群服务器系统发展与集群n集群系统的基本概念集群系统的基本概念nHA基本概念和工作原理基本概念和工作原理n主要主要HA集群及其对比集群及其对比nNEC ExpressCluster集群集群主要内容主要内容双机双机RoseLifeKeeperCo-StandbyMSCSVCSTurboHA操作系统操作系统Windows, Linux, SCO Unixware, SCO OpenServerWindows/NTLinuxWindows NetwareLinuxWindowsWindowsTurbo LinuxLinux实现模
19、式实现模式 共享磁盘柜磁盘镜像共享磁盘磁盘镜像共享磁盘共享磁盘共享磁盘磁盘镜像共享磁盘工作模式工作模式Active/Standby) (Active/Active)Active/Standby) (Active/Active) Active/Standby) (Active/Active)Active/Standby)(Active/Active)(Active/Standby) (Active/Active)(Active/Active)节点数节点数22-162AD:2, DC:422安装需求安装需求操作系统HA 软件操作系统HA 软件操作系统HA 软件操作系统OSOS、Domino主要优点
20、主要优点1、配置简单2、用户界面友好3、功能齐全4、操作系统多样1、支持两种方式2、配置简单3、界面友好4、节点数2161、支持镜像方式2、配置简单3、用户界面友好1.配置简单2.用户界面友好3.不需要额外购买HA软件主要主要HA集群及其对比集群及其对比v微软的MSCS(Microsoft Cluster Server)v是在Windows平台平台上的一种集群方案v该集群软件在操作系统中自带v需要盘柜支持盘柜支持v工作方式为share nothing模式模式v支持主/从、主/主模式v支持SQL Server、DB2、Oracle等多种数据库v支持Windows 2000 AD/DC/2003E
21、,相对地分别支持2/4/8个节点。Win2003E上可以实现N+I集群, MSCS最多可以管理8个节点的集群,是目前市场上低成本、高性价比的方案。主要主要HA集群及其对比集群及其对比u MSCSvCo-Standby Server是Legato公司应用于Microsoft Windows 2000 Server、Advanced Server操作系统平台操作系统平台的高可用解决方案。它是专门设计用来保护公司重要服务器的关键数据和功能。v支持主/从、主/主模式v支持SQL Server、DB2、Oracle、Sybase等多种数据库,还支持用户特定应用。v该集群方案可以使用盘柜支持可以使用盘柜支
22、持,也可以采用磁盘镜像方式,不需磁盘镜像方式,不需要盘柜要盘柜。由于其支持磁盘镜像方式,在一些用户没有磁盘柜,但希望保证关键应用高可用性的情况下,得到广泛应用。 主要主要HA集群及其对比集群及其对比u Co-Standbyn服务器系统发展与集群服务器系统发展与集群n集群系统的基本概念集群系统的基本概念nHA基本概念和工作原理基本概念和工作原理n主要主要HA集群及其对比集群及其对比nNEC ExpressCluster集群集群主要内容主要内容NEC ExpressCluster简介简介ExpressClusterExpressCluster是支持是支持WindowsWindows和和LinuxL
23、inux平台的专业集群中间件软件,平台的专业集群中间件软件,支支持持2 21616个节点,支持镜像和共享模式个节点,支持镜像和共享模式可用于构建高可用性、高可靠性可用于构建高可用性、高可靠性以及高扩展性的集群系统。以及高扩展性的集群系统。 单方向备份单方向备份业务服务器服务器B运行中待机中多加多加1备份备份业务业务服务器运行中运行中待机中双方向备份双方向备份运行中运行中业务业务多备份多备份业务业务运行中运行中运行中业务服务器B服务器C服务器服务器B服务器服务器B服务器CNEC ExpressCluster简介简介NEC ExpressCluster产品体系产品体系LE for WindowsL
24、E for WindowsSE for WindowsSE for WindowsEEEE for Windows for Windows系统规模(数据容量)中小规模(30GB) *1中等规模(到TB级)大中规模(到TB级)磁盘镜像磁盘共享盘柜共享盘柜服务器数22316运行形态单向待机同一AP双向不同AP双向并行支持APu 适用于适用于Windows平台平台名称功能概述数据库监视选项提供4种数据库监视命令,可有效监视数据库的Stall状态。+ Oracle监视命令+ SQL Server监视命令+ DB2监视命令+ ODBC监视命令网络服务器监视选项提供2种网络服务器监视命令。+ IIS监视命
25、令(IIS4.0/IIS5.0/IIS6.0)+ Mail服务器监视命令(SMTP/POP/IMAP4)LAN监视选项监视网卡的link down状态FastSync Option 在故障恢复时只备份差分数据,从而大幅缩短镜像再同步时间,和LE版本结合使用。:支持;:支持;:不支持:不支持NEC ExpressCluster产品体系产品体系u 适用于适用于Linux平台平台LELE for Linux Ver3.0 for Linux Ver3.0SE for Linux Ver3.0SE for Linux Ver3.0系统规模(数据容量)中小规模120GB *1大规模(到TB级)磁盘镜像磁盘共享磁盘服务器数2232名称功能概述数据库监视选项提供4种数据库监视命令,可有效监视数据库的Stall状态。+ Oracle监视命令+ MySql监视命令+ DB2监视命令+ PostgreSQL监视命令网络服务器监视选项提供2种网络服务器监视命令。+ apache监视命令+ sendmail监视命令文件服务器监视选项提供2种文件服务器监视命令。+ Samba监视命令+ NFS监视命令FastSync Option 在故障恢复时只备份差分数据,从而大幅缩短镜像再同步时间,和LE版本结合使用。问题讨论问题讨论谢谢大家