1、上海海得控制系统股份有限公司上海海得控制系统股份有限公司 系统事业部系统事业部 陈晖陈晖 容错技术与容错服务器容错技术与容错服务器p 成立时间:成立时间:1994年年3月月15日日p 注册资本:注册资本:2.2亿人民币亿人民币p 公司性质:上市公司公司性质:上市公司-002184(2007年年11月深交所)月深交所)p 员工总数:员工总数:1029(2010年底)年底)p 主营收入:近主营收入:近14亿人民币(亿人民币(2011年底)年底)p 分支机构:覆盖全国的分支机构:覆盖全国的22个销售分、子公司及办事处个销售分、子公司及办事处p 研发能力:企业技术中心、机电一体化的软硬件研发平台、电力
2、电子系统研发平台研发能力:企业技术中心、机电一体化的软硬件研发平台、电力电子系统研发平台海得公司概况海得公司概况-基本信息基本信息企业文化的核心理念企业文化的核心理念p 海得的使命:海得的使命:为各个领域提供最有竞争力的信息化与自动化产品及系统解决方案为各个领域提供最有竞争力的信息化与自动化产品及系统解决方案 和服务,持续为客户创造最大价值。和服务,持续为客户创造最大价值。p 海得的愿景:海得的愿景:成为中国工业自动化及信息化的领先者成为中国工业自动化及信息化的领先者p 海得的企业精神:海得的企业精神:海纳百川,得立千仞海纳百川,得立千仞p 海得的经营理念:海得的经营理念:优质高效,追求卓越优
3、质高效,追求卓越海得销售网络海得销售网络北京沈阳大连济南南京上海总部无锡杭州武汉福州西安广州新疆成都长春重庆6内内 容容q 容错技术与容错服务器容错技术与容错服务器q 单机容错单机容错 VS.双机热备双机热备q 容错带给客户的价值容错带给客户的价值q 行业应用行业应用7什么是容错?容错是什么?什么是容错?容错是什么?计算机系统可靠性设计方案计算机系统可靠性设计方案避错设计技术避错设计技术 容错设计技术容错设计技术8 世界上最可靠的服务器技术和解决方案世界上最可靠的服务器技术和解决方案美美国容错技术有限公司国容错技术有限公司|Stratus Technologies|Stratus Techno
4、logies1980-硬件级容错计算机系统厂商Stratus成立(位于美国波士顿),主要投资者有 Intel,NEC,Investcorp,MidOcean Partners1981-首先推出基于硬件的容错计算机系统1986-建立世界上第一个提供24小时服务的远程服务网1990 推出世界上第一个容错的 UNIX 操作系统-FTX1991-推出 RISC 结构的 XA/R 系列容错计算机系统1995-推出 RISC 结构的 Continuum 系列容错计算机系统1997-推出容错的 HP-UX 操作系统2001-推出世界上第一台推出世界上第一台 WinNT X86 平台硬件容错服务器平台硬件容错
5、服务器 ftServer2005-推出支持推出支持 RedHat Linux Enterprise 的的X86平台硬件平台硬件容错服务器容错服务器9技术合作伙伴技术合作伙伴10容错服务器的优越性容错服务器的优越性容错服务器的优越性容错服务器的优越性连续处理技术连续处理技术操作简单操作简单价格优势价格优势11快速部署快速部署,简化操作简化操作;最高级别的在线运行时间最高级别的在线运行时间保障连续运行的最佳方案保障连续运行的最佳方案连续处理技术连续处理技术12StratusStratus连续处理连续处理 技术(一)技术(一)13锁步技术锁步技术(时钟同步技术时钟同步技术)Lockstep CPUs
6、DiskPCIPCIDisk14错误检测错误检测和和隔离隔离错误检测错误检测和和隔离隔离错误检测错误检测和和隔离隔离错误检测错误检测和和隔离隔离同步锁定同步锁定 CPUs多路径多路径 I/O6600 15StratusStratus连续处理连续处理 技术(二)技术(二)16Windows 2003:Server,Enterprise Server,Data Center ServerI/O SystemSecurityLocalVirtualProcess StructureObject ServicesFile ServerObject management/executive run ti
7、meDevice Drivers(Level 1)Level 2Platform InterfaceI/ODevicesDMAControlBIOSCacheControlPrivilegedArchitectureHardware Abstraction Layer(HAL)PCI ConfigIOVAInterruptsKernelDaemonsServicesApplicationsManagementFile ServerSecuritySession ManagerReplicatorLogonAltererEvent LoggerOtherSQL ServerMS Exchange
8、Web ServerDiagnosticsRemote ConsoleServer ManagementStratus Value AddDevice Drivers(Level 1)Level 2BIOSHardware Abstraction Layer(HAL)PCI ConfigIOVAInterruptsDiagnosticsRemote ConsoleServer Management Stratus软件增强透明性软件增强透明性17故障安全软件机制故障安全软件机制 软件屏蔽瞬间硬件错误软件屏蔽瞬间硬件错误 强化驱动程序预防软件故障强化驱动程序预防软件故障 广泛综合和错误插入测试广泛
9、综合和错误插入测试 软件在线升级服务软件在线升级服务 内存和磁盘数据保护内存和磁盘数据保护软件可靠性软件可靠性预防、诊断、和解决软件问题预防、诊断、和解决软件问题18 StratusStratus连续处理连续处理 技术(三)技术(三)19 ActiveServiceActiveService 体系结构体系结构 自动的故障检测和隔离自动的故障检测和隔离(服务器的自身纠错机制服务器的自身纠错机制)集成的故障集成的故障”回叫回叫”和远程支持和远程支持(Stratus CAC)Stratus 和第三方的合作支持和第三方的合作支持 系统非工作状态的管理能力系统非工作状态的管理能力故障防范故障防范管理访问
10、网络ActiveService体系结构20 ActiveServiceActiveService 体系体系:自动获得可用性自动获得可用性热插拔部件非常热插拔部件非常容易容易更换更换系统自动同步更换的部件系统自动同步更换的部件系统自动订购系统自动订购正确正确的更换部件的更换部件部件故障部件故障.系统系统隔离隔离错误并通知错误并通知 Stratus 有有CPU 故障故障 21Guest OS 问题分析处理问题分析处理一站式的技术支持一站式的技术支持Count on Stratus&HiteCount on Stratus&Hite22最新推出的第六代容错服务器最新推出的第六代容错服务器采用最新架构
11、Intel Xeon processor E5 处理器 服务器整体性能提升125%以上;逻辑内存可扩展至 256GB;内置8对 2.5”SAS 磁盘,物理存储容量可达 8TB;集成远程管理模块,服务器的管理更加智能灵活Up to8.0 GT/s23Note:All I/O options specified in logical count,physical count is 2 times numbers specified PositioningValueFlexibilityPerformanceProcessors1-socket2-socket2-socketCore per pro
12、cessorQuad-coreQuad-coreOcta-coreMemory Slots8 DIMM Slots8 or 16 DIMM Slots16 DIMM SlotsMaximum System Memory 32 GB (Using 8 GB)256 GB(using 16 GB)256 GB(using 16 GB)Embedded Ports 6 Gb SAS,4 x USB 2.0(3 rear,1 front),2 x COMM,VGA,DVD R/W(front)Ethernet ports2 x 1 GbE1 x VTM 1 GbE2 x 1 GbE1 x VTM 1
13、GbE2 x 1 GbE2 x 10 GbE1 x VTM 1 GbEPCI Slots2 x PCIe x4 Gen 22 x PCIe x4 Gen 22 x PCIe x4 Gen 22 x PCIe x8 Gen 2Disk Slots8 x 2.5”HDD/SSD SAS DisksForm Factor4U RackOptional EmbeddedSlots/GbE PortsNot Available2 x PCIe x8 Gen 22 x 10 GbEIncluded Standard24内容内容q 容错技术与容错服务器容错技术与容错服务器q 单机容错单机容错 VS.双机热备
14、双机热备q 容错带给客户的价值容错带给客户的价值q 行业应用行业应用25委屈求全的委屈求全的“容错容错”方案方案-Cluster26集群是如何工作的集群是如何工作的Data Disk(Mirror)SCSIENETSMMMPU,MemoryServer-PrimarySCSIENETSMMMPU,MemoryServer-StandbyStorage EnclosureHeart-Beat CheckingWorkstation2Workstation3123Workstation127 系统架构对比系统架构对比Stratus ftServer(Single System)System&Dat
15、aDisk(Mirror)SCSISCSIStorage EnclosureENETENETSMMSMMMPU,MemoryMPU,MemoryData Disk(Mirror)Storage EnclosureCluster(Mulitple Systems)SCSIENETSMMMPU,MemoryServer-PrimarySCSIENETSMMMPU,MemoryServer-Standby28拓扑结构比较拓扑结构比较心跳线心跳线p 系统结构复杂系统结构复杂p 环节过多,外部连接环节过多,外部连接p 故障发生点多故障发生点多无单点故障的集群方案无单点故障的集群方案无单点故障的容错方案无
16、单点故障的容错方案n 系统结构简单系统结构简单n 如同单机,内部连接如同单机,内部连接n 故障发生点少故障发生点少29工作原理比较工作原理比较容错容错I/OI/OCPUCPUMEMMEMDiskDisk30当当CPUCPU主板出现问题时主板出现问题时.I/OI/OCPUCPUMEMDiskDiskMEM31如果如果I/OI/O板再出现问题呢?板再出现问题呢?I/OI/OCPUDiskDiskMEM32工作原理比较工作原理比较-集群集群I/OCPUMEMI/OCPUMEMDisk010001011010001010101011101011101001011000110001110133集群和容错
17、方案硬软件工作原理比较集群和容错方案硬软件工作原理比较容错容错CA交易丢失选择新平台业务延滞故障故障出现出现故障故障恢复恢复恢复总时间恢复总时间=基本系统恢复时间基本系统恢复时间+数据库恢复时间数据库恢复时间+应用程序恢复时间应用程序恢复时间+网络恢复时间网络恢复时间 34计算机业界对可靠性的定义计算机业界对可靠性的定义方案可靠性方案可靠性99.999%99.99%99.9%99%独立服独立服务器务器使用外部使用外部磁阵的独磁阵的独立服务器立服务器简易的集简易的集群系统群系统消除单消除单点故障点故障的集群的集群系统系统大型主机大型主机35$Windows 2003 x 22套主机系统集群部件以
18、及存储阵列应用程序和中间件 x 2系统维护以及停机损失应用程序和中间件 x 1集群软件集群规划实施费用-集群设计-集群测试验证-应用程序设置简单的单机管理Win2003 x 1Rapid Disk Resync用户成本比较用户成本比较容错容错ftServerTCO 比较比较一套一套ftServerCluster集群集群362003 2003 美国供电中断美国供电中断是由于集群切换方案的失败是由于集群切换方案的失败区域供电中断区域供电中断13分钟分钟37当我们有彻底当我们有彻底避免灾难避免灾难的方案时的方案时为什么还要选择灾难恢复方案呢为什么还要选择灾难恢复方案呢灾难灾难恢复恢复集群方案集群方案
19、灾难灾难预防预防容错方案容错方案“Why choose a server designed to recover from a failure,rather than a server designed not to fail?”Vernon Turner,IDC38内容内容q 容错技术与容错服务器容错技术与容错服务器q 单机容错单机容错 VS.双机热备双机热备q 容错带给客户的价值容错带给客户的价值q 行业应用行业应用39容错为客户带来价值容错为客户带来价值 -拥有无可比拟的优势拥有无可比拟的优势 (99.9998+%uptime)-提供具有显著的操作简便性提供具有显著的操作简便性-产品和解
20、决方案产品和解决方案(最小的最小的TCO)40内容内容q 容错技术与容错服务器容错技术与容错服务器q 单机硬件容错单机硬件容错 VS.双机热备双机热备q 容错带给客户的价值容错带给客户的价值q 行业应用行业应用41行业应用行业应用连续可用性是必需的,停机时间是不能容忍的实时关键领域应用实时关键领域应用24 x 7小时可用性小时可用性42工业工业控制系统的应用控制系统的应用43秒秒 分钟分钟 小时小时 班组班组 天天 周周 月月 年年L1/L2 L3 L4数据信息指令计划生产控制系统生产控制系统DCS/PLC,SCADA,HistorianERPXML,ETL,ODBC/OLE DBMES制造执
21、行系统制造执行系统ODBC,OPC,HDA,XMLXML,Netwaver,ODBC最可靠的容错服务器无处不在最可靠的容错服务器无处不在44行业应用案例概况行业应用案例概况n冶金行业冶金行业 系统:HMI/SCADA Server;PCS Database Server,Application Server;MES/EMS 业绩:宝钢集团、鞍本钢、首钢集团、济钢、重钢、天铁、西南铝n电力行业电力行业 系统:电厂SIS、MIS、BOP项目中I/O Server、Database Server等;变电站综合自动化系统 业绩:阳西电厂、兰溪电厂、新疆天业电厂、国家电网、福建莆田LNGn交通行业交通行业 系统:高速路隧道桥梁HMI/SCADA监控系统、收费系统、城市智能交通控制系统、机场弱电系统集成等 业绩:上海长江隧桥、宁杭高速、无锡城市隧道监控系统、SCATS智能信号控制n煤炭、化工、烟草行业、汽车制造煤炭、化工、烟草行业、汽车制造 系统:煤矿综合自动化、MES;化工DCS系统、实时/历史数据库系统;物流、制丝生产控制系统;汽车SCE、MES系统 业绩:淮南矿业集团、神华集团、广州烟厂、杭州烟厂、宗申摩托、丰田汽车45