1、 DB37/T 1434-2009 电子政务运维服务管理规范提提 纲纲 标准背景标准背景一 标准思路标准思路二 标准应用标准应用三 标准解读标准解读四标准背景标准背景20062020年国家信息化发展战略中明确提出了未来电子政务行动计划要建立运行、维护管理制度,从国家层面规划了电子政务运维工作的方向。 国家在“十一五”电子政务建设目标中指出:当前和今后一个时期在推进电子政务建设方面要着力抓好七项工作,其中第七项是建立有利于电子政务合理建设、科学管理、有效运行及维护的良性运行机制。 2008年5月,为推动电子政务外包服务规范化发展,原信息产业厅出台了山东省电子政务外包服务管理办法。近期,杨少军主任
2、在2010年省直部门信息中心主任(处长)工作座谈会上的讲话中,提出了“继续推进电子政务外包服务,开展电子政务外包服务企业认定“等工作要求。 政策背景1标准背景标准背景 随着电子政务应用的全面铺开,电子政务运行维护的压力和挑战也凸显出来,成为影响信息系统应用效果的瓶颈。日常运维和突发性运维的双重特点,以及系统用户的信息技术水平不一,使得运维部门就像救火队一样,不知道什么时候、什么地方会出现“火”情,总是处于被动灭火的状态。这种传统被动、孤立、分散的救火队式的运维模式,让电子政务运维部门疲于应付,运维技术人员饱受抱怨,还给电子政务的运营环境带来了复杂性和不确定性。 因此,采纳国际上先进的IT服务管
3、理理念,建立电子政务运维服务管理机制是改进现有的电子政务运维服务的必由之路。技术背景2标准背景标准背景运维服务管理源于IT服务管理,目前国际上运用比较广泛的相关理论有ITIL(IT Infrastructure Library,IT基础设施库)和ISO 20000系列标准,其中ISO/IEC 20000-1已经转化为国家标准GB/T 24405.1信息技术 服务管理 第1部分 规范, ISO/IEC 20000-2目前正在报批过程中。 北京、深圳、大连等地也相继出台了运维服务相关的地方标准。国内外相关标准情况3提提 纲纲 标准思路标准思路二 标准背景标准背景一 标准解读标准解读四 标准应用标准
4、应用三标准思路标准思路 事件管理问题管理。基础环境IT供方运维人员主机系统网络系统。ITIT资源资源运维服务用 户运维服务管理对象运维服务管理对象运 维 组 织服务级别管理运维管理流程运维管理流程服务管理服务管理PDCAPDCA循环循环提提 纲纲 标准应用标准应用三 标准背景标准背景一 标准思路标准思路二 标准解读标准解读四运维管理的核心内容运维管理的核心内容ITIT设施设施主机等硬件存储设备各类系统软件 各类应用软件 各类通讯线路 各类文档流程 各类配置参数实现电子政务运维的有效管理实现电子政务运维的有效管理 保障ITIT系统的稳定与效率从容应对各类紧急事件理顺工作流程、明确职责划分流程控制
5、流程控制工作流程控制操作流程控制系统监控系统监控IT基础环境监控应用系统检查系统性能管理总体运行情况分析事件、问题、配置、变更事件、问题、配置、变更标准应用标准应用提提 纲纲 标准解读标准解读四 标准背景标准背景一 标准思路标准思路二 标准应用标准应用三1 范围2 规范性引用文件3 术语和定义4 运维服务模式5 运维服务管理组织6 运维服务管理对象7 运维服务内容8 运维服务管理流程9 运维监控和管理工具参考文献标准解读标准解读标准结构0标准解读标准解读术语和定义33.1 电子政务运维服务:电子政务运维服务是指运维服务提供方或政务部门内部的IT部门综合利用各种运维手段和方法,提供确保基础设施和
6、应用系统正常、安全、高效、经济运行的服务。3.2 运维服务提供方:本标准中特指为电子政务提供运维服务的单位或部门,包括政务部门内部组织或外部组织。3.2 事件:不属于某项服务的标准操作、导致或可能导致IT服务中断或服务质量降低的任一事态。事件也可能包括请求的问题,如“我如何做?”。 注 参见GB/T 24405.1。3.4 问题:一个或多个事件的未知的潜在原因。 注 参见GB/T 24405.1。标准解读标准解读术语和定义33.5 服务级别协议(SLA):运维服务提供方与顾客之间签署的、描述运维服务和约定服务级别的协议。 注 参见GB/T 24405.1。3.6 流程:被设计完成特定目标的一套
7、结构化活动。流程采用一个或多个预定义的输入,将它们转化为预定义的输出。流程可以包括所要求的角色、职责、工具和管理控制,来可靠的交付输出。如果需要,流程可以定义策略、指导方针、活动和工作指令。3.7 IT供方:负责提供交付IT服务所要求的产品或服务的第三方,如,日常硬件和软件供货商、网络及通信服务商等。3.8 配置管理数据库(CMDB):包含每个配置项所有相关的详细信息和配置项之间重要关系的详细信息的数据库。 注 参见GB/T 24405.1。标准解读标准解读运维服务模式4自运维自运维完全外包完全外包运维运维混合运维混合运维标准解读标准解读运维服务管理组织5运维服务管理组织领导组执行组业务部门I
8、T部门。IT部门服务提供方。入侵检测系统漏洞扫描防火墙杀毒软件PC打印机笔记本电脑复印机运维服务组织IT资源提供商 网络服务提供商安全监控系统UPS系统消防系统门禁系统空调系统应用服务器数据库服务器中间件服务器存储/备份服务器操作系统数据库系统中间件系统办公自动化系统政务网站系统业务系统防火墙核心路由核心交换接入交换集线器网络线路测试设备入侵防御系统扫描仪运维服务人员标准解读标准解读数据存储数据恢复主机安全应用安全网络安全数据安全硬件 软件安全监控系统UPS系统消防系统门禁系统空调系统应用服务器数据库服务器中间件服务器存储/备份服务器操作系统数据库系统中间件系统办公自动化系统政务网站系统业务系
9、统防火墙核心路由核心交换接入交换集线器网络线路测试设备数据备份PC打印机笔记本电脑复印机扫描仪标准解读标准解读标准解读标准解读运维服务内容77.1.1 机房环境运维服务 对机房的线路、设备的摆放等方面进行规范管理; 机房环境及重要设施的日常巡检,如机房主要区域、以及UPS电源、精密空调、消防设备的运行情况进行巡检,安全检查内容包括:UPS电源负载率、各设备报警、有无漏水、机房洁净度等; 建立机房进出管理制度,对机房进出管理人员进行登记管理; 维修因需求变更及设备升级和故障引起相关维护工作; 处理空调、不间断电源等机房设备相关的异常事件,防止故障导致相关设备(服务器和网路设备)无法正常运行。标准
10、解读标准解读运维服务内容77.1.2 主机系统运维服务 了解主机系统运行维护需求和相应的配置; 监控主机系统的使用状况; 评估主机系统的性能; 优化主机系统配置; 制定主机系统重大突发事件的应急预案等。 标准解读标准解读运维服务内容77.1.3 网络系统运维服务 网络建设规划; 监控网络设备状态、网络连通性等运行状态; 监控网络链路流量、核心交换机端口流量; 检查网络设备运行日志; 备份网络、防火墙、入侵检测等设备的配置参数; 网络性能改进、网络配置优化; 控制网络配置的变更; 制定网络系统的应急预案; 及时处理网络中断、网络设备故障等。标准解读标准解读运维服务内容77.1.4 应用系统运维服
11、务 监控各应用系统的运行状况; 评估应用软件系统的性能和功能; 协助开发方沟通消除应用系统可能存在的隐患和威胁; 系统配置优化; 处理系统异常事件; 根据需求升级、更新系统功能等。标准解读标准解读运维服务内容77.1.5 数据的存储、备份和恢复服务 评估数据的完整性、可靠性、可用性和机密性等要素; 评估数据存储、数据通信的安全性; 制定数据存储、数据备份、数据恢复等的策略; 必要时可提供灾备服务(本地或异地)。7.1.6 信息安全管理服务依据GB/T 22081信息安全管理实用规则 的要求提供相应的信息安全管理服务。标准解读标准解读运维服务内容7标准解读标准解读运维服务内容77.2 桌面系统运
12、维服务 硬件支持 硬件设备的安装、配置和升级; 硬件设备的故障诊断和维修维护,包括零部件的替换; 软件支持 基础软件的安装、配置、升级以及故障诊断和排除; 应用软件的安装、配置、升级以及故障诊断和排除; 其他支持 预防性维护:包括日常监控,病毒查杀,软件备份,趋势预测和系统优化等;7.3 资产管理服务 协助政务部门更新、调整、分配IT资产; 定期评估IT资产使用状况; 定期进行设备维护、保养和更新; 定期进行IT资产的汇总分析,确保IT资产的可用性和安全性。标准解读标准解读运维服务内容7标准解读标准解读运维服务管理流程8发布过程发布过程服务级别管理服务报告服务连续性管理解决过程解决过程关系过程
13、关系过程发布管理供方管理事件管理问题管理配置管理变更管理控制过程控制过程服务交付过程服务交付过程标准解读标准解读服务目录服务目录服务服务 内容内容 说明说明 网络日常管理 网络状态巡检 每天定时对网络设备状态(如是否开启、CPU使用率、内存使用率等)、网络连通性等运行状态进行巡检。 网络流量巡检 每天定时对网络链路流量、核心交换机端口流量进行巡检。 网络设备管理 对网络设备登录密码每月修改一次,对网络设备的配置在每次修改配置时备份一次。 日志管理 定期查看网络设备运行日志,对核心设备的日志备份。 系统服务器网络检查 每日定期对系统相关各服务器和其他重要服务器网络运行情况进行检查,包括连通性、网
14、络延时情况,备份链路情况等。 服务级别管理8.2识别需求编制服务目录拟定并评审服务级别协议签订服务级别协议协调签订供方合同供方管理定期评审并修改SLA开 始结束服务目标服务目标编号编号考核内容考核内容* * *网上审批系统网上审批系统办公自动化系统办公自动化系统1系统可用性 99.86% 99.63%2单次最长停机/故障时间 2小时 4小时3重大事件发生个数 3个/年 6个/年4重大突发事件恢复时间 4小时 90% 4小时解决率 90%6用户满意度平均分数 95分标准解读标准解读服务报告8.3 服务级别协议目标执行情况(事件数量、问题数量、变更实施、故障时间/次数、影响业务的时间/次数等);
15、服务级别协议达成及未达成情况、安全违规及考核实施情况; IT资源使用情况分析、隐患及相关的纠正和预防措施或建议; 重大事件(故障)的分析(对政务部门业务的影响和成本分析)、纠正和预防措施及落实跟踪情况,相关变更和发布的绩效; 趋势分析及可能导致违背服务级别协议相关活动的预警; 计划完成情况及未来工作计划; 用户满意度分析。标准解读标准解读服务连续性管理 8.4定义服务连续性管理的范围定义服务连续性管理的范围业务影响分析业务影响分析风险评估风险评估IT服务连续性计划服务连续性计划组织和实施规划组织和实施规划实施备用方案和降低风险措施实施备用方案和降低风险措施开发恢复计划和程序开发恢复计划和程序执
16、行初始测试执行初始测试保证保证教育和培训教育和培训 变更管理变更管理评价和审计评价和审计测测 试试阶段阶段1:启动:启动阶段阶段2:需求分析和:需求分析和战略规划战略规划阶段阶段3:实施:实施阶段阶段4:运作管理:运作管理标准解读标准解读供方管理8.5IT供供 方方 服务提供方服务提供方用户用户 供方管理供方管理服务提供方及供方的的角色服务提供方及供方的的角色标准解读标准解读事件分类事件分类事件类型事件类型描述描述故障故障引起系统故障的事件引起系统故障的事件服务请求用户的服务请求咨询咨询用户的咨询类业务用户的咨询类业务事件管理8.6负责解决事件并跟踪、监督、控制和协调解决过程事件接收和记录初步
17、归类和支持服务请求事件调查和分析解决事件和恢复服务终止事件事件调查和分析是否事件优先级事件优先级紧急度紧急度- -高高紧急度紧急度- -中中紧急度紧急度- -低低影响度影响度- -高高最高(重大事件)高中影响度影响度- -中中高中低影响度影响度- -低低中低最低标准解读标准解读问题管理 8.7分析发现和记录问题归类和分配问题分析问题问题评审问题关闭跟踪和监督提出预防措施或解决方案 问题管理的主要目标是要查明事件发生的潜在原因并找到解决此事件的方法或防止其再次发生的措施。 事件管理的主要目标是在事件发生后尽可能快地恢复客户服务,即使采取的是一些应急措施而不是永久性的解决方案; 事件管理强调速度;
18、 问题管理强调质量,把速度放在第二位; 为了发现事件原因和防止事件再次发生,问题管理可能需要花费更多时间解决事件且可能推迟恢复服务。事件管理事件管理VSVS问题管理问题管理标准解读标准解读配置管理8.8数据库组织结构图姓名/职称姓名/职称姓名/职称软件包程序代码代码广域路由器文件服务器文档:服务目录、服务级别协议、操作手册等局域网台式电脑笔记本电脑打印机小型机/服务器光驱键盘鼠标显示器网卡标准解读标准解读变更管理 8.9配置管理流程提交&登记RFC筛选&接受RFC归类&顺序紧急RFC?计划&组织实施构建测试实施可以运行?评价&终止是否是否拒绝紧急处理程序启动回撤计划标准解读标准解读发布管理8.10设计开发环境测试环境生产环境发布管理发布政策发布规划设计和开发、或订购软件构建和配置发布适用性测试发布验收上线计划沟通和培训分发及安装 配置管理数据库(配置管理数据库(CMDB)标准解读标准解读运维监控和管理工具9标准解读标准解读谢谢!