1、1 1运维的理解及定位运维的理解及定位2 2运维管理体系及要点运维管理体系及要点123项目运维运维与项目在约定的时间内完成约定的事情,达到预期的目标。项目的建设达到相定时期的必然产物。运维是对实施项目的继承,本身也是一个项目,更多是长期为项目提供业务及技术支撑。建设定位业务驱动,服务运营规范管控,实时监控固化流程,强化控制梯队建设,协同综效由“技术驱动”向“业务驱动”转变,主动的服务提供者向客户(业务部门)提供赖以支撑组织业务运作的IT服务,促进业务成熟度的提升,达成精细化的运营管理。以工具、流程为着力点,实现运维的规范管理;以管控为支撑,提供运维过程的实时监控。利用标准化手段,固化流程,强化
2、关键控制点,提高风险管控能力,达成客户满意度初、中、高级运维技术梯队,协同处理,及时分配,高效运转协议清晰,职责明确服务形式、服务目录、SLA(客户协议)、OLA(内部协议)、UC(伙伴协议)。1 1运维的理解及定位运维的理解及定位2 2运维管理体系及要点运维管理体系及要点ITIL:IT基础架构库(Information Technology Infrastructure Library, ITIL,信息技术基础架构库)由英国政府部门CCTA在20世纪80年代末制订,现由英国商务部OGC负责管理,主要适用于IT服务管理(ITSM)。ITIL为企业的IT服务管理服务管理实践实践提供了一个客观、严
3、谨、可量化的标准和规范。旨在提高IT资源的利用效率和质量,帮助企业组织改善他们的IT服务管理。最佳最佳实践实践指南指南ISO20000:面向机构的IT服务管理的国际标准,是从 IT 服务管理最佳实践 ITIL 中发展而来。目的是提供建立、实施、运作、监控、评审、维护和改进IT服务管理体系(ITSM)的模型。建立IT服务管理体系(ITSM)已成为各种组织,特别是金融机构、电信、高科技产业等管理运营风险运营风险不可缺少的重要机制。ISO 20000让IT管理者有一个参考框架用来管理IT服务。n服务级别管理是为签署签署服务级别协议协议而进行的谈判、定义、评价、管理及以可接受成本可接受成本改进IT服务
4、质量的流程。服务级别管理试图在服务质量的供应与需求、客户关系和IT服务成本之间找到某个合适的平衡点。对于IT服务团队和内部业务部门以及外部客户来说,认识到服务服务是一个供供应和接收应和接收的过程这一点是很重要的。n服务目录n服务级别协议(SLA,Service Level Agreements)n运营级别协议(OLA,Operational Level Agreements)n支持合同(UC,Underpinning Contracts)n服务改进计划(SIP,Service Improvement Program)n服务级别协议(服务级别协议(SLA)协议期限协议期限服务服务方式方式服务范围
5、服务范围服务内容及服务标准服务内容及服务标准服务组织服务组织服务报告服务报告服务收费服务收费双方责任双方责任协议变更协议变更n服务方式服务方式n服务范围服务范围n服务组织服务组织n服务内容及服务标准服务内容及服务标准可用性可用性:系统运行时间系统运行时间-业务中断时间业务中断时间/系统运行时间系统运行时间*100%n服务收费服务收费只有配置经理和配置管理员有权有权修改配置信息;IT组件对应的配置项信息的修订由配置管理组件对应的配置项信息的修订由配置管理流程控制; 所有在配置管理范围之内的IT组件的变更都应该由变更管理流程来迚行。每年定期进行配置项审计,审核和验证每年定期进行配置项审计,审核和验
6、证CI、CI属性、属性、CI关系等信息,确保关系等信息,确保CMDB的正确性和完整性的正确性和完整性;配置项审计由配置经理负责实施。建议在每年的资产盘点后,配置管理人员根据资产盘点结果做配置项审计。 n一约束(一约束(SLA)、一中心、一中心(CMDB)服务请求管理流程其其他他流流程程请请求求受受理理者者客客户户电电话话RF 2请请求求分分类类事事件件管管理理流流程程RF 1请请求求受受理理与与记记录录服服务务请请求求邮邮件件/传传真真等等故故障障标标准准服服务务请请求求变变更更RF 5转变更管理流程RF 4转事件管理流程RF 3转事件管理流程需需求求(待待开开发发)RF 6转需求开发流程变变
7、更更管管理理流流程程需需求求开开发发流流程程关关闭闭RF 7(按需)客户反馈与确认请请求求完完成成RF 8客户确认关闭?是是否n一年之中只能宕机一年之中只能宕机20个小时个小时n客户客户不会充许不会充许你在同一个时间里把你在同一个时间里把20小时用完小时用完n宕机是一级故障宕机是一级故障n一级故障一级故障的解决时间是的解决时间是1小时小时n会强制把会强制把20个小时个小时分散分散到全年之中,以减少对业务的冲到全年之中,以减少对业务的冲击击n如如按时解决率按时解决率等等这些事实是用于等等这些事实是用于服务管理服务管理n站在客户方的立场而言有了这些指标就足够约束服务商站在客户方的立场而言有了这些指
8、标就足够约束服务商可用性与解决时间的关系可用性与解决时间的关系事件的测量过程-等于对SLA的测量 解决时间这一指标横跨整个事件 在服务人员处理事件时,当创建的那一刻开始倒计时以约束并加快处理进程 运维人员的接单需要考虑事件等级与解决时间剩余。 开单时间、接单时间、 首次解决、完成时间、 关单时间 挂起(例外因素如:因客户或第三方造成的等待时间) OLA进行体系内各岗位对运维的工作支撑 按排适合的人处理相关事件成为策略关键按排适合的人处理相关事件成为策略关键SLA的实施是需要不断完善及量化的过程的实施是需要不断完善及量化的过程知识问题变更/发布配置CMDB减少帮助约束完善产生产生识别,记录与归类
9、评审与分派调查与诊断问题解决问题关闭问题确定问题确定问题解决问题解决创建问题单收集问题信息设定等级、分类问题经理分析问题对业务的影响并确定是否进行调查工作分派问题给技术专家问题专家决定是否接受分派确定并记录问题的根本原因鉴别已经错误调查问题或技术专家,确定已知错误确定参与解决的人员(厂商,内部人员)有需要提交RFC验证更新知识库问题来源问题来源问题确认问题确认问题解决问题解决质量控制质量控制事件升级事件主动分析巡检发现事件的分析多部门参与协调资源问题的确定多部门参与方案确定技术保障变更的执行产生新的潜在问题避免新问题产生变更来源变更来源变更准备变更准备变更实施变更实施质量控制质量控制事件升级问
10、题解决新需求多部门参与审核与启动复核与确认审批与排程方案与测试多部门参与按计划执行安全保障技术保障变更验证变更回顾变更成功率避免新问题产生实施变更管理的难点和重点并不是工具,而是流程流程变更发生的时候,有一个标准化的流程去执行,能够预测到这个变更对整个系统管理产生的影 响,并对这些影响进行评估和控制评估和控制。而变更管理流程自动化的实现关键就是CMDBp 经常不断地学习,你就什么都知道。你知道得越多,你就越有力量p Study Constantly, And You Will Know Everything. The More You Know, The More Powerful You Will Be写在最后谢谢你的到来学习并没有结束,希望大家继续努力Learning Is Not Over. I Hope You Will Continue To Work Hard演讲人:XXXXXX 时 间:XX年XX月XX日