1、ITIT运维整体解决方案介绍运维整体解决方案介绍ITIT运维整体解决方案运维整体解决方案经验总结IT运维体系使客户实现“三个放心”提升信息化的效益。降低信息化的风险。支持领导宏观决策。提升信息化科学管理水平信息主管领导放心 系统了解用户对服务的需求和规范了用户使用服务的行为。提升IT服务质量和服务感知。业务用户放心 主动监控和预防信息故障发生。提升信息中心工作人员的专业化水平和能力建设信息中心工作人员放心Gartner IT 信息化管理过程成熟度模型被动被动管理管理事件发生事件发生/解决,控制台,故障记录,解决,控制台,故障记录,备份,拓扑,资产清单备份,拓扑,资产清单主动主动管理管理性能,变
2、更,问题管理性能,变更,问题管理配置,可用性管理,配置,可用性管理,自动化与工作调度自动化与工作调度服务服务管理管理支持能力计划,支持能力计划,服务级别管理,服务级别管理,持续性管理持续性管理业务业务价值价值以业务作为衡以业务作为衡量标准的紧密量标准的紧密结合结合混乱混乱缺少网管工具与手段,没有用户通知机制缺少网管工具与手段,没有用户通知机制NSMITSMBSMIT安全运维越复杂环境越需要简单管理手段ITIL:以流程为中心的IT管理行业标准ISO20000:ITIL 的国际标准认证IT运维项目建设步骤IT运维平台设计原则综合考虑到项目的成本、资源、执行时间以及流程的可操作性,建议采用以下流程设
3、计的原则:方便简捷 流程的制定必须简单易行,方便使用急迫优先尽量首先制定对业务和实际工作发展影响较大的管理流程和监控点实用性制定的流程具备可操作性渐进性在较长的时期内,在一个不断演进的环境中持续改进、逐步完善服务管控体系平台标准化、规范化 -符合ITIL方法论,符合ISO20000认证标准业务部门业务部门知识库知识库ITIT服务台服务台配置库配置库综合报表系统综合报表系统其它管理系统其它管理系统基础架构管理系统基础架构管理系统呼叫中心呼叫中心Apps AppsAppsApps AppsAppsApps AppsApps外包服务人员外包服务人员现场支持人员现场支持人员IT运维平台的设计管理领导管
4、理领导CEOCEO、COOCOO、Service Service ManagerManager其他部门其他部门IT运维管理平台服务人员角色与岗位定义按服务划分热线,一线,二线(专家)按技能划分系统、应用、网络、安全、桌面按职能划分技术人员、技术管理人员、项目管理人员、领导层、合同管理员、供应商、外包商技能服务职能集团管理信息中心服务对象确定标准与客户交互方式IT运维体系各种事件的处理流程服服务务台台事件管理事件管理问题管理问题管理变更管理变更管理发布管理发布管理配置管理配置管理服务请求服务请求网管事件网管事件设备故障应用软件应用软件业务系统故障业务系统故障。其其他他业务需求生成业务需求审批产品
5、发布管理需求变更管理软件缺陷追踪软件测试管理NOCAMS项目进度管理服务台事件整合软件配置管理资产管理安全资产管理终端资产管理/AD补丁、软件分发终端设置变更终端事件终端事件终端远程协助预发布管理(打包)SOCTOC安全事件安全事件病毒防护网络漏洞网络堵塞网管事件分类处理问题控制主动问题管理安全事件关联过滤变更评审实施外包管理知识库知识库安全问题处理变更安全策略IT运维平台平台主机监控资产管理子系统资产管理子系统采购管理个人工作台综合监控应急管理安全管理服务管理ITIT运维统一运维统一访问门户访问门户 ITSM PortalITSM Portal系统配置报表统一资产配置库(统一资产配置库(IC
6、MDB)监控数据库监控数据库流程支撑库流程支撑库流程管理子系统流程管理子系统事故管理综合监控子系统综合监控子系统网络设备监控链路监控服务监控环境监控应用监控自动发现拓扑管理告警管理桌面安全数据总线数据总线库存管理资产管理调拨管理合同管理文档管理调拨管理大修管理报废管理资产清理台帐管理卡片管理智能分析巡检管理服务请求问题管理变更管理知识库值班管理绩效管理SLA管理配置管理厂商管理报表管理流量分析流程管控呼叫中心呼叫中心受理请求创建工单处理工单分派工单监督工单关闭工单Portal总线访问门户Portal平台 个人工作台:个性定制个人主页。综合监控:集成综合监控系统。服务管理:集成流程平台。应急管理
7、:提供应急预案的管理。安全管理:提供安全管理,用户远程对设备的管理。系统配置:组织结构管理。报表:在门户中展示相关报表。单点登录:实现对资产子系统,监控子系统,流程子系统等的统一鉴权,避免多次登录和记忆许多系统的帐户和密码信息。个人工作台 根据角色配置不同的菜单 根据管理要求制定主页显示内容集中监控 集中展示系统所有故障信息 集中处理故障 集中监控系统 大屏幕 个人终端统一故障处理告警平台告警通知方式:%手机短信%电子邮件%RTX即时通信平台告警%页面弹出告警内容:%告警来源、类型、级别、发生时间、接收时间、责任人、告警详细描述等告警处理方式:%告警压缩;%告警关联性分析;%告警影响范围分析;
8、%告警定位;%告警类型重定义;%告警过滤;%告警取消;%转发工单(自动、手动)故障告警故障告警管理管理告警显示告警方式告警过滤告警关联性分析告警升级告警定位告警前转告警清除告警诊断预警安全管理 单点登录,安全鉴权,CA接入 提供快捷方式登录相关的业务系统和设备。一般事件管理流程接收记录分类确定优先级服务台人员用户网管KEDBCMDBPDB异常KDB审计SLM一线二线问题管理工单变更管理匹配回访关闭分析调查解决通知投诉咨询、请求、需求、投诉等故障管理流程应急管理流程 现场支持人员:第一时间响应故障第一时间处理故障第一时间上报故障易耗部件更换现场负责制多线协同作战 集团支持人员:协助判断解决故障远
9、程协助协调专家支持备品备件调用现场解决合同管理人员事件管理规则接口manager问题分析组CMDB事故单工单KEDB根本原因工作组已知错误事故管理解决方案变更管理KDB问题管理流程记录关联分类优先级分派调查解决变更请求关闭关闭通知升级变更管理 记录建立变更请求 直接录入、事件管理模块产生、问题管理模块产生 评审、变更请求 分类和确定优先级 制定变更实施计划 变更管理在规划、构建、测试 变更实施 根据资源和其它情况确定实施日期,分配相应资源 提供沟通、监视功能,并在必要时进行协调 评价和终止变更 当变更完成后,问题、事件和配置元素应当自动或手动随之更新配置管理 计量IT资产和配置项、成本 有效对
10、IT环境管理,快速评估故障对业务产生的影响 属性扩展方便 通过变更确保配置信息的更新和准确 追踪系统软硬件变化配置管理数据库服务影响能力管理财务管理可用性管理持续性管理访问、控制CMDBCMDB审计 基线 视图类别 属性 关系状态 数据 日志生命周期生命周期变更管理发布管理访问、控制自动发现监控告警识别监控映射网管CMDBSLM工作台自服务台访问监控巡检事故管理问题管理方便其他流程直接调用、管理配置关系管理配置巡检配置管理数据库配置视图分类:关系类视图物理视图业务视图位置视图个体视图基本信息视图生命周期视图全日志视图个性配置视图服务水平管理优先级+时间 明确客户的业务需求及相应的IT服务需求;
11、确保以合理的成本提供约定的IT服务级别;确保实际的IT服务级别达到约定的服务级别的要求;改善客户关系和提高客户满意度。丰富的通知方式:短信、窗口、RTX、邮件知识共享平台记录:提供知识评论,收藏夹,点击排行等功能检索:提供关键字检索,知识点检索,分类检索等,支持全文索引运用:支持知识相关性匹配,自动按知识点收集和发布,支持专栏设置和展示,支持知识订阅更新:记录知识更新历史日志,提供知识版本管理,支持版本对比和恢复统计:提供知识分类统计,来源,点击率,使用率统计,提供知识价值分析管理:对知识发表观点;将用户感兴趣的知识加入收藏夹;根据知识的浏览次数进行排行 SKMSSKMDBSKMDB服务支持流
12、程服务运营流程配置管理服务设计流程JMS/WebServiceJMS/WebService外部系统SKMDB知识知识知识知识知识评论检索收藏排行专栏匹配更新日志版本统计知识管理排班 交接班手动排班自动排班有排班表方式无排班表方式值班日历值班报告(巡检)值班管理建议:建议:总部总部2424小时值小时值班班 现场值班现场值班5 5*8 8第第一时间处理故一时间处理故障障 定期备份定期备份 日常巡检日常巡检 机房管理机房管理任务计划管理巡检任务安全管理任务维护任务其他任务 组织绩效管理IT资源绩效管理供应商绩效管理报表引擎SLM监控数据员工工单完成情况考核团队工单完成情况考核IT资源可用性评估IT资
13、源故障统计供应商UC执行情况评估员工OLA执行情况评估团队OLA执行情况评估供应商资产故障率业务流程数据CMDB组织绩效考核工具绩效管理网络设备管理自动生成网络拓扑主动式网络管理设备性能监控事件收集及过滤阀值控制及告警性能分析实时性能监测快速故障定位与第三方系统集成支持网络中Cisco/H3C/华为/ZTE等多厂商的网络设备服务器管理性能监控:监控UNIX服务器、各类PC服务器的性能指标(CPU、内存、硬盘的使用率等),根据预先定义好的阀值进行报警,并且把性能数据存储到标准的数据库或者数据仓库中,以便对其进行数据分析;日志监控:日志文件的变化情况,可跟踪操作系统、数据库及用户应用系统的日志文件
14、,根据日志中出现的特定信息进行报警或自动执行用户预定义的动作:进程监控:能够实时监控进程的运行情况,以及子进程、进程对CPU/内存的占用情况等等。监控方式Agent代理Telnet/SSH、SNMP支持Aix、Hp_unix、Solaris、Windows、Linux等数据库管理对数据库的可用性监控 Oracle、Sybase、Informix、DB2、SQLServer、MySQL等主流数据库能够监控数据库引擎的关键参数,例如:数据库文件系统监控数据库系统设计的文件存储空间表空间使用率;事物日志空间使用情况;数据库配置情况;数据库当前的各种锁资源情况;监控数据库进程的状态;进程所占内存空间等
15、;在参数到达门限值时通过网管系统的事件管理机制发出警告,报告给数据库管理员,以便及时采取措施。JDBC/Agent双方式应用管理EMC/IBM/HP存储Veritas NetBackup、EMC Legato NetWorker、HP OmniBack、IBM TSM备份软件Websphere、Weblogic、Tuxedo、CICS、MQ、JBOSS、Tomcat、IIS等系统服务管理对应用系统运行状况进行监控:SNMP、JDBC、XML系统的关键进程;应用系统的日志情况;应用系统的性能、告警信息;应用系统的响应时间情况。支持应用服务:http等web服务、IIS、DNS、FTP等Lotus
16、Domino、Exchange等群件系统。ERP MessagingInternet InfrastructureDatabaseE-Commerce 桌面终端安全管理DSMS桌面安全管理系统桌面安全管理系统桌面终端安全管理机房环境监控机房动环管理温湿度监控空调、新风机柜温度漏水检测烟感UPS/输出电流V/市电输入电流电压视频监控门禁管理现 场 监控站RS485网 络 交换机视 频系统子 系统2配 电系统空 调系统RS485UPS系统漏 水系统发 电机组子 系统1SNMP设备资产管理子系统资产管理子系统资产管理子系统资产管理资产管理资产录入资产录入采购管理采购管理报废管理报废管理资产清理资产清
17、理合同管理合同管理资产卡片资产卡片设备管理设备管理设备管理设备管理大修管理大修管理调拨管理调拨管理厂商管理厂商管理文档管理文档管理设备台帐设备台帐任务计划管理任务计划管理个人设备台帐管理个人设备台帐管理接口接口智能分析,绩效智能分析,绩效低值易耗品管理低值易耗品管理经营财务维护实现资产的采购管理、入库管理、大修管理、调拨管理、报废管理,清理功能。全生命周期的资产管理实现中心和各个站点的设备分级分权管理分级设备管理资产卡片信息包括财务卡片名称、财务卡片编码、辅助卡片名称、辅助卡片编码、规格型号、入账日期、资产原值、使用部门、管理人、存放地点等设备关键信息设备标签粘贴到设备上,同时在系统中进行存档
18、,用户可以根据设备标签信息在系统中对该设备的详细配置信息和维护记录进行查询。方便对设备的管理,减少管理难度。资产辅助卡片管理提供设备的规格、型号、编号、位置、厂家、负责人、图片、技术特征、附属设备等台帐信息,做到帐物相符。设备台帐定义不同的设备之间的关联关系,对于故障定位和影响范围分析带来了极大的便利。附属设备管理提供强大的分析策略,可以定制各种样式的分析图表,满足不同的管理需要智能分析资产平台为流程平台提供基础数据,同时流程平台中有关 资产的变更数据、相关日志等自动添加到资产平台的台帐中。资产管理和流程管理交互同步资产管理子系统中相关资产的配置信息。资产管理和监控管理交互 监控子系统将严重告
19、警通过数据总线自动在流程子系统中创建事故单,当流程子系统处理完事故单,将关闭监控子系统的告警。监控管理和流程管理交互登录CTI 服务器登陆成功进入,空闲的状态,等待电话进入电话进入,未接来电列表点击“摘机”后,IT运维系统会自动弹出事件单,并直接获取客户来电和客户信息。与呼叫中心接口与其他管理信息系统接口华为Optix iManager T2000中兴通讯软交换系统中兴动力设备及环境集中监控OA系统数据分析统计管理工具分析模板设计器分析方案数据收集工具分析统计工具传递收集的数据统计项统计结果生成方案事件、事故、问题、变更、发布、咨询、投诉、常规业务流程、SLM、值班管理等活动注:提供数据仓库建
20、模,专业报表工具分析统计。工作流引擎设计器流程活动节点流转模型参与者参与数据流程设计工作模式定制:可视化流程设计部署:动态部署运行:引擎驱动,追踪,监控,重演更新:无需重启服务管理:版本管理XPDLBPML流程需求(事件,问题,变更,发布)流程库引擎工作列表工作台流程建模依据业务流程需求,通过视化的流程设计器设计流程,实现人员,部门,应用等之间的协作流程执行通过工作流引擎控制复杂的流程逻辑,自动完成流程的流转流程监控监控流程的执行情况,收集流程的执行数据,为流程的改进提供依据表单引擎和工具表单工作模式定制:可视化表单设计,自动布局部署:动态部署运行:引擎驱动更新:无需重启服务管理:版本管理流程
21、操作表单设计 服务请求 事件 事故 问题 变更 发布配置信息展现表单设计 配置信息任务计划工单设计 巡检 自动工单 审计单报表订阅和分发订阅服务:为用户提供订阅接口,设置订阅的报表和订阅规则报表引擎:按照订阅的报表模板生成报表分发服务:将报表发送给用户支持格式:PDF,Word,RTF,HTML,Excel报表设计:为用户提供报表模板设计接口发布服务:将设计的报表模板发布出去可集成专业报表工具(Brio、润乾等)报表引擎和工具订阅服务报表引擎分发服务发布服务订阅请求报表模板和规则报表设计报表报表模板报表需求报表模板报表订阅者设计者模板库报表模板体系建设收益原有原有ITIT运维运维如何转变如何转
22、变技术导向技术导向救火队员救火队员信息孤立,多次录入信息孤立,多次录入非正式流程非正式流程问题解决率低问题解决率低一次性的、混乱的一次性的、混乱的无知识积累无知识积累主观、随意的考核主观、随意的考核体系建设后体系建设后流程导向流程导向多种主动监控手段多种主动监控手段信息关联,自动化同信息关联,自动化同步步固化流程固化流程服务水平监督服务水平监督职责明确、可重复职责明确、可重复知识共享、经验库知识共享、经验库客观、公正考核客观、公正考核系统建设亮点提供统一的IT运维平台,实现“集中监控、集中管理、集中运维”,服务全程自动化实现对应用系统的可用性和关键数据完整性监控实现全集团信息化资产管理,解决了
23、资产管理难点技术上采用AOP、FreeMarker、Hibernate、SOA、WebService等,提升了系统的易用性和扩展性运维能力提升提高管理水平,降低成本提高了故障解决能力和效率,提高了应用系统保障能力提高了信息化资产管理水平,避免了资产变更带来的管理风险分阶段实施建设IT运维体系的科学方法咨询先行,确定目标降低失败风险,同时实施所有流程将过于复杂更平缓的转型,组织,职能的改变及人员的习惯和技能只能一步步实现和提高更易于将技能培养与组织变更同步可以分摊成本在步向世界一流的每个阶段都确定如何提升流程的成熟度IT运维体系实施长远规划,分步实施商业价值稳定敏捷有效IT 管理成熟度基础架构管
24、理设备管理集中监控异构环境基础安全管理面向服务运营-业务服务视图-服务状态监控-根源分析-影响度分析业务流程管理-业务流程模型-业务流程执行可视-财务影响分析-业务连续性管理IT流程核心“集成的服务台”-服务级别初步-配置-问题-事件与服务请求-变更IT 流程高级-绩效管理-服务级别管理-可用性,能力-高级安全-构建,测试,发布IT 治理-高级 IT/业务整合-管理投资-规章依从实施经验与体会 1、在项目实施中,有些客户有以下疑问:到底是以ITIL体系为依据来建立企业的IT运维流程呢,还是让企业IT运维流程来适应ITIL体系呢?而这也是在ITIL体系实施与建设过程中,处理好ITIL体系与企业I
25、T运维流程之间关系的一个重要问题。从多年来的IT运维项目实施经验来看,适合国内用户的做法是:以ITIL体系为依据,结合企业自身特色建立企业的IT运维体系。实施经验与体会 2、稳定,强大的实施团队对项目的成功至关重要!IT运维软件是管理软件而不是工具软件,它必须做客户化订制,所以实施团队的质量、实施人员的素质直接影响着项目的成功与否。没有高质量的实施团队,没有高素质的实施人员,产品质量再好,项目也会失败。IT运维体系的建设遵循原则,IT运维系统的实施是分阶段进行的,所以实施团队的稳定,软件提供商售后服务能力是影响整个IT运维体系建设是否成功的重要因素!实施经验与体会 如何解决这些问题?远景目标是
26、什么?现状是什么?如何确认是否达到目标?目标是什么?怎样达到目标?怎样持续改进?高层次业务目标评估可测量的目标流程改进评估指标体系风险来源风险来源实施完善的帮助台,需要按照ITIL先进的管理流程进行相应部门岗位的设置和职责调整,必将遇到来自不同方面人员、意见的深层次阻力解决办法解决办法领导层的重视、参与和推动;在设计和实施中,突出实用性,项目上线后能让各级人员感到工作便利。深入分析IT服务支持体系要求,确保支持流程的设计和实施要根据现有流程、支持任务和实际环境进行,尽可能优化流程。项目实施风险分析部门架构调整的人员阻力风险来源风险来源目前的IT支持和服务体系基于原有的“数据分布式”处理的业务基
27、础和逻辑,数据集中后,需要对现有的IT支持和服务体系进行重新评估和变更服务台项目实施成功的关键在于最终的IT服务流程与帮助台的设计目标保持相对的一致。在资源、人员和管理流程方面的规范化工作,与帮助台自身的技术建设二者缺一不可服务台的使用方需要在资源、人员、责任、组织结构和处理流程等方面,进行非常细致的规划和设计。用户必须进行部分管理模式的重新设计和变更,对具体组织和操作上存在压力解决方法解决方法根据客户实际情况,IT管理的模式可以阶段性的逐步变更和完善,并形成切实可行的、逐步提升的IT运维模式。通过专业技术顾问的服务和紧密配合,形成一个渐进逼近最终目标的、能够实际操作的实施过程。选择一个成熟的
28、产品和经验丰富的实施厂商,具有非常强大的伸缩性和客户化定制能力,能满足服务台系统各个建设阶段的管理模式、流程的各种定制要求,保障服务台项目的实施效果能符合新型业务模式下所必需的高质量的IT服务质量管理。项目实施风险分析管理模式与设计目标的差距项目实施风险分析性能和可用性风险风险来源风险来源直接使用人员包括普通用户、运维调度人员二线维护人员、管理层人员等,对系统整体性能的保障以及面向不同类型使用人员的操作便利性一旦系统正式上线,将成为这些大量用户的日常操作,对系统在可用性方面提出较高要求。解决方法解决方法通过严格的结构设计,使服务台系统具有“集中数据”处理功能、可以通过Cluster技术使系统具
29、有快速故障恢复能力,满足大量用户实时操作所需要的高性能、又具备足够的可用性。经验总结:IT运维建设关注点1、管理项目,培训先行,将ITIL变成一种文化;2、重管理,重实施,重效果,轻手段;3、执行一定有方法!提升项目整体执行力;4、关注IT管理实际成熟度(人/流程/技术),明确项目建设目标;5、项目推广考虑现行管理制度兼容性;6、务实操作,构建可持续发展的IT运行方法(PDCA);7、善于利用第三方成熟ITSM项目实施经验;8、突破传统IT项目建设理念,关注项目过程的衔接;9、设立流程控制岗位或者职能部门,有助于项目成功;10、ITIL是免费的,但不是一个可以拿来即用的标准;一体化智能监控运维一体化智能监控运维精细化管理精细化管理自动化管理自动化管理服务价值量化管理服务价值量化管理灵活自由管理灵活自由管理成功案例
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。