1、集团运维项目工作汇报集团运维项目工作汇报北京用友政务软件有限公司议程 现状分析现状分析 运维管理思路 解决方案 项目进展现状分析资源管理基础监控运维流程统计分析知识库议程 现状分析 运维管理思路运维管理思路 解决方案 项目进展 制度规范服务管理技术支撑运维管理体系规划的架构论网络主机中间件数据库桌面业务应用机房.ITIL流程考核管理资产管理知识管理管理流程管理制度战略规划运行中心绩效考核IT运维建设项目规划监控域运维域辅助工具建设网络与业务监控平台建设统一运维展现平台实现对IT基础设施和应用系统的集中管理拓扑管理流量管理性能管理链路管理故障管理入网规范业务管理桌面管理权限管理系统管理统一展现安
2、全管理级联管理统计报表操作自动化自动巡检优化监控平台建设流程管理建设资源配置管理实现级联管理优化监控和服务管理系统、使其可利用大量运维数据,向智能化管理系统转型。服务台事件管理问题管理发布管理值班管理考核管理考核管理配置管理统计报表服务目录服务级别操作自动化权限管理优化监控和服务管理系统,使其可利用大量运维数据,向智能化管理系统转型项目建设步骤议程 现状分析 运维管理思路 解决方案解决方案 项目进展运维服务管理体系建设方法论运维管理体系的搭建,总体上来说遵循下面的步骤:1确定体系的内容2、结合运维现状和资源约束条件或者规划目标,形成重点突出、切实可行的管理侧罗。3、定期回顾,持续改善总体规划设
3、计说明融合融合组织管理模式制度规范体系技术支撑体系监控管理体系拓扑管理故障管理配置管理性能管理资源管理终端管理桌面管理报表管理统一事件平台操作维护体系集中巡检操作自动化服务管理体系配置管理变更管理知识库管理发布管理作业计划值班管理项目管理资产管理工作流引擎服务台问题管理事件管理综合分析体系服务质量管理服务水平管理知识库管理服务体验分析绩效考核网络效能评估资产规划资产分析数据仓库/报表分析引擎统一运维展现门户门户管理单点登录综合报表搜索服务界面集成综合呈现统一资源配置库(CMDB)统一采集(NM3/BM3/DM3/DBAudit/AGENT)网络设备服务器数据库中间件业务应用4A管理统一账号管理
4、统一认证管理统一授权管理统一审计管理用友ITOM运维管理逻辑架构终端安全管理 数据库审计系统应用监控 (BM3)网络监控 (NM3)技术方案功能体系 基础资源监控平台 机房监控管理 面向业务的监控理念基础资源监控 统一事件管理平台 IT资源管理(CMDB)知识库管理数据汇聚处理 运行展现中心 ITIL 服务流程管理 服务考核与分析运维服务平台基础资源监控-丰富的资源监测指标网络管理系统管理数据库管理 SNMP智能网络/安全设备 CISCO设备 华为/H3C/中兴设备 北电网络设备 Foundry、AVAYA、DLink F5、Firewall.Windows操作系统 Linux各发行版本系统
5、HP-UX操作系统(含MCSG)AIX操作系统(含HACMP)SCO UNIX操作系统 FreeBSD操作系统 Oracle数据库 SQLServer数据库 Sybase数据库 DB2数据库 Informix数据库 MySQL数据库中间件/平台管理WEB/邮件服务/企业管理通用服务和资源 IBM WebSphere业务中间件 BEA WebLogic业务中间件 IBM MQSeries 消息中间件 BEA Tuxedo 交易中间件 Tibco 消息业务中间件 Tomcat中间件 东方通TongWeb业务中间件 JAVA平台监测.Net平台监测 Microsoft IIS WEB服务器 Apac
6、he WEB服务器 Microsoft Exchange 服务器 IBM Lotus Domino SAP ERP 通用HTTP/HTTPS URL内容监测 通用HTTP请求序列响应监测 通用Email服务监测 DNS服务 FTP服务 LDAP目录服务 通用SNMP资源 ICMP节点资源监测 TCP端口监测基础运行环境其他优势/特性 智能存储设备(EMC、HP、IBM)备份作业监测 智能电源监测 机房环境监测(定制)Syslog日志监测 Windows日志监测 第三方SNMP Trap接入 强大监测插件体系 灵活的监测时间调度机制 智能化的监测阈值分析模型 提供主机的代理Agent和远程监测模
7、式供用户灵活选择骨干网络操作系统应用系统边界网络Internet基础资源监控 扩展与集成骨干网络操作系统应用系统边界网络Internet基础资源监控-网络监控基础资源监控系统监控基础资源监控机房设备监控目标集成机房告警与性能状态、实现统一化、可视化管理方式通过SNMP、WS、iFrame集成技术基础资源监控 面向业务的监控建设iBDM业务影响依赖模型,通过对业务部件组合关联分析,快速分析判断业务问题的根源基础资源监控-业务服务可用性技术方案功能体系 基础资源监控平台 机房监控管理 面向业务的监控理念基础资源监控 统一事件管理平台 IT资源管理(CMDB)知识库管理数据汇聚处理 运行展现中心 I
8、TIL 服务流程管理 服务考核与分析运维服务平台基础资源监控-事件驱动机制告警事件配置变更触发性能阈值触发关联规则策略rules告警故障(Alert)创建工单(Ticket)服务流程(Incident)确认消除故障告警库告警台告警通知自动化排障进入告警处理流程同步消除故障闭环故障管理IT资源管理-CMDB数据最佳模型n业务系统n应用系统n基础设备(各类硬件)n物理部件n链路资源n动态资源(IP地址域名)n人员账号n文档(规范、合同、技术、维护.)用友ITOM最佳配置模型设计经验IT资源管理-CMDB建设过程CMDB数据规范CMDB数据汇总CMDB框架建模配置管理现状分析调研IT资源管理-灵活的
9、自定义资源建模对象设计灵活分类属性定义关联引用唯一性保障可协调性IT资源管理-多元化的资源数据采集n自动识别(通过资源监控工具自动同步获取)n手工录入n批量导入n自动审核资源管理 资产生命周期管控知识库的作用和功能功能:知识的生命周期管理社区化:共享技术、运维经验作用:解放关键技术人员降低IT工程师单点故障率关联、查询知识知识管理员工程师知识库解决方案自助用户查询知识知识审核/评级工单、告警、工单、告警、工单、问题、知工单、问题、知识库识库自助服务台自助服务台知识库维护知识库维护知识库的技术特点采用WEB搜索技术,可以和主题进行自动匹配提供审核、评级、奖励的社区化管理功能知识库的层次分类与权限
10、管理可以和任意运维流程进行捆绑技术方案功能体系 基础资源监控平台 机房监控管理 面向业务的监控理念基础资源监控 统一事件管理平台 IT资源管理(CMDB)知识库管理数据汇聚处理 运行展现中心 ITIL 服务流程管理 服务考核与分析运维服务平台统一运行展现 Live灵动平台视图统一运行展现 Live灵动平台视图统一运行展现运行监控中心大屏幕展现n大屏幕拼接n与控制终端的同步n展现界面分屏显示运维服务平台ITIL运维体系支撑n引入ITIL规范n科学流程管理n统筹闭环管理n考核指导思想运维服务平台 服务台n人工请求n自助服务台n快速建立工单n故障预警处理n跟踪和反馈n规范化值班管理基于BPM技术的流
11、程管理 运维服务平台 动态业务服务平台(iBPM)运维服务平台日常作业与外包管理n针对客户外包代维服务较普遍的现状n管理周期性的、相对固定的日常维护作业与外包服务n主要目的或好处n规范日常作业计划n规范日常作业内容n规范维护人员的维护行为n为人员考核提供基础数据 运维服务平台 服务考核n业务指标SLA考核n代维人员服务质量考核运维服务平台 运维统计分析议程 现状分析 运维管理思路 解决方案 项目进展项目进展项目进展-实施范围10.254.253.0/255.255.255.010.253.1.0/255.255.255.0部署16个网络、120多台网络设备,350个网络资源的发现及监测工作。累
12、计部署配置监测项380余条,涉及千余项监测指标。NM3销售系统、PMP系统、商务订单系统、客户DB系统、TurboCRM系统、用友官网、用友支持服务系统、TKR系统、e-HR系统、UFPARK系统进行了全面的监控,具体包括:CPU内存磁盘基本信息连通率等。BM3统一运行展现、统一事件管理运维流程管理、配置管理知识库管理OM3项目进展-实施内容与计划集团项目一期(9.1-9.30)NM3:实现对集团网络中网络设备的监控管理和展现,实现网络拓扑管理、网络故障管理、网络性能管理、统计分析管理、协议分析管理、网络边界管理BM3:实现对集团网络中的服务器、数据库、中间件及应用服务等IT资源的监控。OM3
13、:统一运行展现、服务流程管理(事件流程):资源管理:以配置数据库CMDB核心,进行所有监控资源的同步,形成正式的资产管理。二期(10.1-11.30)统一运行展现、统一事件管理运维流程管理、配置管理知识库管理监控视图展示u网络设备监测部署:被管网络16个、383个网络资源uFLEX拓扑视图展示监控视图展示u机房监控视图展示监控视图展示u业务视图展示监控视图展示监控视图展示项目进展-一期遗留问题功能类别功能类别遗留问题内容遗留问题内容要求完成时间业务系统(业务系统(BM3)对销售系统、PMP系统、商务订单系统、客户DB系统、TurboCRM系统、用友官网、用友支持服务系统、TKR系统、e-HR系
14、统、UFPARK系统的数据库监控,需要信息部配合完成各项指标的监控10月月10日日-11月月10日日对销售系统、PMP系统、商务订单系统、客户DB系统、TurboCRM系统、用友官网、用友支持服务系统、UFPARK系统的中间件的监控,需要信息部配合完成各项指标的监控各大业务系统销售系统、PMP系统、商务订单系统、客户DB系统、TurboCRM系统、用友官网、用友支持服务系统、TKR系统、UFPARK系统的正常应用URL正常率需要监控PMP报表服务器与TKR服务器未开启SNMP,需要信息部提供信息后监控基本参数项目进展-二期未完成内容功能类别功能类别后续完成内容后续完成内容完成时间服务流程管理服
15、务流程管理问题管理流程的建立10月月10日日-11月月10日日变更管理流程的建立知识库管理知识库管理对知识库进行统一的维护和管理,包含信息的录入、信息的审核、信息的维护、信息统计等。资源管理资源管理完善CMDB数据模型,对模型中多余和缺少的部分进行删减和补充,贴近集团实际需求项目进度示意图 前期工作前期工作一期实施一期实施二期实施二期实施配置参数调优配置参数调优监测视图调优监测视图调优试用试用正式使用正式使用优化及后续工作优化及后续工作2011/9/19/59/3010/3011/2012/1里程碑 已完成100%已完成80%已完成40%已完成50%已完成60%试用 调研完成 监控采集完成 正
16、式使用 项目进展-后续工作计划-一期序序号号资源名称资源名称监控内容监控内容要求完成时要求完成时间间配合配合人员人员完成人员完成人员1应 用 管 理应 用 管 理(BM3)对销售系统、PMP系统、商务订单系统、客户DB系统、TurboCRM系统、用友官网、用友支持服务系统、TKR系统、e-HR系统、UFPARK系统的数据库监控,需要信息部配合完成各项指标的监控11月10日杨松周立军2对销售系统、PMP系统、商务订单系统、客户DB系统、TurboCRM系统、用友官网、用友支持服务系统、UFPARK系统的中间件的监控,需要信息部配合完成各项指标的监控11月10日杨松周立军3各大业务系统销售系统、P
17、MP系统、商务订单系统、客户DB系统、TurboCRM系统、用友官网、用友支持服务系统、TKR系统、UFPARK系统的正常应用URL正常率需要监控11月10日杨松周立军4PMP报表服务器与TKR服务器未开启SNMP,需要信息部提供信息后监控基本参数11月10日杨松周立军项目进展-后续工作计划-二期序序号号资源名称资源名称实施内容实施内容完成时间完成时间配合人员配合人员完成人员完成人员1运维管理运维管理(OM3)服务流程管理:调整问题管理流程和变更管理流程,实现所有流程的定义和制定。11月30日杨松周立军2资源管理:完善CMDB数据模型,对模型中多余和缺少的部分进行删减和补充,贴近集团实际需求11月30日杨松周立军3知识库管理:对知识库进行统一的维护和管理,包含信息的录入、信息的审核、信息的维护、信息统计等。11月30日杨松周立军培训计划序序号号培训人员培训人员培训内容培训内容人人数数天数天数培训地培训地点点培训教培训教材材1管理与系统维护人员网络监控系统(NM3):监测配置培训、系统使用与维护培训51集团会议室用友政务提供2管理与系统维护人员业务监控系统(BM3):监测配置培训、系统操作与维护培训51集团会议室用友政务提供3管理与系统维护人员运维平台(OM3):视图绘制、流程、自定义、CMDB建模、权限划分51集团会议室用友政务提供