1、集团企业集中监控管理平台建设方案 目 录3.1 桌面系统集中监控管理平台的建设目标与特点1集中监控管理平台的监控原理2集中监控管理平台对管理的支撑33.2 双屏系统3.3 大屏系统集中监控管理平台架构和运行管理的整体框架运维考核为目标统一事件规则为准绳集中监控平台为基础集中监控管理平台一期工程建设目标数据库服务器数据库服务器监控中心服务器监控中心服务器E系统、S系统局内及公众、内网网站的基础平台全局网络E系统实审子系统、S系统局内业务系统E系统、S系统内网存储监控机房监控大机监控接口服务器接口服务器接口服务器采集服务器采集服务器采集服务器机房建设:分布北京、武汉两地,共9个,总面积5400平方
2、米(包括网络间)网络建设:接入运营商:联通、电信、教育网,服务于全国互联网用户和高校教育网用户网络架设覆盖全国,支持全国29个代办处网络设备数量:总计822台E、S系统基础设施:主机:小型机56台,服务器244台数据库:12套,中间件:24套大机:2台存储:总容量:NAS 431.11T,SAN 171.96T存储架构:NAS、SAN设备厂商:IBM、NetAPP、EMC、HDS、Brocade 特 点 业务与基础平台的关联 业务与业务之间的关联 基础平台与基础平台之间 的关联 告警关联 形成IT系统整体健康 度评价体系、为故障 快速定位提供支撑。集中监控 集中维护 集中管理 统一展现 统一告
3、警 主动预警 及时告警 快速定位(故障)实时掌握(被监控对象的可用性及健康度)集中性支撑关联性高保障特点 决策视角 管理视角 运维视角辅助决策、重在管理、兼顾运维细节多层级视图 目 录3.1 桌面系统集中监控管理平台的建设目标与特点1集中监控管理平台的监控原理2集中监控管理平台对管理的支撑33.2 双屏系统3.3 大屏系统性能数据采集事件数据采集集中监控管理平台基础平台主机服务器数据库中间件存储网络机房性能数据性能阀值事件数据事件压缩过滤事件规则告警规则(对象、周期)告警信息告警升级规则(对象、周期)事件认领事件确认拓扑展现CPU占用率等主机断开等表空间使用率等数据库断开等队列数等中间件断开等
4、CPU、MEM利用率等网络DOWN等存储容量等存储事件温湿度等机房事件告警清除事件恢复 监控原理业务系统E系统实审子系统S系统局内在线人数等在线人数等正常轻微事件重要或紧急事件 目 录3.1 桌面系统集中监控管理平台的建设目标与特点1集中监控管理平台的监控原理2集中监控管理平台对管理的支撑33.2 双屏系统3.3 大屏系统桌面系统说明从以下三方面对桌面系统进行全面阐释:作用特点内容监视系统运行状况快速定位事件日常管理的工作台为管理层和运维层分别定制不同展示内容包含系统状态、运维管理、资产管理三大模块桌面系统首页系统五大监控对象及其子模块,用于展现当前有无重大事件。公告栏,用于展示重要信息和下载
5、系统相关说明文档。ES系统登录人数统计,从业务角度来表征系统的健康度情况。运维月报:各运维单位事件处理情况运维服务水平情况系统二层Portal标签,下面以基础平台为例进行讲述。事件处理周报,帮助和促进对事件处理的整体管控。系统运行管理支撑仪表盘一、当前各系统运行状况帮助了解各系统当前实时健康度状态表征系统强健度和稳定性,促进对各系统管控力度点击 系统运行管理支撑事件排行二、日常维护、例行检查规程的支撑帮助了解多发事件的故障点与故障类型建立日常维护、例行检查维护点、检查点以及规程明确日常维护、例行检查维护点、检查点关键指标系统运行管理支撑当前事件列表三、对事件处理督办、催办的支撑帮助了解当前未处
6、理事件情况及超时情况事件督办、催办的管理工具 运维考核管理支撑一、对运维人员服务态度考核指标帮助了解各运维人员的事件响应情况评价考核运维服务态度 运维考核管理支撑二、对运维人员事件解决能力考核指标帮助了解各运维人员的事件解决情况评价考核事件解决能力 运维考核管理支撑三、对各运维单位运维整体考核帮助了解各运维单位的事件处理历史情况评价考核总体服务水平 资产管理支撑一、当前资产使用情况帮助了解各系统资源分配、利用和负荷情况调整、优化系统结构资源利用、分配与系统扩容评估 资产管理支撑二、当前资产地理分布情况帮助了解资源分布情况规划资源部署准确找到故障设备位置 资产管理支撑三、当前资产产生事件情况帮助
7、了解哪些厂商的设备问题较多设备选型依据 目 录3.1 桌面系统集中监控管理平台的建设目标与特点1集中监控管理平台的监控原理2集中监控管理平台对管理的支撑33.2 双屏系统3.3 大屏系统 双屏系统说明定位展现的内涵作用让部领导和管理人员直观地看到系统运行状况及运维情况作为系统实时运行情况及其运维情况分析的一个展现平台系统实时运行状态运维单位运维情况E系统 S系统基础设施 网络 机房展现的内容双屏系统展示有事件产生时的系统状态图:内环:5大监控对象外环:各监控对象的子模块当前事件概览第一屏事件详情及处理情况第一屏第二屏无事件时的系统状态图E系统上周登录人数趋势S系统上周登录人数趋势分析重大故障对
8、登录人数的影响登录人数的变化曲线宏观表征ES系统的运行状态第一屏第二屏第三屏系统事件处理情况系统事件运维情况统计展现各运维单位事件处理和运维情况,让领导、管理人员对各单位的运维服务水平有一个总体上的了解第一屏第二屏第三屏第四屏第一屏第二屏第三屏第四屏第五屏前4周有效事件数量趋势前4周有效事件数量统计表有效事件的历史统计及趋势,更加真实有效的评价各运维单位日常运维、例行检查的保障服务水平第一屏第二屏第三屏第四屏第五屏第六屏前4周系统事件及时响应率趋势前4周有效事件及时解决率趋势事件响应率及有效事件解决率趋势,评价总体运维水平,为改良运维方式、提升运维效率提供依据今后,还要继续按照部领导指示进一步开发!目 录3.1 桌面系统集中监控管理平台的建设目标与特点1集中监控管理平台的监控原理2集中监控管理平台对管理的支撑33.2 双屏系统3.3 大屏系统 大屏系统说明领导视察和兄弟单位参观的一个展现平台定位专利局的文化专利局的形象E系统 S系统基础设施 网络 机房展现内容作用展现国家专利局信息化建设的成果反映信息化系统的运行状况展现内涵大屏系统展示首页实审业务S业务E平台资产机房网络S局内S公众汇报完毕 感谢聆听