1、IPv4IPv6网络运行管理系统系统介绍IPv4IPv6网络运行管理系统原理介绍系统数据后台服务权限管理数据接入数据展现管理对象采集适配器SNMP,CLI,SYSLOG,JDBC/ODBC,WEB SERVICE,FILE,其它告警处理服务性能处理服务配置处理服务运行处理服务系统自身服务数据接口门户拓扑图报表功能界面运行工具系统参数配置权限定义数据、服务管理资源库模型库知识库视图库管理库告警/性能数据库系统概述系统概述采集调度服务性能库阀值服务界面服务告警简单分析服务状态比较服务采集服务告警发布服务TRAP接收与处理服务SYSLOG接收与处理服务阀值规则型号采集任务参数TRAP解析参数LOG解
2、析规则状态库告警库应用系统业务系统/OA/ERP中间件BEA/IBM/微软数据库ORACLE/SYBASEDB2/SQL-Srv主机/终端IBM/HP/SUN网络路由器/交换机安全防火墙/防病毒/隔离装置邮件系统环境UPS/空调/摄像其它Trap信息log信息采集指令指令结果被管资源告警分析规则发布规则解析、过滤、转义资源KPI信息资源状态信息分析、压缩、过滤、转义监控原理监控原理系统部署方案系统部署方案探针模式接入无探针模式接入云端大屏幕声光告警台短信池或短信SP接口云核云监控管理服务器云计算服务器群探针探针探针探针云存储租户申请租户申请探针安装探针安装审批通过Mail中国科学院测量与地球物
3、理研究所(),您好! 恭喜您的申请审批通过,您可以立刻体验云网管系统 您的租户您的租户IDID为为f0935e4cd592aa6c7c996a5ee53a7ff0935e4cd592aa6c7c996a5ee53a7f (租户ID非常重要) 如果您选择了本地探针,请即刻登录云管理网址http:/172.24.24.237:8080/itims-cm,登录名cloud,密码ce311f13下载并安装探针,详细见探针安装手册。 租户网管系统登录网址http:/172.24.24.237:8080/itims-cm,登录名,密码ce311f13,注意两个系统的登录名不相同。 建议您立刻登录上述两个系
4、统修改密码。登录云管理下载探针软件安装探针软件启动探针软件租户之间的关系租户之间的关系 租户可以看做是独立的系统,每个租户都有自己专属的工作目录和数据库。 系统提供一种手段(权限共享),在获得授权的情况下,可以进行跨租户访问。 假如有A、B两个租户 B租户的管理员用户b1,授权A租户的用户a1,可以以b2的身份访问B租户的系统 则a1登录后A系统后,可以通过 权限共享 直接转到B系统,其身份切换为b2。 授权是单向的。规模和能力规模和能力 规模 100家研究所及总中心网络 每个研究所的网络设备、服务器以及中间件等规模不等,从几十点到100点不等。 华为、思科、Juniper、华三、中兴、锐捷、
5、北电等主流网络设备制造商 处理能力 并发能力:300人在线 正常运行时间达到99.99%以上 80%页面的响应时间要求在3秒以下,最大响应时间不超过6秒 5分钟原始数据保存一年、半小时压缩数据保存3年、一小时压缩数据保存5年、 12小时压缩数据保存十年云计算处理能力:云计算处理能力:10,252,186(TPMC)10,252,186(TPMC)探针处理能力:探针处理能力:16,004(TPMC)16,004(TPMC)云控制处理能力:云控制处理能力:118,526(TPMC118,526(TPMC)存储容量:存储容量:22TB22TB类型类型数量数量配置配置云控制服务器云控制服务器2 2CP
6、UCPU:4个、内存:个、内存:8G、磁盘:、磁盘:2个个(镜像镜像)、网口:、网口:2个千兆接口个千兆接口云计算服务器云计算服务器1010CPUCPU:2个、内存:个、内存:16G、磁盘:、磁盘:2个个(镜像镜像)、网口:、网口:2个千兆接口、光纤接口个千兆接口、光纤接口(SAN存储接入存储接入,至少至少2台台)项目进程项目进程 2010年底合同签订 2011年6月,第一阶段上线 基本网管功能 2011年底,第二阶段上线 机房图 设备背板图 网络中心所要求的特定业务功能:接入用户管理、IP地址管理、Ping拨测等。 2012年,继续完善和稳定系统,并开始接入租户系统使用情况系统使用情况 有六
7、十多个研究单位提交了接入申请 有50%的租户探针正常运行 其它50%的租户探针处于停用状态IPv4IPv6网络运行管理系统系统功能演示门户门户 设计意图 个性化 可定制 综合性 门户的构成 门户页面 包含多个 仪表板 仪表板 包含多个 业务组件 组件 体现一个特定的业务主题拓扑拓扑/ /视图视图 拓扑自动发现 网络拓扑图 机房图 背板图告警告警 功能 Syslog 告警列表 告警相关配置和管理界面 设计意图 集中查看告警 快捷处置告警 灵活的过滤和搜索资源资源 资源种类 设备 拨测 接入用户(仅网络中心) IP地址 设计意图 集中完成被管资源的配置和数据展示系统系统 功能 权限管理 数据维护
8、权限共享存在的问题和后续工作存在的问题和后续工作 问题 系统稳定性有待加强 后续工作 继续完善网络拓扑图、机房图、背板图等功能 继续扩展支持新的设备种类 提高系统稳定性和自身可管理性 接受用户反馈,改进用户体验Q & AQ & A谢谢各位专家和老师!谢谢各位专家和老师!IPv4IPv6网络运行管理系统系统回顾日常监视故障处理性能分析业务决策网管的业务体现网管的业务体现网管的业务体现网管的业务体现 日常监视的相关功能 门户、资源管理、视图等 故障处理的相关功能 告警列表、维护经验、告警处理过程等 性能分析的相关功能 报表 资源详情 业务决策 报表维护内容1.系统异常处理问题发现问题处理2.系统优
9、化(资源重新配置)系统监视故障处理性能分析业务决策工作内容1.资源维护业务维护(保障业务系统)平台维护(保障IT设备环境)2.资源管理IT应用系统的网管工作内容1.日常维护应用系统监视a)过滤无效信息b)系统异常通知异常问题分析故障处理2.系统优化(资源重新配置)通过报表分析优化应用系统通过历史数据分析优化应用系统3.资源管理接入对象接入用户拨测采集管理IT网管软件的功能组织?IP管理a)IP地址管理b)科技网IP地址管理IP-MAC配置备份4.网管系统自身管理权限管理a)用户b)角色c)组告警配置与管理系统日志a)日志参数配置b)日志处理配置一、日常维护工作中的-应用系统监视1. 告警获知
10、界面(门户、视图、浮动窗) 系统主动通知(短信、mail)2. 信息过滤 门户的配置 视图管理 Mail设置 阀值的设置网管系统自动的不间断的监视应用系统的工作状态。网管系统针对收集到的信息,需要做两件事:一、过滤不必要的信息;二、将必要的信息通知给维护人员。1. 通过门户获知告警 直观、可选择剪裁、快捷 编辑门户2. 通过视图获知告警 明晰告警设备在网络中的位置 编辑视图 系统主动通知(短信、mail)3. 通过机房视图获知告警 直观的引导监视信息 编辑机房、机架视图4. 通过浮动窗获知告警 最新的实时信息5. 通过mail获知告警 Mail的设置一、日常维护工作中的-应用系统监视(1) 维
11、护人员获知应用系统告警的途径。1. 仪表板管理2. 仪表板编辑3. 组件门户配置一、日常维护工作中的-应用系统监视(2)可以编辑、定制网管系统门户的展示内容与风格1. 视图组织2. 视图展现3. 视图编辑4. 拓扑发现视图管理一、日常维护工作中的-应用系统监视(3)可以编辑、定制网管系统视图的展示内容与风格1. 指定发送对象2. 发送来源描述3. 编辑发送信息MAIL配置一、日常维护工作中的-应用系统监视(4)可以编辑网管系统发送电子邮件的配置1. 阀值规则管理2. 个性化的阀值编辑3. 从网元的角度维护阀值4. 拨测阀值编辑阀值设置一、日常维护工作中的-应用系统监视(5)可以编辑、定义网管系
12、统性能与配置数据的多级阀值;可以定制设备类的阀值,也可以针对某个设备定义个性化的阀值。1. 在拓扑图上看网络关联资源告警2. 查看自身的关联资源(告警、性能、配置信息切换)3. 查看关联设备资源信息相关资源分析一、日常维护工作中的-异常问题分析(1)分析告警时可以参考产生告警设备的关联设备是否同时产生告警;告警设备发生告警时的告警、性能、配置信息状态是什么;相关设备的配置资源信息是什么。1. 告警详细内容2. 告警查询3. 查看关联设备告警信息4. 告警处理记录5. 告警生命周期6. 告警分布7. 抖动压制相关告警分析一、日常维护工作中的-异常问题分析(2)查看告警自身相关的信息,分析告警原因
13、。1. 历史告警查询2. 历史告警列表3. 历史告警详细信息历史告警一、日常维护工作中的-异常问题分析(3)查看告警设备的历史告警,分析告警原因。1. 事件列表2. 事件详情3. 事件-告警映射关系4. Tacacs日志原始事件一、日常维护工作中的-异常问题分析(4)查看告警设备收集的原始事件信息,分析告警原因。1. 故障确认及处理 告警列表 相关维护经验2. 告警分析 相关资源分析 相关告警分析 历史告警 原始事件一、日常维护工作中的-故障处理(1)首先需要分析告警是否需要人工处理,以及如何处理;其次在网管系统中声明告警处理的状态;最后,可能的情况下记录告警的处理经验,积累维护知识。1. 告
14、警确认2. 告警清除3. 右键操作4. 告警列表设置5. 告警处理记录6. 相关维护经验操作处置一、日常维护工作中的-故障处理(2)处理告警时需要注明这个告警的处理状态,这在多人维护系统时很重要。积累维护经验,丰富知识库对于维护团队是必要的。二、系统优化1. 报表 基本报表 自定义报表2. 资源状态历史 运行历史分析 历史告警 日志查看应用系统优化是了解应用系统当前、历史的资源、性能、告警状态及变化趋势,以此分析预测应用系统可能的变化,调整应用系统的资源配置,达到资源利用的最优化。二、系统优化-报表1. 即时报表2. 任务报表3. 历史报表4. 模版可以通过报表了解应用系统当前、历史的资源、性
15、能、告警状态及变化趋势,以此分析预测应用系统可能的变化,作为调整应用系统资源配置的依据。二、系统优化历史数据1. 设备当前状态及历史2. 历史告警3. 日志查看可以通过查看设备当前及历史的资源、性能、告警状态及变化趋势,查看历史的原始日志信息,以此分析预测应用系统可能的变化,作为调整应用系统资源配置的依据。 以设备为查看入口,可以得到比报表更多、更详尽的信息三、资源管理1. 接入对象2. 接入用户3. 拨测4. 采集管理5. IP管理 IP地址管理 科技网IP地址管理6. IP-MAC7. 配置备份所有接入到网管系统中的被管理对象都是资源。资源按照不同数据角度、数据属性分成若干个资源管理主题。
16、三、资源管理-接入对象1. 增加监视对象2. 删除监视对象3. 启动、停止对象的监控4. 对象状态监控5. 对象资源信息6. 对象关联信息7. 编辑网元树所有被监控的软硬件设备都是接入对象。网管系统提供增加、删除设备对象;启动、停止对设备的监控;编辑设备关联信息等功能。三、资源管理- 接入用户1. 流量状态2. PING拨测3. 用户列表4. 用户树编辑管理业务系统的用户,监测业务用户的服务及设备质量。三、资源管理- 拨测1. 拨测管理2. PING测试通过拨打测试监测业务服务质量。三、资源管理-采集1. 采集网元树2. 采集器管理被管对象的采集服务。支持个性化的采集设置。三、资源管理-IP管
17、理1. IP地址管理2. 科技网IP地址管理集中管理单位的IP地址资源。三、资源管理-IP-MAC1. 实时信息2. 终端管理3. 地址跟踪4. 欺骗识别5. 地址绑定6. 任务策略管理单位的IP地址和MAC地址;设置绑定规则,完善网络安全管理。三、资源管理-配置备份1. 文件浏览2. 任务管理3. 模版定义管理网络设备的配置数据,提供编辑、多版本间的比较、版本的保存等多项服务。四、网管系统自身管理1. 权限管理 用户 角色 组2. 告警配置与管理3. 系统日志 日志参数配置 日志处理配置网管系统的权限管理是限定网管用户使用权限的。告警配置与管理中定义告警产生的规则、原因、发布的条件等。系统日
18、志定义网管系统工作的运行、数据转换的规则。四、网管系统自身管理-权限管理1. 用户、角色、组 编辑 同步2. 权限共享3. 探针管理4. 数据维护权限管理定义网管系统的用户、角色和组。定义系统运行时采集的数据压缩保存方式。提供探针管理服务。四、网管系统自身管理-告警配置与管理1. 告警规则2. 告警原因管理3. 维护经验管理4. 告警发布管理告警配置与管理定义系统由事件产生告警的规则。管理、编辑告警原因。管理、编辑维护经验。定义告警发布规则。四、网管系统自身管理-系统日志(syslog)1. 日志参数配置 颜色配置 声音配置 日志组配置系统日志的参数配置定义网管系统在处理日志数据时使用的字符显示颜色、关联声音以及日志组的定义。四、网管系统自身管理-系统日志(syslog)1. 日志处理配置 日志来源配置 影射规则配置 屏蔽规则配置 日志级别配置 日志压缩配置 日志分析配置 日志保存配置系统日志的处理配置定义网管系统如何处理采集到的日志数据。Q & AQ & A54Thank you!Thank you!