1、8/31/2023 2.IT管理技术背景管理技术背景 1.公司简介及客户介绍公司简介及客户介绍 3.Union ITRV Union ITRV 运维管理方案综述运维管理方案综述 4.Union ITRV Union ITRV 运维管理产品介绍运维管理产品介绍8/31/2023 2.当今 IT 运维管理技术发展介绍 3.Union ITRV 运维管理方案综述 4.Union ITRV 运维管理产品介绍 1.公司简介及公司简介及客户介绍8/31/2023q成立于成立于20192019年,是一家集研发、经营、服务为一体年,是一家集研发、经营、服务为一体的高新技术企业的高新技术企业q国内领先的电信级数
2、据中心运维管理系统国内领先的电信级数据中心运维管理系统.定位于定位于ITIT服务管理领域。服务管理领域。q在国内运维管理市场上拥有广泛的客户群,覆盖电在国内运维管理市场上拥有广泛的客户群,覆盖电信、金融、政府、税务等行业,承建了电信、金融信、金融、政府、税务等行业,承建了电信、金融等行业数十个省级分公司的等行业数十个省级分公司的ITIT运维管理项目。运维管理项目。q已同已同IBMIBM、HPHP、CISCOCISCO、BMCBMC、SYMENTICSYMENTIC、RSARSA、ISSISS等等世界知名从事世界知名从事ITIT运维管理的公司建立战略合作伙伴运维管理的公司建立战略合作伙伴关系关系
3、 q和国内众多知名系统集成商,(亚信、合力金桥、和国内众多知名系统集成商,(亚信、合力金桥、瑞斯康达、中航网信、银信长远、合力思腾等公司)瑞斯康达、中航网信、银信长远、合力思腾等公司)达成了合作协议,以友联创新产品为基础,共同开达成了合作协议,以友联创新产品为基础,共同开拓国内运维管理市场。拓国内运维管理市场。8/31/2023 北京联通分公司 天津联通分公司 贵州联通分公司 陕西联通分公司 宁夏联通分公司 甘肃联通分公司 辽宁联通分公司 四川联通分公司 安徽联通分公司 江苏联通分公司 湖南联通分公司 河北联通分公司 北汽福田 甘肃工行 农行黑龙江省分行 农行总行运行中心 辽宁网通 深圳移动分
4、公司深圳移动分公司辽宁邮政分公司辽宁邮政分公司8/31/2023 1.公司及客户介绍 3.Union ITRV 运维管理方案综述 4.Union ITRV 运维管理产品介绍 2.IT 管理技术背景8/31/2023v科学的IT管理方法论:nITIL/ITSM:以流程为中心的IT管理行业标准。nISO20000:ITIL 的国际标准。nCOBIT:面向IT审计的IT管理标准。nCOSO:企业内部控制框架,面向内部控制。nISO17799:信息安全管理国际标准。NSMITSMBSM主动管理服务导向业务价值被动管理(IT管理技术发展历程)8/31/2023CIO办公室办公室业务IT运营IT性能指标与
5、业务毫不相干不能有效控制服务中断和性能下降对最终用户体验缺乏可见性缺乏通用语言基础关注点不一致性向业务看齐不太容易“像业务一样运营IT“是CIO共同目标,它的目的是保障业务服务质量,提高IT对业务的贡献。对于大多数公司的IT部门来说,这都是极具挑战性的。因为IT部门受到很多既有的应用、技术、技能和惯例的限制。“Creating The Strategic Plan For Todays IT”,Forrester Research,Inc.,June 2019业务经理要求以业务的语言来描述IT服务水平客户对服务中断和性能问题毫无耐心业务要求IT可靠和透明8/31/2023 人人运维服务管理运维
6、绩效管理业务质量监控IT架构架构应用应用业务业务集中统一监控运行状态监控拓扑管理可用性管理性能管理告警管理动作管理 工单管理事故与投书管理问题管理 变更管理值班/巡检管理 服务台 知识库 员工绩效管理服务质量评估管理 资源运维服务规划业务服务水平规划应用系统服务水平规划基础设施服务水平规划运维业务规划 8/31/2023IT基础架构业务服务层应用层(IT业务支持模型)集中统一监控规范流程管理绩效评估管理IT运维管理8/31/2023IT运运维维管管理理平平台台资源监控管理平台层网络网络主机系统主机系统数据库数据库中间件中间件应用应用存储存储机房环境机房环境桌面桌面运维流程管理层运维绩效管理层基
7、础设施管理应用系统管理业务服务管理客户其他运维管理平台8/31/2023 1.公司及客户介绍 2.当今 IT 运维管理技术发展介绍 4.Union ITRV 运维管理产品介绍 3.Union ITRV 运维管理方案综述8/31/2023基础设施监控用户收益流程、人员技术之桥梁质量监控运维服务标准化流程化降低IT成本应用监控管理应用系统监控服务管理政府业务监控事件管理问题管理配置管理运维管理水平可持续改进业务得到更好支持电信业(BOSS)金融业(业务系统)企业(ERP)ITRV变更管理面向SLA方案作用应用领域资源管理绩效管理8/31/2023BOSS综合服务联机采集计费帐务交换网管EAI资源管
8、理ICSMBMQDB2AIX应用软件第三方接口CPUMEMFSOraclep1接口接口服务器系统进程系统配置运行队列8/31/20238/31/2023IT资源管理IT资源类别管理IT资源规格管理外部系统接口IT资源目录管理运维流程管理平台接口IT资源关系管理IT资源属性管理人力资源管理服务协议管理组织管理角色管理员工基本信息供应商信息管理外包服务合同管理内部服务协议管理IT资源监控平台接口IT资源自动发现8/31/2023其他系统接口流程管理平台接口资源管理系统接口展现层数据处理层监控代理层 事件检测引擎数据缓存器 采集调度任务队列 数据刷新 数据提交事件标准化事件过虑与压制事件相关性分析动
9、作管理告警管理事件管理告警前转告警升级告警清除告警规则性能数据预处理性能数据分析与汇总性能管理Cmd Server应用拓扑展示事件展示系统配置界面8/31/2023流程引擎引擎/数据库接口工单模板工作流程环境控制文档工具接口工具执行代理运维绩效管理平台接口工具描述工单作业计划日志企业规范工单资源管理系统接口规范管理运维业务管理作业计划管理工具管理规范文档管理流程定义事故/服务请求管理问题管理变更管理配置管理其他业务管理作业计划制定作业计划审核工具注册工具测试工单管理工单流转工单审核帮助台监控系统告警接口运维知识管理8/31/2023IT资源性能汇总数据员工处理工单数据绩效数据抽取与清洗IT资源
10、监控平台接口运维流程管理平台接口报表引擎IT资源监控平台接口IT资源故障时长汇总数据供应商服务单数据IT资源绩效管理组织绩效管理供应商绩效管理应用系统可用性管理应用系统性能管理基础设施可用性管理基础设施性能管理员工工单完成率分析团队工单完成率分析供应商服务单完成率分析供应商资源故障率分析供应商服务质量评估业务影响分析8/31/2023 1.公司及客户介绍 2.当今 IT 运维管理技术发展介绍 3.Union ITRV 运维管理方案综述 4.Union ITRV 运维管理产品介绍8/31/20231、业务服务管理中心nUnion ITRVUnionMon (业务服务监控平台)nUnion ITR
11、VLogAnalyzer (日志分析系统)nUnion ITRVBDAudit (业务数据稽核系统)2、运维服务管理中心nUnion ITRVOBM (运维流程管理平台)nUnion ITRVAssets Manager (资产配置管理)3、报表管理中心nUnion ITRVReporting Center(报表管理平台)8/31/2023业务服务监控平台(UnionMon)产品介绍8/31/2023AgentAgentAgentSNMP平台管理接口平台管理接口应用软件应用软件接口规范接口规范其它接口其它接口UnionMon Center Server统一数统一数据模型据模型内部通信引擎第三方
12、产品第三方产品接口接口IExploreFireFox8/31/2023B/SB/SDB管理中心服务器管理中心服务器报表服务器报表服务器告警服务器告警服务器(cmds)(cmds)(cmds)Minor Agent(cmds)(cmds)(cmds)监控对象监控对象代理代理(agent)(agent)代理代理(agent)(agent)8/31/2023 将数据采集中变化最多的部分屏蔽在采集插件之外,使其具有了良好的可扩展性。支持常见的协议:SNMP、TCP、JMX、HTTP。丰富的采集插件以及采集命令。8/31/2023多视角的视图管理分层分级的资源管理。业务服务管理,支持建立业务与资源之间的
13、关联。事件管理,提供特色的事件关联分析,帮助快速定位事件根源。性能管理,丰富的性能报告,分析性能瓶颈,帮助评估能力动作管理,帮助快速恢复服务。告警管理,丰富的告警方式报表管理,丰富的分析图表灵活的系统配置,增加了系统的灵活性、和系统的可用性,极大地降低了实施难度。8/31/2023v 提供多视角的 监控视图n业务视图n系统视图n平台视图8/31/20238/31/2023右键选择需要变更的资源,设置变更后可能的状态8/31/2023v 资源健康指数与可用性状态及其转换规则v 子资源可用性状态传递规则8/31/20238/31/2023v事件关联分析是指对几乎同时发生的事件之间分析其关联性,并设
14、置此关联,包括因果关联、父子关联、依赖关联,以便事件处理者,能够 探询事件根源。v关联设置的两种方式:n手工设置关联,即用户手动设置两类事件之间的关联关系,为以后系统关联分析提供知识。n系统自动设置关联:在关联分析后,自动设置关系。8/31/2023可实时浏览某一资源当前整体性能概况,同时也能观察到资源的可用性状态8/31/2023v 目标:事件快速恢复、事件现场保留、事件根源诊断v 动作类型:事件恢复类、现场保留类、诊断类。动作控制动作发布动作结果分析新事件cmdSev事件8/31/2023v事件统计报表v可用性统计与分析报表v性能分析报表8/31/20238/31/20238/31/202
15、38/31/2023v 告警:n将一事件,翻译成可视、听的方式,向相关负责人发出通告v 实用的告警规则n告警暂停、告警延迟、告警前转与升级v 多样的告警方式8/31/2023v 短消息v 电话语音v EMAILv 桌面提示8/31/20238/31/2023v操作日志管理是系统安全管理之一,系统记录每个用户登陆系统的操作行为,并可以在此查询到其所有操作。8/31/2023v从下至上的监控:可以集中统一监控支持企业关键业务的整个从下至上的监控:可以集中统一监控支持企业关键业务的整个IT基础架构,基础架构,包括:网络、主机、数据库、应用、中间件、机房环境等包括:网络、主机、数据库、应用、中间件、机
16、房环境等.v自上而下的管理:从业务的角度出发,确保业务的高可用性,主要通过收自上而下的管理:从业务的角度出发,确保业务的高可用性,主要通过收集监控业务关键数据和主动模拟特定用户行为来对业务进行监控。集监控业务关键数据和主动模拟特定用户行为来对业务进行监控。v业务流程与业务流程与IT资源的关系管理,真正做到资源的关系管理,真正做到IT与业务看齐。与业务看齐。v资源相关有向图管理,为用户提供了已完整的知识库。资源相关有向图管理,为用户提供了已完整的知识库。v相关有向图概念,可以快速的定位、排除故障,并实现事件关联。相关有向图概念,可以快速的定位、排除故障,并实现事件关联。v服务支持管理,规范了用户
17、的运维业务行为,降低服务支持管理,规范了用户的运维业务行为,降低IT风险。风险。v绩效评估管理,使用户的绩效评估管理,使用户的IT运营管理水平可以得到持续的改进。运营管理水平可以得到持续的改进。v未来支持业务流程再再造。未来支持业务流程再再造。8/31/2023ABIS综合服务银证转帐系统计费帐务交换网管EAI资源管理接口应用软件第三方接口OracleAIXCPUMEMDISKICSMBMQDB2MEMAIX清算业务系统管理层与业务人员应用维护人员基础设施层管理人员8/31/2023业务人员业务人员运营维护人员运营维护人员从业务的从业务的角度主动角度主动进行管理进行管理通用语言通用语言ITIT
18、系统构系统构架管理架管理动态地动态地将将业务映业务映射到射到ITIT构架构架从业务的角度来管理IT运营8/31/2023主机监控主机监控数据库管理数据库管理机房监控机房监控中间见管理中间见管理网络监控网络监控8/31/2023l主机在线可用性lCPU平均利用率lCPU非空闲模式百分比lCPUWIO百分比lCPU特权模式百分比lCPU用户模式百分比l内存利用率l内存页交换速率l内存错页率l硬盘平均等待队列l硬盘平均磁盘时间l硬盘平均读写速率l分区平均利用率l连续运行时间l主机基本信息l操作系统lMAC地址l主机操作系统的OIDl包含的IP地址l系统版本l系统SPl等待处理队列l进程数l线程数l句
19、柄数l当前在线用户数l核心内存总量l剩余核心内存l接收和发送的ICMP包率l核心内存利用率l虚拟内存利用率l认可用量利用率l主机总内存容量l主机总可用内存容量l主机已用用内存容量l分区总容量l分区总使用容量l发送的ICMP包率l接收的ICMP包率l页面调进速率l页面调出速率l硬盘平均读速率l硬盘平均写速率l已用核心内存l虚拟内存总量l虚拟内存已用量l认可用量总量l已用认可用量80多个可用性和性多个可用性和性能指标能指标8/31/20238/31/20238/31/2023主机监控主机监控数据库管理数据库管理机房监控机房监控中间件管理中间件管理网络监控网络监控8/31/2023l自动发现被监控的
20、数据库自动发现被监控的数据库l自动发现数据库上的数据库表和表空间,并对此进行监控。自动发现数据库上的数据库表和表空间,并对此进行监控。l对以下关键组件进行针对性的监控:对以下关键组件进行针对性的监控:数据库、表空间、数据文件、进程。l提供数据库配置的监控提供数据库配置的监控l提供提供70多个可用性和性能指标多个可用性和性能指标l数据库可视化管理数据库可视化管理8/31/2023Oracle 监控指标实例可用性监听器可用性系统CPU利用率Oracle DB CPU利用率系统内存利用率Oracle DB 内存利用率PGA命中率库缓存命中率高速缓冲缓存命中率物理读速率物理写速率数据块获取数/秒一致性
21、获取数/秒内存排序比率当前连接会话数当前进程数登陆会话数/秒当前打开的游标数当前锁数量磁盘排序次数内存排序次数事务回滚数事务提交数表空间个数数据文件个数Log模式高速缓冲池共享池大型池Java池日志缓冲池SGAPGA物理内存容量表空间状态表空间增长率表空间利用率表空间名称死锁数量SQL解析次数/秒事务数/秒事务回滚率资源名称版本操作系统主机名称IP地址主机Mac地址连续运行时间实例名称数据库名称Domain名称数据库大小Open模式SQL语句TOP10CPUTimeSQL语句TOP10DiskReadsOracleSQLTop10BufferGetsSQL语句TOP10BufferGets表空
22、间大小表空间已用空间数据文件状态数据文件增长率数据文件利用率物理读速率物理写速率数据文件名称数据文件Id数据文件大小数据文件已用空间进程状态Oracle实例名称(进程)进程名称文件系统利用率文件系统名称文件系统已用空间文件类型文件系统大小8/31/2023vOracle 8i,9i,10ivDB2vInformixvSybase vSQL Server8/31/20238/31/2023主机监控主机监控中间件管理中间件管理数据库监控数据库监控 机房环境监控机房环境监控网络监控网络监控8/31/2023v通信中间件:MQv交易中间件:Tuxedov应用服务器:Weic,Websphere,Tom
23、cat,Resin8/31/2023主机监控主机监控机房环境监控机房环境监控数据库监控数据库监控 中间件管理中间件管理网络监控网络监控8/31/2023v-机房温度湿度监控v-空调工作状态监控v-UPS监控 8/31/2023主机监控主机监控机房监控机房监控中间件管理中间件管理数据库监控数据库监控网络管理网络管理8/31/2023v网络设备硬件配置,包括机箱、板卡、端口、电源、风扇等硬件;v网络设备IOS版本;v网络设备配置管理;v网路线路带宽状况;v网络设备服务信息及设备序列号;v网络设备的位置;v网络维护联系人信息;v网段划分和IP地址规划;vIP地址及MAC地址管理;8/31/2023设
24、备端口设备端口中断中断服务器服务服务器服务中断中断链路流量链路流量过大过大设备负载设备负载过重过重8/31/2023完全仿真完全仿真的设备背的设备背板图板图,端端口状态一口状态一览无遗览无遗8/31/2023TOPN排列功能排列功能能够知道网络中最主要的设备能够知道网络中最主要的设备瓶颈具体是在:瓶颈具体是在:哪台设备?哪台设备?哪个端口哪个端口/链路?链路?哪个性能指标?哪个性能指标?8/31/2023链路流量即时分析链路流量即时分析.每秒动态尽在掌握!每秒动态尽在掌握!端口流量即时端口流量即时分析分析8/31/2023同时拥有柱状图,同时拥有柱状图,饼状图和折线图饼状图和折线图为用户提供全
25、面为用户提供全面的图形化支持的图形化支持.8/31/2023应用监控应用监控业务监控业务监控8/31/2023应用监控应用监控-对应用系统的各个子模块的各个环节进行监控-对应用系统的布署结构进行监控 -对应用系统的外部接口进行监控8/31/2023-对应用系统的各个子模块的各个环节进行监控应用监控应用监控8/31/2023-对应用系统的布署结构进行监控 应用监控应用监控8/31/2023-对各环节关心指标进行统计业务监控业务监控-对业务系统各流程的各个环节进行监控8/31/2023v值班员定时登陆系统,通过首页上各系统的当前颜色观看各系统运行情况。v对运行状态不正常的系统,可以查看当前有那些异
26、常事件。v导出这些新事件,并沟通相关负责人,明确其是否接受到通知,并确认其处理方式,完善早报内容。v下班前,发出早报邮件。8/31/2023v 定时登陆系统,通过首页上各系统的当前颜色观看各系统定时登陆系统,通过首页上各系统的当前颜色观看各系统运行情况。运行情况。v 对运行状态不正常的系统,可以查看当前有那些异常事件。v 对这些新事件,并沟通相关项目经理,询问短信或邮件接对这些新事件,并沟通相关项目经理,询问短信或邮件接受情况,并确认其处理方式。受情况,并确认其处理方式。v 对一些早期发生的事件观察其发生到现在经历的时长,对对一些早期发生的事件观察其发生到现在经历的时长,对时长超过一定限度的事
27、件,催办。时长超过一定限度的事件,催办。v 可以定期回顾以往事件。8/31/2023q我们公司有近十年的电信、金融、保险等行业系统/应用集成经验,对于客户、行业的需求具有非常深刻的理解和丰富的实施经验。q在产品实际应用方面,我们的产品拥有5、6年大型电信/金融企业应用经验,不同于其他产品,我们的产品是从客户实际需求中走来的。q在技术方面,我们的产品完全符合国际/国内行业标准,采用纯JAVA技术开发整个架构,具有平台无关性、可移植性、灵活的可扩展性、可伸缩性,可应用于不同规模的企业和组织。q独创的轻量级Agent代理技术,将被控机器和网络的性能影响降至最低。并且可以非常方便的监控大量的对象而不用
28、担心部署和资源占用的问题。q在产品使用方面,全中文操作界面,并提供两种操作方式(B/S和C/S)以满足不同用户的需求;产品安装、部署、使用简单,用户不必具有非常高的技术知识便可很快熟悉系统;提供丰富的报警方式、强大的报表功能、独具特色的服务性能拓扑展现 等等。q完善的技术、服务支持,我们是完全自主知识产权的国内产品,所以在项目实施、培训、二次开发、后期维护等各个方面我们都提供完全本地化的支持。特别是二次开发方面,我们具有丰富的实际项目运作经验,并提供源代码级的技术支持。q产品的高性价比,相比同类型产品,不管是在产品模块报价还是授权的方式上,我们都具有很大的优势。8/31/2023q 方案一小型机方案(方案一小型机方案(2台)台)q4*1GHzCPU/4GMem q600G(纯使用空间,两年的数据存储量)q 方案二方案二PC服务器方案服务器方案(2-3台)台)q2棵CPU,双核XEON1.86GHz/4G内存q600G(纯使用空间,两年的数据存储量)