1、智慧IT智能运维平台建设方案从业务角度解决问题数据库开发人员数据库可用,怎么会是我的问题?服务器正常工作,大概是数据库故障。系统维护人员不能登录系统,需要帮助!业务软件提供商系统没有任何异常,跟我没有关系。最终用户 到底谁来解决我的问题?主要内容1 点智数码公司简介2保险行业IT运维管理现状与需求分析4智能监控系统解决方案5自动升级解决方案产品设计理念n 以ITIL为运维管理的实践指导n 以监控为基础、资源为核心、流程为导向、客户为中心n 实时管理、闭环管理、精益管理、战略管理统一数据统一标准统一平台5智能监控 模块设计 无缝衔接 灵活组合系统架构设计u 开放的机构架构,易于特殊应用的定制u
2、专业项目开发团队u 掌握所有的核心技术和代码u 多种二次开发接口,包括RMI、WebService、数据库等系统接口技术平台技术特征单点登录,统一展现基于Portal、WEB技术,网页展示图形可视化界面强大的基于SVG技术,友好交互模块设计,易于扩展MVC框架设计、松散耦合 数据库扩展技术SQL Server、DB2、Oracle 无限扩容,平滑升级多Probe技术、数据库与探针分离完善的系统维护详细的系统操作日志、和设备维护记录主要内容 点智数码公司简介23保险行业IT运维管理现状与需求分析4智能监控平台架构51自动升级解决方案 采集多厂商路由器、交换机等设备总流量、进/出流量、丢包速率、错
3、包速率、进/出包速度、包转发速度、CPU、内存、设备响应时间等,提供实时展示和Quickview高风险信息快速预览。基础资源监控 实时TopN数据快速预览基础资源监控应用服务监控11服务器进行实时监控包括:l 监控CPU运行情况;l 磁盘使用情况,可按分区监控;l 实际内存、虚拟内存;l 系统日志;l 文件大小;l 进程状态;l 等等支持的操作系统:l Windows l Linux l Sun Solaris l IBM AIX l AS400/i系列l HP-Unix/Tru64l Free/Open BSDl Mac OS 基础资源监控服务器监控支持数据库:l Oracle版本8、9i、
4、10g、RACl MySQL 版本3.23.x,4.x,5.xl Microsoft SQL Server 版本2000/2005l IBM DB2 版本8.x,9l Sybase ASE 12.5.3及更高 数据库服务监测点:l 连接统计,请求统计l 线程明细,表锁统计l 键效率,缓冲统计l 数据库明细及状态l 表空间明细及状态l SGA明细及状态l 数据文件性能l 会话明细&回退段l SQL统计,Latch明细l 事务统计等基础资源监控数据库监控应用服务器监测点:l 队列性能的监视;l 应用服务端口状态;l 队列执行线程比率;l 队列执行线程比率的门限;l 队列吞吐量的门限;l 队列中等待
5、处理个数的门限;应用服务器:lBEA WebLogic :6.1,7.x,8.x,9.xlIBM WebSphere :5.x,6.x,支持ND模式lOracle Application Server :10glJboss:3.2.x、4.0.x、4.2.2GA lTomcat:3.x,4.x,5.x及以上lMicrosoft.Net :1.1,2.0lGlassFishlSilvertream基础资源监控中间件监控主要内容1 点智数码公司简介2保险行业IT运维管理现状与需求分析4智能监控系统解决方案智能监控平台架构5Web应用升级要求Web应用管理的要求 应用回复到正应用回复到正常常主动式管
6、理主动式管理发觉问题发觉问题发出通告发出通告主动地主动地生产环境中的监控应用生产环境中的监控应用运行状态运行状态 实时掌握整个应用系统性能变化和趋势,快速定位性能瓶颈 有效的管理流程,明确问题责任,避免互相推拖和指责 灵活的性能报警机制 通过更快地解决问题和避免问题,提高系统的可用性在用户投诉之前在用户投诉之前查明瓶颈,并解决问查明瓶颈,并解决问题题查明在应用、应用服务器、查明在应用、应用服务器、后端系统以及环境中的瓶后端系统以及环境中的瓶颈,为用户解决问题颈,为用户解决问题用户频繁呼叫用户频繁呼叫“救命啊救命啊!”Black Box消防队来啦消防队来啦:火灾现场在哪儿火灾现场在哪儿?反应式管
7、理反应式管理 生产环境升级 配置应用环境路径 上传已打包的文件 解压服务器上的压缩文件 清理stage部署目录 实现一键升级软件功能 监控weblogic应用服务器 监控进程情况 监控正常登录 监控机器内存和磁盘剩余情况 监控请求是否正常 记录监控日志 发送报警邮件 生成监控地图软件功能操作简述 登录:地址:http:/56.1.32.200:9099/WLControler/用户名:admin 密码:admin登录界面登录后,“首页”列出了配置在平台的各个系统,点击“开始监控”,即可同时对选择了的系统进行检查。监控已配置好的应用环境开始监控监控结果系统运行信息系统监控地图通过电子地图可以直接
8、对监控点进行调看、设置、报警联动操作,让使用者更加形象地感受与应用例如某省的应用出现报警时,根据影响程度显示“黄色”或“红色”报警信号。点击报警图标可查看该省的应用列表,定位具体问题。启动或停止生产环境 在“系统运行信息”列表最后有“重启”、“启动”、“停止”、“显示进程”等按钮供操作。例如点“重启”按钮,可以只对系统的其中一个domain进行重启。“显示进程”可以显示当前domain运行的进程号。点里面的“清除”按钮可以快速地杀掉该进程。显示进程信息系统每天定时监控(可配置定时时间)情况都记录下来,方便以后检查。查看日志查询到的日志日志详细信息配置生产环境在“服务器管理”功能中,可以新增或修
9、改要监控的系统的配置信息。已配置的系统及domain点“增加系统”可以增加被监控的系统。例如有一个应用系统,它的登录地址是:http:/IP:PORT/MyApp/login.jsp即可以配置:增加系统配置系统下的domain由于系统可能要部置在weblogic的多个domain(域)里,这里提供了domain的配置。新增一个domain,需要知道weblogic安装的机器的IP、端口、操作系统类型、磁盘挂载路径以及系统部置的路径、启动命令、控制台日志等信息。一个系统可以配置多个domain。Domain配置 配置完成后可以在这里启动或停止该 domain。当配置好日志信息后,可以观察启动或停
10、止的服务端返回信息。启动或重启时可观察日志生产环境升级 在配置了生产环境domain后,如要使用升级功能,还要在“生产环境升级”功能中配置升级路径。点其中一个domain使用须知 用户须先把要升级的文件打包为war或tar文件;然后用上传功能上传到指定的目录(可设置);配置更新路径,即需要部署和升级的路径;缓存路径是针对分布式部署的多domain应用环境,升级后要删除stage目录而设置的;必须配置更新路径才可以进行升级更新操作。更新后还可以在这里重启系统修改系统设置 这是对系统的设置,可配置登录用户,超时时间和监控时间间隔等信息。系统配置设置监控标志 由于系统是采用ssh 方式连接对方机器执行命令的,依靠命令执行后的返回信息来判断执行成功或失败,这里可以增加监控成功或失败的标志信息。感谢聆听 批评指导
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。