互联网运维转型之路课件.pptx

上传人(卖家):ziliao2023 文档编号:5951656 上传时间:2023-05-18 格式:PPTX 页数:28 大小:1.77MB
下载 相关 举报
互联网运维转型之路课件.pptx_第1页
第1页 / 共28页
互联网运维转型之路课件.pptx_第2页
第2页 / 共28页
互联网运维转型之路课件.pptx_第3页
第3页 / 共28页
互联网运维转型之路课件.pptx_第4页
第4页 / 共28页
互联网运维转型之路课件.pptx_第5页
第5页 / 共28页
点击查看更多>>
资源描述

1、互联网运维转型之路技术创新,变革未来目录面临的问题面临的问题01运运维演变之路维演变之路02决决胜未来胜未来0301面临的问题面临的问题面临的问题01监控指标多并且复杂监控指标多并且复杂 误报和漏报严重误报和漏报严重 告警无法合并告警无法合并02故障定位难故障定位难 缺少拓扑与调用关系缺少拓扑与调用关系 缺乏事件关联关系主缺乏事件关联关系主 要靠经验判断要靠经验判断03无法故障自愈或隔离无法故障自愈或隔离 主要依靠人工解决主要依靠人工解决 处理问题效率低下处理问题效率低下运维面临的痛点需求多版本发 布频繁变更快迭代快缺少统 一规划人为干 预多监控实 时性差变更跟踪不全设备增长快设备稳定性差安全

2、性差监控不到位故障缺 少跟踪技术因素告警手 段单一工具 混乱人力增长缓慢标准 不统一传统运维面临的挑战云云计算带来变革计算带来变革传统运维服务体系需要快速适应变革传统运维服务体系需要快速适应变革新技新技术促进运维能力趋向开发术促进运维能力趋向开发/运运维一体化维一体化运运维需要更加贴进研发、业务维需要更加贴进研发、业务02运运维演变之路维演变之路架构演变手工运维手工运维脚本运维脚本运维自动化运维自动化运维智能化运维智能化运维V1.0V2.0V3.0V4.0痛苦的升级复杂的管理扩展性差存储设备存储网络传统数据中心架构现状基础架构的每个组件都很复杂服务器效率低下的孤岛运维需求的发展010302传统

3、模式云计算互联网模式平台化自动化智能化单一化ITILDevOPS“你我贷”运维发展之路技技术驱术驱动动 数据数据驱驱动动智能化运智能化运维维智能告警、故障自愈、运营辅助等。数据采集 量较大,建模过程较久。需要数据支持、规则 建立、机器学习以及各 类决策算法应用的引入,对技术挑战性非常大。自自动化运维动化运维统一标准化、规范化、流程化、电子化、保证 业务724小时高效稳定 运行.缺少事前预警、事 中恢复、事后存档.CMDB与应用配置管理 为基础,实现可持续集成发布手工运手工运维维业务运行环境复杂,故 障定位难,效率低,重 复性、手工性工作量较 大,费时费力,容易出 错脚本运脚本运维维缓解了手工运

4、维的部分 压力,架构越来越复杂,故障定位慢、缺少流 程化、规范化、电子化,工作效率低。重复性、手工性工作量仍然较 大,并且容易出错,缺 少自动化工具和手段自动化&智能化运维平台建设理念0103050204从0到1 从1 到N优先核心功能 逐步完善 小步快跑收益最大化以大化小 优先最核心 最迫切功能 功能插件化容忍缺陷 业务导向 快速反馈 不断改进标准化 规范化 流程化完善监控 从底往上 由精至细 分步落地自动化运维建设历程010302从0到1稳定期整合阶段需求拆分 以大化小分析、总结运维场景逐步丰富功能 功能开发插件化难点在于对运维场景和业务的理解摸石头过河学习、交流、借鉴从一头雾水到思路明确

5、难在规划智能告警 故障自愈 决策辅助转向智能化运维难点在于数据支持、规则的建立自动化运平台介绍统一资源管理可视化全自动化管理资源统一管理、运维操作在平台界面完成、运维流程实现自助自动发打包、自动安装部署、自动配置管理更新、自动扩展、自动备份与恢复、自动数据采集、自动故障隔离等资源视图、网络视图、系统管理视图、监控视图、报表视图、告警视图、安全事件等多维报表监控体系安全监控业务监控应用监控系统监控硬件监控性能监控服务器温度、电压、风扇、电源模块、网络设备软硬件状态等CPU、内存、磁盘IO、网络IO、连接状态、进程端口、存储容量等服务探活、作业调度、批处理、日志等交易数据、资金监控、信审业务监控、

6、负载使用、流量分布等响应时间、网络利用率、吞吐量、慢查询、调用栈、cache等行为分析、羊毛党监控、CC攻击、DDOS、SQL注入等ProxyCDNDNSCDNCDNCDNGTMFWDataCenterData CenterWebStorageDatabaseWebWebWebAppAppAppAppAppDatabaseStorageZabbix、Cat、NAGIOS、Grafana(生产)、(生产)、ELK、响应、响应 系系统统数据库数据库存储存储系统系统网络网络警报警报客户端客户端中间件中间件监控体系数据分析数据分析消息队列变化之路PostMQ在RocketMQ基础上自研 了PostMQ

7、:提高了消费者获取消息的实时性;实现了单消 息、批量消息的处理模 式;HA方案中实现了raft 一致性算法;功能更加 完善的管理后台。Redis初期使用,可以满足要 求,但是随着管理服务 器增加,处理消息量剧 增,出现过消息丢失情 况,造成运维故障。(返 回结果的确认很重要)ActiveMQ能满足我们的运维使用 需求,但是管理页面不 友好,不支持完善的事 务型消息解决方案,HA 方案存在一些问题。标准变更问题杂乱无序的标准规范不适用统一规范规范杂乱无章,各个研发团队各自为政,生产上线手动运维阶段。(例如:生产环境的war包命名规范)制定运维平台需要的统一规范,统一标准,推行实施,自动化运维初期

8、。(制定统一的war版本规范,用研发部名+项目名+包名)制定的标准和规范发现不能满足业务的发展或者是运维平台的建设。(运维平台简化上线流程时,需要直接从对接北斗系统的时候,发现之前制定规范根本行不通)规范再统一再次制定新的标准和规范,推行实施,自动化运维中后期。出现这种情况后,怎么去协调各个部门,解决问题,这也是一门大的学问。智能化运维核心全生命周期 自动化管理故障预防、发现与自愈智能化容量 运营智能化运维面临的挑战010302全链路监控、海量日 志自动学习、分析大数据分析与可视化通过大数据平台,建立分析模型,发现问题以及相关联信息,进行 可视化展示用户端、链路、服务端等多维度进行数据采集、分

9、析,并进行自动化检测通过机器学习算法,自动学习并发现故障趋势。自动发现环境、服务或应用依赖关系的变更04预测故障、自愈在故障发生前发出预警或根据预先 设立的规则进行故障自动处理数据源收集010302机器数据埋点网络通信数据网络抓包,流量分析,协议分析服务器、操作系统及相关 日志输出到ELK在各接口或关键核心业务点 插入统计或函数调用等代码 数据汇总到ELK或CAT里面04探针通过听云在各地模拟ping,HTTP GET等操作或SDK对系统检测决策分析数据分析决策支持数据采集智能化运维平台数据多样性数据多维性非结构化数据智能算法模型训练提前预知辅助决策管控风险03决决胜未来胜未来目标降低采购成本节能降低运维成本节省空间降低TCO提升性能数据保护高可用灵活提升SLA智能化运维平台建设路线状状态监控及信息收集态监控及信息收集 监控应用、硬件、网络等 整体运行状态,并收集各指标数据分析数据分析 分析历史数据 辅助问题解剖预防预防 问题定位 流量预测 决策支持 故障自愈报表统计报表统计统计分析历史数据 辅助运维系统管理预测判断预测判断 分析历史数据 构测分析模型 预测事件发生 提供决策支持

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(互联网运维转型之路课件.pptx)为本站会员(ziliao2023)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|