1、DevOps自动化运维平台实践技术创新,变革未来目录运维三个阶段运维三个阶段1自动化运维实践自动化运维实践2应用运维平台(应用运维平台(ATOM)3批量腾挪工具批量腾挪工具4弹性伸缩弹性伸缩5运维三个阶段运维三个阶段用 户系 统黑屏黑屏人肉脚本白屏白屏人push机器事件驱动大量人机交互无屏无屏机器push人 少量人机交互自决策 自驱动人工运维人肉运维人肉运维自动化运维自助运维自助运维自助自治规模化智能化运维定义运维定义运维自动化运维基自动化运维基础础n 运维标准与规范n 泛监控,运行时,静态,数据化,可视化n CMDBn 高效的CI,CD,CD运维系统重要特运维系统重要特性性基于目标管理基于目
2、标管理保持服务可用状态保持服务可用状态图片来源:图行天下PaaS变更挖掘机bug硬件 故障目标 - CMDB中定义现状现状- 泛监控感知现状容器 挂了 几个Dont know why运维自动化架运维自动化架构构研发定义运维研发定义运维 配置驱动变更配置驱动变更OODA环运维工具与方法运维工具与方法论论精益发现价值根据客户 需求重新 定义价值识别价值 流,定制 活动价值流动 起来需求拉动 价值流不断改善 尽善尽美敏捷交付价值客户合作个体和互动响应变化工作的软件OODA实现价值观察 Observe确认 Orient决策 Decide行动 Act形成闭环,让价值快速流动DevOps转型对运维工具的影
3、响转型对运维工具的影响影响影响1. Dev使用运维工具,自助单应用运维2. 运维要更多时间投入研发,专注平台打造挑战挑战1. 运维工具用户体验不佳2. Dev在运维投入时间增多3. 离一线远了,故障处理能力如何不退化4. 运维研发能力提升,抓手是什么应用运维平台ATOMA T O M平 台 产 品 架 构门Portal(App Container)面核 心 业 务 能 力预算容量资源弹性应用管理规模化数据化运营工单效率DevOps分 析预算报表资源报表预算收集性能基线资源池管理日常弹性扩容缩容单元扩缩容额度管理水位分配策略大促弹性网络变更机房搬迁预算执行容量规划资源腾挪容量预测单机自动化 运维
4、凑框腾挪预算追加大促备容资源利用率异常决策配置变更一键容灾中 台规则中心异步任务引擎任务队列任务调度 消息通知微服务API定时任务引擎流程引擎原子服务定时调度流程控制注册中心任务执行数据交换原子规格并发控制流程调度原子操作Gateway二 层Zeus 2.0NormandyCMDB监控一 层一级资源调度批量腾挪工具( Aliconan ) - 背景 痛点:l 每一至两年一次的机房搬迁,投入人力多、时间跨度长 l 机器批量过保替换,人工操作、人工通知 l 机器故障频发,运维/研发手动替换 目标:l 规模化、系统化资源腾挪,提升运维效率l 减少批量腾挪投入的人力、时间资源l 单机替换自动化处理批量腾挪工具业务架构图批量腾挪执行界面例子弹性伸缩 - 背景 痛点:l 加机器是“万金油”,用成本换稳定,敢上不敢下l 机器上下没有依据,峰值备容全靠“拍脑袋”l 运维集群规模大,资源管控靠人肉?别逗了目标:l 基于策略和目标的自动化机器伸缩容,精准决策,成本、稳定、高效三合一l 多维度实时智能容量预测,全方位指导资源最优配置l 基于规模数据分析构建容量模型,从预测到弹性伸缩执行,自决策资源管控,有条不紊弹性伸缩(Athena)弹性伸缩架构小结小结1. 4条自动化运维基础2.研发定义运维,配置驱动变更3.基于目标管理4.形成闭环,让资源流动起来