1、美图运维动化系统架构设计1主要内容 美图运维临的困难与挑战 美图运维动化思路 美图运维动化实现美图运维的挑战 益复杂的业务 多种语混 流量突增,如何快速扩容 业务频繁变更,如何撑 业务故障由于复杂场景更具有隐蔽性 监控与业务SLA如何保障 etc.来业务的压 90业务运营需更快速的发布 27户在经历4秒延迟后,就可能放弃公司web站或者app产品27%73%运维动化系统设计指导思想 标准化 流程化 集成化 智能化定位需求 适合的才是最好的 细化痛点 尽量不造轮 全局化 注重基础系统建设设计思想价值导向平台撑数据驱动服务透明效率运维成本质量体验安全整体架构配管中监控中流程中资产系统集成可视CMD
2、B志中美图运维动化前治理范围 资产系统 配置管理系统 流程管理系统 监控系统 志系统资产系统 弱化单独变更操作 每天动校准数据(动抓取机器系统信息)提供各种API供上层服务调 与PXE部分深度整合对接(动上报、库)运维统授权平台 集成OA认证 SSO 集成权限、管理 降低多平台接复杂度统授权平台流程代码发布平台 动发布与强制审核相结合 兼容多种开发语(PHP、JAVA、Go、NodeJS etc.)产、测试、预发布环境隔离 预留API,可供其他平台调 可通微信公众号审批发布申请 完善的代码回混机制动化进阶(集成化)监控系统部署系统。User(OP/QA/RD/运维树SA.)美图运维树 机器管理(机器列表、统计信息)基础服务(机器命名、重启、重装、报修、下线)监控集成(实时流量、监控及报警操作)权限管理(管理、权限申请、回收)数据管理(志中、监控)DB(慢查询、动扩容)配置管理设计考虑 录结构就是棵树 根(部)级节点(业务)三级节点(服务)四级节点(实例)叶节点(机器)所即所得所有操作通过变更节点属性达成志中建设 基于ELK实现 采集使filebeat,通过logstash过滤后存ES 提供志数据源来做不到维度的展示To DO 基于docker+mesos 架构的私有云动化 设计私有agent 丰富完善运维树Q&A