1、数据驱动的数据中心数据驱动的数据中心提纲提纲1. 背景背景2. 挑战与根因挑战与根因3. 解决方案解决方案4. 结果结果5. 经验教训经验教训2Salesforce#1客户关系管理 (CRM) 平台3业绩业绩$10.5BFY18FY18 & FY17 revenues asrecasted under ASC 606.All prior fiscal years areunder prior accountingaccounting ASC 605.4Salesforce云架构云架构5数据中心数据中心 面向内部 vs. 基于公有云6核心价值核心价值可靠可靠敏捷敏捷 成本成本7以前的挑战以前的挑
2、战运维服务运维服务 问题问题可靠可靠 敏捷敏捷 成本成本安装安装修复修复用电用电系统间延迟;机器故障XXXX人工排查缺乏监测XX容量规划容量规划 子系统间未打通;记录不实时XXX容量优化容量优化 负载记录不全,预测不准8根因根因9路线图路线图213210解决方案解决方案观测数据观测数据- 机器记录- 硬件健康- 资源使用率- 用电/环境- OS/ 固件状态- 网络/安全状态展现层行动批处理数据质量/ 关-报表联 机器学习/- 安装- 修复容量规划容量优化- 补丁- 用电警报数据湖声明数据声明数据- 网络拓扑- 集群拓扑- 配置目标- 容量请求- 预算目标- 工单处理后数据- 查询- BI- 聊
3、天机器人- 虚拟现实异常检测流处理推导数据推导数据- 自动化日志- 工单- 聊天,知识库收集存储分析展现行动11数据闭环数据闭环 安装 调度器 拓扑图 修复 仲裁器 文本挖掘 12结果结果运维任务运维任务结果结果ROI安装安装修复修复更快,研发敏捷度较高更快,运维成本,容量损失 较高容量优化容量优化补丁补丁负载更均衡一般一般有限有限及时更新,避免安全隐患可靠保障用电用电容量规划容量规划规划更准确13展望展望: 自治运维自治运维运维步骤运维步骤手动手动 自动自动 自治自治确立目标人机决定触发工作确定优先级执行工作验证结果解读验证结果处理任务失败处理异常14经验教训经验教训 经验 构建了数据驱动闭环 改进了运维的可靠性,敏捷性,成本 研发团队满意度,数据中心团队士气和技术 推广工具(chatOps) 教训 数据覆盖/质量是通病 业务导向 业务目标 要回答的问题/ 触发行动 需要的信息 数据定义 (解决方案) 路径依赖 数据完整性/质量 关联/ 及时性 智能 手动 自动 数据驱动1516