1、砥砺前行:华泰证券技术运营实践与探索之路目录目录涨乐财富通介绍涨乐财富通介绍1行业现状行业现状&运运维维的的挑挑战战2技术运营实战技术运营实战3未来发展方向未来发展方向4 涨乐财富通介绍涨乐财富通介绍 运营数据下载量4800+万 月活750+万公司客户交易人数占比87% 获奖情况2018年度券商优秀APP2017年度最佳金融APP 涨乐财富通业务涨乐财富通业务业 务 保 障 级 别行情沪深期货港股 科创板全球 新三板交易普通买卖港股通融资融券 大宗交易打新神器 国债理财公募基金工资定投私募基金 养老专区天天财 闲钱理财账户账户管家网上开户资产分析 业务办理我的账单 风险评估资讯热门财经快讯要闻
2、专区 涨乐吧自选资讯 热门概念其它消息推送优惠价智能选股 乐米Level2涨乐会员 目录目录涨乐财富通介绍涨乐财富通介绍1行业现状行业现状&运运维维的的挑战挑战2技术运营实战技术运营实战3未来发展方向未来发展方向4 行业现状行业现状-客户投诉客户投诉 行业现状行业现状-监管压力监管压力 2018年年7月月23日,日,XX证券发生信息安全事件,导证券发生信息安全事件,导 致致集中交易系统部分中断集中交易系统部分中断10分钟。分钟。违反了证券期货业信息安全保障管理办法(证监会令第违反了证券期货业信息安全保障管理办法(证监会令第82号)(以下简称管理办法)第二十四条规定。根据管理号)(以下简称管理办
3、法)第二十四条规定。根据管理 办法第五十条的规定,深圳证监局决定对办法第五十条的规定,深圳证监局决定对XX公司采取出具警公司采取出具警 示示函的行政监管措施。函的行政监管措施。2018年12月24日,XX证券集中交易系统中断37分 钟,2019年2月26日,XX公司综合账户管理系统 发生故障,影响交易时间累计13分钟。违反了证券期货业信息安全保障管理办法(证监会令第82 号)第二十四条的规定。依据证券期货业信息安全保障管理 办法第四十八条第二款、第五十条和证券期货业信息安全事件报告与调查处理办法(证监会公告201246号)第三十条 的有关规定,辽宁证监局决定对XX公司采取责令改正并定期报 告的
4、监管措施。2018年12月24日,XX证券信息技术运维人员XXX违反了证券期货业信息安全保障管理办法(证监会令第82号)违反所在证券公司信息安全管理规定,在交易时第二十四条的有关规定。根据证券期货业信息安全保障管理间对生产环境中的存储过程进行运维操作,引发公司网上交易系统和移动终端交易系统客户端登办法第五十条、证券期货业信息安全事件报告与调查处理 办法(证监会公告201246号)第二十六条的规定,浙江证监录异常的风险事件。涉事技术人员被浙江证监局 出具警示函并记入证券期货市场诚信档案。局决定对你采取出具警示函的行政监管措施,并记入证券期货 市场诚信档案。行业现状行业现状-行情波动行情波动 复杂
5、的业务5000+条测试用例复杂的系统8个机房,1500+服务器频繁的变更全年变更800+ 运维的挑战运维的挑战-系统现状系统现状运维过程中的难题运维过程中的难题 故障问题定位耗时太长无法从客户视角感知系统健康状况缺乏贴近实际业务的监控方法服务端架构物理隔离,还会出现故障蔓延目录目录涨乐财富通介绍涨乐财富通介绍1行业现状行业现状&运运维维的的挑战挑战2技术运营实战技术运营实战3未来发展方向未来发展方向4 技术运营概览技术运营概览机房服务器交换机防火墙负载均衡虚拟化操作系统通讯线路IP地址基础架构硬件属性地域分布应用属性业务属性流程管控状态信息配置信息资产信息配置&流程应用高可用用户体验业务连续性
6、系统健康度风险量化运行管理早间巡检值班补丁安装基础运维基础监控客户端监控服务端监控监控体系变更流程灰度发布风险管控变更管理事件知识库事件处置事件分析事件管理应急预案演练报告混沌工程应急演练容量指标基线管理扩容缩容系统容量立项预算成本成本管理 客户端监控客户端指标业务感知 真实客户业务感知 UI测试用例 视频留存 崩溃率 耗时 机型分布 地域分布 版本分布服务端监控基础指标应用指标业务指标 cpu,mem tcp http ping 可视化监控 服务器 交换机 负载均衡 防火墙 吞吐量 耗时 错误数 日志 时间序列异常检测 全业务链监控监控体系监控体系可视化监控案例可视化监控案例-系统拓扑系统拓
7、扑 全业务链监控案例全业务链监控案例-设计思路设计思路 全业务链监控案例全业务链监控案例-落地情况落地情况 全业务链监控案例全业务链监控案例-桑基图桑基图 时间序列异常检测案例时间序列异常检测案例-业务周期性业务周期性 时间序列异常检测案例时间序列异常检测案例 时间序列异常检测案例时间序列异常检测案例-检测模型检测模型 模型模型适用场景适用场景新标签对一段时期内新出现的标签(请求号、功能号、错误号)进行揭示,可以关 注到系统中不同以往的事件点。动态阈值利用历史数据,自动计算出上下限。对突破上下限的情况,进行告警。非常 适合请求耗时这样比较稳定的指标,也可以用于请求量突破历史极限等情况 的发现。
8、请求有无不关注请求的量,关注请求是否出现。通过历史数据,计算出请求出现的概 率。可以用于监控关键时刻(如开闭市)关键请求是否出现。周期很多请求具有较强的周期性,通过历史数据,计算出中位线和波动范围,对 突破正常范围的情况进行揭示。真实客户业务感知案例真实客户业务感知案例 变更流程变更流程自测&系统集成测试变更申请验收测试变更&验证 升级说明 测试需求评审 功能测试 恢复发布 SLA 测试方案手工和自动化用例 健康检测 自测报告 风险评估 回归测试 流量镜像 部署方案 关联系统日志回放 业务监控 回退和应急方案 性能测试 混沌测试 自动化变更案例自动化变更案例研发侧IT资源管理系统自动化服务平台
9、变更墙变更流程 变更指令变更结果变更内容变更通知应用高可用应用高可用两地三中心部署两地三中心部署全链路调用关系绘图全链路调用关系绘图丰富的测试演练手段丰富的测试演练手段多层次的运行监控维护多层次的运行监控维护01020304 强弱依赖关系强弱依赖关系&混沌工程案例混沌工程案例-故障蔓延故障蔓延 强弱依赖关系强弱依赖关系&混沌工程案例混沌工程案例-设计思路设计思路交 易 M obileStock行 情 MobileStock资 讯 M obileStock涨乐UI自动化用例 测试集标记页面步骤标签程序交易主站日志行情主站日志资讯主站日志映射页面与接 口调度程序涨乐页面与 接口映射关 系集 强弱依赖关系强弱依赖关系&混沌工程案例混沌工程案例-演练思路演练思路 目录目录涨乐财富通介绍涨乐财富通介绍1行业现状行业现状&运运维维的的挑战挑战2技术运营实战技术运营实战3未来发展方向未来发展方向4 应用应用CMDB的完善,与监控、变更等系统的联动的完善,与监控、变更等系统的联动 建立系统健康度评估模型建立系统健康度评估模型 谢谢