1、中国农业银行数据库使用实践和发展规划数据库使用实践数据管理体系建设数据管理典型案例数据库发展规划3/33一一二二三三四四1.1 农行省域及数据大集中农行省域及数据大集中4/331.2 农行数据库产品总览农行数据库产品总览5/331.3 关系数据库工具箱关系数据库工具箱PowerDesignerOMEGAMON15243DBArtisanOEMProActive6/331.4 关系数据库经验谈关系数据库经验谈OLTP统计信息 事务颗粒度 SQL组合SQL索引诊断分区分表数据模型 配置规范运维 数据库整合并行7/331.4 分析型数据库经验谈分析型数据库经验谈OLAP列存储MPP架构数据分布无无M
2、aster架构:最多支持架构:最多支持64节点节点联邦架构:最多支持联邦架构:最多支持300节点节点维度模型索引分表8/33数据库使用实践数据管理体系建设数据管理典型案例数据库发展规划9/33一一二二三三四四2.1 企业级数据模型企业级数据模型数据模型层次企企业级业A级业务概念级数据模型设计方法数数据模型B级业务概念分类据OLTP模型C级企业级逻辑数据模型管 应C级用理应用级逻辑数据模型OLAP级数据D级模应用级物理数据模型型10/332.1 数据模型规范数据模型规范主题域实体特征属性分类数据类型应用规范11/332.2 数据管理制度和规范数据管理制度和规范制度规范通过一体化的制度设计,规范了
3、系统研发与运维全流程中的数据生产与消费数据管理与一阶:战略规划服务规划数据集市建设规划01数据管理基本制度数据质量管理办法数据信息分级分类指南数据安全管理实施细则配以专业的数据管理团队、流程化的改进机制落实系统研发运维及数据全生命周期的架构管控二阶:规章制度02数据模型设计与管理工作手册应用系统接口规范管理规程三阶:技术标准项目总体方案编制规范企业级数据标准应用系统数据模型设计技术手册数据库设计开发规范核心业务系统建表规范服务方接口规范. 数据架构管控机制 数据质量保障机制改进机制12/332.3 数据质量保证机制数据质量保证机制数据问题发现数据问题发现线上系统按规则自动检测;线下多渠道收集数
4、数消消据据费费标标准准领领管管监测规则管理监测规则管理统一口径;梳理规则数据问题分析数据问题分析业务主管部门牵头域域理理生生产产元元领领数数域域数据问题整改数据问题整改据据数据问题管理数据问题管理按季度季度召开专题行办会,定期发布全行监测报告管管高层协调,联合治理;量化考核,挂钩绩效系统建设需求数据控制需求历史问题清理理理13/332.4 数据管理技术平台数据管理技术平台流程线上化流程线上化数据逻辑设计管理:统一管理数据模型的资源和标准元数据管理:一致性分析、影响性分析运维应用:数据变更的流程化管理数据可视化数据可视化数据地图:实现数据定位和多种形式展示数据质量:实现生产过程中问题数据的全流程
5、管理14/332.5 OLTP数据管理实践数据管理实践BoEing数据模型数据模型总结总结形成形成DOTA数数选取选取OLTP典型项目进典型项目进行行DOTA框架框架再实践再实践数据模型方法数据模型方法研究研究实践实践据管理框架据管理框架2008年年 - 2011年年10月月研究FSDM、Inmon范式建模等,形成农业银行OLTP的11步建模方法和建模流程。2009年年 - 2015年年10月月2016年年3月月2017年年4月月2017年年2月月成立BoEing数据模型组, 通过研究DAMA国际、统筹数据管理方面工作, IBM、同业实践等,总结选取OLTP典型项目,进行实践,从数据模型变更、
6、数据模型设计、数据质量提升、数据标准落地等角度均进行了有效实践。结合数据规划,从数据源头着手,打通数据消费(OLAP)的通道。完善数据管理各项规章制度,形成全行数据标形成DOTA数据管理框架,完善数据规范体系。整合准。打造数据管理平台, 数据管理各系统,打造研包括数据模型设计与管理系统、元数据管理系统、数据质量管理系统等。初步实现数据管理工作的线上化。发运维数据管理一体化平台。在研发、运维、应用等方面均实现了数据的有效管理。15/332.6 OLAP数据管理实践数据管理实践共享多层次OLAP系统原OLAP系统建模方法建模方法应用于应用于OLTP孤主主应应用用区区岛题题分析型应用分析型应用电子银
7、行、化化竖绩效管理监管、信贷管理系统IDC、RPTS.数数据据集集市市区区个人客户运营风控对公客户风险管理分行数据数据集市集市井共共式审计内控享享整整 合合客户营销管理系统、可可多人行监管共性共性加工加工数据数据模型模型复复CCSAS、CSAS.数数据据整整合合加加工工区区预聚合预聚合预汇总预汇总账户统一视图产品汇总客户统一视图客户汇总产品统一视图机构汇总标用用信用卡业务系统准、数据数据处理处理、多多当前模型当前模型基础模型基础模型预处理预处理组织单元基础基础数据数据模型模型参与人产品合约渠道资产财务事件营销共层层EBRS、ALMS.享通 用 数 参次次掌银、网银等差资产负债聚合聚合的操操作作
8、数数据据区区海量数据预处理海量数据预处理系系其他.统统历史数据文件存储历史数据文件存储系统2012年年1月月 - 2012年年10月月2012年年8月月 - 2016年年8月月2016年年3月月 - 2017年年4月月2017年年2月月 -研究维度、范式建模理论,形成农行OLAP数据建模方法在OLAP领域大数据平台工程中实践维度与范式结合的数据建模方法总结融合OLTP和OLAP实践,贯穿研发与运维,研究形成DOTA框架DOTA框架进一步在金融大脑工程再实践16/33数据库使用实践数据管理体系建设数据管理典型案例数据库发展规划17/33一一二二三三四四3.1 核心系统核心系统18/333.1 核
9、心系统下移成效核心系统下移成效按交易码分布,下移按交易码分布,下移100多支交易多支交易联机交易延迟联机交易延迟0.75s,最大延迟,最大延迟4.6s批量时段延迟批量时段延迟20s之内之内按渠道分布,开放核心渠道接入按渠道分布,开放核心渠道接入50个个按应用分布,核心查询下移应用按应用分布,核心查询下移应用12个个数据复制日均交易数据范围数据总量日均交易:主机日均交易:主机3.6亿笔,开放平台亿笔,开放平台2.3亿笔亿笔主机主机50T,下移到开放,下移到开放12T总量总量4000多张表,下移多张表,下移400多张表多张表下移约下移约100亿条记录,最大表亿条记录,最大表16亿亿峰值交易:主机峰
10、值交易:主机4.0亿笔,开放平台亿笔,开放平台2.6亿笔亿笔时间节约主机MIPS节约财务支出6.25亿亿2018年底2019年底3.2万万MIPS1万万MIPS1.95亿亿19/333.2 银行卡受理中心系统银行卡受理中心系统负载均衡总行渠道接入服务集群负载均衡POSPOS联机服务集群1(31-35)1数据库集群1DB2DB2负载均衡2VISAPOS联机服务集群2(36-40)Master异步服务集群1(81-85)负载均衡数据分库INTECUPSCUPS联机服务集群1(41-45)数据库集群2数据分表DB2DB2负载均衡CUPS联机服务集群2(46-50)3异步服务集群2(86-90)4AT
11、M联机服务集群1(01-10)数据库集群3DB2DB2负载均衡异步服务集群3(91-95)短事务ATMATM联机服务集群2(11-20)多种切换方式数据库集群4DB2DB2ATM联机服务集群3(21-30)20/333.3 分布式缓存云分布式缓存云78台台服务服务器器2.4TB内存内存高并发在线水平扩容高可用统一缓存基础设施空间空间互联网金融需求8个应用应用系统系统统一管理和运维磐云缓存平台建立应用技术规范完善监控统计功能电子商务 快捷支付掌上银行 个人网银门户网站 社交生活网点WIFI 企业网银低延迟读写21/333.3 大数据实践大数据实践首家全面自主可控大数据体系首家全面自主可控大数据体
12、系自主研发预处理平台、分析挖掘平台、流计算平台及ETL、监控、调度等大数据工具集”科研驱动科研驱动+创新引擎创新引擎“模式模式专利(21个)+科技论文(8篇)实现异构、异源、异库访问人民银行科技发展奖一等奖MPP数据库数据库+HADOOP技术技术高可用、高性能混搭全天候、全模式的数据服务海量结构化和非结构化数据处理和存储大数据大数据+AI智能化服务框架智能化服务框架构建智能感知+智能服务的金融大脑提供人脸识别、智能投顾、量化交易、智能推荐等数据服务22/333.4 两地三中心建设两地三中心建设主机系统主机系统技术架构GDPS/Active-Active sites数据复制DB2 Qrep异步复
13、制运行模式Active / Query园区级灾难:RT05分钟(一键切换),RPO0分钟(数据补偿保障数据完整)区域级灾难:RT05分钟(一键切换),RPO5分钟(大量应用改造降低时延)23/333.4 两地三中心建设两地三中心建设开放系统开放系统架构架构A-A架构:两中心同时提供全功能服务A-Q架构:主中心提供全功能服务,备中心提供查询服务,同城中心提供数据A-S架构:主中心提供全功能服务,备中心仅作应用和数据备份,不提供查询服务,同城中心提供数据24/333.5 快捷支付系统快捷支付系统体系体系A-S架构架构(北京中心忽略)(北京中心忽略)网联应用银联应用支付宝,财付通小机构支付宝,财付通
14、,小机构RAC RACRACRACRACRACRAC RACRACRAC.1291014129100009 10191019 00098089 90999099 808900247599759950740009101910190009808990999099808925/333.5 快捷支付系统快捷支付系统为了减少数据库访问压力,通过把静态数据为了减少数据库访问压力,通过把静态数据1支付宝,财付通小机构及变化频率低的数据缓存到及变化频率低的数据缓存到Redis中。中。对客户限额也进行缓存,应用对于限额的访对客户限额也进行缓存,应用对于限额的访问和回写都只访问问和回写都只访问Redis,缩短交易
15、耗时。,缩短交易耗时。Redis批量同步RACRACRAC RACRACRAC2 为进一步提升系统高可用性,计划新增为进一步提升系统高可用性,计划新增Redis同步功能,日终将月限额写回至数据同步功能,日终将月限额写回至数据库,实现限额数据持久化。当库,实现限额数据持久化。当Redis出现故出现故障时,通过访问数据库实现限额控制。障时,通过访问数据库实现限额控制。.129101400091019101900098089909900247599759950749099 808926/33数据库使用实践数据管理体系建设数据管理典型案例数据库发展规划27/33一一二二三三四四3.1 数据库产品战略数
16、据库产品战略关系数据库内存数据库分析型数据库历史交易数据分布式MySQL图数据库待选型文档数据库待选型28/333.2 批量数据分布架构批量数据分布架构服务域管理域基础服务数据可视化数据分析&查询数据智能指标报表数据接口数据大屏驾驶舱仪表盘多维分析即席查询交互式服务训练评估部署运行智能服务基础数据管理数据资产库基础模型智能模型维度度量标签特征血缘关系数据资产管理数据产品管理运行监控基础域大数据平台开发平台个人集市对公集市监管集市风险集市分行集市运营集市审计集市财会集市大数据平台主库数据预处理全流程数据开发平台数据归集&存储&计算作业调度离线数据采集交换实时数据采集交换离线数据处理实时数据处理29/333.3 实时数据分布架构实时数据分布架构实时数据应用实时数据应用层数据数据实时计算平台服务服务实时数据计算层流流计算计算批量批量计算计算实时数据交换层实时数据总线Kafkatopictopictopic数据传输 格式适配 消息缓存同步接口 消息接口发布订阅消息接口实时数据采集层oracleoracle日志采集DB230/33