1、大数据时代银行数据价值变现之路银行大数据应用现状 数据资产管理现状 大数据应用现状成熟:传统数据仓库和新型大数据在技术、框架、平台和工具基本成熟,且需要的硬件成本更加廉价资产:“数据是资产”的概念已普及,但是“如何管理数据资产”仍然缺乏成熟的理论、方法、工具和成功实践探索:大数据应用处于摸索阶段,更多的是在引入大数据技术优化底层IT技术架构,在业务应用上缺乏实际有价值的应用,更缺乏“杀手级”应用土壤:银行业是数据产生最为庞大的行业之一,且非结构化数据增长迅速,应用场景丰富,可以为大数据应用落地提供肥沃的土壤银行需要在大数据资源获取,数据资产管理,应用落地和场景入口上亟需解决和完善起来!互联网金
2、融时代贷款风险更严峻 随着普惠金融的到来,在缺乏有效金融大数据的情况下,要做好小微和零售贷款的难度非常的大,近年来小微和零售贷款遇到了增速下滑,不良率迅速上升的尴尬,贷款逾期潜在风险巨大,贷款损失急剧增加。当前,银行更多关注的是在授信评级,还有没有更好的办法管理贷后风险,尤其是零售业务的贷后风险,基于大数据预测分析的贷款客户风险预测分析将颠覆银行传统的风险管理手段,可以具备“先知”能力一样的采取决策和行动!某某银行银行20102014小微贷款增速及不良率走势(来源:平安证券研究所)小微贷款增速及不良率走势(来源:平安证券研究所)迫于竞争压力贷前审批放宽贷后管理滞后贷款损失增加3.3.场景为王场
3、景为王1.数据为根0减少风险损失增加营销收益 三类数据价值变现三类数据价值变现提高管理效能解决之道:数据资产管理和价值变现2.人才为核数据资产管理(数据治理+数据管理+数据应用)+数据资产运营直接服务单体通过区域服务单体服务区域100100何为数据资产管理?数据治理数据管理数据应用数据资产管理数据资产管理完整安全一致准确及时数据资产增值数据资产变现定义:数据资产管理是为了保证数据资产的完整、安全、一致、标准、准确、及时等因素(PS:PS:“数量、质量和安全数量、质量和安全”),使数据能够合理配置和有效利用,从而采取的各种管理活动。目标:是让数据变成资产,使数据资产增值和变现。数据资产运营数据资
4、产运营数据治理(1/3)数据战略数据战略数据资产数据资产估值估值数据治理数据治理活动活动组织和角色组织和角色数据政策、数据政策、标准和规程标准和规程问题管理问题管理数据管理数据管理项目和服务项目和服务定义:数据治理是对数据资产管理活动行使权力和控制的活动集合(规划、监控和执行),是指导数据管理活动如何执行。目标:是制定正确的原则、政策、流程、操作规程,确保以正确的方式对数据和信息进行管理。数据管理(2/3)管而不乱,让数据变成资产管而不乱,让数据变成资产数据管理核心内容定义:数据管理是规划、控制和提供数据和信息资产,让数据变成资产,发挥数据和信息资产的价值。数据应用(3/3)人才为核数据为根场
5、景为王 业务洞察业务场景设计数据来源分析算法模型实现试点单位验证投产价值回报单体 区域应用演进区域应用验证数据来源优化算法模型优化投产价值回报区域 概述:在合理有效的数据管理和管理的基础上,实现对数据资产的保值增值,真正实现数据带来的业务价值回报。直接服务单体通过区域服务单体直接服务区域 应用主体应用主体数据价值变现的演进过程应用的价值能力演进过去发生了什么?具体情况如何?现在是什么情况?发生的原因是什么?未来会发生什么?我们应该怎么做?最好的情况是什么?统计报表即席查询多维分析定制查询统计分析模型查询模型监测风险预警数据挖掘机器学习深度学习预测建模大数据决策信息信息BIBI时代时代知识知识B
6、IBI时代时代数据资产运营观点:观点:数据资产管理和价值变现是一个过程,需要将产品、工具、方法和实施经验与企业的业务逻辑和实际需求紧密结合;需要企业的实际历史数据来训练验证和测试,且数据源的范围和要素在不断演进,算法模型和特征项也需要不断优化演进;这个工作需要机器和人协同作战,缺一不可!目标:目标:实现“数据、信息、知识、价值”的实践提升闭环。单击此处添加文字数据治理数据管理应用提出历史数据业务经验机器学习预测建模数据积累算法积累应用积累正式投产决策支持价值回报业务经验业务场景深入分析试运行真实数据数据资产运营目录数据资产管理和价值变现贷款客户风险预测分析应用我们可以提供的支撑业务分析目标n
7、缩小预测范围方法,提高精确率缩小预测范围方法,提高精确率 主要通过资金链健康度(资金来源、资金去向、资金交易金额)、客户脉脉圈的优良情况(黑名单户多少,交易频繁度)、客户额度合理性、客户画像中客户存款余额、客户财务指标合理性等重点标签分析识别逾期名单。n 发现潜在风险发现潜在风险,识别风险客户识别风险客户 授信额度合理性、资金交易动向风险性、资金活动频繁性、客户行业 变动性、客户信用变化优良性、客户脉脉圈的优良性。算法预测业务分析决策支持总体业务纵深拓展客户脉脉圈分析客户经理管户圈分析 黑名单户关联分析 l 资金活动相关客户情况分析l 客户保证人情况分析l 客户圈行业情况分析l 客户资金用途分
8、析l 客户圈信用评级分析l 管户总体风险分析l 管户资金活动情况l 管户客户脉脉圈分析l 管户总体风险暴露及缓释分析l 其它客户与黑名单户资金情况l 黑名单脉脉圈情况分析l 黑名单户资金来源与去向分析l 可疑客户圈建立客户资金链分析l 资金活动情况分析l 资金全在风险分析l 资金来源及去向分析l 资金活动频繁度l 资金投向分析总体业务纵深拓展客户画像l 客户资金链情况l 客户贷款情况l 客户存款情况l 客户授信情况l 客户还款情况以客户为中心、以资金活动及客户关系为向导,对预测客户进行全方位整体分析。得出客户在我行的总体画像。深层次挖掘客户价值、实现风险全面监控,分析潜在客户风险,找出相应的解
9、决策略。风险计量分析l 全行总体风险及缓释情况l 各分支机构风险及缓释情况l 预计风险损失估算l 风险暴露情况l 重点客户追朔分析贷款逾期预测解决思路行业经验人工处理事后处理传统方法大数据技术人工智能提前预测我们方法基于客户的贷款信息和交易流水等行内数据;结合征信、工商、法院等外部数据;整合社交媒体、电商购物、衣食住行等行为数据;运用大数据预测技术,挖掘潜在高风险客户,预测未来可能会出现逾期的客户。由事后变成事先提前预知!有人工变成机器智能!提前预测实现方式数据准备/特征分析样本整定机器学习网络时间序列模型检验结果反馈优化特征指标:贷款信息相关特征:卡上余额、应还款金额、放款利率、当月放款利率
10、与上月放款率差值、执行利率、已罚利息总额、额度下最差十级分类代码、十级分类代码、小微采录行业种类代码、小微贷款申请人分类代码、担保方式细分代码、零售贷款品种代码、交易流水相关特征:收入总金额、收入总笔数、收入总平均额、支出总金额、支出总笔数、支出总平均额、我行对手收入金额、我行对手收入笔数、我行对手收入平均额、我行对手支出金额、我行对手支出笔数、我行对手收入笔数-他行对手收入笔数、我行对手支出金额-他行对手支出金额、我行对手支出笔数-他行对手支出笔数、还款卡号余额/本月应还款金额、收入总金额/支出总金额、收入总笔数/支出总笔数、我行对手收入金额/我行对手支出金额、我行对手收入笔数/我行对手支出
11、笔数、他行对手收入金额/他行对手支出金额、他行对手收入笔数/他行对手支出笔数、我行对手收入金额/他行对手收入金额、我行对手收入笔数/他行对手收入笔数、我行对手支出金额/他行对手支出金额、我行对手支出笔数/他行对手支出笔数、基于银行提供数据提取近百维度特征多种分类算法组合:One-class SVMRandom Forest模型测试示意5月份以前数据6月份预测结果模型预测6月份真实结果对比InputOutput测试指标:准确性:逾期用户命中个数/逾期用户总个数过滤比例:正常用户命中个数/正常用户总个数逾期客户正常客户预测7月份结果投产数据范围银行内部数据银行内部数据法院查询数据法院查询数据车辆查
12、询数据车辆查询数据征信数据征信数据工商查询数据工商查询数据房产查询数据房产查询数据社交网络数据社交网络数据客户交易数据、交互数据和行为数据:基于客户的贷款信息和交易流水等行内数据;结合征信、工商、法院等外部数据;整合社交媒体、电商购物、衣食住行等行为数据。基于大数据平台下的分布式存储和分布式计算,可以处理结构化、半结构化和非结构化的多种类型的数据电商购物数据电商购物数据使用效果和价值体现XX银行内部方法准确率为46.7%,我们方法的准确率为88.0%准确率准确率民生的方法我们的方法查找范围查找范围传统方法我们的方法传统方法需要在所有客户中查找逾期客户,我们方法只需要在11.2%的客户中查找逾期
13、客户。只需花费10%的成本和人力,达到接近90%的预测准确率,价值回报为9倍!预测结果和准确率只是第一步,关键的是要依据预测结果进行决策和行动,这里将由客户资金链分析、客户圈分析、风险客户分析等进一步的应用场景来支撑。客户资金链分析主要对于贷款逾期预测客户进行资金链全方位分析,以贷款客户为中心,在本行或是他行之间的资金往来情况,主要分析以客户资金链健康度、资金活动频繁度、资金流向风险度、资金额度可控度等情况反应客户所带来的资金问题。n资金链健康度资金来源客户状态正常性,客户信用度优良性,客户归属黑名单、客户在征信系统归属于可疑交易的客户或是非法组织等、或是客户对账户状态不正常,如客户与本类客户
14、发生交易,可能带来资金链健康问题n资金活动频繁度 对于客户资金活动频繁度分析,主要体现在客户在一个月或是一个季度资金交易发生频率分析,一般良性客户,在流动资产方面比较活跃,对于一般经济状况不太好的客户、资金活动频度很慢,从而分析客户经济状况。可能会给银行带来经济损失。客户资金链分析主场景n资金流向风险度 对于资金流向风险度,主要分析客户资金去向,是否为非法组织,是否参与股票、期货、期权、大量资金出现跨境支付等投资业务交易。通过交易资金去向分析安全性,可能给客户带来直接经济损失,从而影响还贷能力,造成银行经济损失。n资金额度可控度 对于我行贷款户,在资金交易过程,存在大量资金流出,而资金回扰现象
15、很少,客户在我行的存款业务量远远小于还本金及利息的额度时,这类客户会直接给银行带来经济损失 客户资金链分析主场景存款贷款票据委托代理投资客户资金链分析主页面n资金流向n资金交易频繁度n客户持有产品n客户发生交易类型n交易对像范围n交易金资金额n资金来源n交易资健康度客户“脉脉圈”分析客户脉脉圈主场景n客户脉脉圈的广泛度广泛度主要体现贷款客户与之相关联客户的数量,通过客户广泛度能区分体现客户资金活动的范围度,客户关系区域度,客户行业分布度。n客户脉脉圈的健康度健康度主要分析客户关系链中,是否我行白名单客户存在关系,是否与黑名单存在关系,还是一些知名公司及一些可疑客户,或是客户信用度底或高的客户来
16、分析客户脉脉圈的健康度。n客户脉脉圈的信誉度主要通过客户脉脉圈分析与之相关客户的信誉度,来总体评价本客户圈的信誉情况。客户脉脉圈主画面n脉脉圈联系紧密度n脉脉圈客户数n脉脉圈重点数n脉脉圈资产情况n脉脉圈风险数n脉脉圈白名单数n脉脉圈信用评分值客户经理“管户”分析n客户经理客户经理“管户管户”分布图分布图 客户经理进入系统,能清晰的目前本客户经理下管户分布情况、各管户的信用情况、管户资金情况、与管户关系的客户情况n客户经理客户经理“管户管户”资金链分析资金链分析 客户经理能清晰分析出,各管理资金链情况,管户下的资金健康情况,资金活动情况,资金流入情况、资金流出情况n客户经理良性优客户分析(营销
17、)客户经理良性优客户分析(营销)客户经理通过资金链及客户信誉情况分析出优质客户,为后期营销准备客户经理“管户”主场景客户经理“管户”主画面客户经理额度风控管理NoImagen额度合理额度合理 主要结合贷后以贷前总体情况,对贷款的额度进行分析,贷款不良是否额度不合理、额度范围评估真实性、贷款违规性等行为情况分析n额度规范性额度规范性 主要分析贷款从授信、评审、审批等过程中是否存在违规行为分析额度风控管理主场景NoImage额度风控管理主页面授信额度风控中心授信总金额缓释总金额还款总信息变更总记录授信总金额授信可用总金额总借据金额循环授信协议数单授信协议数还款总金额贷款总金额逾期总金额逾期总客户数
18、展期总借据数担保总金额押抵总金额质抵总金额保证人总金额抵债资产总金额变线资产总金额资产化总金额期限变更额度变更冻结变更型态变更方式变更NoImage 点击逾期客户数,查看哪些机构,哪些客户经理的管户存在逾期,点击逾期客户数,查看哪些机构,哪些客户经理的管户存在逾期,同时分析这些客户圈及资金链,客户信授总额与缓释金额的差别同时分析这些客户圈及资金链,客户信授总额与缓释金额的差别额度风控管理子页面n额度不合理性分析图风险客户链分析风险客户管理主场景n黑名单资金链主要对于黑名单户或是一些贷款核销户进行资金链分析,查看黑单名与我行哪些户存在资金链关系,从而分析出目前正常或是逾期贷款户是否存在欺诈现象,
19、还款意愿不高的客户。黑名单也有生命周期管理。n聚类分析体现出物与类聚、鸟与群居的思想。n黑名单脉脉圈客户经理或是信贷部经理查看黑名单户。通过历史数据深层次挖掘分析。找出我行贷款户现阶是否存在欺诈现象,对这些贷款户要重点关注。NoImagen贷款户与黑名单关系贷款户与黑名单关系n逾期与逾期客户关系逾期与逾期客户关系n逾期客户与黑名单资金额度逾期客户与黑名单资金额度n逾期客户与黑名单客户数逾期客户与黑名单客户数风险客户名单管理主画面n黑名单户是否存在担保关系黑名单户是否存在担保关系贷款风险评测贷款风险评测主场景n全行总体评测贷款风险评测主要是对本行逾期贷款户的风险进行总体评测,估计预算损失,对重点
20、客户进行重点追搠。从而分析出我行重点风险分布情况。n分支行各自评测风险评测可以根据分行情况,支行情况评测,以可以按客户经理评测,查看风险分布情况,进行总体跟踪。n客户经理管户评测客户经理可能对其管户进行总体风险评测,分析所有管户的风险情况,预计所带来的损失情况。NoImage逾期本金抵押物质押物担保人计量规则评测方法抵债变线损失估算担保金风险暴露风险缓释风险计量风险评测预计损失敞口总风险缓释总金额预计总损失追搠重点总体评测,查看本行总体风险情况,同时可以按分行、支行、客户经理评测查看风险分布情况。针对风险进行总体跟踪。贷款风险评测主画面客户画像客户画像特征跟踪主场景n产品跟踪 客户在我行所使用
21、的产品情况,在各产品上的余额情况,在各产品上账务发生情况的统计分析。各产品在同不时期的占比情况n资金链跟踪 通过客户在我行的资金往来情况,资金交易频率情况,资金交易对手信用情况,资金来源情况等跟踪客户的资金链。分析资金链的健康度。n客户脉脉圈跟踪 通过客户资金交易关系,客户关联关系,担保合同关系,委托代理关系等来划分客户的脉脉圈。通过历史数据深层挖掘,来分析客户圈价值等。NoImagen欺诈现象跟踪通过资金链及客户圈,分析本客户是否存在与一个或多个黑名单名发生资金往来。交易次数是否频繁,交易金额是否大额,黑名单户是否存在担保或是互保关系。n还款信息跟踪 通过客户历史还款信息,分析其资金来源正当
22、性,还款日期准确性、结算账户资金活动性,逾期次数,罚息金额等情况客户画像特征跟踪主场景NoImage客户画像展现主画面NoImage目录数据资产管理和价值变现贷款客户风险预测分析应用我们可以提供的支撑新型的数据服务&合作模式产品:产品:大数据平台、挖掘分析应用平台、数据管控平台、算法模型、具体应用产品等服务服务:数据治理、MAST数据验证、数据处理服务、解决方案等咨询:咨询:算法和模型落地咨询、数据专家咨询、业务专家咨询运营:运营:数据资产管理运营、数据价值变现过程运营新型合作模式:大数据实验室产品实施服务咨询运营Level1OLevel2OOLevel3OOOLevel4OOLevel5OO
23、Level6金融大数据实验室新一代数据服务将是:围绕着银行数据资产管理和业务应用价值变现的持续优化演进的过程。首先实现数据作为企业资产的管理和运营,然后逐步实现数据资产带来的真正应用价值,这个过程需要数据使用方和数据服务方紧密配合,是一个不断持续演进和提升的过程。超强的资源整合能力“肩膀”产品支撑落地经验“MAST”外在驱动力区域“风口”DT时代“科学家”科研力量业务力量数据力量“根据地”数据土壤应用摇篮“场景验证”试点客户整合能力整合资源,聚集人才,依托“根据地”和外部推动力,持续合作,循环递进!共建大数据应用实验室背景:大数据时代,需要一种新型的合作模式,整合价值链主要环节的资源,共同打造
24、银行大数据生态圈,银行业在大数据应用发展上处于摸索的阶段,需要在互信互利的前提下,采用战略合作的模式,以建立银行“大数据应用实验室”的方式来实践前行。目标:旨在海量数据的智能挖掘分析技术、算法和模型的研究和应用落地,合作各方在数据源、算法、应用场景和大数据平台技术上通力协作,并最终服务于金融行业的大数据价值变现,推动大数据在金融行业的应用落地。主要合作方:银行、实验室运营团队,大数据算法和模型团队,应用场景设计团队、专业的IT技术团队等。合作各方共享人才资源,共同运营大数据实验室,共享大数据实验平台,共享大数据价值变现回报,并将大数据实验室打造成一个人才聚合的平台,并以此为契机,形成不同商业模
25、式的协同发展,建立金融大数据生态环境!Big DataBig Data阿里小贷之所以成功的根本原因在于阿里巴阿里小贷之所以成功的根本原因在于阿里巴巴帝国的庞大生态圈巴帝国的庞大生态圈!助推区域应用服务单体机构定标准,建平台,服务监管1.1.实施标准和规范实施标准和规范2.2.基础物理通道基础物理通道3.3.基础数据产品基础数据产品4.4.基础应用管理平台基础应用管理平台5.5.运行机制运行机制阶段性成果阶段性成果治理数据,价值变现,服务银行机构1.1.大大数据分布式平台数据分布式平台2.2.数据验证工作数据验证工作3.3.区域级数据价值变现应用区域级数据价值变现应用4.4.单体和区域应用的互通
26、单体和区域应用的互通5.5.运行机制运行机制演进提升演进提升应用展现应用展现数据挖掘数据分析(OLAP)固定报表指标引擎多维建模分类回归聚类分析时间模式关联规则异常检测即席查询经营管理历史查询监管报送领导查询经营报表风险防范风险指标逾期预测流失预测风险监测市场营销精确营销行为分析推荐系统产品定价信息门户和用户统一登录(PC终端/移动终端/自助终端)高价值密度数据(结构化数据)低价值密度数据(结构/半结构/非结构)数据来源数据来源数据采集存储数据采集存储数据加工数据加工数据资产应用数据资产应用业务数据互联网数据社交媒体物联网第三方数据 预测建模DWDW报表展现灵活查询多维分析监测预警预测分析决策
27、支持互联网金融数据生命周期管控标准体系元数据管理数据质量管理知识库数据资产管理数据白盒运维监控提供平台产品支撑业务总流程银监合规效验内部风险管理内外兼顾业务总体目标贷款逾期预测数据共享银监EAST规则银监MAST规则银监客户风险规则合规性风险信用风险规则操作风险规则算法演练预测分析风险跟踪特征共存规则共享贷前合规性原则合理性原则合法性原则规范性原则资金链分析脉脉圈分析风险计量客户画像贷中贷后348条件共规则合规性业务流程规则定义银监准上报数据银监规则行内规则交集规则合规性规则合法性规则合理性规则规范性规则规则评审规则发布规则周期业务人员规则梳理业务规则管理提前预警数据调整上报确认源系统完善预处理上报数据、发现问题数据致力于数据资产管理和价值变现增值