1、大数据理念在金融交易风控中的应用在大数据应用综合价值潜力方面,信息技术、金融保险、政府及批发贸易四大行业潜力最高。麦肯锡咨询公司(McKinsey)大数据在各行业的应用潜力 大数据在金融行业应用精准营销交叉营销个性化推荐客户生命周期管理个人、小微企业贷款风险评估欺诈交易识别和反洗钱市场和渠道分析优化舆情监测和分析包括人口统计学特征、消费能力数据、兴趣数据、风险偏好等银行交易社交媒体电商网络交易网络访问、广告点击风险管理运营优化用户画像大数据在金融行业应用 大数据应用与金融风险管理Lending Club 风险定价系统将消费者信用征信机构FICO分数,初始评分模型分数,信用属性和其他申请数据输入
2、ModelRankuModelRank得到一个介于1-25之间的分数并对应一个基础风险子级,再根据贷款金额和贷款期限调整基础风险子级得到最终子级uLending Club 将借贷人平均利率从21.64%降至14.8%,审批贷款时间约为7天,截止2014年其贷款违约率保持在5%左右的较低水平 大数据应用与金融风险管理JPMorgan:Big Data+Fast Data 欺诈侦测根据客户长期积累的交易历史建立客户的欺诈消费模式和正常消费模式,实现两种检测欺诈消费检测:利用数据挖掘从消费历史数据库已经收集的欺诈消费记录中挖掘类似的欺诈模式,并利用已有欺诈模式对新的消费行为进行分析和判断异常消费检测
3、:基于用户长期交易历史建立的正常消费模式,实时捕获新的消费行为,判断是否异常大数据理念在汇付天下中是如何运用的呢?汇付数据中心业务拓扑图OBiee报表系统网页访问监测用户行为监测其它监测交易数据集市用户数据集市专门用途数据集市VerticaHadoop业务系统1业务系统nWeb结构化数据Web非结构化数据财务系统CRM金融数据风控系统查询系统数据分析,R,SAS数据查询Data ApiData Portal应用系统Oracle RACETLMobile聚合表数据访问DSL数据钻探商业智能VerticaVertica Vertica性能测试环境配置:操作系统CentOS,内存64g,逻辑CPU3
4、2个。测试内容OracleVertica性能提升倍数数亿条事实表计数查询179,890ms950ms189倍数亿条事实表条件查询52,984ms2,663ms19.9倍数千条维度表计数查询87ms32ms2.7倍多表关联复杂条件查询17,734ms3,534ms5倍双表关联复杂条件查询765,233ms17,206ms44.5倍 Data Portal数据接口Data API Mobile数据接口Data API大数据理念在汇付天下金融交易风控中是如何运用的呢?汇付天下金融交易风控应用案例1.收单服务商风险评级2.P2P用户异常交易识别3.P2P商户异常交易识别4.P2P平台网站监控系统 收单
5、服务商风险评级模型业务流程风控需求需求方沟通收集业务相关信息初定方案并与需求方确认前期准备模型建立模型评估模型确认是否分析建模风控系统监控与处置模型跟踪模型结果是否稳定?模型排序是否有效?模型是否无偏?记录模型表现ETL调度配置R自动计算模型结果输出是数据计算回归分析建模实施及跟踪综合评价服务商风险等级采取不同策略,防范风险事故 收单服务商风险评级模型模型建立数据预处理主成分分析综合评分相关系数矩阵特征值和特征向量主成分贡献率变量分析变量筛选变量标准化主成分权重原始变量权重综合得分 收单服务商风险评级模型数据及变量风险模型数据集交易规模数据差错案件数据风险损失数据反向行为数据汇付静态数据所处区
6、域注册时长开户银行交易金额交易笔数交易时长撤销交易退货交易消费冲正 查询调单退单赔付短款 收单服务商风险评级模型模型结果前11个主成分累计贡献率达到80%共有43个原始变量初步筛选40个变量 收单服务商风险评级模型风控系统监控与处置风险等级综合得分采取措施严重风险型大于60分降低信用额度发放预警函关闭违规商户较高风险型大于40分小于60分小幅降低信用额度走访商户关注日常风险指标和交易情况中级风险型大于20分小于40分关注日常风险指标和交易情况关注风险排名的变化较低风险型大于0分小于20分关注日常风险指标和交易情况关注风险排名的变化提高信用额度 汇付天下金融交易风控应用案例1.收单服务商风险评级
7、2.P2P用户异常交易识别3.P2P商户异常交易识别4.P2P平台网站监控系统 P2P用户异常交易识别流程图用户端交易数据库Oracle行为记录数据库MongoDBP2P 账户托管平台AppWeb数据仓库 VerticaETLETL数据分析模型计算Data APIP2P 风控系统用户数据仓库ETL每日新增30万条交易记录每日新增200万条行为记录560万账户340万独立用户 每日新增1.2万独立用户ETL基本属性购买能力行为特征产品偏好风险偏好 P2P用户异常交易识别用户画像基本属性购买能力行为特征产品偏好风险偏好性别年龄地域联系方式交易活跃度促销敏感度潜在购买需求购买力基金交易频度偏好投资期
8、限偏好利率大小风险评估问卷偏好理财产品类别偏好标的类型偏好P2P平台POS消费类型使用设备品牌浏览时长交易时间段移动终端使用频率日常交易地区 P2P用户异常交易识别数据模型数据分析模型计算交易金额异常识别交易行为异常识别异常大额交易识别近似等额交易识别异常交易频率识别长期闲置账户频繁交易账户分散转入集中转出账户集中转入分散转出交易时间使用设备使用账号登录商户交易类型IP地址交易频率异常识别 汇付天下金融交易风控应用案例1.收单服务商风险评级2.P2P用户异常交易识别3.P2P商户异常交易识别4.P2P平台网站监控系统 P2P平台异常交易识别新用户开户到观测日小于60天商户分类历史表现评估实时监
9、控预警收集静态信息:用户注册地,有效经营时间,注册资本等积累交易行为数据:记录用户操作行为,P2P账户系统记录订单信息分析日交易量分布类型,筛选最优统计量识别异常计算异常交易占比筛选异常占比较高商户,加强关注程度利用局部加权回归,拆分时间序列识别不规则波动中的异常点特别关注异常波动较多商户结合白用户静态信息,匹配存量用户,设定阈值,控制风险超过阈值,触发警报根据数据分布类型,设定5%置信区间,结果推送风控系统风控系统监测实时交易,列出超过区间用户名单名单自动添加到警报信息表,标明警报类型及等级每15分钟预测未来1小时内交易量范围预测范围准实时推送风控系统,风控系统自动匹配超出预测范围,触发警报
10、不活跃用户开户到观测日大于60天,但最近3个月交易日小于30天活跃用户开户到观测日大于60天,且最近3个月交易日大于30天 汇付天下金融交易风控应用案例1.收单服务商风险评级2.P2P用户异常交易识别3.P2P商户异常交易识别4.P2P平台网站监控系统 P2P平台网站监控系统P2P 平台网站MySQLBA1BA2VerticaData API抓取程序P2P 站点列表抓取url规则原始数据分离产品url分析标的相关信息去除停用词分词解析语义信息标的类型借款人类型担保情况标的名称借款金额借款期限项目描述风控系统平台网站状况是否正常?标的发布频率是否异常?标的利率趋势是否平稳?标的利率相对行业水平是否异常?借款期限长度变化情况是否异常?结合交易数据库推算逾期情况ETLThanks!