ImageVerifierCode 换一换
格式:PPT , 页数:17 ,大小:1.97MB ,
文档编号:3496381      下载积分:18 文币
快捷下载
登录下载
邮箱/手机:
温馨提示:
系统将以此处填写的邮箱或者手机号生成账号和密码,方便再次下载。 如填写123,账号和密码都是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

优惠套餐
 

温馨提示:若手机下载失败,请复制以下地址【https://www.163wenku.com/d-3496381.html】到电脑浏览器->登陆(账号密码均为手机号或邮箱;不要扫码登陆)->重新下载(不再收费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录  
下载须知

1: 试题类文档的标题没说有答案,则无答案;主观题也可能无答案。PPT的音视频可能无法播放。 请谨慎下单,一旦售出,概不退换。
2: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
3: 本文为用户(三亚风情)主动上传,所有收益归该用户。163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

1,本文(基于大数据技术的互联网征信-课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!

基于大数据技术的互联网征信-课件.ppt

1、 基于大数据技术的互联网征信 葛伟平 2015年6月7日拉卡拉联合四大上市公司共同组建 央行首批授权的个人征信机构 同时持有企业征信和个人征信牌照的征信机构 拉卡拉跨行还款转账数据生活服务数据POS交易数据电商数据理财数据小贷数据拓尔思股票代码:300229中国互联网行为数据挖掘领先企业,拥有中国最强的大数据技术及舆情分析数据旋极信息股票代码:300324中国两家营改增服务商之一,拥有企业税务类服务数据蓝色光标股票代码:300068全球第六大传播集团,是大数据营销的代表企业梅泰诺股票代码:300038三大通讯运营商服务数据及全国企业工商服务数据考拉征信公司互联网征信特点基于云大物移智技术,提供

2、互联网征信需要的大数据存储、计算能力、建模平台和访问便利性纳入一切能够反映能力或意愿的数据:信用类数据为主体购物、理财、缴费等数据社交关系位置数据用户上传/提供的有效数据互联网信息以经验为主的专家评分卡转换到以大数据为主的全量数据分析 高频、秒级的信 用评分评级响应互联网征信本质仍然是征信,互联网是渠道和工具!趣味大数据分析记性最差的星座(最容易忘记还钱,贡献了不少额外利息):射手最抠门的星座(最后一天的最后一刻还钱,不愿给利息):双子最土豪的星座(12星座中借钱最少):天秤存在的挑战:数据资源 数据的碎片化 数据的稀缺性 数据的精细化 数据的理解度 数据的高成本存在的挑战:大数据处理 大数据

3、采集 大数据存储 大数据计算考拉征信应对:数据资源引入股东数据提供支撑借助外部合作数据积极牵头或参与制定数据标准和互换数据与中科院合作成立实验室制定模型知识图谱考拉征信应对:数据资源组建数据抓取团队考拉征信应对:大数据处理传统数据平台、Hadoop平台和NoSQL数据平台的结合传统平台存储评分结果离线式计算基于Hadoop分布式处理环境Hive平台R结合Hadoop用于大数据统计分析快速的大量数据勘察基于Impala,从小时级缩减到秒级NoSQL处理社交关系考拉征信应对:大数据处理图数据库在社交关系/朋友圈模式应用可视化效果找到显性特征、显著变量通过“弱关系”找到与征信业务的“强关联”考拉征信

4、模型技术框架考拉个人信用分考拉商户信用分互联网金融行业征信产品信用评分引擎 数据理解模型组合和模型部署 变量选择样本准备模型设计变量处理数据分析模型训练参数调整模型验证模型跟踪与反馈征信产品征信建模ETL数据接口平台(清洗、转换、脱敏)传统数据平台Hadoop数据平台(Hive仓库)数据采集拉卡拉业务数据其他股东数据互联网抓取数据公开数据外部合作单位数据贫困人口征信数据(待接入)数据标准管理数据质量管理数据安全管理NoSQL数据平台考拉职业信用分考拉模型训练数据到最终模型的递进式过程:就业务细节业务特征理解听取业务专家的定性叙述数据异常值处理、聚集处理、数据规范化进行数据的违约关系分析对变量进

5、行变换分组分析对最终选择变量进行建模运用多种模型技术和算法进行训练测试结合可解释性、预测精准性及训练成本权衡后选择适用算法或组合子模型和通用基础子模型组合考拉征信模型的KS值处于合理稳定范围考拉信用分值分布考拉个人信用分特点:上亿数量级客户缴费、理财、购物类信息金融社交关系和位置信息互联网信息考拉商户信用分信用记录商户及法人的过往信用记录及信用账户历史记录等履约能力综合能力体现,尤其指经营能力交易行为交易行为特征、互联网舆情信息等成长能力发展规模和速度能力企业属性基本信息,经营范围、注册资金等经营稳定经营波动状况考拉商户信用分特点:真实、整合、实时的商户运营情况成长能力画像,反映变化交易行为特征和互联网信息现状:中国有1千万以上小微商户传统财务指标无法有效核实小微商户信用状况小微商户贷款难考拉信用分考拉信用分信贷旅游保险租车租房婚介商户促销理财餐饮酒店考拉信用分应用:信用价值的体现谢谢!

侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|