1、大小数据融合的金融营销建模大小数据融合的金融营销建模金融行业需要大数据吗?金融行业需要大数据吗?大小数据整合大小数据整合通过结合大小数据,能够更加全面的对客户进行画像营销信息营销信息关联信息关联信息上网特征上网特征金融产品偏好金融产品偏好系统交易流水数据客户关系管理系统客服中心服务记录柜面行为手机银行浏览行为网上银行浏览行为客户社交客户社交 媒体信息媒体信息客户消费客户消费 偏好信息偏好信息客户兴趣客户兴趣爱好信息爱好信息新闻新闻行业分行业分析析报告报告政府报告政府报告经济形势经济形势分析报告分析报告银行面临的营销问题银行面临的营销问题客户客户是是什么什么样样子的?子的?客户的购买 意愿、喜好
2、、未来的购买 可能性客户都属于 哪些细分类 别?每个类 别有怎样的 特征?客户对行内 的贡献、高 端客户如何 维系?哪些客户有 发展成高端 客户的可能 性客户购买哪 些 产 品?喜 欢购买哪类 产品客户的交易行 为能反映什么?习惯哪种行为 模式客户处于哪个 生命周期,需 要怎样维护、管理?客户有哪些风 险?客户信用 如何?应该对客户推 销哪些产品?客户的关联人 是谁、社交网 络关系如何,关联群体营销 指导?客户在行内的 等级、忠诚度、流失可能?在大数据助力下的营销在大数据助力下的营销模模式演进式演进初级中级高级大众营销大众营销目标营销目标营销个性化营销个性化营销 产品导向 同样的营销组合,认为
3、每 个客户是无差异的 以不变的营销策略广撒网式的进行低效率营销 少量行方数据支持少量行方数据支持 基于市场细分 选择不同细分组的群体作为目标市场 按群制定营销策略 大量行内数据大量行内数据与与特特定定维维 度的互联网数据支持度的互联网数据支持 以客户为中心 及时探测客户行为模式变化“量体裁衣”的营销策略 结合数据挖掘与事件式营 销发现最佳营销时机 需要紧密需要紧密结结合的合的大小大小数数据据 共同支撑共同支撑营销成功率:大众营销目标营销个性化营销在大数据助力下的营销在大数据助力下的营销建建模模扩展扩展基基于于规规则则的的存存量量客客户户拓展拓展故有高价值客故有高价值客户户分析分析客户流失预警客
4、户流失预警客户生命周期客户生命周期判判别别传统活动、事传统活动、事件件营营销销分析分析产品交叉销售产品交叉销售传统数据传统数据基于客户细分基于客户细分的的营营销销提升提升大众营销获新客大众营销获新客 基基于于行行为为模模式式的的客客户户拓拓展展(存量存量&新新客客)低资产高潜力低资产高潜力客客户户识识别别客户个人大事客户个人大事记记预预测测与与相相关营关营销销提升提升流流失路径分失路径分析析、潜潜在流失模式在流失模式监监 控与挽留控与挽留产品产品-产品、客户产品、客户-产产品品、客客户户-客户、客户、产品产品-客户交叉销客户交叉销售售老客维护老客维护、睡眠客睡眠客 户激活、新客户激活、新客识识
5、别别新客行为、路新客行为、路径径预测预测 大小大小数据数据地域化、偏好地域化、偏好性性、精精准准细细分的分的营营销销提提升升行内某贷款产品促额度行内某贷款产品促额度使使用用&潜潜在在客户客户挖掘挖掘 业务目标:某贷款产品促额度使用业务目标:某贷款产品促额度使用&潜在客群挖掘潜在客群挖掘1.从某额度类贷款产品分析存量客户额度使用率,从低额度使用率的客户中挖掘潜在额度使用人群,并进行相应营销促进2.通过结合银行一方数据及互联网三方数据,从多维度分析某贷款产品客户特征,并将此特征扩散到其他存量用户中,找到潜在的某贷 款产品客户,达到潜在客户转化为真正客群的目的 解决方案及流程解决方案及流程营销方案制
6、定营销方案制定与与执行执行找到精准营销找到精准营销切切入点入点某贷款产品促某贷款产品促额额度度使使用用&潜在客户挖掘潜在客户挖掘数据准备与匹配数据准备与匹配数据准备数据准备数据匹配数据匹配探索性探索性 数据分析数据分析历史用户指历史用户指 标分析标分析样本客户选样本客户选 择择用户行为分用户行为分 析析特征变量选择特征变量选择目标客户选择目标客户选择目标客户扩散目标客户扩散制定营销方案制定营销方案营销方案执营销方案执行行营销方案执营销方案执 行行行内某贷款产品促额度行内某贷款产品促额度使使用用&潜潜在在客户客户挖挖掘掘营销方案制定与执行营销方案制定与执行某贷款产品促额度使用某贷款产品促额度使用
7、&找到精准营销切入点找到精准营销切入点潜在客户挖掘潜在客户挖掘数据准备与匹配数据准备与匹配)通过ID/身份证号/手 机号等关键字段将某 银行内部数据与互联 网数据(来源百分点 进行匹配。未匹配未匹配匹配匹配m%n%进行数据清理,剔除 互联网类别标签稀疏 客户(完全匹配但互 联网行为较少客户)匹配客户匹配客户未匹配客户未匹配客户分析方向分析方向方法描述方法描述R语言示例语言示例探索性描述统计探索性描述统计通过对样本的字段描述分析以测量所代 表的客户群体特征及其初步发现所选取 特征对分析主题的区分度大小summary()、head()、range()、table()、pie()、barplot()
8、、mean()、skewness()、sort()、hist()、sunflowerplot()、class()、var()、density()分析方向分析方向方法描述方法描述R语言示例语言示例匹配样本代表性分析匹配样本代表性分析(特征分布差异假设检(特征分布差异假设检验)验)统计量:样本变量均值或水平占比、样 本变量方差、样本变量标准差等检验:Z检验/T检验/卡方检验/K-S检验等var.test()、t.test()、ks.test()、chisq.test()、mood.test()、ansari.test()、fligner.test()探索性描述统计探索性描述统计47.18%52.已
9、匹配用户的性别分通过对样本的字段描述分析以测量所代 表的客户群体特征及其初步发现所选取 特征对分析主题的区分度大小29.0335.3731.75%82%布情况已匹配用户的年龄summary()、head()、range()、table()、pie()、barplot()、mean()、skewness()、sort()、hist()、sunflowerplot()、class()、var()、density()2.86%1.00%布情况分行内某贷款产品促额度行内某贷款产品促额度使使用用&潜潜在在客户客户挖挖掘掘找到精准营销切入点找到精准营销切入点营销方案制定与执行营销方案制定与执行某贷款产品促
10、额度使用某贷款产品促额度使用&潜在客户挖掘潜在客户挖掘数据准备与匹配数据准备与匹配业务经验业务经验数据印证数据印证研究主题合理研究主题合理正负例区分度检验正负例区分度检验正负例在经验特征维度上是否具有区分度原假设:无区分度备择假设:有区分度12检验统计量:=max|+1212=1()分别为正负例样本量,-2(以以X银行额度银行额度类类贷贷款款产产品品A为例为例 贷款前:金融相关互联网网站金融相关互联网网站&咨询浏览咨询浏览&点击行为、贷款相关关键词查询行为、人生重要节点(结婚、买房、买车等)点击行为、贷款相关关键词查询行为、人生重要节点(结婚、买房、买车等)获得贷款资格&额度:产品相关信息、客
11、户个人及亲属信息、营销渠道、行内资产及交易情况、当下互联网行为模型当下互联网行为模型 使用贷款额度:资产变动情况、交易习惯变动情况、临人生重要节点交易习惯变动情况、临人生重要节点、个人基本信息变动、互联网行为习惯变动互联网行为习惯变动研究合理性验证研究合理性验证结合业务和数据特征,提前验证问题提出的合理性行内某贷款产品促额度行内某贷款产品促额度使使用用&潜潜在在客户客户挖挖掘掘找到精准营销切入点找到精准营销切入点营销方案制定与执行营销方案制定与执行某贷款产品促额度使用某贷款产品促额度使用&潜在客户挖掘潜在客户挖掘数据准备与匹配数据准备与匹配在确定了研究意义后,需要结合数据与业务经验一同确定进入
12、模型的变量及变量水平原始因子水平研究生及以上本科大专中专及以下未知著差无异显regroup大专及以上中专及以下未知重构因子水平例例汽车用品关汽车用品关 开卡时长开卡时长注度注度近期金融相近期金融相关关区域区域 网站关注度网站关注度信用评分信用评分收入收入年龄年龄 单位类单位类型型母婴用品母婴用品*重要度排序来源于变量值发生轻微扰动后的是否提款分类正确率与扰动前分类正确率的平均减少量的排序例例library(smbinning)aov()TukeyHSD()嵌入嵌入(Embedded)决策树 平均纯度减少率 平均精度增益变量筛选变量筛选过滤过滤(Filter)距离度量 相关性度量 信息度量 一致
13、性度量有监督有监督 基于熵离散 卡方分裂 卡方合并变量水平设计变量水平设计 无监督无监督 等宽分箱 等频分箱 自定义分箱 相应合并library(Boruta)library(caret)library(corrplot)library(VSURF)library(lars)行内某贷款产品促额度行内某贷款产品促额度使使用用&潜潜在在客户客户挖掘挖掘找到精准营销切入点找到精准营销切入点营销方案制定与执行营销方案制定与执行某贷款产品促额度使用某贷款产品促额度使用&潜在客户挖掘潜在客户挖掘数据准备与匹配数据准备与匹配贷款产品贷款产品A促额促额度度模型模型 特征:行内一方客户基本属性、交易行为特征和百
14、分点互联网金融&生活类相关属性 样本:与总体分布一致的匹配客户 模型:组合模型(银行需要解释性强的模型:如LR等线性模型、RF等决策树模型)输出:客户额度使用提升概率,客户与行内特征对应结果,客户与互联网特征对应结果组合组合怎样的模型适合组合使用?怎样的模型适合组合使用?判别需组合模型间的嵌套关系,相关检验的通用的原理如下:=mod mod+mod mod+若(mod,mod)=(1,0):模型a嵌套模型b;若(mod,mod)=(0,1):模型b嵌套模型a;否则,两模型互不嵌套,即各能说明最终预测模型的一部分,有理由进行组合行内某贷款产品促额度行内某贷款产品促额度使使用用&潜潜在在客户客户挖
15、掘挖掘贷款产贷款产品品A促额度模型促额度模型 特征:行内一方客户基本属性、交易行为特征和百分点互联网金融&生活类相关属性 样本:与总体分布一致的匹配客户 模型:组合模型(银行需要解释性强的模型:如LR等线性模型、RF等决策树模型)输出:客户额度使用提升概率,客户与行内特征对应结果,客户与互联网特征对应结果结果输出结果输出营销方案制定与执行营销方案制定与执行数据准备与匹配数据准备与匹配找到精准营销找到精准营销切切入点入点某贷款产品促某贷款产品促额额度度使使用用&潜在客户挖掘潜在客户挖掘行内某贷款产品促额度行内某贷款产品促额度使使用用&潜潜在在客户客户挖掘挖掘营销方案制定与执行营销方案制定与执行数
16、据准备与匹配数据准备与匹配找到精准营销找到精准营销切切入点入点某贷款产品促某贷款产品促额额度度使使用用&潜在客户挖掘潜在客户挖掘*锁定近期有金融相关互联网行为的人群是扩散潜在贷款额度使用目标人群的有效方式以X银行额度类贷款产品A为例1.根据业务规则过滤出一部分客群(时间T0时未参与额度类贷款的客户),并按照近期是否有过金融相关互联金融相关互联网浏览或交易行为网浏览或交易行为分别对客户是否参与贷款进行生存分析2.对A银行从2014年10月起获得A产品贷款额度的客户分成前三个月有过金融相关互联网浏览或交易行为的客金融相关互联网浏览或交易行为的客 户户及未有过相关浏览或交易行为两类分别进行生存分析建
17、模:相对于传统推广方式:相对于传统推广方式:针对目标客户群的电 话咨询率有显著提高推广两个月推广两个月:金融贷款产品A销售 增长率为历史最高行内某贷款产品促额度行内某贷款产品促额度使使用用&潜潜在在客户客户挖掘挖掘数据准备与匹配数据准备与匹配某贷款产品促某贷款产品促额额度度使使用用&潜在客户挖掘潜在客户挖掘找到精准营销找到精准营销切切入点入点营营销销方方案案制制定定与与执行执行细细 分分 型型 营营 销销 短短 名名 单单A类唯一识别类唯一识别ID.贷款目的:房产&汽车喜欢大额度贷款产品较为关注贷款利率偏好白天营销喜欢柜台营销方式 B类唯一识别类唯一识别ID.贷款目的:婴幼儿&教育喜欢还款灵活
18、的贷款产品较为关注贷款产品安全性偏好非工作时间营销喜欢电话营销方式 C类唯一识类唯一识别别ID.贷款目的:阶段型无特别贷款产品偏好金融相关互联网行为先行偏好短信&电话&邮件营销喜欢尝试新金融产品 营销时间营销时间营销营销 切入点切入点潜在客户潜在客户类别细分类别细分待挖掘扩散待挖掘扩散 的目标人群的目标人群兴趣偏好兴趣偏好行内某贷款产品促额度行内某贷款产品促额度使使用用&潜潜在在客户客户挖掘挖掘广义交叉销售广义交叉销售客户流失客户流失/欺诈路径分析欺诈路径分析新产品购买前行为特征分析新产品购买前行为特征分析社交网络分析社交网络分析文本文本&语义语义&舆情分析舆情分析地理信息热图分析地理信息热图分析基于大小数据结合还可以完成以下诸类的客户分析