1、用户画像演讲人202X-06-08202X目录01.定量类画像02.定性类画像03.性能调优04.标签开发05.数据架构06.应用定量类画像01定量类画像标签类型用户维度定量类画像标签类型机器学习挖掘类标签(算法类)规则类标签统计类标签定量类画像用户维度D社交属性-维度E用户分层-维度A用户属性-维度B用户行为-维度C风险控制-维度一级归类年龄性别城市渠道职业类型设备一级归类一状态渠道u注册渠道u最近访问渠道u购买渠道一级归类设备uOSu分辨率u机型一级归类状态u安装u注册u购买一级归类参与度指标活跃度用户停留时长用户访问页面数粘性指标访问频率忠诚度比率留存率转化类指标用户的转化指标一级归类近
2、 N 日行为累计行为消费行为售后行为累计行为u购买单数u购买金额u客单价一级归类消费行为u订单类u购买类u物流类一级归类售后行为u退货率u赔付率一级归类风险控制-维度一级归类无效渠道潜在问题用户账号风险设备风险借贷风险社交属性-维度一级归类D职业E家庭成员A经常活跃时间段B活跃地C年龄段一级归类RFM生命周期预流失模型活跃分层RFMu重要价值u重要保持u重要发展u重要挽留u一般价值一级归类RFMu一般保持u一般发展u一般挽留u重要,消费金额高u一般,消费金额低一级归类生命周期u引入期u成长期u成熟期u衰退期u流失期一级归类预流失模型u预流失用户u已流失用户一级归类活跃分层u高活跃u中活跃u低活
3、跃一级归类定性类画像02优势更加精确用户需求方式问卷调研电话调研当面访谈第三方权威数据劣势样本有限,不能代表大体用户定性类画像性能调优03数据倾斜过滤掉倾斜数据引入随机数合并小文件 缓存中间数据 开发中间表 性能调优标签开发04统计类标签开发0106用户特征库开发03流式计算标签开发挖掘类标签开发标签权重计算02规则类标签开发0405标签开发单击此处添加文本具体内容,简明扼要的阐述您的观点。根据需要可酌情增减文字,以便观者准确的理解您传达的思想。单击此处添加标题标签开发标签相似度计算组合标签计算数据服务层开发标签开发流式计算标签开发Spark StreamingKafka标签开发标签权重计算词
4、空间向量01时间衰减系数02标签权重配置03标签开发数据服务层开发ABCD短信影响邮件营销风控系统BI数据数据架构053ID-MAP拉链表1分区存储 2标签汇聚 Hive数据架构Mysql元数据管理01监控预警数据02结果数据03优势高性能列存储可伸缩实时读写操作脚本将hive数据导入Hbase劣势无法多条件组合查询,需要建立二级索引Hbase数据架构ElasticSearch010203存放用于检索条件的数据,rowkey也要存储通过ES 的API根据组合条件查出rowkey通过rowkey去hbase查询crontabuairflow数据架构应用06经营分析商品分析用户分析渠道分析漏斗分析渠道分析u激活u注册u留存u营收u传播经营分析漏斗分析u产品流程关键路径转化为追踪u业务价值路径转化为追踪u虚拟流程类指标追踪经营分析应用精准营销应用个性化推荐服务感谢聆听202X