1、 O2O智能PUSH的实践之旅樊聪 美团点评 技术总监摘要本案例分享美团.大众点评如何运用大数据技术、机器学习和用户画像的挖掘,结合用户场景給平台和商家做精准触达和精准营销,給用户提供个性化的推送服务体验。从技术方案和架构的演化介绍其中的实践经验关于我O2O智能PUSH的实践之旅v 背景介绍v 美团点评介绍v 项目背景v 美团点评 PUSH业务概览v 系统构建与实践v 挑战与解决思路v 架构经验v 智能场景意图识别v 品类偏好画像v 意图识别v 总结美团点评简介中国第一的“互联网服务业”电商集团项目背景用户体验差、骚扰关闭push推送点击率低、转化效果差千人一面手机push推送用户:业务:粗放
2、场景单一项目背景目标:v 创造价值v 唤醒沉睡/流失用户v 转化v 用户体验v 給用户惊喜感v 减少骚扰方式:v 千人千面、场景化、个性化智能运营数据驱动美团点评 PUSH业务概览营销PUSH功能PUSH运营PUSHPUSH SDKiOS通道自建通道物料配置防骚扰控制文案选优用户包上传数据仓库(Hive)画像抽取PUSH 平台智能push 商家精准营销运营活动v 主要的运营手段v 多种push方式v B端/C端业务系统构建与实践v 问题与解决思路v 架构经验问题与解决思路双平台,多业务,C/B 两端美团、点评两套push平台、通道两套ID体系运营平台不够易用画像数据人肉SQL、人肉上传效果报表
3、不直观只支持T1 发送数据统计,时效性差结婚丽人休闲娱乐用户运营商家营销查SQL上传重传问题与解决思路双平台美团、点评两套PUSH平台、通道两套ID体系运营平台不够易用人群包人肉SQL、人肉上传效果报表不直观只支持T1 发送,时效性差抽象配置和发送服务,与底层解耦构建双平台UserID/DeviceID 的mapping数据和服务推动平台技术融合一套底层push通道运营平台Push 管理集成用户标签体系多维度实时效果报表基于Storm的实时发送引擎和报表统计系统构建与实践v 问题与解决思路v 架构经验架构经验v 数据、计算、算法 三位一体v 模块化,可快速并行迭代v 规则和模型有机共存、相互补
4、充总体架构验券位置支付交易数据POI 召回User 排序场景识别实时 PUSHLBS 索引离线 pushId-mapping服务用户行为商户数据智能PUSH实时画像流特征计算ML模型离线画像天气服务公共数据服务过滤规则批量 PUSHPush方案管理配额管理防骚扰模块AB测试效果统计基础服务运营平台(C端)用户透视规则配置push管理效果报表效果报表用户营销配置后台(B端)人群设置优惠设置UPS画像服务消息订阅去重机制公司统一push平台push发送服务定制化引擎去重机制DP实时push服务push发送服务去重机制push发送服务MT实时push服务RPC 服务调用批量PUSHv 根据配置,离线
5、生成push 所需数据 v 配置可以例行化自动发送(意图push)v 通过可组合的过滤规则(日期、白名单、黑名单、配额)进行过滤实时PUSHv 用于B端和C端v 基于画像的场景化意图识别v 基于GeoHash的LBS 倒排索引v 高可用、高吞吐、自动触发智能场景意图识别v 基础偏好模型v 广告营销业务使用广泛(FB淘宝)v 发现更多高质量用户,覆盖率与质量的权衡v 用户品类偏好模型v 用户在一段时间内对不同垂直业务的偏好/下单意向度v Lookalike 方法品类偏好模型协同过滤ALSPU Learning贝叶斯学习LR问题:正样本少,未标记样本多ALS算法得到用户对于类目的评分矩阵用户ID
6、类目结婚打分休闲娱乐打分教育培训打分User12.53User21.82.8User33.3User44.45.4User54.2行为行为休闲娱乐休闲娱乐 教育培训教育培训 丽人丽人 餐饮餐饮 电电影影浏览浏览v33414交易交易t24523访问时长访问时长l1053209用户在平台上的行为统计Scorew1*v+W2*tw3*l通过最小化MSE,求得分解矩阵Users矩阵:UK1K2K3K4User15231User24321User33231User44521User51344 Items类目矩阵:IItem1 Item2 Item3K1523K2432K3323K4452 其中K为隐藏因
7、子用户ID 类目结婚打分休闲娱乐打分 教育培训打分User12.53.33User21.82.82User33.34.13.7User444.45.4User544.25Users矩阵:U Items类目矩阵:I完整的用户类目评分矩阵PU Learning红色为已知种子用户(Positive):可根据业务定义为交易用户,预约用户等U型区域内为所有用户(Unlabeled):平台上有行为的用户PU learning圈出真实负样本RN(Real Negative)利用真实正负样本,训练GBDT或LR模型,预测用户意图概率使用朴素贝叶斯(Naive Bayesian,NB)分类方法计算 RNP-1;
8、U-1;使用 P 和 U 训练分类器;对U进行分类,把负类加入RN。https:/www.cs.uic.edu/liub/NSF/PSC-IIS-场景化和个性化引擎协同过滤ALSPU learning贝叶斯学习LR问题:1.正样本少,未标记样本多意图识别v 搜索意图理解v O2O意图识别搜索意图搜索意图理解理解queryquery理解理解知识图知识图谱谱短语相短语相关性关性东方明珠 门票北京分词主题:酒店 0.6 机票 0.2 景点 0.2上下文结果:打折机票四季酒店上海一日游意图识别v 搜索意图理解v O2O意图识别v 链条长v 波动大O2OO2O意意图识别图识别行为行为社交社交路径路径兴趣
9、吃川菜?湘菜按摩?足疗看电影?意图识别v 智能意图识别引擎v 预测用户场景与意图v 数据源的种类丰富度v 精确度 召回度v 新鲜感搜索词品类浏览行为(长期/短期)消费行为规则引擎AB测试用户偏好旅游场景位置属性决策场景到店场景天气Push 敏感度找优惠模式场景配置排序模型意图识别意图识别v 效果v 自动触发,降低运营成本v 点击/转化率提升v 用户体验提升总结和未来规划v 深入业务,了解痛点v 统一、稳定的数据仓库和服务v 场景深挖v 场景结合的排序模型v 人群自动扩展v 互联网下半场:精细化,个性化时代数据数据&智能智能个性化个性化广告广告个性化个性化销售策销售策略略个性化个性化服务体服务体验验个性化CRM管理。Q&AWere Hire!