1、个性化的双11-天猫推荐技术应用天猫推荐总体情况服务平台MobilePC推荐实体品牌推荐商品推荐促销活动等等推荐形式User2ItemsItem2ItemsPersonalized RankingOthers推荐产品超过40+推荐产品每天服务 6M+用户(有点击过推荐产品)天猫推荐总体情况-架构用户实时意图计算推荐实体索引检索Ranker(CTR 预估)装配(参数化)在线实验框架离线实验框架Detail 给我推荐会员俱乐部推荐天猫/淘宝 首页logo 推荐图书城推荐前端匹配层Hadoop集群MPI集群Spark集群2013-11-11 00:01:002013-11-11 天猫总体效果-双11
2、当天9.4521322500501001502002503002010201120122013最近四年双11成交趋势(仅天猫,单位:亿)双11 推荐产品的效果预热期(10月30日至11月10日)双11当天(11月11日)14.00%16.00%18.00%20.00%22.00%24.00%02000000040000000600000008000000010000000012000000020131101201311022013110320131104201311052013110620131107201311082013110920131110预热期推荐引导加入购物车占总体的趋势推荐引导购
3、物车量天猫加入购物车量购物量占比预热期平均16%的加入购物车行为是由推荐引导的双11 推荐产品的效果-预热期582.301020304050607080902012年2013年最近两年推荐引导成交的金额趋势(仅天猫,单位:亿)预热期由推荐引导收藏和购物车的商品在双11当天成交的金额为:25.5亿。双11当天由推荐直接引导的成交总额(不同资源位去重):56.8亿双11当天点击推荐产品的用户:36M双11 推荐产品的效果-双11当天双11当天,推荐引导了近30%的成交遇到的挑战系统 流量暴增带来的系统压力算法 用户行为模式特征 实时计算转离线计算 效果压力 估计QPS 65w,需要机器1350台峰
4、值QPS 为500的机器。而我们只有500台机器遇到的挑战-流量压力-性能的优化是必须的非个性化推荐:CDN 静态化 Cache 命中率达到95%降低系统依赖 建立商品信息库,减少对其他系统的依赖。算法数据本地Cache 对数据量小(3 or 购买次数 1 then score=3else if 关注过 and 购买次数 1 then score=9else if 收藏次数=1 and 购买次数=0 then score=5Learn from the historyQ3:如何计算权重(学习版)在相似的场景下,用当时用户的点击数据(点击当时的品牌数据),学习出,在这种场景下,什么样的品牌特征是
5、重要的,有多重要。用户曝光品牌特征1(点击次数)特征2(购买次数)特征n是否点击Xbrand1201brand2310brand30brandn1w1w2wn学习的目标:去年双11日志:Q3:如何计算权重machine learninglogistic regressionMPI结果双11当天,无线女装会场个性化算法相对于运营赛马结果,成交金额提升27%。无线男装会场相比基准桶,成交金额提升15%。无线女装会场预热期效果(10月30日至11月10日)购物阶段情景指标提升展示阶段曝光情况分桶量-曝光PV-点击PV-点击PV/曝光PV3.77%进店后IPV点击情况点击商品数12.17%点击商品的用户数9.45%人均点击商品数2.48%收藏收藏/加入购物车收藏量15.39%人均收藏量5.42%加入购物车量20.38%人均加入购物车量9.98%