1、大数据在CSDN的应用实践数据业务用户数据数据论坛百万级数据量下载百万级数据量博客千万级数据量580万微信公众号用户2500万注册独立用户3亿+用户行为信息业务业务留存留存UVPV用户需求用户需求用户找到问题答案推荐系统推荐系统1. 相关推荐简介 基于内容(CSDN博客、下载、论坛、学院等)做关联匹配,为用户推荐相关的周边内容,使用户能更好的了解相关内容或知识 应用在博客、下载、论坛、学院等详情页的下方或右侧分发量分发量用户业务 数据分发量推荐系统推荐系统相关推荐相关推荐2. 相关推荐召回策略 搜索词关联推荐a) 内容页对应的搜索词列表b) 搜索词对应内容页列表c) 内容页根据搜索词列表再去关
2、联对应的内容页,根据内容页的访问时间和访问次数进行访进行时间衰减策略计算推荐系统推荐系统相关推荐相关推荐3. 相关推荐召回策略 百度搜索结果推荐a) 根据内容页的搜索词去百度进行查询保存b) 取内容页搜索词获取百度查询结果进行推荐 ES查询推荐a) 根据内容标题和搜索词查询ES获取相关性内容推荐推荐系统推荐系统相关推荐相关推荐4. 相关推荐算法策略 位置系数计算每条推荐内容所在位置的点击数与曝光数,将点击曲线拟合到曝光曲线,得到每个位置的位置系数,最终计算得分推荐 不同策略初始交叉排序根据不同策略的数据表现,将高效策略排于高位,并进行策略间交叉排序 点击反馈根据点击率进行排序推荐系统推荐系统相
3、关推荐相关推荐5. 相关推荐优化策略 增加标题飘红词 压缩页面高度,提高曝光量 区块点击 ES查询词中英文词进行权重增加查询推荐系统推荐系统 A/B 测试测试策略AVS.策略B推荐系统推荐系统 相关推荐相关推荐6. 数据流程推荐系统推荐系统分发能力分发能力分发能力成倍提升100%2018/3/5 2018/4/5 2018/5/5 2018/6/5 2018/7/5 2018/8/5 2018/9/5 2018/10/5 2018/11/5推荐系统推荐系统 效果效果相关推荐访问深度浏览量跳出率下降10%日均提升百万级推荐系统推荐系统个性化推荐个性化推荐1. 个性化推荐简介 基于用户浏览记录,为
4、用户推荐感兴趣内容。 应用在博客、公司网站首页,通过信息feed流形式呈现。用户标签用户标签2. 根据用户最近兴趣标签,短期兴趣标签和长期兴趣标签长期标签用户行为时间短期标签推荐系统推荐系统个性化推荐个性化推荐3. 个性化推荐数据源 根据用户最近兴趣标签,短期兴趣标签和长期兴趣标签,从ES搜索引擎进行数据召回 最近博客热数据召回 百度搜索数据 基于用户CF推荐数据召回 热门分类补充数据 关注博主推荐系统推荐系统 个性化推荐个性化推荐4. 内容池质量过滤 质量分(中、英文字数,代码段数量,图片数量) 时效性(2011年至今文章) 原创性(仅展示原创文章) 标题长度 标题去敏感词推荐系统推荐系统个性化推荐个性化推荐5. 个性化推荐算法感谢聆听!