1、内容电商推荐算法体系-目录l 内容电商的主要挑战l 系统框架l 我们的主要工作l 心得体会l 内容电商的主要挑战场景分散场景内容电商的业务场景多,分散还有大量的内容场景,穿插在其他产品下面多变模态模态目标目前包含:图片集,文本,短视频,中长视频,直播等形态每种类型还有若干种展示方案多目标点击,停留时间,IPV,GMV还要考虑内容生态建设系统架构TPP(推荐入口)SP(搜索入口)日志/系统eventMerge Sort (混排策略)离线/在线学习系统Query/User FeatureRank/SortrecallPAI PSModelBEABFSQPRTPPAI TF内容召回链路:u2foll
2、ow;U2watch;flowA2a;宝贝召回链路:I2i2a;I2i2feed;I2a;等向量召回Profile/ActionPorscheA2a;等IgraphRealtime User-ActionUser Long term-TriggerUser embedding选品Feed Feature图文类内容平台内容库视频类直播类(离线+实时)TimeLine(离线 + 实时)BlinkODPS我们的主要工作业务目标智能展示微观业务指标CTR + VV率 + 停留时间+GMV宏观业务指标卡片大盘指标 各主题产品指标 用户粘性指标+交互策略胶囊样式策略定坑展示/动态展示/跳失点展示/pop
3、layer展示投放算法内容理解内容建设召回策略多目标排序策略用户实时意图文本特征+商品特征+主题特征+场景特征质量+个性化+动态相关性+商业目标实时挖掘用户浏览等长期忽略的行为,动态认知外部数据理解主题质量体系主题价值分级主题标签建设热点预估特别关注热点数据,获取并理解淘内没有的增量信息内容加工内容生产商品簇挖掘,主题聚合,关键词理解,LBS挖掘达人/机构运营/商家图集生成,问大家结构化抽取,主题挖掘,场景挖掘,图文生成媒体/达人等级建设,流量分配,运营机制用户理解/兴趣热点平滑购物决策阶段内部画像外部画像多维属性时空偏好需求分类意图识别负反馈识别短期行为理解打通淘内电商数据,UC/优酷等数据
4、,长期用户数据相似内容点击换词 / 刷新点击关键词/用户触发内容列表内容详情商品详情用户详情回退与商品混排详情回退点击内容坑位点击换词 / 刷新首图首IconSuggestFeeds智能内容内容详情页首页素材库优化展示图文类视频类Session推荐内容页UI优化内容平台内容库关联推荐排序召回选品内容建设辅助直播类(离线+实时)TimeLine(离线 + 实时)内容表征的工作Normal:韩国婚礼NextSentence1Bert1Masked LM举办Multi-Modal:TextTokens/Sentencesmage-Text PairClassificationImage Encode
5、-123Decode23Image Inpainting Bert style Transformer on 1and 2 Combining 1 and 3 fordifferent tasksNextSentenceImage Regions(e.g., objectgenerator)Masked LMRaw Images基于co-training的多场景训练Objective 大小渠道联合学习解决淘宝经验冷启动的问题Co-Training Network 加入channel specific network去学习渠道特有的特征FeatureExtractionl加入产品迭代策略Dens
6、eFeatures 加入display learning network去学习不同的展示样式带来的效果SparseFeatureschannelspecificnetworkdisplaylearningnetworkContentEmbeddingnetworkDisplay learning networkl工程上实现了业务无关,完全按照展示样式和位置schemal对算法来说,是很好的display learning 特征显示单张图还是多张图列表的主图瀑布流主图标题副标题业务类型的icon,个数/类型底部展示的icon,个数/类型底部icon后面追回的文本底部tag文案最后一张图上的第一行
7、文案最后一张图上的第二行文案直播观看人数文案lbs类型的距离文案- LTR在线决策 特点&挑战p 业务目标复杂 业务多目标 人群目标差异 支持流量调控 冷启动p online-LTR 数据分布变化(case:大促期间),更快的拟合新数据 快速响应需求:能够灵活调头,指哪打哪儿 RL在线决策 list天然是一个序列决策过程,可以兼顾多个业务要求 使用神经网络去逼近策略函数和Q函数 (soft update, replay buffer)但是在具体场景应用RL会有一些难点 :l 缺乏模拟器,依靠模型在线学习l 策略探索的regret比较高l 高度sparse高度方差的reward可能的解法:基于监
8、督信息以及辅助奖赏的训练方法决策与内容生态质量评估和保护内容质量 原创保护 内容运营者本身在持续做trail-and-error,反馈的缺乏抓手主要问题在于这个过程反馈缓慢,导致内容运营者普遍追求短平快的手段,抑制了平台供给水平的快速提升 质量预估 预估数据披露间接直接机制升级决策机制弱感知强感知 新内容冷启动,流量探索 流量监控和下发诊断平台策略作者赋能支撑 流量过于集中,两极分化比较严重;可能会导致优质内容量下降,创作者流失 内容优质模板 行业数据输入 自动化选品内容生态建设业务长期发展的基础如何全面认识我们的决策对业务的影响如何提高优质内容的ROI,一方面解决Return,一方面解决In
9、vestment智能展示的体系个性化偏好匹配人/人群与图片的匹配业务需求智能化展示店铺搜-品质图片展示需求行业特征特殊化支持服饰-搭配/SKU合图前台策略及场景主搜结果页(包含新的垂直化场景)店铺搜挑尖货等tab展示引擎投放策略: 概率投放 | 贪心策略 | Bandit思想中控枢纽素材类型展示预估:用户展示图偏好模型 | 信息优选模型 | 布局优选图像/视频决策信息布局行业人工模板模型生成模板白底图SKU图实拍图合成图详情图视频图商品卖点促销信息属性服务场景图视频摘要素材加工底料媒体质量图片合成图片缩放图片主体识别视频图提取视频图封面视频图摘要原商品素材(视频 / 图片)素材单独招商文案 /
10、 促销 / 服务信息case智能展示业务换图 合图 摘要 标题智能交互依赖客户端的能力 单次请求内容数较多,客观造成用户与系统交互少,算法能力受限的情况 随着手机端的计算能力提升和业务对于实时意图计算能力的要求,促使我们思考是否可以在手机端进行模型的预测case智能交互的工作Tpp内容视频搜索主题内容排序图文ClientJarvis模型推理Native用户实时意图识别:预估点击率与商品统计点击率比较渲染广播实时特征收集事件监听搜索/推荐场景内容需求挖掘与用户引导 Query是显示表征用户需求的工具 内容query vs. 商品query 用户实时点击 - 生成内容query根据用户行为算法设计
11、基本思想:解析出属性偏好,根据商品属性生成一句内容需求Query = argmax (:|) log , , :内容需求挖掘与用户引导V encoderK encodercontextdecoderV embeddingK embeddingV attentionK attention Loss:lInput: (品类,连衣裙),(材质,雪纺) 语言模型分类 行业限制单纯的V属性导致属性和品类词是相等对待,造成缺少中心词问题,额外的K特征帮助减轻这一问题;同时也希望模型可以学习到重要的属性当作修饰词 要求语义通顺 预先训练分类器(广告,散文) 通过MCMC,去模拟整句query,加入连贯性的loss心得体会需要从用户内容消费的角度看算法与产品的迭代 内容本身是最重要, 内容需要大量的清洗和预处理,内容理解本身对于业务发展至关重要在产品快速迭代工程中,如何配合产品节奏,优化模型,还是一个课题