1、 计算广告的训练和平滑思想崔骁凯 广东vivo电子工业有限公司vivo互联网业务浏览器应用商店电子书vivo官网游戏中心其他CPD账号精准推送推荐搜索文本挖掘自动化排期产品产品运营运营数据数据用研用研设计设计商业化商业化业务线产品线能力线组织架构应用应用游戏游戏广告广告用户画像计算广告目录1、互联网广告的历史与发展2、计算广告的训练模式3、计算广告的平滑模式广告载体的发展PC端传统广告移动端广告PC端计算广告泛平台个性广告数据的发展数据的融合付费模式的发展 按【广告展示时间】付费,通常单位是天。按【广告点击次数】付费。按【广告曝光次数】付费。需要计算的广告收费模式移动端广告CPC类广告点击率预
2、估点击率的训练和平滑点击率的训练和平滑之于移动端广告基于CPC的互联网广告计算广告上架排序计算广告平台收益计算CPC的优势更精准明确的出价更透明互信的合作更优化的曝光收益广告主合作关系广告平台CPC的最大困难是:作为新进广告训练数据不足作为现有广告CTR不断变化我们永远无法得知100%真实的CTR我们的目标是尽可能算准CTRCTR对计算广告收入的影响:CTR越接近广告真实情况ECPM的计算就越准确广告平台的曝光利用越充分什么是训练?新广告上架后的训练过程:给予新广告一定量的曝光,来产生相应的点击数据;根据点击量估算该广告的CTR;训练完成后,根据CTR计算ECPM并排序。训练:通过给予新广告一
3、定量曝光,从而估计其CTR的过程训练产生的两种误差这样的广告ECPM会被算高,会得到比他应得的更多的曝光,从而降低平台收益。这样的广告ECPM会被算低,在极端情况下会永久沉溺。预估CTR高于实际CTR 预估CTR低于实际CTR解决CTR估低的传统方法开辟单独训练位新广告在训练结束前不参与ECPM排序,而在特定的位置完成设定好的曝光数;基于UCB思想的训练引入置信区间上界估高CTR,避免广告沉溺让所有的广告尽可能公平的完成训练如何确定置信度?置信度与广告训练完成的程度成反比。广告的CTR不同,完成训练所需曝光数也不同。置信区间上界与训练完成度的关系n置信区间上界(均值+n倍标准差)什么是平滑?平
4、滑:根据当前的曝光不断更新广告CTR预估的过程。同一个广告的CTR随着时间在不断变化;和训练一样,短期CTR估计不准,波动较大;SmoothCTR =HistroyCTR a+CurrentCTR (1-a)为什么要做平滑:基础平滑公式:平滑公式进阶SmoothCTR aHistoryC+(1-a)CurrentC aHistoryI+(1-a)CurrentI纳入曝光和点击的考量=考虑时间权重的平滑公式使用贝叶斯思想构建平滑算法先验知识当前条件使用历史CTR作为先验知识。更新条件为当下的数据表现。贝叶斯平滑的含义SmoothCTR=(+CurrentC-1)/(+CurrentI-2)平滑公式求解的关键是:和求解和的思路引入r因子求解和的关键是令:mode=mean*r,其中r为可调系数,其值非常接近1。不同r对应的平滑图r=0.998r=优势总结简化操作持续进化 不需要初始CTR;不需要单独训练位 变权公式;支持动态规划