美团外卖广告模型演进t路 - awps-assets.meituan.net¢„估... · 外卖广告 用户...

36
ᨀԦὄ 2018.11 美团外卖广告模型演进t路

Upload: others

Post on 08-Oct-2019

38 views

Category:

Documents


0 download

TRANSCRIPT

  • 2018.11

    美团外卖广告模型演进t路

  • 外卖广告

    CPM

    品牌广告 推荐广告 搜索广告 营销广告

    CPC CPC CPS

  • 外卖广告风险由商户向平台转移

    技术挑战增加

    4P=g展示计费

    4P4g点击计费

    4PCg成单计费

    CTR

    CVR

    平台收益0LSN

    平台收益04DB * LSN

    平台收益04DB * 4FB * LSN

  • 外卖广告

    用户

    平台 商家

    用户体验

    千次展现收益d4P=e 投入产出比dBO:e

    广告生态

    CPM广告 CPC广告 CPS广告

    ROI = GMVCPM =

    !"# ∗ !%# ∗ '!()'*

    !%# ∗ '!()'*

    '!()'*

    ctr cvr ror

    CPM =bidctr ∗ bidctr ∗ cvr ∗ bid

  • m界模型发展历程

    线性模型g LBdL378CfOGLA>e OWUSWO-LBdC85f7DBLe 7=

    77=

    树模型g
835D H83XXst LSQRt83=

    神经网络模型

    5>> GSNO 5OOY 7>> 5OOY7= 54> c

    • 优点g简单高效 • 缺点g线性f表达能力弱

    • 优点g非线性f可解释性 • 缺点gk能XWUSWOf高维离散特征

    • 优点g精度高f表达能力强 • 缺点g性能f可解释性

  • 外卖广告模型演进

    XGBoostFTRL

    FMDNN

    LightGBM

    MTL

    DeepFMWide&Deep

    DQN

    闭环场景

    多目标学w

    提高迭代效率和精度

    刻画能力 泛化能力

    线性模型l神经网络的组合

    优化长期目标

  • 树模型

    bH83XXst bLSQRt83=

    神经网络

    b5>> b=DL

    强化学w

    b5A>

  • 树模型

    bH83XXst bLSQRt83=

    神经网络

    b5>> b=DL

    强化学w

    b5A>

  • GBDT & XGBoost

    H83XXst是835D的一种实现

    01 835D/ 8raNSOWt 3XXstSWQ 5OMSsSXW DrOO

    02 H83XXst/ OHtrOVO 8raNSOWt 3XXstSWQ Does the person like computer games

  • XGBoost

    &fy阶泰勒展开g损失函数更精准f收敛速度更快

    2f引入正则项g防止过拟合

    (f缺失值处理g自动学w特征缺失值的分裂方向

    )f直方图算法g如右图

    ●H83XXst的实现方式

  • LightGBM

    ●LSQRt83=改进精度提升 • LOaP-wSsO分裂

    易用性

    性能优化

    • 样本采样d8OCCe

    • 特征合并d673e

    • 分布式通信优化

    • 支持类别特征 • 支持忽略特征

  • LightGBM—

    保留梯度大的样本f采样梯度小的样本f并提高

    其权重

    ●8OCCd8raNSOWt-LasON OWO-CSNO CaVYUSWQe

    ●优点既减少x数据量f又能有效保持精度

  • LightGBM—●673d6xMUusS^O 7OaturO 3uWNUSWQe建立直方图的时间复杂度可以由O(#Nata * #POaturO) 减小到 O(#Nata * #LuWNUO)

  • LightGBM—●LSQRt83=o的并行

    2f计算直方图 (f计算最优分裂 )f分裂节点&f计算特征分桶

  • LightGBM—建立特征直方图

    建立本地直方图

    2#合并全局直方图

    • 2UUBONuMOg对所有计算节点i

    的数值进行归约操作

    • BONuMOCMattOrg只保留归约后

    的部分结果

    02

  • LightGBM—

    H83XXst-12UUBONuMO

    LSQRt83=-1BOMursS^O 9aU^SWQ

    ●BONuMOCMattOr

    优点g大大减少通信数据量 缺陷g只适用于2JT wXrTOr情况

  • —Yarn-LightGBM●支持aarW环境

    ●支持957C文件

    架构图

  • —Yarn-LightGBM●优化非2TnwXrTOr时的通信时间

    执行步骤 H83XXst +)wXrTOrs

    LSQRt83= +)wXrTOrs

    LSQRt83= +*wXrTOrs

    IarW-LSQRt83= +*wXrTOrs

    建立本地直方图 2#0(227+s &()2.(s .+2*)+s -&2.-&s对所有直方图加和 &(#+-&0)-s 2#0.7.(+s 2-#+&*--&s (#&.()&s同步分裂属性 &.#0&7&-7s 0#.07*).s (#0*&+22s -*&-&)s分裂叶子 0#2*.*2+s 0#0-)*2*s 0#&77.7(s 0#0.&(.sDraSWON a trOO (*#272(22s )#)(+)+(s ()#0-+-2+s +#.).*.*s

    优化g FSrtuaU BaWT + BOMursS^O 9aU^SWQ

    CtOY & CtOY 2

  • • 训练速度比H83XXst提升2倍

    • 线i效果正向

    • 目前在集团内部多n团队应用f性能提升&-(倍

    ✓ 以i特性已经被合并到QStRuL开源版本o➢效果g

    ➢总结g

    LightGBM

    1. MPI/Socket

    2.

    3.

    4.

    Yarn-LightGBM

    1. yarn Spark

    2. dmlc-core HDFS

    (# 分布式通信算法改进

    4.

    5.

    —Yarn-LightGBM

  • 树模型

    bH83XXst bLSQRt83=

    神经网络

    b5>> b=DL

    强化学w

    b5A>

  • V1 V2

    V3

    5>> LB+5>>

    7=+5>>

    V4

    4>>+5>>

  • 预估目标8=F

    4DB 4FB PB:46

    MTL-

    / /

    4HB/

    整体预估gk够灵活

    拆分预估g误差大f样本稀疏

    =uUtS-DasT LOarWSWQ ✓ 同时学w和预测多n目标d5>>多输出e

    ✓ 解决4FBfPB:46样本稀疏问题

    解决方案

    ✓ 输入几u相同 ✓ 任务高度相关

    问题特点

  • m内解决方案

    ✓ 4DB、4FB UXss线性加权 ✓ JXSWt/2UtOrWatO traSWSWQ ✓ 共享隐层

    ✓ 4DBf4HB UXss加权 ✓ 4FB作为o间结果 ✓ 共享6VLONNSWQ特征表达

    经典=DL方案

    阿里6C==

    ✓ UXss线性加权 ✓ JXSWt traSWSWQ ✓ 共享隐层

    共性

    MTL-

    ✓ 样本更加稀疏 ✓ UaLOU的sMaUO

    特性

    同时学w4DB和4FB PB:46怎r办h

    外卖广告解决方案

  • 初步探索

    &

    方法 ● =DL同时学w4DB、4HB

    效果 ● Mtr和Mxr相对NWW正向

    i线落地

    2

    方法 ● =DL同时学w4DB、4FB

    效果 ● 离线2E4有所提升 ● 线i表现正向

    终极方案

    (

    方法 ● =DL同时学w4DB、4FB、PB:46

    效果 ● 4DBf4FB 2E4持平 ● =26正向

    问题 ● PrSMO如何解决

  • ✓样本 ✓曝光

    ✓LaLOU✓点击、成单

    单n3atMR的样本分布片段

    ✓ 4DB和4HB均比单目标5>>有所提升

    效果d对比5>>e

    MTL-

  • 单n3atMR的样本分布片段

    CXR=CTR*CVR

    加入4FB LaaOr

    样本k均 物理含s

    LXss加权 LXss约束

    挑战

    应对

    改进

    MTL-

    ✓ 4DB和4FB均比单目标5>>有所提升

    ✓ 线im务指标正向

    效果d对比5>>e

  • 单n3atMR的样本分布片段

    加入PrSMO LaaOr

    样本k均 LXss冲突

    LXss加权

    挑战

    应对

    • 无法同时收敛

    改进

    MTL-

  • 样本k均 LXss冲突挑战

    网络拆分 共享6VLONNSWQ应对

    ✓ 同时收敛 ✓ 4DBf4FB 2E4持平 ✓ PB:46 =26正向

    效果

    MTL-

  • 树模型

    bH83XXst bLSQRt83=

    神经网络

    b5>> b=DL

    强化学w

    b5A>

  • 用户体验dE6Ae✓为何要关注用户体验h

    ✓用户体验如何定sh

    • 影响对资源位入口的认知

    • 影响用户留存f平台的长期发展

    • 平台复购率

    • 用户活跃度

    • 推荐多样性

    用户

    平台 商家

    • 短期用户体验gMtrfM^r • 长期用户体验gh

    广告生态

    • 4P= • BO:

  • m务场景

    用户

    点击

    下单

    点击

    曝光 曝光 曝光

    ✓为什r用强化学wh

    • 长期指标f全局最优

    • 多目标d复购+活跃度e

    • 探索产生多样性

    产生间接影响

  • 系统框架

    强化学w的*大要素g

    • OW^SrXWVOWtg用户集和广告集

    • statOg用户的特征表达

    • aQOWtg推荐系统

    • aMtSXWg推荐的广告商家

    • rOwarNg复购率+活跃度

  • 要点详解➢ statOg用户的特征表达 ➢ aQOWtg5A>-15XuLUO 5A>-15uOUSWQ 5A>

    ➢ aMtSXWg推荐的广告商家

    ➢ rOwarNg复购率+活跃度

    • 用户历史浏览/点击序列

    • 用户画像特征g性别f年龄f历史单均价等

    • 地理位置f时间

    • 广告历史统计特征

    • 广告:5类特征

    其oD为距i一次下单的天数f间隔越小rOwarN越大

    在平台下单 未下单

  • 6xYUXrOd多样性e

    ➢O-QrOONa

    ➢E43(EYYOr 4XWPSNOWMO 3XuWN)

    一定概率随机推荐f获取充分p富的样本。

    在目前输出A ^aUuO的基础ifv以一n系数g

    其oW为广告历史展现的次数f倾向于曝光少的广告

    代价大f效果有损

    效果优于 O-QrOONaf但仍然k够准确

  • 6xYUXrOd多样性e

    ➢5385(Dueling Bandit Gradient Descent )&f对模型参数随机扰动f倾向选择当前策略推荐的StOV附近的候选集f效果损失最小 2f可以对模型进行实时更新

  • A 2