Skip to content

Latest commit

 

History

History
126 lines (110 loc) · 5.05 KB

dropoutnet.md

File metadata and controls

126 lines (110 loc) · 5.05 KB

DropoutNet

简介

类似于DSSM的双塔召回模型,分为user塔和item塔。DropoutNet是一种既适用于头部用户和物品,也适用于中长尾的、甚至全新的用户和物品的召回模型。

原始的DropoutNet需要提供用户和物品的embedding向量作为输入监督信号,使得模型使用门槛增高。

EasyRec的实现对原始DropoutNet模型进行了改造,直接使用用户与物品的交互行为数据作为训练目标进行端到端训练,从而避免了需要使用其他模型提供用户和物品的embedding作为监督信号。 相应地,我们对模型的损失函数也进行了改造,如下图所示。

EasyRec的实现使用了Negative Mining的负采样技术,在训练过程中从当前mini batch中采样负样本,扩大了样本空间,使得学习更加高效,同时适用于训练数据量比较少的场景。

dropoutnet

同时还提供了常规的二分类sigmoid cross entropy loss,以及适用于优化全局AUC指标的pairwise rank loss 可供选择。 用户可以从三种损失函数中任意选择一个或多个,并为每种损失函数配置不同的权重。

配置说明

model_config {
  model_class: "DropoutNet"
  feature_groups: {
    group_name: 'user_content'
    feature_names: 'user_id'
    feature_names: 'gender'
    ...
    feature_names: 'city'
    wide_deep:DEEP
  }
  feature_groups: {
    group_name: 'user_preference'
    feature_names: 'fans_num'
    feature_names: 'follow_num'
    ...
    feature_names: 'click_cnt_7d'
    wide_deep:DEEP
  }
  feature_groups: {
    group_name: "item_content"
    feature_names: 'is_new'
    feature_names: 'primary_type'
    ...
    feature_names: 'grade_score'
    wide_deep:DEEP
  }
  feature_groups: {
    group_name: "item_preference"
    feature_names: 'exposure_cnt_7d'
    feature_names: 'click_cnt_7d'
    ...
    feature_names: 'share_cnt_15d'
    wide_deep:DEEP
  }
  losses {
    loss_type: CLASSIFICATION
    weight: 1.0
  }
  losses {
    loss_type: PAIR_WISE_LOSS
    weight: 1.0
  }
  dropoutnet {
    user_content {
      hidden_units: [256]
    }
    item_content {
      hidden_units: [256]
    }
    user_preference {
      hidden_units: [512]
    }
    item_preference {
      hidden_units: [512]
    }
    user_tower {
      hidden_units: [256, 128]
      use_bn: false
    }
    item_tower {
      hidden_units: [256, 128]
      use_bn: false
    }
    l2_regularization: 1e-06
    user_dropout_rate: 0
    item_dropout_rate: 0.5
  }
  embedding_regularization: 5e-5
}
  • model_class: 'DropoutNet', 不需要修改
  • feature_groups: 需要四个feature_group: user_content、user_preference和item_content、item_preference, group name不能变。 其中,user_content和user_preference两者至少要有1个;item_content和item_preference两者至少要有1个。
  • losses: 配置模型使用的loss function的类型和权重;DropoutNet支持三种类型的loss函数,可以单独使用,也可以搭配在一起使用。
    • loss_type=CLASSIFICATION: 常规的二分类sigmoid cross entropy loss
    • loss_type=PAIR_WISE_LOSS: pairwise rank loss,也就是AUC loss,以优化全局AUC为目标;
    • loss_type=SOFTMAX_CROSS_ENTROPY_WITH_NEGATIVE_MINING: 自带负采样功能的support vector guided softmax loss,使用该 loss 类型时, 需要在dropoutnet模型参数中配置softmax_loss对应的参数。
  • dropoutnet: dropoutnet相关的参数,必须配置user_tower和item_tower
    • user_content/user_content/user_preference/item_preference/user_tower/item_tower: dnn的参数配置
      • hidden_units: dnn每一层的channel数目,即神经元的数目
      • use_bn: 是否开启batch normalization,默认值为true
    • user_dropout_rate: 用户偏好统计特征dropout概率,0表示不执行dropout操作;当模型用于用户冷启动场景时,必须设置该值大于0
    • item_dropout_rate: Item偏好统计特征dropout概率,0表示不执行dropout操作;当模型用于物品冷启动场景时,必须设置该值大于0
    • l2_regularization: L2正则项系数
    • softmax_loss: 自带负采样功能的support vector guided softmax loss
      • num_negative_samples: 从mini-batch中负采样多少个样本,必须小于 batch_size
      • margin: 正样本对的语义向量直接的距离必须小于负样本点语义向量之间的距离减去margin
      • gamma: softmax函数的平滑系数;建议配置为大于1的值
      • coefficient_of_support_vector: 支持向量softmax loss的参数,一般设置为大于1的值
  • embedding_regularization: 对embedding部分加regularization,防止overfit

示例Config

DropoutNet_demo.config

效果评估

效果评估

参考论文

DropoutNet.pdf 冷启动推荐模型DropoutNet深度解析与改进