深度学习在推荐系统中的最新应用( 五 )

损失函数分析

(1)延迟反馈损失(delayed feedback loss)

在延迟反馈损失函数中,假定时滞服从指数分布,并将此模型与 Logistic 回归或深度模型联合训练。参数θ和 w_d 的正则对数似然优化为:

其中 alpha 为正则化参数,L_DF 表示为:

深度学习在推荐系统中的最新应用

图3/19

f_θ(x)对应 pCTR 模型的输出,d 对应于点击一个正样本的时间,而 e 代表自广告播放以来经过的时间。延迟反馈损失函数的数值计算格式为:

深度学习在推荐系统中的最新应用

图4/19

(2)正未标记损失(positive-unlabeled loss, PU 损失)

本文在 FN 设置下使用正未标记(positive unlabeled,PU) 损失,将有偏训练数据中的所有负样本视为未标记。损失函数为:

推荐阅读