当推荐遇到社交:美图的推荐算法设计优化实践( 八 )

但是,将几十万维的高维空间直接压缩到几百维,存在一定的信息损失,因此,在 NFM-v4 的基础上,我们通过将部分高维 id 特征单独建模,比较好的解决了这个问题,在业务指标上,也有不错的效果提升,美拍的人均播放时长增加了 4.75%,人均有效行为数增加了 3.45%。

不过,NFM 存在的一个问题是,bi-interaction pooling 认为特征二阶交叉的权重是相等的,这种假设在多数场景下并不符合数据的真实分布。因此,在 NFM 的基础上,我们提出了 Neural Field weighted Factorization Machines(NFwFM)模型,通过引入一个权重向量,来建模二阶交叉特征的权重。通过二阶向量不等权相加,业务指标整体提升较为明显。其中美拍人均播放时长增加 3.78%,播放用户数增加 1.74%,美图秀秀点击率提升了 5.689%,人均使用时长增加 2.53%,新用户点击率增加 2.701%。

当推荐遇到社交:美图的推荐算法设计优化实践

图5/7

美图推荐排序实践——特征工程

从 LR 升级到 NFwFM,我们虽然减少了大量的特征组合上的工作,但是,如何从数据中挖掘对当前业务有效的特征?如何进行特征选择?依旧占据了我们的主要精力。去年,工业界和学术界,都发表了大量关于 User Behaviors Sequence 建模的新工作,随后,我们也开始跟进这一方面的工作,并在我们的业务中进行了尝试,通过端到端的建模,减少我们在特征工程上的工作。

推荐阅读