微信尝试结合时间过程与内容特征,重新定义“爆款文”?( 四 )

其中包括静态特征 , 比如资讯的类目、主题等;以及动态特征 , 如某条资讯、某类资讯分时间段的各种统计值等 。 通过这种方法 , Yahoo发现在推荐新闻时 , 娱乐类新闻天然比体育类新闻点击率高 。

由于内容特征不会随着时间而变化 , 因此很多不那么刺激眼球的内容也可以获得公平的曝光机会 。 使得该模型在早期阶段效果更为可靠 。 但问题也随之而来 。

网络文章通常是长文本 , 加上越来越复杂的元数据特征(如标题、类别、作者信息等) , 建模难度也日渐增大 , 目前还没有此类模型能够完全地利用这些数据 。

不难发现 , 不论是基于时间演进 , 还是基于内容特征 , 都不足以支撑内容终极价值的判断标准 。 只有双管齐下 , 才能发挥出最佳的预测效果 。 然而 , 这对于算法工程师来说是极大的挑战 。

DFTC:改写热度预测的丛林法则

为了改变这一现状 , 微信的研究人员就此提出了一种将时间过程与内容特征深度地融合到一起的神经网络方法——Deep Fusion of Temporal process and Content features , 简称DFTC , 来构建更合理的热度预测系统 。

推荐阅读