大数据变现实践:微博百亿营收背后的数据挖掘技术(15)

但实际上用户的短期兴趣更有用,比如用户刚刚阅读了关于汽车文章,可能反映出用户对汽车比较感兴趣,这个数据要反馈到广告系统里面,需要有一套实时标签计算架构,捕获到用户的实时行为。

引入实时行为对于点击率有33%的提升,所以让数据动起来是非常有必要的。

大数据变现实践:微博百亿营收背后的数据挖掘技术

3)数据挖掘

数据挖掘的范畴非常大,包括语音、图像的识别,文本、视频的挖掘等等,在此举一个在商业化里面经常用到的例子。

它的基本原理如下,从下图左边的用户里面寻找相似用户,再扩展这些用户,扩展到一定的体量。

应用场景如下,广告主积累了购买过商品的10万转化用户,接下来看看这10万用户有没有什么特点,能不能扩展到100万客户,根据一个种子人群的特点来扩展一波用户,这波用户就是高转化的用户。

大数据变现实践:微博百亿营收背后的数据挖掘技术

推荐阅读