数据人看Feed流-架构实践(12)
基于推荐的传递
图8是基于推荐的模型 , 可以看出它是在推拉结合的模式上融合了推荐系统 。
-
引入画像系统 , 保存用户画像、消息画像(简单情况下消息画像可以放在消息元数据中) 。 画像用于推荐系统算法的输入 。
-
引入了临时收信箱 , 在信息过载的场景中 , 非大V的消息也是总量很大 , 其中不免充斥着垃圾、冗余消息 , 所以直接进入用户收信箱不太合适 。
-
收信箱和发信箱都需要有良好的搜索能力 , 这是推荐系统高效运行的关键 。 Outbox有缓存层 , 索引可以做到缓存里面;Inbox一般情况下二级索引可以满足大部分需求 , 但如果用户希望有全文索引或者任意维度的检索能力 , 还需要引入搜索系统如Solr/ES
图8 基于推荐的Feed流架构
用户画像使用HBase存储
-
画像一般是稀疏表 , 画像总维度可能在200+甚至更多 , 但单个用户的维度可能在几十 , 并且维度可能随业务不断变化 。 那么HBase的Schema free和稀疏表的能力非常适合这个场景 , 易用且节省大量存储空间 。
推荐阅读
- 捉迷藏|?LOL世界赛“含金量”数据出炉:EDG仅排第六,IG稳居榜首
- 碧蓝航线|碧蓝航线SR重巡福煦数据详解 期待越高失望越大 强度平平无奇
- kramer|国服极地大乱斗数据上线,来看看胜率榜符合你的预期吗?
- 米莱狄|峡谷数据榜:分均输出TOP5,干将莫邪只排第四,米莱狄至今被误解
- |S11淘汰赛数据盘点:场均时长为33分 55个不同英雄登场
- 中单|2021年英雄联盟世界赛终于落下帷幕!!大数据统计二!!
- 灵饰|梦幻西游:109级法系前排灵饰选择方法,用数据告诉你怎么做
- 卡牌|S11淘汰赛数据出炉,卡牌24场全被ban,压刀最多竟是辅助
- edg战队|堡垒之夜国服将清除数据,EDG创造队史晋级S11世界赛决赛
- 电子竞技|鱿鱼游戏:给成年人看的童话故事