数据人看Feed流-架构实践( 十 )

图6 基于关系传递的纯推模式

推荐使用HBase实现收信箱

  1. HBase单机批量写能力在几十万并且可以水平扩展 。

  2. HBase的高效前缀扫描非常适合读取最新的消息 。

  3. HBase的TTL功能可以对数据定义生命周期 , 高效的淘汰过期数据 。

  4. HBase的Filter过滤器和二级索引可以有效的实现Inbox的搜索能力 。

消费者收信箱hbase表设计如下 , 其中序列号要保证递增 , 一般用时间戳即可 , 特别高频情况下可以用一个RDS来制造序列号

Rowkey消息元数据列状态列其它列
MD5(用户ID)+用户ID+序列号消息ID、作者、发布时间、关键字等已读、未读

推荐阅读