数据人看Feed流-架构实践( 七 )

综上 , 个人推荐使用HBase存储

  1. HBase支持结构化和半结构化数据;

  2. 具有非常好的写入性能 , 特别对于Feed流场景可以利用批量写接口单机(32核64GB)达到几十万的写入效率;

  3. HBase具备非常平滑的水平扩展能力 , 自动进行Sharding和Balance;

  4. HBase内置的BlockCache加上SSD盘可以提供ms级的高并发读;

  5. HBase的TTL特性可以自动的淘汰过期数据;

  6. 利用数据复制搭建一个冷热分离系统 , 新消息存储在拥有SSD磁盘和大规格缓存的热库 , 旧数据存储在冷库 。

  7. 运用编码压缩有效的控制存储成本 , 见HBase优化之路-合理的使用编码压缩

图3 使用HBase存储Feed流消息

推荐阅读