学习大数据开发,一定不可错过的大数据组件图谱——很齐全( 三 )

HDFSHadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统 。 它和现有的分布式文件系统有很多共同点 。 HDFS是一个高度容错性的系统 , 适合部署在廉价的机器上 。 HDFS能提供高吞吐量的数据访问 , 非常适合大规模数据集上的应用 。

HBASE是Hadoop的数据库 , 一个分布式、可扩展、大数据的存储 。 是为有数十亿行和数百万列的超大表设计的 , 是一种分布式数据库 , 可以对大数据进行随机性的实时读取/写入访问 。 提供类似谷歌Bigtable的存储能力 , 基于Hadoop和Hadoop分布式文件系统(HDFS)而建 。

Neo4j是一个高性能的 , NOSQL图形数据库 , 它将结构化数据存储在网络上而不是表中 。 自称“世界上第一个和最好的图形数据库” , “速度最快、扩展性最佳的原生图形数据库” , “最大和最有活力的社区” 。 用户包括Telenor、Wazoku、ebay、必能宝(Pitney Bowes)、MigRaven、思乐(Schleich)和Glowbl等 。

Vertica基于列存储高性能和高可用性设计的数据库方案 , 由于对大规模并行处理(MPP)技术的支持 , 提供细粒度、可伸缩性和可用性的优势 。 每个节点完全独立运作 , 完全无共享架构 , 降低了共享资源的系统竞争 。

推荐阅读