学习大数据开发,一定不可错过的大数据组件图谱——很齐全

学习大数据开发,一定不可错过的大数据组件图谱——很齐全


HDFSHadoop Distributed File System , 简称HDFS , 是一个分布式文件系统 。 HDFS是一个高度容错性的系统 , 适合部署在廉价的机器上 。 HDFS能提供高吞吐量的数据访问 , 非常适合大规模数据集上的应用 。

GlusterFS是一个集群的文件系统 , 支持PB级的数据量 。 GlusterFS 通过RDMA和TCP/IP方式将分布到不同服务器上的存储空间汇集成一个大的网络化并行文件系统 。

Ceph是新一代开源分布式文件系统 , 主要目标是设计成基于POSIX的没有单点故障的分布式文件系统 , 提高数据的容错性并实现无缝的复制 。

Lustre是一个大规模的、安全可靠的、具备高可用性的集群文件系统 , 它是由SUN公司开发和维护的 。 该项目主要的目的就是开发下一代的集群文件系统 , 目前可以支持超过10000个节点 , 数以PB的数据存储量 。

推荐阅读