学习大数据开发,一定不可错过的大数据组件图谱——很齐全( 八 )
Spark Streaming实现微批处理 , 目标是很方便的建立可扩展、容错的流应用 , 支持Java、Scala和Python , 和Spark无缝集成 。 Spark Streaming可以读取数据HDFS , Flume , Kafka , Twitter和ZeroMQ , 也可以读取自定义数据 。
Trident是对Storm的更高一层的抽象 , 除了提供一套简单易用的流数据处理API之外 , 它以batch(一组tuples)为单位进行处理 , 这样一来 , 可以使得一些处理更简单和高效 。
Flink于今年跻身Apache顶级开源项目 , 与HDFS完全兼容 。 Flink提供了基于Java和Scala的API , 是一个高效、分布式的通用大数据分析引擎 。 更主要的是 , Flink支持增量迭代计算 , 使得系统可以快速地处理数据密集型、迭代的任务 。
Samza 出自于LinkedIn , 构建在Kafka之上的分布式流计算框架 , 是Apache顶级开源项目 。 可直接利用Kafka和Hadoop YARN提供容错、进程隔离以及安全、资源管理 。
StormStorm是Twitter开源的一个类似于Hadoop的实时数据处理框架 。 编程模型简单 , 显著地降低了实时处理的难度 , 也是当下最人气的流计算框架之一 。 与其他计算框架相比 , Storm最大的优点是毫秒级低延时 。
推荐阅读
- 捉迷藏|?LOL世界赛“含金量”数据出炉:EDG仅排第六,IG稳居榜首
- 魔兽世界|《轨迹》新作明年发布! 法老控将针对NS平台开发游戏
- 手机游戏|CFHD:神秘组织为什么开发生化手雷呢?关键是为了赚更多钱
- 碧蓝航线|碧蓝航线SR重巡福煦数据详解 期待越高失望越大 强度平平无奇
- kramer|国服极地大乱斗数据上线,来看看胜率榜符合你的预期吗?
- 国服|LOLM:60天内如何从小白打到国服王者?这快捷径方法值得学习
- 大话西游|大话西游2这些召唤兽的天生技能是开发组拿来凑数的吗?实际效果完全没用
- 电子竞技|【欣然轻资讯G】《地平线2西部禁域》新老怪兽即将登场 开发者日志
- 桌游|48小时里,游戏开发能给这群大学生带来什么?
- 米莱狄|峡谷数据榜:分均输出TOP5,干将莫邪只排第四,米莱狄至今被误解