互联网风口太多了,到底哪些才是真的趋势?( 九 )

随着时代的发展,实时处理的需求越来越多,虽然 Spark 推出了 Spark Streaming 以微批处理来模拟准实时的情况,但在延时上还是不尽如人意。2011 年,Twitter 的 Storm 吹响了真正流处理的号角,而 Flink 则将之发扬光大。

到现在,Flink 的目光也不再将自己仅仅视为流计算引擎,而是更为通用的处理引擎,开始正面挑战 Spark 的地位。

Apache Flink 已经被业界公认是最好的流计算引擎。然而 Flink 的计算能力不仅仅局限于做流处理。Apache Flink 的定位是一套兼具流、批、机器学习等多种计算功能的大数据引擎。在最近的一段时间,Flink 在批处理以及机器学习等诸多大数据场景都有长足的突破。

——王绍翾(大沙)《不仅仅是流计算:Apache Flink?实践》序

Hadoop 本身也遭遇了 Kubernetes 的挑战。Hadoop 本身包括专用于处理大数据的编排系统如 Yarn 等,但如 Spark/Presto/Kafka 等最重要的 Hadoop 技术已经可以在 Kubernetes 上运行,使用 Kubernetes 来运行大数据技术栈,可以更好的与其它业务集成。遭遇挑战的表现之一就是 Hadoop 技术栈的两家主要提供商,Cloudera 和 Hortonworks 最近决定合并,缓慢的增长表明市场上已经容不下两家提供商了。

推荐阅读