学习大数据开发,一定不可错过的大数据组件图谱——很齐全(13)

Kylin是一个开源的分布式分析引擎 , 提供了基于Hadoop的超大型数据集(TB/PB级别)的SQL接口以及多维度的OLAP分布式联机分析 。 最初由eBay开发并贡献至开源社区 。 它能在亚秒内查询巨大的Hive表 。

Kibana是一个使用Apache 开源协议的Elasticsearch 分析和搜索仪表板 , 可作为Logstash和ElasticSearch日志分析的 Web 接口 , 对日志进行高效的搜索、可视化、分析等各种操作 。

Druid是一个用于大数据实时查询和分析的高容错、高性能、分布式的开源系统 , 旨在快速处理大规模的数据 , 并能够实现快速查询和分析 。

KNIME的全称是“康斯坦茨信息挖掘工具”(Konstanz Information Miner) , 是一个开源分析和报表平台 。 宣称“是任何数据科学家完美的工具箱 , 超过1000个模块 , 可运行数百个实例 , 全面的集成工具 , 以及先进的算法” 。

Zeppelin是一个提供交互数据分析且基于Web的笔记本 。 方便你做出可数据驱动的、可交互且可协作的精美文档 , 并且支持多种语言 , 包括 Scala(使用 Apache Spark)、Python(Apache Spark)、SparkSQL、 Hive、 Markdown、Shell等 。

推荐阅读