辨析BI、数据仓库、数据湖和数据中台内涵及差异点( 六 )

数据湖示意图

2. 2 数据湖能给企业带来多种能力

数据湖能给企业带来多种能力,例如,能实现数据的集中式管理,在此之上,企业能挖掘出很多之前所不具备的能力。另外,数据湖结合先进的数据科学与机器学习技术,能帮助企业构建更多优化后的运营模型,也能为企业提供其他能力,如预测分析、推荐模型等,这些模型能刺激企业能力的后续增长。数据湖能从以下方面帮助到企业:

实现数据治理(data governance)。通过应用机器学习与人工智能技术实现商业智能。预测分析,如领域特定的推荐引擎。信息追踪与一致性保障。根据对历史的分析生成新的数据维度。有一个集中式的能存储所有企业数据的数据中心,有利于实现一个针对数据传输优化的数据服务。帮助组织或企业做出更多灵活的关于企业增长的决策。2. 3 数据仓库与数据湖差异

在储存方面上,数据湖中数据为非结构化的,所有数据都保持原始形式。存储所有数据,并且仅在分析时再进行转换。数据仓库就是数据通常从事务系统中提取。在将数据加载到数据仓库之前,会对数据进行清理与转换。在数据抓取中数据湖就是捕获半结构化和非结构化数据。而数据仓库则是捕获结构化数据并将其按模式组织。数据湖的目的就是数据湖非常适合深入分析的非结构化数据。数据科学家可能会用具有预测建模和统计分析等功能的高级分析工具。而数据仓库就是数据仓库非常适用于月度报告等操作用途,因为它具有高度结构化。在架构中数据湖通常,在存储数据之后定义架构。使用较少的初始工作并提供更大的灵活性。在数据仓库中存储数据之前定义架构。表 1. 数据仓库、数据湖和数据湖的区别如下:

推荐阅读