运营商大规模数据集群治理的实践指南( 三 )

工程二:实现全域数据计算集群的深度治理,完成全域数据治理元数据的自动化采集、存储和分析,构建数据能力开放平台多租户专项治理机制,沉淀数据治理中台能力,基于大数据集群底层核心组件(如YARN、HDFS)的深入洞察,孵化出数据集群治理的应用。

工程三:完善治理机制体制建设,构建数据资产管理体系,并利用该系统的运营逐步重塑优化业务流程,实现可支撑全业务流程的成本评估机制,让数据价值持续攀升。

回到你刚才的提问,数据治理基本上可以理解为工程一的核心目标;大规模集群的治理对应工程二,它需要长期支撑工程一的具体建设任务,并为数据资产管理体系的运营夯实基础。

二、集群治理的背景

Q: 你刚才说的好像很有道理,但是我还是不太明白,为何不是在数据治理工程中扩展一个子任务去做,而是要另起炉灶,搞一个新的大工程来做数据集群的专项治理?

A: 好问题!恭喜你!你快要触摸到数据集群治理问题的核心了。我们不妨再捋一下数据集群治理的背景,主要是遇到的历史部分集群无序建设的种种问题:

推荐阅读