运营商大规模数据集群治理的实践指南( 六 )
其关键是组织、流程、平台工具、评价考核机制的全面协同。
首先是从数据采集加工流程中梳理出数据治理体系最需关注的各环节建设内容和目标:
然后构建元数据管理、数据质量稽核、数据血缘分析、数据地图等工具集:
元数据管理:数据库表、模型脚本等元数据信息庞大复杂,可通过全文检索功能迅速查找和关键字匹配的权限范围内的元数据信息,为海量数据分析提供更快、更正确的查询处理、更好的数据质量、更易使用的操作接口等。
数据血缘分析:元数据管理重要应用之一,展示表、视图、过程之间的关系,表和指标间的关系。采用NET模式或FLOW模式进行信息呈现。血缘关系的数据来源支持通过解析数据加工SQL脚本、存储过程注释的方式;可支持通过ETL流程自动生成的方式,亦可支持通过配置表的方式。
推荐阅读
- 捉迷藏|?LOL世界赛“含金量”数据出炉:EDG仅排第六,IG稳居榜首
- 碧蓝航线|碧蓝航线SR重巡福煦数据详解 期待越高失望越大 强度平平无奇
- kramer|国服极地大乱斗数据上线,来看看胜率榜符合你的预期吗?
- 米莱狄|峡谷数据榜:分均输出TOP5,干将莫邪只排第四,米莱狄至今被误解
- |S11淘汰赛数据盘点:场均时长为33分 55个不同英雄登场
- 中单|2021年英雄联盟世界赛终于落下帷幕!!大数据统计二!!
- 灵饰|梦幻西游:109级法系前排灵饰选择方法,用数据告诉你怎么做
- 卡牌|S11淘汰赛数据出炉,卡牌24场全被ban,压刀最多竟是辅助
- edg战队|堡垒之夜国服将清除数据,EDG创造队史晋级S11世界赛决赛
- 原神|原神:流水预测数据还在变化,日本的预估流水,倒是有了小状况