可视化|搞了三年,再看数据中台的价值与解决方案( 三 )
智能营销平台(CDP):基于大数据计算和数据挖掘技术,构建用户画像标签体系,用户圈选、精细化分层,进行差异化运营和营销触达,提升运营ROI。业务同学可基于平台实现从人群圈选、场景构建、触达投放、效果回收的闭环,同时,基于算法挖掘标签及模型推荐的人群组合,从基于人的经验运营,到基于大数据算法推荐的智能运营。
(2)数据资产建设与治理问题
21年云栖大会,阿里云数据中台负责人强调,要在场景的驱动下,把数据中台的资产模块做的更厚实。
目标:提供数据资产建设、资产管理与治理的完整产品方案,通过数据资产化管理和共享流程提高数据复用性,减少重复开发成本,基于完善的监控覆盖保障数据质量,并周期性的盘点、治理资产,达到降本的目标。
数据地图:通过业务域、主题、标签、字段元数据等信息,帮助用户快速检索到目标数据,基于条件过滤或自助搜索,“逛数据”,“用数据”。
数据质量监控:围绕“准确性、一致性、及时性、唯一性、完整性”等标准维度,提供配置化的质量监控规则,对数据表数据量、字段值进行监控覆盖,从源头及时发现数据问题并加以干预,保障数据质量。
数据血缘:数据入湖到输出应用经过多个环节,上游数据问题如何快速通知下游,下游数据逻辑排查如何向上追溯,以及数据治理表或路径下线,如何评估下游的影响并通知,都依赖于全链路数据血缘的建设。可以说,完善的血缘功能,可以极大提高数据开发的工作效率。
成本优化:数据有自己的生命周期,比如活动期间的数据监控报表,活动下线后,报表可以下线释放资源。成本优化提供高耗任务、小文件、冷数据等不同治理维度的指标,及治理目标,从资产健康度评估维度,指导数据开发人员主动进行成本优化、数据治理,系统层面具备治理目标检测、一键治理、数据回收、彻底删除等治理功能,并且可以基于固化的治理规则,进行系统自动化治理。
(3)数据开发流程的效率问题
目标:提供异构数据源数据同步可视化工具,通过源和目标参数配置实现数据入湖、入仓,以及存储介质的转换,降低人肉脚本处理带来的风险和维护成本。建设统一的数据开发平台,数据开发只需要关注数据处理逻辑,无需关注集群资源、任务调度,通过配置化的方式进行依赖关系配置,及任务运行周期,快速进行数据回溯、任务重启、停止。
数据集成:业务数据库、操作日志、状态变更消息等数据源接入数据中心,如Biglog同步、MySQL库表订阅、Kakfa数据落HDFS等。数据经过实时或离线ETL后,数据集成再将数据输入CK、Hbase、ES等供业务端应用。
离线开发平台:批数据处理,一般为T+1或小时级的准实时数据,包括任务逻辑处理、依赖配置、调度配置、任务运维等功能。
实时开发平台:流数据处理,以FlinkSQL、StreamSQL为主要计算处理框架,实时处理消息队列等各种流式数据,输出实时报表、实时接口推荐等服务随着批流技术组件的发展,批流一体化开发平台的建设也陆续在实践中。
(4) 数据服务快速输出
有人也把数据中台称之为DAAS,即数据即服务,数据如何快速输出业务端,赋能产品创新。API服务统一管理,建立完善的应用血缘关系,提供通用接口的配置化生成能力,降低对Java开发的依赖。
数据服务管理平台:数据中台思想下,数据服务输出是应用输出的最主要形式,数据服务管理平台一方面要具备将数据资产自助配置化输出的能力,即数仓清洗好的数据模型,数据开发或业务人员可以通过入参、出参的可视化配置生成API接口,不需要接口开发介入。同时也要把API资产化管理,API接口文档、应用调用情况做到可追踪、可监控。
推荐阅读
- 手机银行|漫谈金融产品数据可视化
- 共享单车|哈啰顺风车:上线三年完单总量 3 亿,认证车主数量达 1800 万
- 哈啰顺风车|哈啰顺风车:上线三年完单总量 3 亿,认证车主数量达 1800 万
- 李瑞玉|刘强东隐身的这三年:对高管实行“大清洗”,更加重用管培生
- 上市|三年败光120亿,曾力压刘强东上市,如今沦为直播网红
- 拼多多|刘强东"隐身"的这三年
- 印象|印象笔记独立运营三年后:从工具到信息服务平台,发力B端市场
- 直板手机|手机在中国平均用三年,这种消费让厂商头疼,是因为没钱换吗
- G递四方戴彬:跨境电商物流未来两三年将出现明显的分水岭 | 建仓
- 淘菜菜|重拾“9.9元包邮”人群的三年,淘特、淘菜菜要怎样打下沉市场?