行社|浙江农信:数据分析平台的创新与实践

来源:第五届农村中小金融机构科技创新优秀案例评选
一、项目背景及目标
随着大数据、人工智能、5G网络等金融科技的规模化应用 , 银行业内数据和算力都呈现爆炸式增长态势 , 驱动着银行业加速数字化转型进程 , 数据资产势必成为银行的关键生产要素 , 数据挖掘能力势必成为银行的核心竞争力 , 在可预见的将来 , 成功的银行也势必为数据大行 。 近几年 , 随着浙江省农村信用社联合社(以下简称省农信)全系统数字化转型的深入推进 , 各行社也渐渐培育起数据思维 , 从原来仅将数据应用于报表统计 , 逐渐将数据分析全面应用于银行管理、运营、营销和风险等各领域 。 然而 , 大部分行社受制于资产规模、科技人才等因素影响 , 其数据应用完全依赖于省联社 , 虽然省联社也已经集中建设并运维了数百套重要的省级业务系统 , 但依然很难兼顾辖内业务发展较快农商行对科技建设的“个性化”要求 。 因此 , 为了提升下辖行社对数据资产的获取、分析、应用、流通需求 , 省联社建设了建设数据中台-数据分析平台 , 聚集业务发展过程中的痛点难点 , 创新“痛点集中攻坚”式的课题分析模式和“成效复制推广”式的数据产品应用模式 , 逐步解决行社对数据生产要素的“不敢用、不会用、用不好”问题 。
数据分析平台是一个旨在提升法人行社数据创新应用能力的平台 。 平台主要包括基础数据存储模块、数据分析工具模块、应用分析主题模块以及数据服务模块等四部分 , 利用容器化技术搭建各类数据分析服务 , 提供便捷的开发工具和部署渠道 , 为省县两级法人的数据分析人员提供从数据整合、分析探索、运营跟踪、经验分享到资产积累的全流程服务支撑 , 从而实现浙江农信数据价值的有效变现 。
二、项目方案
数据分析平台基于容器云技术 , 整合现有内部数据 , 接入外部数据 , 搭建出处理能力更强、更易于扩展、性能更高的统一云计算与分析平台 , 实现数据、应用、BI分析、AI人工智能的完美融合 。
1.总体设计目标
(1)贴合浙江农信及下辖82家行社的现有业务发展情况 , 建立起一套数据分析实验环境 , 优化数据分析现有流程;
(2)满足浙江农信及下辖82家行社的业务快速响应 , 实现业务快速扩展的操作平台;
(3)遵从浙江农信整体IT架构规划的要求 , 增强整体IT架构弹性 , 规范IT技术标准的使用 , 提高系统的可维护性 , 保证系统的客户服务能力和效率;
(4)建立统一的数据资产管理和分析流程 , 形成数据清理和历史数据管理机制 , 支持未来业务分析、报表制作、商业智能的实现;
(5)建立统一的系统监控和运维管理机制 , 为系统稳定运行保驾护航;
(6)建立一个稳定的、可扩展的系统开发环境、测试环境 , 有效管理应用系统软件版本;
(7)建立完善的、覆盖系统各层次的安全机制 , 确保业务信息和业务过程的安全性;
具体应用架构如下图1所示:
行社|浙江农信:数据分析平台的创新与实践
文章图片
图1 总体架构图
2.分析应用架构设计
根据数据分析系统总体的应用架构图(图2) , 对数据分析系统的总体功能分布如下:
(1)数据资产模块:基于简化的inceptor操作 , 实现指标、特征数据的探索及开发工作 , 包括对基础数据集的清洗 , 标签 , 筛选以及数据的批量处理工作 。
(2)人工智能机器学习模块:为提供完整的机器学习建模环境,整合建模平台Sophon的部分功能到分析平台 , 打造支撑机器学习建模的数据接入、数据清晰、特征提取、算法选用、模型调优、模型评估、结果输出等全流程的支撑环境 。
(3)可视化与决策模块:针对数据分析挖掘产生的不同类型的结果 , 采取相应的应用方式 。 如对客户画像、分析报告等分析产出 , 引入可视化工具进行展示;对模型、评分卡决策等产出 , 对接决策平台进行应用 , 同时也可以采取客户清单的方式将模型输出的客户对接到客户经理或下游系统进行应用 。
行社|浙江农信:数据分析平台的创新与实践
文章图片
图2 应用架构图
3.系统集成架构
行社|浙江农信:数据分析平台的创新与实践
文章图片
图3 系统集成架构图
(1)数据层:对接业务的一般数据接口和大数据的Inceptor的统一接口 , 用来进行数据集的展示 , 实验调用数据集 , 以及结果集的报表展示 。
(2)系统层:包含机器学习、规则平台、自助分析等集成系统 , 机器学习Sophon平台主要是用了进行AI实验 , 规则平台Ilog规则引擎用来进行评分卡调优的实验 , 帆软/自助分析平台的BI实验用来进行实验结果的报表展示等功能 。
(3)应用层:包含了数据分析目前的所有功能模块:课题 , 实验管理 , 工单管理 , 用户管理 , AI实验 , BI实验 , 评分卡实验和数据集管理的部分 。
数据分析平台通过统一的用户登陆认证框架进行权限控制和登陆控制 。
4.功能模块设计
【行社|浙江农信:数据分析平台的创新与实践】数据分析平台能够提供安全、独立的数据实验环境 , 让用户进行不同主题的数据探索 , 其载体为分析课题 。 平台功能模块如下图4所示七大模块 , 其中基础模块为工具模块 , 提供进行不同类型实验的工具及工具相关功能 。 在工具模块上的课题模块、数据模块、实验模块、调优模块及分享模块 , 打通科技到业务 , 数据到模型的整体流程 , 满足省联社科技人员及业务人员等不同技术水平人员对数据探索的需求 。 底层利用容器化技术搭建各类数据分析服务 , 提供便捷的开发工具和部署渠道 , 赋能业务部门和行社快速进行业务应用创新与共享 , 为自主业务探索创新提供支撑 。
行社|浙江农信:数据分析平台的创新与实践
文章图片
图4 系统功能模块图
其中实验探索模块主要支持分析课题探索和数据产品适配工作 。 其中 , 课题分析模式是一种“数据攻坚式”探索模式 , 针对行业在营销、运营、管理等业务发展过程中面临的一些痛点问题 , 课题分析模式通过集中业务专家、分析专员、数据开发人员组成攻坚小队进行定点式突破 , 用于专项定位、解决业务痛点问题;“数据产品”模式是当课题分析应用效果比较明显时 , 将所分析的课题进行总结及工程化 , 进而进行分享推广 , 以实现数据应用效益的最大化 , 数据产品一般由数据清单/数据仪表盘/AI模型/评分规则及相应的运营方案组成 。 通过“课题分析”的探索模式及“数据产品”的数据应用模式 , 数据分析平台从技术层面实现数据的“采集-开发-分析-应用-跟踪-优化”流程 , 从业务层面上实现了业务场景的“痛点定位-数据归因-策略制定-试点应用-规模推广”流程 , 有效打通数据服务业务场景的通路 , 让数据资产有效服务于业务实际 。
三、创新点
1.容器化技术
数据中台-数据分析平台底层采用目前业界较为领先的Docker+Kubernetes容器云技术进行建设 , 具有低成本、可共享、高扩展等诸多特性 。 数据分析平台的定位是新一代智能大数据云平台 , 未来可以进行持续的功能扩展 。
2.虚拟化技术
综合利用虚拟化技术、大数据技术、多租户技术等创新技术 , 打造高效易用的交互界面 。 一方面 , 在整合现有内部数据加入外部接入数据接入功能 , 实现数据资产的便捷管理和沉淀;另一方面 , 整合图形化界面拖拽操作方式的 , 简化专业的数据分析工作对用户IT能力的要求 , 降低分析工作的门槛 , 让分析人员拥有良好的使用体验 , 能够便捷的进行数据分析探索 。
3.隔离与共享
数据中台数据分析平台主要保证了两个关键特性:隔离和共享 。 提供原生的多租户属性 , 租户之间完全隔离 , 默认各自只能访问到内部所属数据 。 租户权限管控和数据管理分别由统一的权限与管理服务以及统一的数据服务提供 。 实现权限和资源的合理划分与管理 , 由统一管理平台对多租户提供服务 。 租户管理员具有租户最高管理权限 , 负责权限管理 。 租户内部以项目为单位管理产品实例 , 实现清晰合理的权限管理划分粒度 。 由于引用了容器技术 , 所以可实现多租户间的应用隔离、数据隔离、资源隔离、运行隔离 , 即使运行在同一平台上 , 彼此之间也完全透明 , 像运行在不同基础架构 。
4.课题分析与数据产品模式
课题分析模式是一种“数据攻坚式”探索模式 。 针对行社在营销、运营、管理等业务发展过程中面临的一些痛点问题进行定点式突破 。 课题分析流程包含“课题申请-课题申请-数据分析-结果应用-效果跟踪-课题总结”环节;数据产品模式是一种扩大分析成效的应用模式 。 当分析课题试点应用效果比较明显时 , 将课题分析过程与应用方案进行总结 , 形成的分析成果和应用方案叫数据产品 。 数据产品应用流程包含“产品申领-产品适配-产品部署-产品运营-效果跟踪-产品分享” 。 分析平台已完成课题分析模式和数据产品模式的流程建设 , 实现对各个环节中参与人员及分工、要求及产出的管理 。 从而形成完整的数据分析闭环 。
5.形成数据分析的完整闭环
通过整合数据的归集、存储、开发、分析、应用能力 , 打通数据流转流程 , 提高数据应用效率 , 从而为业务部门及法人行社的业务发展赋能 。 平台主要由数据集市、沙箱环境、运行环境三个模块组成 。 数据分析平台的三个模块互相依赖 , 覆盖了数据产品的数据准备、分析探索环境、应用跟踪环节 , 形成了数据应用的科技支撑闭环 。
四、技术实现特点
根据平台所服务的业务场景特点 , 数据中台-数据分析平台采用混合云架构部署 , 包含云平台和行内系统两个子系统 。 云平台部署业务属性服务 , 支撑与银行业关联度不高的业务流程 , 云平台采用微服务架构 , 借助强大的弹性计算能力 , 整合Kubernetes集群与Docker等最先进的容器技术 , 具有低成本、可共享、高扩展等诸多特性 , 为此未来可以基于建设好的数据中台-数据分析平台进行能力扩展 , 利用云平台内多租户与各项资源隔离等技术 , 将平台打造成为新一代智能大数据云平台 , 实现了平台云、数据云、应用云的完美融合 。
此外 , 本平台不仅能够快速建立模型 , 对外提供批量的预测结果;通过Kafka技术与docker的结合 , 同样能够胜任实时决策的场景 , 为智能银行业提供全方位的赋能 。
五、项目过程管理
项目采用容器云技术架构模式 , 历经需求编写、设计、编码、测试等多个阶段 , 局部快速迭代开发 , 于2020年3月正式上线 , 具体项目过程如下:
(1)需求阶段:2020年5月1日—5月15日 , 编写平台各子系统和关联系统详细需求 。
(2)设计阶段:2020年5月16日-5月31日 , 完成系统概要设计以及系统详细设计 。
(3)开发阶段:2020年6月1日—2020年7月20日 , 完成应用系统开发 。
(4)测试阶段:2020年7月21日—2020年8月25日 , 完成单元测试、2轮系统集成测试、3轮用户验收测试、性能测试及第三方安全检测 。
(5)上线准备及正式上线:2020年8月26日-2020年9月5日 , 进行上线准备工作 , 9月6日正式上线 。
六、运营情况
系统自2020年9月份上线以来 , 已平稳运行一年时间 , 从实际使用情况看 , 分析平台实验环境功能及分析课题共享功能已经得到行社的高度认可 。 系统经过3个版本的迭代 , 不断完善和优化数据预处理、AI模型、课题跟踪等功能的应用功能与体验 。
基于数据分析平台这个数据分析的实验环境 , 省联社分析团队与30+行社以课题分析形式在20+课题上进行了分析探索 , 同时对试点应用成效较好的课题转化成数据产品并应用于行社的业务实际 , 有效助推行社数字化改革进程 。
七、项目成效
在课题分析和数据产品应用推广的模式下 , 作为全系统分析实验环境 , 分析平台在两方面成果已经凸显:一是将底层标签体系(形成7大类150小类)、特征工程作为数据资产形成沉淀并以数据产品进行输出 , 已为超过30+行社提供50+名单下发服务 , 同时对接省联社业务部门需求并打通如数字银行、数字营销等下游系统 , 直接推送客户行为标签客群 , 为数字客户、数字营销、移动展业APP等平台提供营销、运营数据支撑 。 二是以分析课题形式 , 面对行社业务发展过程中面对的重点难点 , 进行重点分析及突破 , 推动行社业务发展 , 例如:
(1)针对部分行社普惠授信后用户用信不高的情况 , 建立授信未用信分析课题 , 为第一季度为普惠金融部的普惠农户贷款营销提供数据支持 , 服务35家行社 , 最终促活43910人 , 新增农户普惠贷款用信26亿元 , 平均为每家行社提升贷款用信额度7429万元 , 未应用名单的46家行社每家贷款用信额度提升平均4565万元 , 应用推广效果明显 。
(2)针对大部分行社贷款营销客户定位难问题 , 建立他行借贷客户分析等分析课题 , 对接杭联等7家行社贷款营销需求 , 共下发33万客户 。 其中温岭4月26日至5月25日 , 已营销4639户、总签约197户、授信总金额5824.40万元、用款户数125户、贷款余额2507.54万元销名单;
(3)通过信用卡分期潜客分析对接省联社外呼中心营销需求 , 在大规模外呼应用中高概率客户接通成单率超12% , 对比外呼系统同期经验名单4.54%的接通成单率率 , 效果提升显著 。
八、经验总结
浙江农信省联社下辖的82家农商行除小部分实力较为充实外 , 其他农商行受制于资产规模、科技人才等因素影响 , 大部分行社缺乏利用数字化手段来解决业务发展的有效途径 。 建设数据分析平台的目的就是通过构建“省县”两级共用的数据探索实验环境 , 提供从数据整合、分析探索、运营跟踪、经验分享到资产积累的全流程服务支撑 , 实现对业务发展中的痛点难点进行集中破解 , 从而实现了浙江农信数据价值的有效变现 。
更多金融科技案例 , 请登录数字金融创新知识服务平台- 金科创新社(FintechinChina.com)官网案例库查看 。

    推荐阅读