数据采集和存储技术的迅速发展 , 加之数据生成与传播的便捷性 , 致使数据爆炸性增长 , 最终形成了当前的大数据时代 。 围绕这些数据集进行可行的深入分析 , 对几乎所有社会领域的决策都变得越来越重要 。 而这一切的起始 , 源于对数字的挖掘 , 在这过程中 , 合理、安全地使用数据 , 也是一代代科学家孜孜以求的目标 。
文章图片
刘世平
中国科学院大学教授
吉贝克信息技术(北京)有限公司董事长
文章图片
主持人:数字挖掘技术是您的绝活 , 先给我们来介绍一下这到底是什么 。
刘世平:数据挖掘这个概念早在上世纪90年代中期由IBM提出来 , 到现在大概已经有二十五六年的时间了 , 英文叫做data mining , 我翻译成中文叫做数据挖掘 。 数据挖掘主要是从大量的数据中提取有用的信息 , 把这些信息结合行业知识 , 运用到我们的决策过程中去 , 这就是数据挖掘最主要的含义 。
所以它包含几层含义 , 第一个是包括数据 , 包括数据的整合;第二个很重要的问题是数据的分析 , 也就是今天所谓人工智能里面的很多算法;第三个因为数据挖掘是一定要应用到某一个行业里面去 , 解决具体的问题 , 所以行业知识很重要;第四个是加上数据 , 加上分析的结果 , 加上行业的知识 , 然后把它运用到这个行业的决策过程中去 , 这是数据挖掘整个的过程 。
【基建|数字挖掘:智慧金融的新基建】
文章图片
▲
数据挖掘不仅仅是“挖掘”
它包含后面一整套处理数据的流程
主持人:数据挖掘和现在的大数据有什么关系?
刘世平:数据挖掘解决了很多金融方面的一些问题 , 那么它跟大数据时代是密切相关的 。 大数据演变的过程 , 应该已经有33年的历史了 , 最早在1987年的时候 , 提出了一个概念叫做数据仓库 , 英文叫做data warehouse 。 它主要是指把分散在各个地方 , 一个企业或一个政府里边不同地方的数据进行有效的整合 , 提炼出来同一系列的手段和方法把数据里边的信息能够提炼出来 , 然后结合行业知识用于决策的过程 , 所以数据挖掘更多的是在数据的分析阶段 。 90年代末期又有一个新的概念 , 叫做商业智能 。 那么发展到了2011年的时候才开始叫大数据 。 所以它是先从数据仓库 , 数据挖掘 , 商业智能再到大数据 , 整个这样的发展过程 。 而数据挖掘这些年来就会显得更加的重要 。
文章图片
▲数据挖掘和大数据息息相关
主持人:您怎么会去关注数字挖掘这项技术的?
刘世平:这个也是挺好玩的 , 因为在这个概念完全提出来之前 , 在西方实际上已经有一些分析的手段和方法 , 尤其是结合应用数学、统计学的一些方法和算法 , 解决金融机构的问题 。 我们日常生活或者企业的运营过程中 , 都会收集和整理大量的数据 , 举个很简单的例子 , 全世界最早用数据挖掘用得比较好的 , 是银行里边的信用评级模型 。 它通过数据的分析 , 判断一个人在未来一段时间内 , 他有没有可能出现违约的概率 。 后来包括大家都知道的像当当网 , 我们去买书的时候会碰到关联分析 , 你会发现到网上书店来买书的人 , 同时会把另外一些书一起买了 , 我们会去分析哪些书是容易被一起买的 , 可以把这个概率算出来 。 现在的应用就更广泛了 , 比方说我们的支付 , 我们中小微的贷款 , 我们个人的贷款 , 这些都是它的延续 , 其实方法和理论体系是一样的 。
文章图片
▲
看似简单的关联分析 其实涉及到很复杂的算法
主持人:现在我们对于数据的运用和以前比有哪些区别?
刘世平:今天的数据更多了 , 数据的类型更多了 , 这是第一个方面;第二个是我们的计算能力 , 存储能力加大了 , 我们能存的数据更多了;第三个是我们的数据分析能力加强了 , 以前大部分的数据我们要经过抽样分析 , 为什么我们不能把所有的数据都拿过来分析 , 因为计算机没有那么强大的处理能力 , 以前数据量很大的时候 , 你分析的时候就分析不出来 , 算法结果也算不出来 , 现在没问题 , 现在计算能力很强大 , 所以这个是跟过去一个很大的不同 , 应用在生活上也更加便捷了 。
文章图片
▲
随着时代的发展 现在处理数据的能力有了质的飞跃
主持人:海量数据被挖掘 , 个人信息安全如何得到保障?
刘世平:数据如果能得到准确的运用实际上是可以避免过多地骚扰客户 , 你想想是不是这些年我们都会接到很多电话 , 他会问要不要贷款 , 要不要升学 , 都是骚扰性的 。 坦率地讲就是说他这个基础工作做得不好 , 举个很简单的例子 , 我有时候会接到一些电话 , 问你是不是刘世平 , 我说是 , 说你要不要考虑办一个专升本 , 我说你开啥国际玩笑 。 实际上如果他简单地调一些数据 , 他知道了我自己本身是博士 , 我已经是中科院的大学教授 , 我还会考虑专升本的问题吗 。 这就是不准确的问题 , 它就变成一种骚扰 , 所以我觉得数据挖掘一方面可以解决企业效率的问题 , 降低它的成本 , 获客成本的问题 。 另外一个方面 , 它可以减少不必要的对市民或者是客户的骚扰 。
文章图片
▲
如果数据挖掘缺少分析 电话营销会变成骚扰电话
主持人:数据挖掘未来有哪些可以期待的亮点?
刘世平:对智慧金融的话 , 我觉得未来很重要的一点 , 实际上就是一个速度问题 , 一个准确的问题 , 公平和透明的问题 。 也就是说金融机构除了提升自己的效率 , 赚好自己的利润之外 , 另外还有一个很重要的社会义务 , 也就是公平 。 比方说服务三农的问题 , 更好地服务中小微的问题 , 我觉得数据挖掘能够解决很多的问题 。 通过数据挖掘 , 你更加透明和公平地去服务不同阶层的人 , 通过数据挖掘的方法 , 我们可以设计出不同的产品 , 不同的社会阶层都能够得到好的金融服务 。
举个很简单例子 , 我最近在设计一款产品 , 解决农民的信贷问题 。 通过数据挖掘 , 利用金融的体系架构 , 我可以把农民逐渐变成农业产业工人 。 农民什么时候需要贷款?一定是他买农药 , 买种子 , 买化肥的时候 , 所以我们可不可以利用今天新一代信息技术 , 比方说利用区块链的技术 , 我们可以对种子、农药、化肥进行溯源的问题 , 让假冒伪劣产品不会在市场上留着 , 这是第一类 。
第二个 , 农民生产过程中会出现哪些风险?如果碰到了自然灾害 , 他颗粒无收 , 他也就还不了贷款了 。 这个时候怎么办?我们能不能把金融的风险管理引进来 , 把保险的风险意识引进来 , 给农业生产加一份保险 。 另外一个很重要的问题 , 农民生产了之后 , 他能不能真正实现增收 , 收益能不能跟得上?那么我们可以引入金融期货的概念 , 到他卖的时候 , 我们提前跟粮食收购公司谈好一个价格 。
在这个过程中 , 我引入了信贷、保险还有期货的概念 , 你看农民就很好办 , 这样的话农民只需要去管生产 , 他就标准地变成了一个产业工人了 , 这样对农民是巨大的利好 , 就是农业的转型升级 , 把信息化、大数据和金融有效地结合起来 。
文章图片
推荐阅读
- 数字化|零售数字化转型显效 兴业银行手机银行接连获奖
- 生活|数字文旅的精彩生活
- 数字货币|2021年加密货币市场盘点:比特币仍是霸主,NFT进入大众视野
- 研究院|传统行业搭上数字化快车,施工现场变“智造工厂”
- 山西|移动5G+智慧成果亮相山西数字化转型大会
- 数字货币|币安在法国扩张业务 项目规模1亿欧元
- 猎豹|数字化助力实体消费 机器人让商场“热”起来
- 数字货币|比特币逼近关键支撑位 若失守恐下探40000美元
- 数字化|商场数字化有本“生意经”
- 数字化|70%规模以上制造业企业到2025年将实现数字化、网络化