刘晓春:数据治理是科技向善的源头
原创2021-08-14 15:56·
科技平台公司之所以能发挥作用 , 正在于大数据的有效运用 。 因此 , 要创造一个大型科技平台公司与社会和谐相处的环境 , 先要理顺大数据的一些问题

文章图片
文|刘晓春
曾几何时 , 人们认为 , 随着科学技术的发展 , 人类会从繁重的体力劳动、简单乏味的重复劳动中解脱出来 , 人类会进入一个更加公平、和谐的社会 。 然而 , 这样的美好社会从来没有达到过 , 自从工业社会以来 , 繁重的体力劳动、简单乏味的重复劳动 , 在技术进步中只是转换了形态 , 且在资本和技术的作用下 , 被更加精准和残酷地挤压 。
工业化时代来临 , 机器代替人的同时 , 人类也发明了泰勒制 。 科学的机器设备和科学的生产管理制度 , 造成的是贫困的工人和紧张的劳资关系 。
互联网、大数据、云计算、人工智能 , 出发点是造福人类 。 但是资本的逻辑很清楚 , 减少人工 , 降低人工成本 。 更加精准科学的管理 , 带来的是“996”福报和被算法牢笼的员工、快递小哥和客户 。
曾几何时 , 我们认为 , 互联网的发展 , 数据更加开放 , 信息更加透明 , 销售者可以更方便地找到需求者 , 消费者可以更容易地找到所需要的商品 , 投资人可以撇开中介直接找到合适的投资项目 , 精准地评估风险 。 因此 , 敦促社会各方开放数据 , 打破信息孤岛 。 结果却是形成了严重的信息和数据垄断 。 并且 , 数据成了数据垄断者垄断经营、向数据提供者索取收益的工具 。
曾几何时 , 我们认为 , 互联网的发展 , 信息更加公开 , 信息的传递更加快速与广泛 , 人们获取信息的渠道更丰富、更方便 , 有利于促进人们开放思维、独立思考 。 却没曾想到 , 互联网是个信息泥沙俱下的深坑 , 充斥着各种虚假信息和垃圾信息 。 更由于各种人工智能算法的作用 , 反而固化了人们获取信息的渠道 , 为每一个人筑起了思想的围墙 。
人工智能、客户画像 , 初始是为了商品的精准营销 。 但当在互联网上任何事物都有了商品属性和营销属性后 , 思想的营销、观念的营销 , 比商品的营销更成为互联网上的主流 。 当一个人接受了一种观念 , 算法会自动不断地发送同类观念的信息 , 并且观念不断地极端化和低俗化 , 人们的思想于是更封闭、更极端 , 为社会带来看不见的动荡隐患 。 部分人的过度消费、过度借贷 , 是这类观念灌输在经济领域造成的一个恶劣结果 。
因为互联网的发展 , 因为数字经济的未来 , 数据 , 突然成了被广泛叙事的名词 , 有所谓“得数据者得天下”之说 , 这之前是“得渠道者得天下”“得流量者得天下” , 也因此 , 数据便成为了“资产” 。
然而 , 与科技相连的数据和科技一样 , 数据作为资产是有两面性的 。 好处不用多说 , 叙事者们有大量论述 。 恶的方面 , 满天下是疯狂攫取数据的主体和滥用数据的主体 。 现在 , 人们开始关注个人隐私和个人数据的权利 , 以至于数据主权 。 但是 , 我觉得 , 数据概念的泛化与混乱 , 其危害可能与其作用一样 , 远远超出我们的想象 。
前两年有几位搞智慧管理的朋友跟我讲大数据的神奇作用 , 并吹嘘他们已经拥有了多少数据 。 我说:“作为一个管理者 , 我完全清楚掌握足够信息的重要性 , 也完全清楚打通各类信息隔离的协同效应 。 但是 , 我更清楚 , 你应该采集什么信息 , 确保信息的安全性 , 比掌握足够信息和打通信息隔离更重要 。 不该你拥有的信息 , 你抓取来了 , 并且用到了不该用的地方 , 说严重点 , 是可能要被杀头的 。 ”
因为科技的高度发展 , 人类现在意识到 , 人需要与自然和谐相处 。 同样 , 科技更需要与人类和谐相处 , 科技平台公司要与社会和谐相处 。
科学技术是中性的 , 并没有善恶之分 , 为善还是为恶 , 是人的因素;资本是逐利的 , 逐利的结果是善是恶 , 同样是人的因素 。 要让科学技术与人类和谐相处 , 让科技平台公司与社会和谐相处 , 不可能只靠资本背后的人的自我道德约束 , 还是需要公共制度和机制的安排 。
厘清数据交易的概念与逻辑
科技平台公司之所以能发挥作用 , 正在于大数据的有效运用 。 因此 , 要创造一个大型科技平台公司与社会和谐相处的环境 , 先要理顺大数据的一些问题 。
首先 , 需要更清晰地定义“数据”概念 。 目前 , 关于“数据”的概念包含非常庞杂的内容 , 有时与传统的“信息”“资料”“情报”相混淆 。 当然 , 在大数据技术面前 , 没有什么是不可以成为“数据”的 。 但是 , 经过大数据技术采集、处理之前的“数据”与经过大数据技术采集、处理后输出的可以作为资产的“数据”究竟有没有区别?区别在哪里?经过大数据技术采集、处理之前的“数据”是不是资产 , 是否可以交易?这个分别 , 是非常重要的 。 这也是确认原始数据所有权、使用权及今后数据收益分享的前提 。
许多人强调 , 大部分数据都是人们在交易、生活等行动中产生的 , 本来就无所谓归谁所有 , 这些数据科技公司不采集 , 就不成其为数据 。 但另一方面 , 许多人又大声疾呼打通信息孤岛 , 实现信息共享 , 其目标不是这些行为数据 , 正是那些原始档案信息及个人、机构的身份等各类相关信息 。 不能不说 , 这是两类完全不同性质的数据或信息 。 可能分别讨论两类数据 , 才能分清有关数据的一些法律等边界 。
其次 , 需要分清可共享数据和不可共享数据 。 可共享数据需要确定相应的共享范围和期限 。 现在出台的新的法律要求对数据分级分类 , 是完全必要的 。 目前 , 不仅“数据”这个概念泛化 , “信息共享”也是一个非常泛化的概念 。 同样的信息 , 或者数据 , 对不同的人、不同的机构 , 其意义、性质和作用是不同的 。 “共享”也不是一个绝对的概念 , 不是任何数据都可以全社会共享的 。 不同的数据需要有不同的共享范围和期限 , 更不是所有数据都可以提供给市场交易 。 实际上 , 许多科技平台公司 , 以“共享”的名义攫取数据后 , 都垄断数据 , 不仅不与社会共享 , 甚至也不与原提供数据的个人和机构共享 。
第三 , 审慎对待数据资产和数据资产交易 , 区分数据服务和数据买卖 。 数据是“资产” , 这同样是一个泛化的概念 , 因为这个概念 , 导致许多科技企业不择手段地去攫取各种信息 , 倒卖各种信息 。 以前 , 信息服务、咨询服务 , 甚至情报服务 , 都有一定的市场 , 但整体规模不大 。 今后 , 数字经济、数字社会条件下 , 数据服务业应该会有非常大的市场空间 。 但是 , 数据服务与数据交易是否等同 , 恐怕是要进一步探讨和厘清的 。
在厘清数据服务和数据交易的基础上 , 还需要厘清什么样的数据才可以作为资产 。 前文讲要清晰定义“数据” , 分级分类 , 要区分可共享与不可共享数据 , 都与最终哪些数据可以作为资产进行交易有关 。
必须明确的是 , 可共享的数据是不可以交易的 。 比如 , 中国人民银行征信系统 , 银行将相关的信贷风险数据发送中国人民银行征信系统 , 供参与银行在业务范围内共享 。 这样的数据 , 中国人民银行是不能作为资产出售的 , 共享这些数据的银行也不能将这些数据据为己有并转卖获利 。 前期一些地方搞数据交易中心等 , 之所以没有成气候 , 就是还没有搞清楚什么样的数据才可以作为资产进行交易 。
第四 , 数据资产的会计处理 。 数据如果可以作为资产 , 就带来会计记账和核算问题 。 现在会计科目中一般有资料费、咨询费等管理费用开支 。 数据资产如何认定属性 , 肯定不是固定资产 , 也不是库存材料 , 与低值易耗品不同 。 作为资产的价值如何确定?是折旧还是摊销?是否按公允价值计算现值?如何记账背后的问题是 , 数据资产的市场价格是不是波动的?价格没有波动 , 市场交易就活跃不起来 。 数据资产的质量如何认定?数据资产如果像现在这样有如黑箱或盲盒 , 就无法确认质量和评估价格 , 市场也不可能活跃起来 , 否则只能是如同赌石一类的另类市场 。 真是这样的话 , 数据资产作为对数字经济的促进作用就很难正常发挥 。
【信息|刘晓春:数据治理是科技向善的源头】再有 , 数据资产如何保存和使用?作为资产 , 是否可以出借或转让?如果可以出借 , 最初的买入还有意义吗?如果可以转让 , 接受方如何认定转让数据的价值?这里牵涉到 , 数据未被使用而出借或转让 , 或已被使用并留有备份而被出借和转让等情况 。 数据无限制地出借或转让 , 对于最初的数据资产生产商又意味着什么?如果真是这样 , 这个市场是不可持续的 。 也因此 , 对于开放数据交易 , 建设数据交易市场 , 恐怕需要制度先行 , 而不能贸然先开放再说 。
和谐共处的五项制度安排
在理清楚大数据问题的基础上 , 更进一步需要就科技平台公司与社会和谐相处探讨相应的制度安排 。
首先 , 科学地看待科技平台公司的垄断 。 应该看到 , 同类业务在科技平台的集中 , 正是数字科技发挥协同效益的体现 。 万物互联条件下 , 今后的物联网一定是相关行业或产业产供销各个环节的参与者都在同一个物联网平台 , 物联网才能真正发挥作用 。 目前已经出现的科技平台公司 , 应该说还只是初级形态的平台 。 今后还会出现不同领域形形色色的平台 。
由此逻辑看 , 一方面要鼓励平台竞争 , 但又不能以市场集中度定性垄断 。 我们还是要从科技的两面性着手 , 平台的市场集中度不是必然负面的 , 真正的问题是平台实现市场集中的手段 。
以电信为例 , 电信公司是人们电信沟通的平台 。 要实现沟通 , 交流双方就必须能接通信号 , 所以 , 人们一定会集中到互相能接通信号的平台上 。 如果电信公司的电信通道不能互相接通 , 人们最后一定会集中到一两家电信公司 。 如果以市场集中度把这一两家公司定性为垄断 , 要求分拆 , 过一段时间 , 人们又会自然而然地集中到一两家公司 。 现在 , 电信公司之间的信号通道互相打通 , 用户可以带号转台 , 就有了竞争 , 但总体上 , 人们在习惯上还是会相对集中 。
第三方支付平台、电商平台等各类平台 , 也是同样道理 。 近期出台办法 , 禁止平台公司采取“二选一”等手段垄断经营是非常正确的 。
其次 , 科技平台公司职能单一化 。 科技平台公司真正的垄断问题是利用平台垄断客户、垄断平台上的相关业务 。 比如 , 电商平台公司利用平台资源经营各类金融业务等 。
最近人们讨论平台公司在联合贷款中收取引流费是否增加了实体经济的融资成本 , 笔者认为 , 一、从这些年实际情况来看 , 所有互联网金融平台发放的贷款 , 利率都比银行高 。 技术真的没有解决贷款贵的问题 , 只是让贷款更贵了 。 二、助贷、引流等 , 实际上是增加了中间环节 , 当然就增加了中间环节的盘剥 。
据说平台们都觉得很委屈 。 真委屈吗?未必 。 电商平台 , 就相当于线上的义乌小商品市场 , 里面的商户只是在经营商品交易的时候才是平台的客户 。 当这些商户需要办理其他非商品交易业务的时候 , 他们就不是平台的客户 。 就好比义乌小商品市场的商户 , 他们在摊位上销售商品的时候 , 他们是义乌小商品市场的租户;当他们进货需要贷款和支付的时候 , 人虽然坐在摊位上 , 但却是银行的客户 。 希望给商户减少中间环节的互联网平台自己却横插一杠 , 成为中间环节 , 实在是一个悖论 。
在数字经济中 , 各类数字平台既是商业机构 , 同时也具备公共品的属性 , 因为公共品的属性 , 为了保持公信力 , 其职能必须单一化 。 为此 , 互联网科技公司的平台服务业务必须与其他业务严格隔离 , 其他业务只能以同样条件在平台上与平台上的其他参与者公平竞争 。
第三 , 数据采集、治理、服务、出售持牌制 。 数据的产生与运用 , 大致可分为采集、治理、服务和交易这四个环节 。 由于数据的特殊性 , 可能需要对这四个环节分别考察和分别监管 。
当客户银行卡发生盗刷或资金损失 , 银行认为是客户没有保管好自己的相关信息 , 但在到处采集个人信息、交易个人信息的环境下 , 客户确实不知道如何保管好自己的信息 , 更不知道自己的信息被什么人、什么机构所掌握 。 所以 , 银行卡资金损失 , 客户觉得很无助 。 如果法院因此让银行承担资金损失的责任 , 无论是法理还是事实 , 都是说不通的 。
所以 , 对采集数据必须有明确的规则 , 什么类型的数据采集 , 必须持牌 。 无资格者不得采集特定的数据 。 根据机构不同的经营目的 , 必须明确不同的数据采集范围 。 对一些场合必须确认真实身份等数据 , 可以考虑集中认证机制 。 比如公园门票 , 客户只要刷一下身份证或输入手机号等 , 系统自动到公安等系统确认身份 , 公园本身不得采集、保存、应用、转卖相关数据 。
就数据治理而言 , 毫无疑问 , 也需要持牌经营 , 对不同机构可以核准不同的数据内容 。
就数据服务而言 , 对数据内容、数据服务形式、服务对象 , 可能需要有明确规定 。 比如征信公司 , 就是为金融机构 , 或者贷款机构提供客户征信服务 。 今后工业物联网平台 , 其数据服务对象 , 可能只能是同一个平台上的相关企业 , 不能超出这个范围 。
就数据资产交易而言 , 恐怕至少出售业务必须是持牌经营 , 购买方是否需要持牌 , 需要进一步探讨 。 这里的关键还是前文说到的 , 什么样的数据可以成为资产 , 可以上市交易 。
这里之所以把四个环节分开了分析 , 是因为一般来说一个科技平台公司不会只经营其中的一个环节 , 但这四个环节可以有不同的组合 。 笔者认为 , 可能不能允许同一个科技平台公司可以拥有所有这四个环节的业务 , 特别是数据服务业务和数据交易业务 , 不能由同一个公司经营 。 比如征信业务 , 就只能是为特定客户提供数据服务 , 其所拥有的数据不得上市交易 。 前文讲到的共享数据 , 就只能用于数据服务 , 绝对不允许作为数据资产出售获利 。
有些企业采集数据 , 是为了自身产品研发、改善营销等 , 比如汽车制造企业采集行车数据 , 目的是为了汽车技术的研发 , 首先需要规定这类数据的范围 , 比如行车数据、路况数据等 , 但与提供导航服务企业不同 , 并不需要定位数据;其次就是 , 数据只能用于自身研发 , 不得对外提供数据服务和出售相关数据 。 因此 , 这样的企业 , 就只能拥有采集数据和治理数据的牌照 。
第四 , 建立专业的科技平台公司及数据行业监管体制 。 有关这方面 , 相关的法律法规正在不断发布 , 更有许多深入的研究 。 本文不做赘述 , 只谈几点建议:一是 , 鉴于今后数字经济的发展 , 各类科技平台公司和数据行业会有很大的发展 , 这两个行业与传统的各行各业有很大的区别 , 又具有公共品属性 , 风险影响很大 , 可能需要设立专门的部门进行专业监管 。 二是 , 为了监管的专业性、公开性和有效性 , 需要引入如会计师事务所之类的第三方机构 , 依据监管要求 , 对科技平台公司和数据行业的业务、科技、算法模型等进行审计 。 三是 , 数据资产交易 , 需要考虑场内交易和场外交易的规则和程序 。 监管 , 包括市场规则等 , 必须统一规制 , 不能各部门各搞一套本系统的市场和规则 , 最后形成监管套利的混乱局面 。
第五 , 各类科技平台必须开放 。 要建设科技平台与社会和谐相处的环境 , 消除垄断和赢者通吃现象 , 必须从制度上要求平台公平开放 , 让平台本身成为一个充分竞争的平台 。
以电商平台为例 , 一方面平台的职能或功能需要单一化 , 就是提供一个有利于商品交易的高效率平台 , 真的让天下做生意的人没有不好做的生意 。 另一方面 , 为了让平台上的人们好做生意 , 应该允许各类支付手段在平台上提供服务 , 充分竞争;让各类金融机构进入平台 , 直接面对平台上的各类客户提供金融服务 , 充分竞争;其他行业也是如此 。
如果该电商平台公司自己也要开展这些业务 , 可以设立专业公司 , 获得相应牌照 , 与平台本身业务严格隔离 , 与其他同业在平台上公平竞争 。 许多大型商场都有银行网点进驻 , 银行只向商场业主支付租金 , 商场业主并不过问商场里的商家与顾客到这个银行网点办理业务 , 更遑论代替银行确定贷款利率和收取引流费 。 地铁站里银行布设的ATM机 , 同样如此 。当然 , 如果银行需要平台提供相关的有偿数据服务 , 则平台提供的数据 , 客户不应该是打了马赛克的 , 数据的质量是可以鉴别的 。 平台提供的只是数据服务 , 客户还是必须与银行直接洽谈相关业务和价格 。
放眼人类历史 , 科技造福人类 。 数字科技以及因数字科技而起的科技平台公司 , 也一定会造福人类 。 但历史也告诉我们 , 每当有重大科技产生 , 都会带来人类社会的重大转型 。 转型本身是人类社会的发展与进步 , 但转型过程并不总是为当时的人类带来幸福 , 科技在转型中并不总是给人类带来平等与快乐 , 更多的往往是一代人遭遇的动荡、不平等甚至战争 。
如何让科技、大型平台公司与社会和谐相处 , 减少转型期的社会摩擦强度 , 是当前百年未有之大变局中人类所面临的重大课题 。
(作者为上海新金融研究院副院长、浙商银行原行长;编辑:袁满)
题图来源 | Pixabay
版面编辑 | 周斌
推荐阅读
- 建设|这一次,我们用SASE为教育信息化建设保驾护航
- 新机|快准稳,捕捉每个高光瞬间! 刘衡分享EOS R5拍摄体验
- 领域|上海市电子信息产业“十四五”规划:以集成电路为核心先导
- Tencent|微信小程序新规则:调用个人敏感信息将需授权
- 刘思远|从1到100 这座“塔”不断创造中国航天奇迹
- 接口|微信小程序用户信息相关接口调整
- 梦芯|梦芯科技:精准时空信息赋能汽车技术创新发展
- 信息|我国成功发射天绘 4 卫星,用于地理信息测绘等任务
- 信息|财报识别系统教你怎样做好金融信贷审批工作!
- 安全|T-Mobile再遭网络攻击 部分客户信息和SIM卡被窃取