数据|全球数据开放研究者范佳佳:需要制定详细的数据开放负面清单

数据新作为·数据30人20城 系列报道解码数治之道?
数字政府建设是推进治理能力现代化的重要支撑 , 是经济社会高质量发展的必然选择 。 而盘活数据资源是数字政府建设的关键之举 。 南方都市报、南都大数据研究院推出系列专题 , 专访数据开放实践者、治理标准制定者、数据安全护航者、数据立法起草者等 , 并且挖掘数据应用创新举措 , 探寻数治能力优秀区域 , 以“30人访谈为引 , 以20城案例为鉴” , 致力呈现新时代下的“数据新作为” , 共谱数智新篇 。
同时 , 面向全国企事业单位、科研机构等征集数据应用优秀案例(资料或线索请发邮箱nandubdi@163.com) , 我们将组织大数据领域有关权威专家对案例进行解读、评估 , 并进行更深入采访 , 实现更广泛推广应用 。
数字化改革过程中 , 探索分层分级、授权运营等可行方案 , 一直是国内数据开放领域的主攻方向与难点所在 。 目前 , 对政府数据的研究重点之一就是政府数据运营 , 它是一个闭环流程 , 包括数据采集、存储、加工、共享、开放、授权运营等 。 而推动政府数据可持续运营的关键之举是对政府数据的充分开放 。 那么 , 在大数据环境下 , 政府数据可持续运营的本质与前提条件是什么?有没有什么内在机理?要如何合法开发政府手里掌握的数据 , 释放数据资产价值?上海社会科学院信息研究所副研究员、《大数据环境下政府数据的可持续运营》作者范佳佳接受了南都专访 。

只有有效保障政府数据充分被获取利用
才能更多样更多维度实现数据资源价值
南都:随着数据上升为新型生产要素 , 数据资产时代已经来临 。 在您看来 , 什么是数据资产 , 什么样的数据可以成为数据资产 , 有没有统一定义与标准?
范佳佳:我们要先搞清楚“资产”是如何定义的 。 按照《企业财务会计报告条例》(国务院第287号令发布 , 2001年1月1日起施行 , 以此为依据制定《企业会计制度》)第九条中对资产定义:资产 , 是指过去的交易、事项形成并由企业拥有或控制的资源 , 该资源预期会给企业带来经济利益 。
那么 , 数据资产是什么?“数据资产”一词于1974年由Peters提出 。 2018年, 上海市政府信息化专家委员会专家朱扬勇等将数据资产定义为拥有数据权属(勘探权、使用权、所有权)、有价值、可计量、可读取的网络空间中的数据集 。 虽然目前国际上还没有统一正式的数据资产定义 , 但相类似的信息资产概念早已存在 。 国际标准化组织(ISO)在《ISO/IEC 27000:2014信息技术-安全技术-信息安全管理系统-概览和词汇》中将“信息”解释为是组成企业、公司等社会性组织中业务运营的重要组成部分 。 该组织通过大量的统计和调查 , 最终将信息的搜集、储存工作归结于人脑、纸质以及电脑等;在生活中 , 信息传输的方式也是多种多样的 , 例如对话、网络、光缆等 。
可见 , ISO把数据作为信息的一种形式置于信息资产的概念之下 。 而从企业财务意义上来讲 , 符合资产定义的资源满足“与该资源有关的经济利益很可能流入企业”和“该资源的成本或者价值能够可靠地计量”两个条件时 , 确认为资产 。 所以 , 作为资产的数据应具体以上两个条件 。
南都:政府数据资产有哪些明显特征?国内外有哪些主要研究方向?
范佳佳:政府数据资产是政府组织拥有或控制 , 能够给政府组织带来社会效益或经济利益的数据资源 。 作为资产的政府数据具有如下特征:
一是准公共性 。 该数据是政府在进行各职能运转中产生的 , 因此其本身就具备了一定量的公共特性 。 但就资产的所有而言 , 政府数据是政府拥有或控制的“私有财产” 。 政府及其职能部门必须严格执行对于数据的“统一开放 , 以开放为常态、不开放为例外”的基本管理方针 , 必须建立科学有效的管理模式 , 具备过硬的硬件设施 , 促进一般大众和企业充分利用政府数据 。 就资产的保值增值而言 , 政府数据面向社会开放应采取免费的方式 , 但为促进某类专业性强、关联价值高的数据的利用 , 政府及其职能部门有责任设置多样的激励措施 , 鼓励企业或社会组织为公益目的开发和再利用这些数据 。
二是可再生性 。 我们强调政府数据的资产特征 , 并不是认为其能够“自然而然”产生巨大的经济和社会价值 , “以市场机制运作为背景条件”始终是一个不可回避的基础性制度要求 , 而在此要求下 , 不同的开放应用以及加工方式可以产生价值差异极大的数据产品 。
三是数据正义性 。 事实证明 , 只有有效保障政府数据更充分地为广大人群所获取和利用 , 才能更多样、更多维度地实现数据资源的价值 。
目前 , 国内外对政府数据的研究重点集中在政府数据运营 。 以美国、欧盟、英国、日本为代表的发达国家在政府数据运营方面开展了实践探索 , 美国以政府信息公开实践为依托 , 在此基础上进行了创新 , 包括出台更适用政府数据运营需求的法律政策 , 如《开放数据政策-将数据当作资产管理备忘录》、搭建促进政府数据传播的开放数据平台、积极探索政府数据运营业务 , 鼓励公司利用数据开展商业活动等 , 美国 Factual 大数据交易平台的客户就包括 Apple Maps、Facebook、Microsoft Bing 等 。 而欧盟则与美国的偏商业化模式不同 , 采取渐进模式 , 通过制定相关政策法规、创立成员国之间的开放平台以及开放政府数据的应用场景来推动政府数据运营发展 。 欧洲数据门户就是一个统一的开放数据门户 , 收集整合欧洲的政府数据 , 并以统一格式发布 , 使用户可以一站式检索到多个国家和地区的政府数据 , 同时在网站上提供数据使用教程 , 激发用户的使用需求 。
政府数据将成为一种无形资产
由政府代全社会进行管理运营
南都:政府数据是现阶段数量最庞大、价值密度最高、涉足广度最宽的数据资源 , 我们要如何合法开发政府手里掌握的数据 , 释放政府数据资产价值?
范佳佳:大数据环境下 , 政府广泛开放跨域关联、多源异构的海量数据 , 对其进行开发、增值运营 , 使其成为大数据产业重要的资源供给 , 是顺应国家大数据发展战略 , 转变政府职能 , 调整产业结构 , 改变经济增长方式 , 实施创新驱动发展规划的必然趋势和智慧选择 。 数据是政府未来的核心资产和社会创新要素 , 是促进国家产业转型发展、社会进步的能量源泉 。 如何合法开发政府手里掌握的数据是“十四五”时期国家实施大数据战略和创新发展的重要命题 。
对政府数据开发实质上是要让政府数据运营起来 。 这里重点强调使政府数据能够持续增值 , 即其经济价值与社会价值的增值和再利用 。 政府数据运营是一个闭环流程 , 包括数据采集、存储、加工、共享、开放、授权运营等 。 其中 , 政府数据开放和授权运营属于增值运营部分 , 是政府数据开发和可持续运营的必要环节 。 作为学者更要围绕政府数据的开发和可持续运营 , 研究可以挖掘影响政府数据持续开放和健康利用的因素 , 找出用以判断政府数据资产可持续运营的标准 , 为大数据产业发展提供决策依据 。
南都:政府数据权属各国是怎么规定的 , 使用哪种途径能为数据的合法利用铺平道路?
范佳佳:政府数据若作为资产 , 前提必须是权属明晰 。 不同国家对政府数据权属的规定不同 。 如 , 美国将政府数据归入公共领域 。 而英国皇室拥有政府数据的著作权 。 根据我国《著作权法》第 5 条规定 , 除“法律、法规 , 国家机关的决议、决定、命令和其他具有立法、行政、司法性质的文件 , 及其官方正式译文”不属于著作权法保护范围 , 其他政府数据并未被排除享有政府著作权 。 虽然目前我国在法律上没有明确政府数据的权属 , 但政府是政府数据的实际或逻辑上的控制者 。 从数据控制角度讲 , 未来 , 政府数据将成为一种无形资产由政府代全社会进行管理和运营 。
但不同属性数据的权属不同 。 有学者认为 , 有关政策、法规、人口、资源等基础数据具有共享全民受益和完全非竞争性的特点 , 是纯公共物品 , 应属全民所有 。 而大部分政府数据只具备准公共物品属性 , 其产权的归属并不天然的完全属于全社会 , 政府和第三方可能会参与数据的所有权 。 鉴于数据权属的复杂性 , 政府选择可用许可协议的形式 , 将部分权利受让给公众 , 在承认数据所有权的同时 , 为数据的合法利用铺平道路 。
合理配制政府开放运动各利益相关方权责
可实现开放数据价值释放与风险管理平衡
南都:政府数据开放的重点是要解决是什么问题 , 如何解决?
范佳佳:政府数据开放的重点是要解决利益相关方的权责分配问题 。 李凯尔特曾说:“一切纯粹存在的问题都必然仅仅涉及现实的某些部分 。 ”由于社会事物之间的相互作用在本质上就是价值作用 , 任何社会事物的运动与变化都是以一定的利益追求或价值追求为基本驱动力 , 权利与责任相对应 , 权责往往成对贯穿于几乎所有社会事务与关系 , 政府开放运动也不例外 。 有学者认为作品权利人对部分权利的释放 , 是以使用人对作品进行传播或衍生性使用遵守许可协议为前提 。 这就需要厘定开放许可协议的责任分配 , 并明确侵权责任与救济机制 。 所以 , 合理配制政府开放运动中各利益相关方的权责可以实现开放政府数据价值释放与风险管理的平衡 。
宏观上讲 , 系统论、数据生命周期理论和信息生态理论为政府数据开放各利益相关方权责的分配提供了理论基础 。 政府开放运动由政府、用户、技术、价值等要素组成一个生态系统 , 其发展依赖各要素的协调管理 。 整个生态系统相互依存 , 各要素之间相互关联 , 共同构成一个不可分割的整体 。
以价值实现为目标的生态系统其权责的分配需要从数据的获取、传输、加工、利用整个生命周期去考量 。 具体而言 , 首先 , 这种权责的分配要遵循《G8 开放数据宪章》提出的五项原则的要求 。
其次 , 产权的相对性和开放政府数据的公共、准公共属性决定了可以将“开放”产生的权利分别赋予不同主体 , 在不干涉其他方享有权益的条件下实现自身利益 , 故政府与用户都享有各自的权利 , 同时也需承担相应的责任 。
再次 , 政府的责任内容由其促进经济发展、增进社会公共福祉的政府职能 , 以及作为社会权力的拥有者应负有体现公共利益诉求的数据开放义务的政府职责所决定 。 政府开放运动作为一种公益行为 , 政府扮演服务社会大众的角色 , 理应承担责任 , 保障大众享用数据 。
最后 , 法律赋予社会大众享有的数据权、知情权、政治监督权和行政参与权 , 决定了用户拥有数据开放请求权和合法利用数据 , 获取收益的权利 。 而用户担责是保护数据安全之必须的监管手段 , 呼应了政府开放运动的核心议题 。
需要制定详细的数据开放负面清单
并制定中国政府数据开放许可协议
南都:政府数据开放是否要制定负面清单 , 您认为的负面清单是什么?
范佳佳:我认为需要制定详细的数据开放负面清单 。 负面清单包括四个子单:涉及个人隐私的敏感性个人信息豁免清单、涉及国家安全信息的豁免清单、涉及商业秘密的豁免清单、其他数据豁免清单 。
涉及个人隐私的敏感性个人信息豁免清单包括:
高敏感信息:行踪轨迹信息(物理地理位置)、通信内容、征信信息、财产信息、个人身份信息、网络身份标识信息等 。
敏感性社会行为信息:住宿信息、通信记录、人事档案、收入状况、交易信息、曾参加组织的成员资格、私人照片等 。
医学生物信息:健康(身体、生理、精神)信息、DNA、指纹、虹膜、面部识别特征等 。
精神层面信息:政治观点、性取向等 。
涉及国家安全信息的豁免清单包括:国防军事情报 , 威胁社会主义制度和政权的数据 , 破坏国家统一大业和民族团结的数据 , 有关恐怖主义、极端主义和邪教组织的数据 , 有关我国在外层空间、国际海底区域和极地的活动、资产和其他利益安全的数据 , 威胁意识形态安全的数据 , 关于重大技术、工程和知识产权安全的数据 , 涉及公民生命财产安全和其他合法权益的数据 , 关系国民经济命脉的重要行业和关键领域、重点产业、重大基础设施和重大建设项目以及其他重大经济利益安全的数据 , 涉及金融安全的数据;涉及食品、环境和能源安全的数据 , 其他涉及领陆、内水、领海、领空和网络安全的数据等;
涉及商业秘密的豁免清单包括:涉及某组织、企业的商业活动 , 能够为知晓人获取经济资产且其被权力者或是机构进行了保护处理的技术和数据信息 , 囊括了工程、材料、配方、设计构思、用户信息、决策方案、竞标价等;
其他数据豁免清单包括罪行诉讼、调查记录、刑事审判数据、涉及内部人事规则和惯例的数据等 。
南都:在您的著作《大数据环境下政府数据的可持续运营》中 , 建议要制定中国自己的政府数据开放许可协议 , 请问协议核心内容是什么?
范佳佳:我建议制定中国政府数据开放许可协议(the Chinese Licence for Open Government Data(CLOD) , 协议分条、款、项 (文本内容)和文本所规制的权责 。 “条”分为被许可人的权利、被许可人的义务、许可人义务、许可人权利、定义、管辖法律、有关CLOD和附件等几个部分 。
在“款”中 , 被许可人的权利要明确其数据请求权、数据使用权和数据收益权 。 被许可人的义务包括署名(注明出处)、付费(或免费)下载数据、保护数据安全、不滥用数据 。 许可人义务包括制定开放政府数据豁免清单、实施个人信息去标识化、制定三级数据开放政策、实施开放政府数据去向说明制度和实施开放政府数据解释说明制度 。 许可人权利包括数据豁免开放权、免责和数据收益权 。
数据|全球数据开放研究者范佳佳:需要制定详细的数据开放负面清单
文章图片

个人简介:
范佳佳 , 上海社会科学院信息研究所副研究员 , 上海社会科学院绿色数字化发展研究中心副秘书长 , 上海市人民政府发展研究中心与上海交通大学国际与公共事务学院联合培养博士后 , 南京大学信息管理学院博士 , 蓝皮书《全球信息社会蓝皮书》(2020-2021)副主编 。 主要研究公共数据开放与运营、城市治理数字化转型、数字经济与绿色发展 , 承担国家、省部级及横向课题等10余项 。 在《中国行政管理》《电子政务》等发表研究论文和文章近30篇 , 撰写专报多次获省部级以上领导批示 , 2019年开始作为项目负责人连续发布《全球重要城市开放数据指数》报告 。
出品:南都大数据研究院 数字政府研究中心
【数据|全球数据开放研究者范佳佳:需要制定详细的数据开放负面清单】统筹:邹莹 研究员:袁炯贤 设计:刘寅杉

    推荐阅读