当面孔成为大数据养料 你的脸还好吗?( 五 )

每次有新项目访问数据集时,损害可能导致的影响和范围都会发生变化。数据的可移植性和互联网的快速度结合在一起,大大扩展了一个研究项目的可能边界,也把风险扩展到远远超出任何一所大学能承担的范围。

解决尝试:建立学术审查系统

杜克大学最终决定删除与该研究相关的数据集。斯坦福大学清除了研究人员基于旧金山咖啡馆的顾客所创建的数据集。

科罗拉多大学博尔德分校信息科学系助理教授Casey Fiesler撰写了关于在研究中使用公共数据的伦理学。Fiesler提出了一种用于审查数据集访问的系统,与审查版权类似。她指出,系统中的使用条款主要关注请求者计划如何使用该数据。

“为这些数据集设置守门人是一个好主意”,她说,“因为只要明确使用目的,请求者就能够访问数据集。”类似的规则在开源软件和Creative Commons的标准化版权许可协议上已有应用。

Creative Commons是一种基于许可的系统,请求者只能将获得的作品作为非商业用途,而一旦他们隐瞒或歪曲意图,则需要承担责任。这些标准可能与学术环境并不完全匹配,但至少在切断后续伤害方面是有用的。“这并不是将规则繁琐化,但它提出了一种方法,使得你无论决定要做什么时,都把前后因果考虑进去”,Fiesler说。

推荐阅读