非法爬取简历、网贷、淘宝……还有啥信息不扒不卖( 九 )

针对裁判文书网数据被爬虫售卖一事,北京市社会组织法律调解中心副理事长张新年律师认为,裁判文书网站上的内容基于司法公开目的,是免费的公共资源,未经最高人民法院授权,商家售卖裁判文书网数据则会构成侵权。

大数据爬虫背后谁在提供技术支持?

网售大数据采集定制业务如此“火爆”,这些所谓的“大数据”信息从何而来?又是如何被泄露出去的?南都采访人员调查发现,这背后隐藏着一条非法爬取用户数据的黑色产业链——“专业老手”编写爬虫软件、提供软件订制服务、黑产团伙购买软件批量生成“大数据”信息再转手出售。

“专业老手”代写爬虫软件

所谓爬虫,是一种常见的数据捕获技术,又被称为网页蜘蛛,网络机器人,其按照一定的规则,自动从互联网上提取网络信息的程序或脚本。虽然利用爬虫软件等各种技术手段爬取互联网数据的行为广泛存在,但为保护自身数据不被爬取,很多企业也都设置了反爬虫策略。

“python爬虫程序数据采集代写软件,专业老手,定制化服务”,二手平台上一位卖家介绍,其提供各类大数据采集软件代写订制服务,可进行“各种加密网站破解登录”,采集数据范围包括携程春秋航空等旅游网、美团天猫京东拼多多、微博知乎豆瓣等电商社交平台。该卖家称,他们是“一批精通软件开发的编程高手组成”的软件开发团队。平台信息显示,该卖家近期已完成多笔交易,用户反馈“好评如潮”。

推荐阅读