隐私|滴滴下架,谈谈数据黑产( 二 )


可以看出,这是一种“广撒网”的“轻诈骗”模式,可以很容易把大量用户信息变现。这类模式需要的信息,是那些“可以找到你”的信息,比方说住址、电话、email之类。
这类信息有个统一的名字,大概您听说过,叫“个人可定位信息(PersonalIdentifiable Information, PII)”。
该怎么防范呢?这种广撒网的模式需要用到的PII信息,在如今各国的用户隐私保护法规下,几乎都已经被禁止传播和使用了。
在我国,贩卖五十条以上的手机号这类信息,就有可能有刑事责任,所以这种风险在总体上是可控的。就算是信息真被泄露了,人家是广撒网嘛,一般也不会把你一把薅死,倒也犯不着忧心忡忡。当然,自己的PII信息,还是要看住了,别轻易给别人。
而更生猛的模式,“广撒网”就不够了,还得“深挖洞”。这就要用到用户身份以外的“行为数据”了。简单来说,就是深入分析你平常的网络行为,找到你的软肋之后,一刀下去,砍你个全身不遂。
这个路数最兴旺的领域,是放贷。放贷的爱找什么人呢?就是那些频繁借钱的人,这种人拆了东墙补西墙,听说哪儿能借出钱来,就跟苍蝇见了血一样。
于是,想办法通过各种来源的数据,找出那些频繁借贷的人,诱使他上自己这儿来借,再设下个套路贷的陷阱,就能挣一把大的。而这些人常用的数据,就是短信、搜索词什么的。
至于来路,没几个正规的。当年那一拨金融科技公司纷纷被抓,不少都跟这些数据黑产有关。
“深挖洞”的模式,用户就有可能蒙受重大损失了。说到底,这还是违背了上面说的“在同一个场景下服务于你本人”这条原则:一个人在A家借贷的数据,按说是不应该让B家知道的。
但是,这样一来麻烦就来了。本质上看,所有的精准广告模式,都存在把A场景/客户的数据用于B场景/客户的问题。如果B场景/客户的金主有恶意,那么这里的风险不容小觑。
【 隐私|滴滴下架,谈谈数据黑产】因此,我支持对于广告业务中使用的数据,要有明确的规范和边界。您想想,搜空调维修把骗子引到家里来这种事,还少么?
在现代的大数据技术下,这种“深挖洞”的能力超乎你的想象:举个例子,通过手机陀螺仪数据,能分析出用户的行进速度,如果速度比较快,再看看电量一直是满的,那么他十有八九是在开车,手机插着充电。
如果一天有八九个钟头都是这状态,那大概就是个职业出租司机了。如果这司机在北京,消费上又不像一般司机那么节俭,那很可能是城乡结合部的拆迁户,手里有了点钱,没啥事干只好开出租。
这些人一夜暴富,耍钱的比例不低,耍着耍着家里管得紧了,可手瘾还在,就只好借钱了。抓住他们玩套路贷,那可是一抓一个准!
而像滴滴这种掌握大量用户数据的公司,任何一点疏忽或恶意,都可能让用户蒙受重大损失,至于上市过程中,把什么数据交给SEC,SEC又能从中挖掘出什么,虽然不得而知,也是细思极恐了。
咱们再来说说第二类,借你的身份去干坏事。这类方法,往往是在互联网的技术体系内,用一些非PII信息,从客户而不是你身上挣钱。
最典型的例子,就是在黑产圈长盛不衰的的cookie stuffing。这事比较复杂,简单说是这样的:举个例子,假设淘宝为了搞到更多流量,就跟一些渠道说,你们去给我送流量,带来的用户下单,我给你提成千分之二!
但是怎么才算这个渠道带来的下单呢?就是用户通过这个渠道的广告位点击到淘宝的时候,带了个用户的ID,后面这个ID再下单时,就能对上了。
这样一来,鸡贼的渠道就想出个办法:尽可能多收集用户ID,然后给每个ID伪造一个到淘宝的点击事件,这些ID里如果有人下单,那不就算我的了!反正我一点成本也没有,撞上多少算多少呗!

推荐阅读