被遗忘权的崩塌:当AI可以通过你的朋友了解你( 二 )
换句话说 , 就算你删号退网 , 机器学习仍然可以通过你的好友列表来分析出你的用户画像 。
在研究中 , 研究人员收集了一万三千余个推特账号 , 这些用户分别都拥有150-200个好友 。 在好友中找到互动率最高的前9位并进行分组 , 将用户好友组中好友的行为数据以时间为线索进行分析 。
数据科学家们通过研究得出 , 一般社交媒体用户 , 只要不是专注某一领域的KOL , 通常在社交媒体上使用的词汇不超过5000个 。 如果用中文来比喻 , 大概就是“哈哈哈哈”“不转不是中国人”“我家哥哥太帅了吧”这些常规词汇 。
而通过对用户好友的常用词分析 , 基本可以圈定该用户的兴趣范围 。 研究者提到 , 很多专注于某一领域的用户(比如政治) , 其实在社交媒体用词量上只有几百个单词 。 在兴趣范围内的词汇量中引入代表个人行为变化的熵率 , 再与建立在时间序列上的文本生成算法相结合 , 就能够实现通过社交关系来预测个人社交媒体行为 。
而当好友组中的好友数量越多时 , 这种预测也越准确 。 但值得注意的是 , 一旦好友数量超过150人 , 预测的准确率反而会下降——因为好友数量过多时往往双方的关联度降低 , 脱离了一个本来的兴趣圈子 , 在行为上也很难形成映射关系 。
推荐阅读
- 金泰相|蚌埠住了!LOL第一美男颜值崩塌,满脸胡子像50岁抠脚大汉
- 希尔瓦娜斯|被遗忘者的愤怒 佣兵战纪无菠萝女王流攻略
- 法术|大话西游2这把遗忘武器是沾了“孟婆汤”了吗?这忽视实在太高!
- 钱小佳|被遗忘的一哥回归复播,成功签约新平台,散落的粉丝迅速集结
- 精灵宝可梦|《宝可梦》理应进化却迟迟没进化的精灵,它们真的被官方遗忘了?
- 假面骑士|DNF:不舍得买假面骑士?被遗忘的卡片册,能白嫖传说胚子卡
- 暗黑|不可遗忘的经典,当年那些最好的暗黑类动作游戏
- 陆逊|被遗忘的史诗级武将?放置鸿图陆逊装配和阵容搭配攻略
- 遗忘之城|卡哥游戏攻略:夏侯惇的开团能力,有哪些是你不知道的呢
- gta三部曲|原神:五星角色说送就送?可惜连被讨论的资格都没有,完全被遗忘