大数据时代保护隐私的另一方向：往大数据里投毒

kaiki

2021-01-29 11:17:50 +08:00

用魔法打败魔法还是挺难的，毕竟道高一尺魔高一丈。
我在淘宝上搜索一个我之前从来没搜过的商品，直接让我滑验证码。
如果大数据足够强大，通过对用户进行画像，剔除无关数据，那灌垃圾行为就可以被发现，退一步来说，现在已经画得差不多了，灌垃圾也不过是多加几笔罢了，影响不了大数据对你的真实信息的判断，除非你的在所有平台的数据无关联或无规律可循。

arcadia

2021-01-29 11:22:49 +08:00

这个如果能实现，可能要系统化的帮你做一个假身份，模拟人每天都在产生大量的假行为。但是真做出来了，你使用各种 APP 的体验也都会差很多

czfy

2021-01-29 11:24:14 +08:00

主要是，太麻烦了..或者说门槛相对高，无法普及，无法大规模反制
当然关心隐私的个人这么做是可以的，多一个人是一个人

kaiki

2021-01-29 11:27:16 +08:00

@arcadia 其实没那么复杂，假身份太假更容易被拆穿，最主要的还是不同的 APP 身份隔离，让背后的数据收集无法归类为一个身份。

billytv

2021-01-29 11:28:59 +08:00

@kaiki 用户画像会随着时间而改变, 比如一个单身的人恋爱了, 他需要的东西跟之前完全不一样, 兴趣 /爱好这些也会慢慢产生变化, 至于判断垃圾数据的机制, 就跟爬虫与反爬一样, 是技术的较量, 没有说哪一方一定会赢, 试了才会知道

kaiki

2021-01-29 11:32:27 +08:00

@billytv 变化一般是循序渐进的，就像我遇到的例子，突然搜索从来没搜过的东西他会让我验证，很明显就是发现了异常，同理灌垃圾这种行为也是会被检测到的，它可以先画，但是是否标记为有效数据，得再继续深入了。
你这个想法在 V 站不是第一次出现，我认为单纯的无效数据很容易过滤，如果能创建有依据、连续的数据，更容易产生干扰效果。

jiezhi

2021-01-29 11:34:14 +08:00

以前也想过试图扰乱对手，只要我跑得步伐够乱，敌人就看不清我的方向。

但最后应该是数据挖掘技术更强了。

xiangyuecn

2021-01-29 11:36:42 +08:00

深挖洞广积粮扔掉手机剪断网线

imn1

2021-01-29 11:42:29 +08:00

前几天好像已经有一帖讨论过了

很难，难点在于难以坚持
信息鲜活度是个很重要的参数，技术上就是权重，近期的信息权重肯定更大，除非一直保持信息投毒这种操作，否则过一段时间，这个有毒信息鲜活度降低（权重减少），那么你的日常操作又重新占了主要的权重，没用

#1 说的是另一方面，现在很多“追踪隐私”的操作，已经和账户联系相当紧密了，变成了风控的一个部分，如果进行大量自我数据污染，搞不好就是封号
你可以试试切换多个 IP 访问 v2ex，先说一句，出问题我不担责，🐶

我现在用的是行为隔离的方案，但向别人推荐时，99.9%都嫌麻烦
所以，“大部分人愿意用隐私换便利”，将成为今后几十年的一个恒久金句