namelosw
2021-01-20 22:32:20 +08:00
这个东西靠嘴说谁也说服不了谁, 究竟有没有监听, 用哪种方式, 哪个 app, 没有大样本严谨一点的实验是很难发现的. 逆向很多时候只是知道它在收集数据, 也不一定能确定是不是就是它, 比如输入法是提交一些零散的 keystroke, 那它到底用这些数据做了什么其实很难推断. 在有人找到证据之前这个问题永远扯不清, 像输入法之类的没办法在手机本地找证据就更困难了, 除了员工爆料就只能自行怀疑了.
如果大家真这么闲, 可以合力搞个方式验证一下, 但是这种东西确实比较困难, 有很多地方做得不好就会污染样本.
比如下面我拍脑袋随便想的方式, 应该有很多地方都可以改进或者简化:
假如写个简陋的网站部在外网, 每天有 N 个人登记自己的城市, 这个网站每天会把人们三个三个组合起来(来自不同城市), 每次参与需要一到两天的时间. 这个网站有一些简陋的视频语音功能(不能是输入法, 或者用桌面版的 Skype 或者 Discord 之类的), 过程中不能提任何和接下来要购买商品相关的内容(打字, 语音).
假如这三个人是 ABC, A 在自己买过的东西里找一个最冷门或者反季等等的商品, 然后在纸条上用行体手写商品名称, 在电脑摄像头上给 BC 看, 全程不能提商品相关信息. BC 任何一个人觉得对他们不够冷门, 就换倒数第二个商品. 如果找不出来就换 BC 做 A, 直到大家都能同意这个商品足够冷门为止.
然后 A 离开, BC 单独交流, 两个人随机选一个人做实验(打字, 麦克风等等), 另外一个人什么也不做. 上面三人分组的时候, 可以分打字 /麦克风等等不同的小组, 也可以有搜狗百度输入法之类的, 或者可能还可以想办法把这些人装机 app 分一下组之类的. 打字或者和麦克风输入的时候, 不要只说那个商品名, 要实际场景, 比如让另外一个人和你聊一会这个话题(“诶谁谁你买这个了吗? 我买了这个特别好用”, “挺好, 我也打买算个试试”之类的, 因为之前在 HN 之类的讨论上看到有人说怀疑关键字唤醒, 这样相对比全程分析或者上传省电且不容易被发现).
最后第二天 B 和 C 给 A 看推荐列表, 然后 A 决定是不是有影响, 并将实验数据录回网站, (假如 BC 不愿意分享推荐列表, 可以只录入 A 觉得相关性大的条目). 最后网站分别给不同的类别的组统计结果, 反复做这个实验, 样本比较大的时候就能看出来区别了.