发现抖音一个很厉害的地方

2022-07-12 11:45:34 +08:00
 v23x

比如说 你在 v2 或者在微博 发一个帖子 发一个图片 小粉红和网警是看得到的.反手一个举报.信息封控就完成了.

任何关键词混淆都是没用的.因为这是直接人眼识别

因为这些都是公共社区.所有人都可以进.

但是抖音现在的技术 可以做到私密的信息流.就像 TG 的私密频道一样.而且比 TG 的私密频道还要保险. 因为这种私密的信息流是不依赖邀请制度的.只要通过了抖音的大数据判定 你是属于这个私密信息流的人 才会让你进去

比如 按照性别的信息流.只有判定了你是男性.你才会来到这个男性专属的信息流. 一个专门讨好男性的视频(典型的各种段子嘲讽大龄剩女要求高)就只会推送到男性.不会推送给女性用户.

反动视频只会推送给反动派.不会推送给小粉红

只要抖音有这样的意愿.然后技术上能够做到精准的用户画像.那么这种私密的信息流要如何封杀控制?

一方面是可以蜜罐钓鱼.伪装.比如一个男性用户可以伪装成女性用户. 那要如何伪装呢?这个男性用户会按照他对女性用户的理解去伪装. 比如只点赞那些他认为女性用户会喜欢的视频.各种帅哥 各种讨好女性的话术(女人应该像公主一样被宠爱).

但是这样的一种伪装能不能成功呢?抖音对于女性用户的理解是绝对强于普通人的.因为抖音的数据多.抖音会知道一个真实的女性用户有什么样的特点.比如可能会出现月经痛经相关的搜索.讨论 hpv 疫苗相关的.

还有其他更加偏门一点的特点.就是只有抖音的机器人经历那么多的数据之后留下了的特征标记.

其他人是无法知道的.

所以这样的一种伪装.这样的一种技术上的对抗.抖音的机器人是完全碾压的

第二种思路.就是随机抽查(效果有限)或者每一个视频都看一遍(需要的人力很多).而且这种思路是 O(N)的.每天新增的视频数量越多 这个方法就越差

大家有没有其他思路

7306 次点击
所在节点    问与答
58 条回复
kindjeff
2022-07-12 11:53:06 +08:00
伪装很容易成功,我曾经就试过用一台新 iPhone 训练,让抖音误认为我是一个老年人,刷了很多震撼我三观的视频,并且持续了一段时间。

训练方法主要是模仿观看习惯,包括观看时长、循环次数、分享习惯(有些直接分享到微信,或者假装给身边的人看,这时通常会往下刷一下再刷回来以便从头开始放)

不过这个需要坚持,不如不是刻意为了训练它,我没有办法看一个逆天老年人剧情向视频超过五秒。这样的话只要一两天抖音就会重新推送我真正喜好的东西。

---

我觉得这个「私密圈子」没有楼主想的这么牢不可破(不过这样发展下去迟早有一天会变成这样)。
czfy
2022-07-12 11:55:00 +08:00
合着你就是来讨论怎么更好地做审查的?
那滚吧
v23x
2022-07-12 11:58:56 +08:00
@czfy 我不是.请你不要激动


@kindjeff 所以我觉得这种伪装的对抗是不可能成功的.因为如果你不是那样的人.你伪装不了多久的.伪装的程度也不像.只要是足够敏感的信息.抖音是完全可以采用更严格的转入制度.比如一年的考察之后.你才能接受到敏感的信息
murmur
2022-07-12 11:59:05 +08:00
说这些玩意你的意图是什么,比如是 b 站,假设你喜欢看女装和化妆的东西,那你直接搜索就可以了,为什么要跟自动推荐对抗

搜索、tag 、分类这些功能是摆设么?
kop1989smurf
2022-07-12 12:00:26 +08:00
假设一个平台完全依赖于内容推送,其实就相当于一个独断专行,自我进化的内容分发系统。
外部审查确实比较困难。

所以更多的是依赖内部审查和抽查。

比如每个维度抽查几个 tag ,一旦某些 tag 的内容偏向极端化(这是媒体逐利的必然),就开始针对某个 tag 进行清洗。
westoy
2022-07-12 12:02:09 +08:00
想多了, 四五年前抖音官方就说过审核团队就有几千人的, 审核团队介入前还有 shadownban(仅自己可见)和 AI 自动删除的分档屏蔽, 之后还以后系统内举报

信息茧房的软屏蔽更类似海外平台的机制

国内平台并不能依赖这个, 因为不止小粉红, 竞争对手也会制造这种内容然后举报的, 依赖这个的结果就是被锤
kop1989smurf
2022-07-12 12:02:26 +08:00
而且还有一点,就是内容分发者其实并不能确定他的内容一定会被下发到其目的 tag (或者筛选维度)中,所以很大程度上上传者也会考量风险,自我审查。
v23x
2022-07-12 12:06:21 +08:00
@kop1989smurf 所以前提是抖音本身要有这样的一个意愿.

如果有这么一群人想对抗信息审查.那么他可以按照这种用户画像的思路去筛选真正的同道中人.

只要机器学习到了一个的程度 就不会被伪装欺骗被捅刀子
kop1989smurf
2022-07-12 12:10:06 +08:00
@v23x #8 假设这个平台自身真的想搞一些偏门,确实是可以实现的,而且外部审查很难。
况且媒体引导,一直是舆论政治的主流做法,现在的媒体平台也在这么做(无论是西方还是中国)。

只不过平台因为趋利而没有选择对抗政 @府而已。
v23x
2022-07-12 12:14:30 +08:00
@westoy 故意陷害然后举报 确实是一个需要注意的地方

比如网警可以故意构造类似的视频.然后发现没有被审核过滤.就去找抖音的麻烦.

但是这种也是可以破解的.因为这也是一种识别和准入.

你一个陌生人来到平台.突然就发敏感信息.这种是可以简单就识别出来的

必须要被系统信任了 你为反动派 你才会被接纳到这个私密的信息流里面来

才可以接收和发布对应的信息
kop1989smurf
2022-07-12 12:17:42 +08:00
@v23x #10 所以之前 tiktok 的模型问题闹的非常大。各国都不希望自己的媒体宣发模型被其他企业(或者说国家)所掌握。
v23x
2022-07-12 13:13:04 +08:00
这种系统比较难处理的是叛徒问题

假设一个恨 8 国 8 党 出身农村 家庭背景贫穷 经过自己做题的努力 一路拼杀到了大城市 每天 996 加班
身体熬夜一身病痛 今年已经 30 岁了 考公务员好几次都失败(还听过有各种黑幕) 没车没房 相亲总是失败 他恨透了这个状况 他对这个社会不满意 觉得很不公平

经过一年的视频点赞之后 他被抖音逐步筛选进入了恨 8 国 8 党的私密信息流中.一帮志同道合的人聚在了一起.他觉得信息流里面每个人讲的简直都是自己的心里话


但是突然 他考中了公 8 务 8 员 8.集团夏天给他发西瓜荔枝各种水果高温补贴冬天给他发米面粮油冷空气补贴

每个月公积金 6000 元.轻松首付买房(公 8 务 8 员可以零首付)

考上公 8 务 8 员第二天就相亲成功.买了车.每天早上 9 点钟上班 5 点下班.食堂 4 块钱吃一顿.营养丰富又美味.
集团提供 12 年义务教育(机关幼儿园到初中一路完全免费包括书本费)

那么这个时候他再来看抖音上私密信息流里面的视频就显得那么刺眼

这些整体发牢骚的人 只不过都是不努力只会埋怨集团的 loser

每天嚷嚷着这里不满意那里不满意 但是又不滚出 8 中 8 国
太平洋没有加盖 有本事你跑出去 不要留在 8 中 8 国 影响社会稳定

这个时候的他 已经成为了利益集团的一份子 维护这个利益格局的稳定(社会稳定) 是他的核心利益诉求

所有那些曾经看起来那么顺眼的视频 那些 UP 主 现在都显得那么不可理喻

于是 他愤恨地对这些视频进行了举报

集团根据他的举报 成功抓获了一大批 8 恨 8 国 8 党 摧毁了一个已经被 8 境 8 外 8 势 8 力渗透的 8 反 8 动 8 集团.
社会的稳定再一次得到了加强.人民的利益()得到了保护


面对这样一种基本无法预测.突如其来的政治图谱的改变.叛徒的发生.

系统很难处理这种状况.只能是快速止损.比如发现了类似举报之后.剔除叛徒.销毁证据.切割联系.等等

当然集团也不蠢.接到举报之后.有可能按兵不动.等到网住了一大批.才收网.一网打尽.

这样的一种叛变情况.如果是叛变比较慢.有征兆.那么还可以应对.提前发现.提前剔除出私密信息流.

叛变的转变特别快的话.就比较难处理了.

比如某个叛徒发现外面有悬赏.十万元人民币.让你举报这种反动的私密信息流.
那么这种情况下.系统就有可能被突破掉了.

所以这种反抗信息审查的系统.必须注意有限的切割.一个叛徒的出现.叛变.要让他的影响尽可能小范围.
这种小范围的实现.包括视频的过期处理.一个敏感视频在某个人的历史纪录中不长期保留.阅后即焚.这样就不会往前追溯

然后这种系统还必须不能有关注机制.因为关注机制等于用户可以自行标记哪些人是哪些成分.等到叛变的时候可以一起举报.

欢迎大家讨论.还需要注意哪些情况
realrojeralone
2022-07-12 13:28:54 +08:00
@v23x 没懂为什么都上 v 站了还自我阉割,主动规避墙内的敏感词
v23x
2022-07-12 13:30:17 +08:00
@realrojeralone 因为发不出去 V2EX 提示我有敏感词.但是没有告诉我敏感词是哪些
Jwyt
2022-07-12 13:36:54 +08:00
@realrojeralone 那是论坛的敏感词,没想到吧
kop1989smurf
2022-07-12 13:39:06 +08:00
@v23x 这其实就是简单的用户画像误差问题。一个人因为个人原因,导致其喜好,利益关系,甚至是三观和系统既有的画像模型有偏差。

这时候对应赛道的从业者会失去这个用户,甚至会承受更大的损失。
这很正常。(比如我就对短视频平台有偏见,认为内容低俗,但因为工作原因接触了几个月,短视频平台在我心目中的形象有所改观。)

但你这个例子举得过于极端了。
因为当你发送内容给平台时,你要默认你自己可以承受其后果。
换句话说,你这个例子搞错了因果逻辑。

不是因为某个领域的受众倒戈,导致内容发布者受损。
而是内容发布者本来就选择了有风险的内容。
反之,如果是有不可承受风险的内容,你就不应该依赖一个自动分发系统。
wxiao333
2022-07-12 13:39:13 +08:00
我前几天看 NBC news 的新闻说 tiktok 可以通过前置摄像头看到你的肤色 种族 性别,建立用户画像的,不知道真假
hidemyself
2022-07-12 13:43:07 +08:00
可以关闭个性化推荐的
echo314
2022-07-12 13:48:47 +08:00
@v23x 没想到吧,自由主义盛行的社区也搞关键字审查。
love642285
2022-07-12 13:50:42 +08:00
那我觉得小红书也是这样的私密信息流

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/865626

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX