盗版小说站的内容被替换成了反义词,这是什么技术

2023-07-15 20:14:59 +08:00
 Lightbright
如题,很久前看小说时就发现有的网站内容存在这个问题,
今天又遇到了,咱就是说,这也太缺德了吧



注意到一些常见词都变成反义词了:
快->慢
进->退
上->下
多->少
高->低
不->是
前->后
特殊->普通

这到底是哪位人才想出来的办法,
污染的来源是哪里,起点嘛。。。
5816 次点击
所在节点    分享发现
35 条回复
mmxq
2023-07-15 20:19:21 +08:00
这个不是污染吧,就是那些小网站为了规避审核和正版平台的防盗整出来的。
之前就有人说过这事儿了。
blockmin
2023-07-15 20:36:50 +08:00
搞盗版的人的正版网站账号被风控,出现替换文字,盗版 copy 过来又没校对,就这样了。
正版搞防盗,盗版没校正
biquzhi
2023-07-15 20:38:30 +08:00
字体反爬吧
cairnechen
2023-07-15 20:40:48 +08:00
@blockmin 搞盗版的人的账号咋风控啊,应该不会蠢到所有书付费订阅都用同一个账号吧
NoOneNoBody
2023-07-15 20:42:41 +08:00
厉害,中国人真不缺点子 🐶
Ansen
2023-07-15 20:43:07 +08:00
@cairnechen 盗版都是你抄我,我抄你
huguadao
2023-07-15 20:43:53 +08:00
尼玛,还真是,搞得都么有看下去的欲望了
cairnechen
2023-07-15 20:46:19 +08:00
@Ansen 他的意思是,盗版网站通过付费订阅拿到最新章节内容,然后通过 OCR 之类的方式拿到文本,正版网站是通过风控找到这个付费订阅的账号,然后替换掉这个账号看到的章节内容,我说的是这个过程
yyzh
2023-07-15 20:47:00 +08:00
正版的防盗版措施吧。某点也是这样,某些字莫名其妙用了繁体的
blockmin
2023-07-15 20:57:33 +08:00
@cairnechen #4 标点符号,特殊字符,还有一些其他的方式检测的,盗版个几章就能定位到账号了,这个时候找客服申述,提供手持照就能解
Jirajine
2023-07-15 21:27:31 +08:00
这样搞不怕出现政治问题么,作者写了一句赞歌,你给他替换成了反义词,那怕不是要直接被举报了。
yfugibr
2023-07-15 21:30:06 +08:00
原站把对应的字符编码互换(所以盗版网站爬到的字是反的),同时把对应的字体外形也互换(所以原站上看起来是正常的)
iamee
2023-07-15 21:36:11 +08:00
如果你们爬过美团、大众点评等网站,就会发现这点反爬手段只能算是入门级~
rming
2023-07-15 21:46:24 +08:00
@yfugibr #12 好思路
Lightbright
2023-07-15 22:07:00 +08:00
@yfugibr 单个字符可以这样解释,但他这个还有词语的反义词
yfugibr
2023-07-15 22:16:15 +08:00
@Lightbright #15 具体没研究过,但是好像也能做到替换多个连续字符的显示内容。

见过一个编程字体,可以把 --> 替换成一个 ⇨,拆开时每一个字符都是正常显示,同理应该也能做到将”特殊“的字符编码作为一个整体显示为”普通“。
shinession
2023-07-15 22:21:01 +08:00
是的, 所以我很久没用过盗版的了, 而且它这个反义词还不是针对所有的, 有一定的比例, 全部替换也是读不通, 中国人鬼点子多
yfugibr
2023-07-15 22:26:54 +08:00
kkocdko
2023-07-15 22:35:48 +08:00
没人理会的 3 楼大概率是正解。
kkocdko
2023-07-15 22:36:12 +08:00
抱歉看到了,还是有人理会的 hhhhh

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/957035

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX