写了一个生成反 OCR 图片的工具

2023-05-05 04:58:43 +08:00
 nanwangjkl
目前来说在贴吧发帖是没问题的,但是微信的准确率还是很高,大家有什么思路吗?



https://github.com/nanwangjkl/anti-ocr
4957 次点击
所在节点    分享创造
39 条回复
LeegoYih
2023-05-05 14:34:53 +08:00
不清楚数字水印会不会影响
LancerComet
2023-05-05 14:35:01 +08:00
个人测试过 GIF + 分割帧渲染效果还可以
但这种如果要防也很好破
air00dd
2023-05-05 14:39:36 +08:00
air00dd
2023-05-05 14:42:31 +08:00
╔═╤═╤═╤═╤═╤═╤═╤═╤═╤═╗
║卝│卝│卝│卝│卝│卝│卝│卝│卝│卝║
║那│有│它│而│中│何│他│奖│而│进║
║卝│卝│卝│卝│卝│卝│卝│卝│卝│卝║
║,│没│解│然│传│任│于│尔│,│走║
║卝│卝│卝│卝│卝│卝│卝│卝│卝│卝║
║念│就│理│┊│自│有│关│贝│儿│你║
║卝│卝│卝│卝│卝│卝│卝│卝│卝│卝║
║概│你│正│﹁│的│没│经│诺│事│带║
║卝│卝│卝│卝│卝│卝│卝│卝│卝│卝║
║个│么│真│。│他│,│正│的│的│是║
╚═╧═╧═╧═╧═╧═╧═╧═╧═╧═╝

╔═╤═╤═╤═╤═╤═╤═╤═╤═╤═╗
║┊│┊│┊│┊│┊│┊│卝│卝│卝│卝║
║┊│┊│┊│┊│┊│┊│曼│如│向│某║
║┊│┊│┊│┊│┊│┊│卝│卝│卝│卝║
║┊│┊│┊│┊│┊│┊│费│﹂│能│释║
║┊│┊│┊│┊│┊│┊│┊│卝│卝│卝║
║┊│┊│┊│┊│┊│┊│┊│:│不│解║
║┊│┊│┊│┊│┊│┊│┊│卝│卝│卝║
║┊│┊│┊│┊│┊│┊│┊│过│你│人║
║┊│┊│┊│┊│┊│┊│┊│卝│卝│卝║
║┊│┊│┊│┊│┊│┊│┊│说│果│别║
╚═╧═╧═╧═╧═╧═╧═╧═╧═╧═╝
Yeen
2023-05-05 15:15:19 +08:00
盲水印可以试试。端到端加 /解水印
Drumming
2023-05-05 15:31:12 +08:00
有用,推广引流好使。
iminto
2023-05-05 17:23:46 +08:00
20 多年前吧,Java 特效还很流行,看到过有人用 java awt 做验证码的 gif 特效,做的雪花散落堆放效果,感觉这种效果对人友好,OCR 还不好识别
sadfQED2
2023-05-05 17:42:40 +08:00
你这不就是验证码吗,加干扰线,加旋转,加颜色,然后就是字体粘连。

最终结果就是人和机器都不认识了。如果机器根据你的数据做针对性训练,那么最终结果就是人不认识但是机器准确识别
metalvest
2023-05-05 19:02:06 +08:00
@LancerComet 多加些变化就不好破了,对每种变化要分别处理
OnceUponATime
2023-05-05 19:42:51 +08:00
我有个想法:每个字随机分配 4 种颜色中的一种,然后设置字间距 d=-0.5*字宽。 这样每个字的前半部分会遮住前面一个字的后半部分。因为大脑会自动填充被遮挡住的部分,所以应该不会影响阅读。
iorilu
2023-05-05 20:57:12 +08:00
微信肯定是 ai 学习识别, 人工打标, 弄几个就能认了
gam2046
2023-05-06 11:09:48 +08:00
上深度学习的文字识别,在纯图形领域基本上已经无解了。但依旧可以对某一个特定的深度学习模型进行攻击,以达到不影响人类阅读,但是机器无法识别。但这种攻击很难做到通用性,即对于不同的模型均产生攻击效果。

同时这种攻击手段也需要大量的数据用以验证,生产环境其实很难达到。
Cyrix686
2023-05-06 11:32:40 +08:00
将文打字乱排组列合,不并影阅响读,就算识出别来,机不器知准道确内的容。
S1ngleton
2023-05-06 16:24:25 +08:00
我之前也写过一个,参考一下我这个如何? demo 界面丑了点,但是可以用。
我增加了旋转,干扰线等
https://github.com/Leisurelybear/ocr-bye
raykle
2023-05-06 17:20:30 +08:00
为什么要反?
nanwangjkl
2023-05-08 11:29:31 +08:00
@raykle 主要是为了在贴吧发锐评,哈哈,当然也会有人拿去发广告
500
2023-05-08 17:32:43 +08:00
两种思路,一种是如何让 OCR 无法识别图中的文本;一种是如何让 OCR 识别不到正确的文本。
相较而言第二种更好实现:

https://s1.ax1x.com/2023/05/08/p90SzJU.png
OnceUponATime
2023-05-25 22:25:13 +08:00
dagou
2023-07-17 10:39:39 +08:00
在 utools 里发现一个类似功能的插件,叫反 ocr 。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/937406

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX