字体加密反爬虫对用户不友好

2019-03-05 15:58:51 +08:00
 liyuhang

点名批评美团、大众点评和天眼查。

一个是用户无法复制保存想要的信息,例如某餐厅的地址,某公司的信息。

一个是字体样式和正常字体不同,眼神稍微好点的应该能注意到。

5128 次点击
所在节点    程序员
17 条回复
keventseng
2019-03-05 16:49:47 +08:00
爬虫太猖狂~
ysc3839
2019-03-05 16:51:58 +08:00
我估计他们同时也想防止用户复制吧?比如天眼查这种数据。
kzfile
2019-03-05 16:54:00 +08:00
天眼查这种爬虫起家的公司反爬也是有一手的
Rehtt
2019-03-05 16:54:13 +08:00
其实真的有心爬的话是防不住的,截屏+文字识别
herozzm
2019-03-05 17:59:06 +08:00
他们爬了别人的数据 然后不想被人骗他们 好笑吧
herozzm
2019-03-05 17:59:24 +08:00
不想别人爬他们
liwl
2019-03-05 18:02:25 +08:00
@herozzm 你可以学习他们
Reficul
2019-03-05 18:03:06 +08:00
天眼查用客户端的接口去爬
crawl3r
2019-03-05 19:02:52 +08:00
字体加密破解起来也没那么难,去年就弄出来了,有兴趣可以看看我的文章 http://www.wisedream.net/2018/10/15/spider/font-encryption-decryption/。这玩意有点像 ctf,挺有意思的
forblackking
2019-03-05 19:28:41 +08:00
@crawl3r 哈哈是的,之前去爬某某之家字体加密真的有快感跟刷题一样,不仅每个字体有偏移量,最后还要丢进 PyV8 去跑出结果
hakono
2019-03-05 19:32:09 +08:00
如果不局限于爬虫而且需求没那么复杂的话,可以直接上 OCR 把文本扫出来
HughZadora
2019-03-05 22:19:47 +08:00
@crawl3r 404😑😑
gavindexu
2019-03-05 22:30:29 +08:00
@herozzm 某数字做杀毒的不也是不想被别人卸载吗……
stephenliubp
2019-03-05 23:03:50 +08:00
@Rehtt 增加成本,没有根本的措施
Mac
2019-03-05 23:22:07 +08:00
大数据是门生意,断人财路犹如杀人父母
davie
2019-03-05 23:39:49 +08:00
@Mac 总结到位
xiao38245
2019-03-06 14:02:39 +08:00
小程序啊,大部分小程序好像都没加密

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/541359

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX