哪些反爬技术大家没能爬过去?来来来,我先说

2020-10-10 16:29:40 +08:00
 supermoonie

1 、APP 开启了 HTTPS 证书双向认证且 APP 经过加壳加固

2 、基于跨浏览器指纹识别技术的风控

3 、基于深度学习的鼠标轨迹分析

2454 次点击
所在节点    互联网
18 条回复
songjiaxin2008
2020-10-10 16:35:55 +08:00
cpws
songjiaxin2008
2020-10-10 16:36:26 +08:00
主要是 瑞数 和 sojson
cccp2020
2020-10-10 16:39:43 +08:00
记得携程还是哪里,修改了字体里数字的显示顺序,网页 dom 元素中和实际的不一样,直接下毒一样
wzzzx
2020-10-10 16:51:10 +08:00
@cccp2020 #3 这种很好解决丫,做一下替换就好拉
x86
2020-10-10 16:59:03 +08:00
有些股票的,你抓的结果有细微的偏差的你就很头疼
lazyrm
2020-10-10 17:08:01 +08:00
@wzzzx #4 不是简单的替换,每次都是生成一个字体文件,天眼查吧,似乎还是这样
supermoonie
2020-10-10 17:14:49 +08:00
@cccp2020 我遇到过,直接 ocr 盘它,哈哈
est
2020-10-10 17:15:49 +08:00
不做反扒。只随机返回假数据。
supermoonie
2020-10-10 17:16:52 +08:00
@x86 确实头疼,爬下来的数据比较难做准确性检验,也不知道爬的对不对……
supermoonie
2020-10-10 17:18:27 +08:00
@songjiaxin2008 你说这家用到的技术基本上是我列举出来的吧,之前分析过,浏览器指纹技术用的比较多
supermoonie
2020-10-10 17:19:05 +08:00
@est 那你总要区分哪个是爬虫吧🌚
cccp2020
2020-10-10 17:21:46 +08:00
@wzzzx 是的,不注意的前提下是有迷惑性的


@supermoonie 你厉害
kindjeff
2020-10-10 18:02:50 +08:00
以前贴吧就做了什么鼠标轨迹的东西,就是把发帖前一段时间鼠标的坐标值记录下来,然后 post 的时候带着这个作为参数。看起来很高级。

然后实际上你可以一直重复用同一个轨迹数据就能过掉。
supermoonie
2020-10-10 18:10:45 +08:00
@kindjeff 哈哈哈,我遇到过,那种看起来吓人,其实很简单,一直传同一种就行
crab
2020-10-10 18:17:05 +08:00
淘宝支付宝 UA
supermoonie
2020-10-10 19:56:51 +08:00
@crab 只知道淘宝的那个滑块很难,你所说的是?能详细说下吗🌚
mmdsun
2020-10-10 21:52:01 +08:00
Google reCAPTCHA v3 有没有过的思路。之前这个卡了好久
supermoonie
2020-10-11 07:25:19 +08:00
@mmdsun 有没有试过类似 VMLogin 之类的浏览器?就是价格过于美丽

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/713711

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX