大佬们,爬虫遇到高级验证码怎么办

2019-05-11 21:33:34 +08:00
 Tezos
无论什么语言或者框架 爬虫对于那些复杂度较高的滑动验证码 或者 reCAPTCHA 这种 是不是只能通过收费打码平台来实现?如果成本不允许那么就只能 game over 了?
3557 次点击
所在节点    Python
9 条回复
designer
2019-05-11 21:53:49 +08:00
这个头像是随机生成的还是你改造的。挺像狗头
Tezos
2019-05-11 22:08:43 +08:00
@designer 系统生成的
Windelight
2019-05-11 22:15:22 +08:00
reCAPTCHA 的话 v3 暂时无解,v2 的话可以用语音无障碍验证,然后再转文字输进去,v1 的网站基本绝迹了。国内的几家主要滑动验证码提供商怎么滑网上都有,另外根据你的描述并不知道什么是"复杂度较高的滑验",是得模拟真人拉动,还是你的爬虫卡不了位?
Tezos
2019-05-11 23:37:26 +08:00
@Windelight 滑验这个搜了一下确实有解决方案 之前还碰到那种出九宫格选项让你选择的 人工点实在费劲。
binux
2019-05-11 23:46:06 +08:00
又不贵,1000 个才不到 $2
danmu17
2019-05-13 17:37:28 +08:00
好奇什么数据价值那么低又值得去爬,还是说一直都用免费的黑服务器所以从来没有过支出所以不能接受?
zibber
2019-05-14 17:03:16 +08:00
能不能用 cookie 池 跳过验证
Tezos
2019-05-14 21:29:30 +08:00
@zibber 貌似 不能
AmberJiang
2019-05-15 10:22:53 +08:00
所以有实例吗?最近我也弄验证码这个

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/563228

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX