郁闷,折腾了一周的爬虫

75 天前
 guoguobaba

辛辛苦苦解码 js ,绕开反爬机制,结果他认证的时候加了个手机实名,我艸。

4536 次点击
所在节点    Python
28 条回复
llbqwhtxi
74 天前
之前用 selenium 玩页游来的,最近一打开就被 403,要弃坑了(主要是不会"反爬")
incubus
74 天前
@xinghusp 细说
Daybyedream
74 天前
控制频率= = 不公开 是最后的温柔
linxb
74 天前
@ospider #3 啊,这言论是什么立场,合着放开让你随便爬才是法治是吧
guoguobaba
74 天前
@somebody1 我指的破解 js ,是屏蔽他对 selenium 之类自动化工具的检测。你去看看瑞数是怎么干的吧。
naythefirst01
74 天前
想起之前一些 app 的反爬 就是强制登录。。。 简单有效
xinghusp
74 天前
@incubus 改天我写个帖子详细的介绍,这事情一两句说不清。。反正就是爬虫的入罪门槛非常低,只要:1.你没明确得到对方同意(签协议的那种同意,公共网页也不可以); 2.你尝试绕过了任一反爬措施(包括但不限于验证码、代理、JS 混淆等等); 3 、获利大于 5000 元。达成上述三个条件,就可以追究刑事责任了,哪怕对方不报警。
duansindo
70 天前
我这边需要抓取外国网站的数据,能做的联系我 https://t.me/githubaa

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1067921

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX