例如用多个地区的 ip 地址,模拟自然人访问某个网站,注册账号。需要绕过反爬虫和机器人识别。
有没有库推荐?
1
Kilerd 2018-11-28 16:20:14 +08:00
https://github.com/kennethreitz/requests-html
试试这个? 不行就用 headless 来实现咯 |
2
EvilCult 2018-11-28 16:21:55 +08:00
菜鸟表示能想到的最简单的就是
python + Selenium 使用 chrome driver 设置--proxy-server http 代理 |
3
kljsandjb 2018-11-28 16:25:17 +08:00 via iPhone
chrome headless ?
|
4
jydeng 2018-11-28 16:27:33 +08:00
puppeteer
|
5
zr8657 2018-11-28 16:27:37 +08:00
selenium,最近发现代理 ip 真是贵
|
6
onedayoneapple 2018-11-28 16:28:54 +08:00
@zr8657 有好的 ip 推荐吗
|
7
q4336431 2018-11-28 16:51:19 +08:00
selenium+phantomjs,只不过 ip 这个不好处理,代理是真滴贵
|
8
zr8657 2018-11-28 17:58:46 +08:00
@onedayoneapple 我自己买的最便宜的 60 一个月 1000 条,但是速度很慢,1M 带宽都不到,我也想找更便宜的。。有大肘子科普下为什么这么贵吗
|
9
andylsr 2018-11-28 18:01:18 +08:00 via Android
adsl 服务器
|
10
yanjieee 2018-11-28 19:16:12 +08:00
我觉得主要资源是 IP,以前买过美国的 private proxy,一个月 5 美元,速度非常快。
|
11
akira 2018-11-28 19:44:58 +08:00
这个不是某一个库可以做到的事情吧
|
13
Daveedo 2018-11-28 22:35:27 +08:00
ip 代理去买就行了。几块钱买 500 个
|
14
takato 2018-11-28 22:47:47 +08:00
如果对方对抗措施充分,完成这个就至少需要良好的数学和统计学功底。。。
可能一般的库或方法是不行哦。。 举个子问题的例子:如何用 code 控制鼠标光标的移动轨迹,使其符合人类使用物理鼠标移动光标的特征。 |
15
clap3times 2018-11-29 16:08:18 +08:00
有个爬虫私活,有人感兴趣吗
|