想找个爬虫高手学习下

2020-01-16 16:01:32 +08:00
 huadaonan
主要目标是想学会爬 amazon,fb,淘宝,微博等大站,我觉得这几个站能搞定基本覆盖爬虫大部分知识了。
有大神或者培训机构推荐吗。多谢 qq 805709000
5948 次点击
所在节点    Python
35 条回复
scyangjian
2020-01-16 17:22:35 +08:00
17L+1
淘宝太凶残了
yumenlong
2020-01-16 17:23:37 +08:00
我在爬淘宝,来吧,只有 app 一条路。
VermouthcZzz
2020-01-16 17:25:34 +08:00
面向监狱编程🐴
Vhc001
2020-01-16 17:30:10 +08:00
1、从未爬过淘宝。
2、正常淘宝购物都被识别为爬虫的我迫不得已只能注册了京东账号。
3、京东电脑网页版登陆,验证码滑块划了十分钟几百次还是验证不通过,被迫下载京东 app 扫码才能登陆。

我太难了
XavierXJ
2020-01-16 19:09:43 +08:00
这样一种思路:让软件模拟鼠标点击,截图桌面分析文字和图片,想要多线程的话,浏览器多开,开虚拟机
no1xsyzy
2020-01-16 19:38:53 +08:00
@XavierXJ 最后三个分句铁定没了
分析鼠标路径已经是至少 5 年前的技术了,鼠标疯狂瞬移直接拜拜
Eugene1024
2020-01-16 19:46:13 +08:00
随便学下法律
explorerEX
2020-01-16 20:17:24 +08:00
@fancy111 哪两种方法 能提示下吗
wersonliu9527
2020-01-17 10:01:56 +08:00
如果数据量不是太多,几个月前用过一种方法爬淘宝. 命令行开启一个 谷歌浏览器指定端口,再登录个小号,然后 selenium 去对接这个端口可以爬几十页.不知道现在还行不行0.0
Mavious
2020-01-17 10:40:50 +08:00
咸鱼(搭配手机浏览器)和淘宝 PC 端,人肉浏览都经常蹦滑动验证码,用鼠标去滑老是失败(我明明滑到底了)。
你看正常用户都经常失败,那爬虫的难度真是不可想象……
RSDTE
2020-01-17 12:54:05 +08:00
爬了淘宝, 能下单的那种.. .
Iamnotfish
2020-01-18 00:04:26 +08:00
降低点难度,先从微博开始爬。现成可用的代码也很多,推荐一个项目 weibospider
FaceBug
2020-01-18 15:02:59 +08:00
哈哈哈,你来我这干活啊,靠抓 amz、fb、aliexpress、ebay……吃饭的公司
huadaonan
2020-01-19 13:28:45 +08:00
@cepczkd 可以啊。我是自带专家级别 dba 技能
huadaonan
2020-01-19 13:31:27 +08:00
多谢大家踊跃出谋划策,我会阶段性汇报学爬虫的进展。我觉得可能还是做专项分析靠谱,针对问题找大家咨询。群策群力还是好

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/638472

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX