想系统的学一下爬虫,各位大佬有没有比较好的,比较系统的教程,最好是从零开始。

2021-05-27 10:26:44 +08:00
 zror
开始用 selenium 感觉还挺好用的,我说那就爬爬淘宝,然后刷一会就被淘宝限制了。网上反爬的教程一大堆,也不知道哪些是可行的。
后来又发现有 Puppeteer 个东西,v 友有爬虫大神能分享点教程么 谢谢了
6035 次点击
所在节点    Python
33 条回复
tsuih
2021-05-27 15:01:49 +08:00
秒杀建议写浏览器插件跑
0044200420
2021-05-27 15:46:15 +08:00
爬虫写得好 牢饭吃得早
Yeen
2021-05-27 15:54:02 +08:00
爬虫主要就是在反抓取和反反抓取的轮回里醉生梦死
zjsxwc
2021-05-27 15:55:26 +08:00
爬大众点评试试
7075
2021-05-27 15:59:38 +08:00
爬虫这东西,如果做好了,来钱很快。但是做好很不容易。上帝是公平的。
lopetver
2021-05-27 16:01:29 +08:00
崔庆才的博客是个好地方
cdlnls
2021-05-27 21:15:01 +08:00
爬虫说简单也简单,说难也难。简单的模拟接口请求数据就行了,难的就有一堆东西,JS 要熟悉、人机验证、代理调度、数据清洗储存、逆向,还有性能,这里哪一块都能深入。
godblessumilk
2021-05-28 02:06:06 +08:00
秒杀可以写浏览器油猴插件脚本啊,爬虫正面刚,估计不可
zror
2021-05-28 13:40:13 +08:00
@godblessumilk 油猴我写了,但那个店铺的商品是不定时上架的,不是正常套路的秒杀。用油猴刷不出来商品上架了
zone10
2021-05-28 14:24:45 +08:00
爬虫学点简单的确实有意思, 爬爬盗版小说, 小电影之类的. 如果是全职的话我是来劝退的, 一来容易入狱不说, 二来和反爬的不断内卷死磕, 相互加大对方的工作难度, 想想何必呢, 程序员何苦为难程序员
ritaswc
2021-05-28 17:36:35 +08:00
真的!从 《网络安全法》学起!真的认真的 ~ 不要问我为什么?我是一个有故事的人!
DeWjjj
2021-05-28 22:27:01 +08:00
反扒其实是个体力活,每次要解决不同程度的数据欺骗和数据混淆。
ch2
2021-05-29 09:47:57 +08:00
爬虫最难的就是反制,反制没有系统的学习方法,你必须至少达到跟对面同等的技术水平才能有效解决对方的反制,但是你那么牛逼的话干啥都比干爬虫强

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/779500

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX