大家用 python 都做过什么有趣的爬虫吗?

2015-09-10 19:31:03 +08:00
 tooweakchen

大家用 python 都做过什么有趣的爬虫吗?分享分享呗!

26044 次点击
所在节点    Python
97 条回复
leavic
2015-09-11 10:54:00 +08:00
爬 javbus 上的 av 封面
codeforlife
2015-09-11 11:04:16 +08:00
我爬的一个 xx 论坛的某个专区,每次种子更新了自动下载。。
sinosure
2015-09-11 11:13:09 +08:00
把感兴趣的公众号的当天更新爬到一个 feed 里面算么
liaa
2015-09-11 11:20:45 +08:00
@mckelvin so...Where is the code.
ljdawn
2015-09-11 11:26:49 +08:00
@liaa so...Where is the url.
lxy
2015-09-11 11:36:30 +08:00
爬某网站数据,做数据分析后发现一些不可告人的秘密,公布出来后成功引发一场论战……
还有就是一些网站不慎泄露的用户数据,密码、邮箱之类的。
imn1
2015-09-11 12:13:58 +08:00
爬北都集团
sun2920989
2015-09-11 13:54:36 +08:00
PHP 简单写了个最简易的 爬美女图。。。。
fish267
2015-09-11 14:06:56 +08:00
codercai
2015-09-11 15:03:24 +08:00
@mckelvin 哈哈哈,学以致用,求源码
Aresn
2015-09-11 15:43:39 +08:00
第一次写爬虫,把一个竞聘的所有文章( 10 万+)全部爬来了,不知道这数据都是几手的了。。
bullettrain1433
2015-09-11 15:56:40 +08:00
@codeforlife 求共享
iamnuomi
2015-09-11 16:01:34 +08:00
@sinosure 这是怎么做的?有代码吗?
truehyp
2015-09-11 16:08:56 +08:00
爬过学校图书馆自己借阅过的书。噢,主要是为了可以无限续借书,顺带爬了书单。
zhouquanbest
2015-09-11 16:17:30 +08:00
1024 的算么
fakir
2015-09-11 16:43:54 +08:00
把拉钩,内推,IT 桔子上爬了二十万职位信息和五万多家公司信息, 结果发现拉钩数据存在造假呀
BUPTGuo
2015-09-11 16:51:10 +08:00
@sinosure 公众帐号怎么爬?源是哪?
sinosure
2015-09-11 17:12:08 +08:00
idblife
2015-09-11 17:28:37 +08:00
@mckelvin
求代码
idblife
2015-09-11 17:29:34 +08:00
@fakir
怎么造假了?另外我觉得拉钩很不靠谱

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/219769

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX