看到好多爬虫于是我也写了个爬 tumblr 的来骗回复和 star,丢 API

2016-10-29 03:19:15 +08:00
 lc4t

https://github.com/lc4t/tumblr_download

刚刚无聊写的0.0 可以挂着爬一波了。。

pip3 install lxml gevent PySocks

Usage: tumblr.py [options]

Options:
  -h, --help            show this help message and exit
  -s SITES, --sites=SITES
                        sites split with ',', example:2013117,66666
  --type=TYPE           [photo|video|both]
  --thread=THREAD       threads

can be changed in source file:
RETRY: retry times, default 1
PROXY: because G.F.W must use proxy
TIMEOUT: time to wait net IO

example:
  python3 tumblr.py -s 2013117,66666 --type=both --thread=10

API:
  http://{site}.tumblr.com/api/read?type={photo|video}&num={pagesize}&start={start}

居然有蚊子,还没被冻死。。成都今天好冷

3125 次点击
所在节点    Python
3 条回复
tumbzzc
2016-10-29 09:14:09 +08:00
你进小黑屋了,比我晚发的帖子,反而时间比我还早
lc4t
2016-10-29 10:14:07 +08:00
@tumbzzc 啊?
lc4t
2016-10-29 17:08:59 +08:00
收藏比回复多系列..

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/316357

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX