萌新边学边写、基于 Python3 的 Yande.re 图片爬虫

2017-03-07 22:56:58 +08:00
 mokeyjay

Yande.re 图片爬虫

前言

每天打开电脑第一件事,就是打开Y 站,看看又更新了哪些图片、其中又有哪些适合作为壁纸

日久天长,总会感觉浪费时间精力,每天都要在一堆图片里找 PC 壁纸

这可不符合我作为一个码农的身份

正好最近想学学Python3,于是一边看着廖学峰的 Python 教程一边撸出来这个项目。写得很差,轻喷

本项目基于Win7Python3.5.2开发,其他环境下未测试

功能

如何使用

必须 编辑Function.py5行,将该变量的值设为自己想要的目录,程序将会自动创建,路径必须以斜杠结尾

例如某图片的详情页 Url 为:https://yande.re/post/show/346737,则图片 id 为346737

然后命令行执行python index.py即可( Windows 下)。 Linux 下可直接执行

注意事项

值得一提的是,无论使用哪种方案运行,last_start_id.data的内容都会被自动修改为爬取到的第一张图片的 id

这样做的目的是为了实现方案二,相当于每次执行都只从新增的图片中爬取。比较适合设置为自动运行之类的

项目地址

https://github.com/mokeyjay/Yandere-crawler

2855 次点击
所在节点    Python
4 条回复
menduo
2017-03-07 23:24:21 +08:00
酷!
fengxiang
2017-03-07 23:28:12 +08:00
mokeyjay
2017-03-08 08:23:09 +08:00
@fengxiang 我在写这个程序的时候也注意到了……并发会导致被禁止访问一阵子,所以最终成品是单线程的……跟我手动访问也差不多啦
green68599
2017-03-08 14:14:21 +08:00
66666666,大神给跪

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/345723

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX