如何采集漫画

2014-02-28 09:20:33 +08:00
 LINAICAI
说到底就是采集规则,采集漫画和采集图片一样吗。
2866 次点击
所在节点    问与答
5 条回复
kiah
2014-02-28 10:48:40 +08:00
一样的。。
zhy0216
2014-02-28 16:29:07 +08:00
一样的,
但最好自己写个model, 分好哪本漫画, 哪一卷这些数据,
然后在页面的model里存图片的url就好
LINAICAI
2014-02-28 16:55:35 +08:00
@zhy0216
是不是读取目标网页html内的特定节点然后记录到相应的model,这样的话,如何做到自动展开二级或者内链读取下级网页数据呢?
LINAICAI
2014-02-28 16:56:43 +08:00
@zhy0216 还有是有些分页数据怎么去,不可能每一页都去读取一次吧。
zhy0216
2014-03-20 10:33:05 +08:00
@LINAICAI
没太看懂你的意思
就是找到这个漫画, 这个漫画下面有很多卷
你把这些都存下, 然后再去爬每一个卷,
看这个卷的时候, 一方面都有下一页的连接, 所以你可以继续爬
另外一般的漫画站都是把页码数写在url上的, 你可以猜

不知道讲清楚没。。。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/102258

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX