关于这个想法的指导

2017-05-25 23:01:37 +08:00
 vzlf

有这么个想法,比如我用 github 的 issues 来写 blog,现在我想把我的 blog 文章给爬取下来,整合成一个静态的博客网页。(加速访问速度) 这样的话,是相当于做一个爬虫么?并且在 issues 修改后,能同步的修改这个“镜像站”的内容 (第一阶段我准备就做个定时器,定时爬取,后面查查看 github 应该有这方面的 api 吧?再完善下。)

我想,第一步我应该是要先学习怎么写个爬虫吧,不知道 v 友有没有这样的爬虫小 demo 给一个参考,或者相关的文章指导一下。

Java 最好了,别的语言借鉴也行(我知道 python 有很多,也很方便,不过主要是想借着这个项目的机会来锻炼下 javaweb 的= =,多谢 V 友了

1321 次点击
所在节点    问与答
1 条回复
vzlf
2017-05-26 12:32:59 +08:00
怎么都没有 v 友呢....

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/363859

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX