伪电工写了一个简单的程序将新闻类网站转成RSS,有一点问题:
1.目前是定时抓取,每次都会解析一遍首页和各文章网页,很多都是重复劳动。如何简单有效地判断某文章是否已经抓取过,从而避免重复抓取?
2.生成的RSS需要包含所有的文章吗,还是只要包括最新的几条就行?如果是后者,那么RSS阅读器是否可能漏掉一些老文章。
3.有什么更好的方法能实现即时推送到手机?除了RSS以外。
谢谢!
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.