关于论坛 rss 新主题源

26 天前
 s1xu

来了挺久了一直潜水,最近在写 tg 推送 rss 的东西,想追下论坛最新的帖子

现在是抓取的 https://www.v2ex.com/index.xml 这个地址,但是有新回复也会推送

我的需求是,只要新主题,请问各位有没有这个源?

9771 次点击
所在节点    V2EX
27 条回复
s1xu
26 天前
@fydss 不是,点进去第一条,发布时间是 9 个小时 5 分钟前
fydss
26 天前
@s1xu https://www.v2ex.com/feed/tab/all.xml 我把楼上老哥的地址改了一下,还真是可以访问的 XML ,乐
s1xu
26 天前
@fydss 但是这个 table 推送的也不是最新发送的主题哈哈哈
NewYear
25 天前
这说明你抓取的不对,RSS 的<id>就是每个主题的唯一值。不会变化的,不要光靠 URL 来做判断,而且你自己抓取的话,也可以去掉#后面的内容。


@s1xu
@0o0O0o0O0o
0o0O0o0O0o
25 天前
@NewYear #24 #15 我看了下,v2ex 的 RSS 是有 ID 的,是我记错了

遇到过有的 RSS 不带 ID ,RSS 工具就会自己算 id/guid , # 后面的内容也会被带进去计算
s1xu
25 天前
@NewYear 主要是想做一个通用的,直接解析 title 和 link
NewYear
25 天前
@s1xu

这一块我之前也研究过,甚至报告过 feedly 错误处理的问题。加上后来自己想做个 rss 阅读器所以比较清楚。

<id>就是最通用的,是规范。
另外你要用自己的算法判断唯一,也可以用“标题”+“内容”做一个 hash 。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1046281

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX