代友请教:国外的 RSS 网站 Feedly 的订阅源标签管理是如何实现的?难度大吗?

2017-08-22 05:38:26 +08:00
 starvedcat

在做一个资讯聚合和推送的产品,后台抓取了大量的订阅源。但是很多网站的内容都不是单一类别的,而是涉及了很多领域。(比如一个娱乐杂志的网站既有八卦消息,也有专业的影视资讯)这种情况下,订阅源的分类管理上就比较麻烦。

  1. 如果按照大的类别划分,感觉太过笼统,一个类别下的订阅源数量会太多,使用者很容易看不到想要的东西;
  2. 如果细分成各种垂直领域的子类别(如把娱乐细分成影视、音乐、八卦消息等等),这样划分的类别可能又无法穷尽;

所以,想要考虑让使用者自己去自定义订阅源类别的方法,然后发现 Feedly 上采用了类似的管理方式: Feedly 网站上可以用户自己搜索标签(#topics ),然后搜索的结果显示的是一连串被打上了这个标签的网站订阅源(这些网站可能同时也有别的标签);用户可以把某个订阅源网站添加到现有的类别里,也可以自己再新建一个类别添加进去。(见附图)

我自己感觉上可能是类似今日头条那种先用机器算法给文章打标签,然后再一起入库的方式。但是不知道这种网站订阅源适不适用?或者说需要让编辑人工去给这些网站订阅源打标签?

(代友发帖,以上为复制粘贴)

3039 次点击
所在节点    编程
2 条回复
starvedcat
2017-08-22 05:43:16 +08:00
代同学问的,她对编程不太懂,想知道这个“订阅源标签管理”的功能实现起来难度大不大?
就我个人 naive 的观点,感觉难度不大。但我也不敢妄下结论,还是想请教一下更有经验的诸位,谢谢!
whileFalse
2017-08-22 09:22:21 +08:00
很可能是 feedly 抓取用户给订阅源打的标签,综合一下。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/384715

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX