已经受不了抽风的 rss 阅读了,打算买个主机自己来抓取。

2015-10-27 19:06:07 +08:00
 yech1990

求推荐合适的开源方案。

需求如下:

1 ,网页端和移动端最好都能完美支持。

2 ,基于 python 的,这样可以自己做一些修改,也能和爬虫比较好的对接。

3 ,可以自定义抓取规制,对一些源提前抓取全文。

4 ,能加 star 或是一键保存到 evernote 之类。

5 ,不能太卡,初步预算也就是 RAM=250MB 的主机。

6 ,支持用户数量=1 ,即可。

重度 RSS 用户,自从 google reader 死掉后就各种揪心。
所有决定自己抓取,自己阅读。
不知道这么做的人多不,请问有什么合适的方案可以推荐?
以上 6 条重要性依次降低,不需要全部满足。

6598 次点击
所在节点    Linux
30 条回复
vibbow
2015-10-27 19:13:32 +08:00
tiny tiny rss
Mac
2015-10-27 19:18:41 +08:00
我靠,你这属于嫌邮局送报纸慢,自己开个书报亭
youling
2015-10-27 19:33:10 +08:00
QQ 邮箱-阅读空间
Acirno
2015-10-27 20:32:17 +08:00
tiny tiny rss
stanhou
2015-10-27 20:33:26 +08:00
为什么不用最好的语言?
yech1990
2015-10-27 20:54:47 +08:00
@vibbow 挺好的,不过看到挂掉的主页和 php 顿时内心一凉
yech1990
2015-10-27 20:56:39 +08:00
@Mac 不怪邮局,只怪我和邮局之间有一道高高的墙
eoo
2015-10-27 21:42:35 +08:00
为什么不用最好的语言呢?
mimzy
2015-10-27 21:49:46 +08:00
NewsBlur https://github.com/samuelclay/NewsBlur

说实话我觉得用 InoReader 可以很省心
hack
2015-10-27 21:51:42 +08:00
Feedly 付费用户路过,买买买,别客气
yech1990
2015-10-27 22:06:06 +08:00
@hack
@mimzy
不是服务质量的问题,是连接速度。
教育网 inoreader 已经无法正常打开了,电信用户打不开也是分分钟的事。。。
hack
2015-10-27 22:21:49 +08:00
@yech1990 把一切交给 feedly 吧
mimzy
2015-10-27 22:25:08 +08:00
@yech1990 你还不如买个好点的服务器搭 ss …我看你之前的帖子 ss 是放在搬瓦工的 那个慢的话试试位置在日本新加坡或者香港的 VPS 呗…
yech1990
2015-10-27 22:42:46 +08:00
@mimzy 已经用上 ss 。不过。。。
一方面阅读内容包含一些文献,得用教育网才能打开,大部分时间是不能开 ss 的。
另一方手机和几台电脑来回切换,对同步的速度要求很高,延时造成了很多 feed 重复读了好几遍。

第一个的话尝试了在路由设置规制,不过好像都比较弱,只能是 ignore list 的形式,到现在都没搞定类似 pc 客户端的 pac 模式,严重影响使用,每个终端去调试的话太花时间,规制一直会变。。。所以顺便问下路由的 ss 怎么设置 pac 模式。

第二个的话我觉得 feedly 同步这一块即使网速给力也十分弱的,比起几年前的 google 还是差了几条街。
vibbow
2015-10-27 22:43:43 +08:00
@yech1990 首页没挂啊
mimzy
2015-10-27 23:17:03 +08:00
@yech1990 我之前电脑上的 Inoreader 一直是配合 Android 手机上的 News+ 在看 没太注意过同步速度的问题 然后就是只有 Inoreader 走 Chrome 的代理 别的不用管啊 路由器这块不了解

话说 难道说在 RSS 阅读器里看到的订阅内容也得走校园网么 文献的网址设置规则不走 ss 不就行了?没太理解是怎么回事……
hljjhb
2015-10-27 23:50:33 +08:00
Tiny Tiny RSS

基于最好的语言

网页端和移动端最好都能完美支持。

feediron 插件,可以自定义抓取规制,对一些源提前抓取全文。

能加 star 或是一键保存到 evernote 之类

速度不快,然而虚拟主机也可以运行

支持单用户模式
Moker
2015-10-28 00:11:52 +08:00
推荐下 pyspider 爬虫....vps 是学生的话就很便宜了
yech1990
2015-10-28 00:25:00 +08:00
@mimzy 有些源比较奇怪, 1.爬了学院的新闻,必须的是教育网才能取成功。 2.文献不是教育网只能抓到个标题,点击全文的话必须是教育网才能点开
yech1990
2015-10-28 00:34:16 +08:00
感谢各位 feedly 的粉丝。。。
重度的 RSS 用户了, feedly 功能还是太弱,即使是付费用户。另外搜索自己的订阅居然要收费,这个我是完全抵触的。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/231531

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX