为什么 readhub 就可以爬大站，而不吃免费饭？

2020-12-02 09:49:53 +08:00

i4oolish

如题，readhub 数据是爬虫爬的，还是 rss 获取的？有人关注研究过 readhub 的数据来源吗？

1324 次点击

所在节点

5 条回复

TimePPT

2020-12-02 09:59:48 +08:00

都有可能，这个除了内部人谁能说得清。
其实爬虫也好 RSS 获取也好都是灰色地带，有几条红线别碰一般站方不刻意整你都没啥关系。

1. 别把人站点爬瘫了，造成经营问题
2. 别无授权全文转载
3. 别未经用户允许爬取个人隐私数据，特别是别商用。

对比下 Readhub，你看看哪条触红线了？

wildnode

2020-12-02 10:10:33 +08:00

我记得 ReadHub 不是跳转到源站观看吗？

gesse

2020-12-02 10:15:22 +08:00

readhub 只是个索引，而且本身冯大辉和他公司应该也有相关都公关操作。

i4oolish

2020-12-02 10:37:23 +08:00

@TimePPT 你说的这几点确实都没有，我比较好奇的是，即使没碰这几条红线，是不是找你的话你也肯定兜不了，还是说，通过其他什么方法规避，可以规避法律漏洞。

TimePPT

2020-12-02 11:23:38 +08:00

@i4oolish 如果硬找茬基本上协商解决，要么合作要么赔钱然后停止抓。判例可以看下当年传统媒体和门户跟诉头条的几个 case

第 1 页／共 1 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.