请 tuicool.com 网的朋友不要全文抓取我 blog 的文章

2014-03-10 13:27:39 +08:00
 yanng
可以使用链接,但全文抓取商业使用,我觉得不好,还请以后不要这么做了。之前好像看到过这个网站的招聘,另外想看看大家怎么看这件事的,全文抓取,对原作者没有任何好处的,好像有点没劲。
(to推酷的朋友:我的个人资料里有博客地址)
3674 次点击
所在节点    分享发现
10 条回复
levan
2014-03-10 13:39:56 +08:00
这个应该去ruby china 发 他们应该在那
Livid
2014-03-10 13:40:42 +08:00
loading
2014-03-10 13:44:31 +08:00
太可耻了。
Mihuwa
2014-03-10 14:01:28 +08:00
yanng
2014-03-10 14:07:42 +08:00
@Mihuwa 原来不止我一个人的网站被抓取,个人觉得抓取作为个人使用没问题的,搜索引擎都不会全文拿去,商业网站更不能这么做。
hadoop
2014-03-10 14:28:58 +08:00
还有一个 博客聚合站也是,巨讨厌,抓了之后还会把里面一些链接换成自己的
FarBox
2014-03-10 19:56:39 +08:00
@yanng 很抱歉,这个我们甚至都帮不上忙。原本想增加一个用户自定义的user-agent过滤,但我在nerdyang.com的访问日志里,找了半天,没有找到tuicool的user-agent……
yanng
2014-03-10 20:59:16 +08:00
@FarBox 这么高大上的技术,没什么,他们看到了相信会处理的,另外一个帖子的人都给删掉了。
yanng
2014-03-11 11:22:56 +08:00
请 @guiquba 及时处理一下。
kernel1983
2014-03-11 16:53:16 +08:00
同意, http://simple-is-better.com/ 也喜欢全文抓

还是要推荐 http://news.pychina.org/ 这种形式的玩法

笑而不语:)

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/103640

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX