国内这么多采集器,造就了大量的垃圾站,国外有没有人用采集器,有没有这种现象?

2012-11-23 16:38:12 +08:00
 sohoer
8748 次点击
所在节点    问与答
20 条回复
l0wkey
2012-11-23 16:42:10 +08:00
有。
sohoer
2012-11-23 16:44:12 +08:00
@l0wkey 那你知道有什么采集器吗?我就是不会搜,找不到
soudesuka
2012-11-23 16:47:28 +08:00
外国的普世价值不允许有采集器,没有法律条例约束,这是信仰的力量。
sohoer
2012-11-23 16:51:44 +08:00
@soudesuka 采集器要看在什么人手中对吧,这工具是肯定需要的,
GOOGLE其实也是靠的采集
kava
2012-11-23 16:54:12 +08:00
国外也有采集的垃圾站。。。。只不过是要少些
flyingkid
2012-11-23 16:57:47 +08:00
看是采集的用途咯。采集还是有很多人写的。
如果只是写出来copy一个站的,还是比较少的。
sohoer
2012-11-23 17:05:29 +08:00
@flyingkid 我想也是,只是就是找不到国外的采集工具,呵呵
likai
2012-11-23 18:00:25 +08:00
为什么一定要用国外的采集工具?
国外应该 叫爬虫之类的吧...
scg16
2012-11-23 18:11:04 +08:00
记的美国有个专门做垃圾站的公司上市了,前年下半年的事。
Keinez
2012-11-23 18:12:21 +08:00
@soudesuka 在国外随意转载是要受到追究的,详见各种各样的协议诸如CC/GNU/GPL……这和普世价值和信仰什么无关。君不见香港的外国人一到内地就开始随地乱扔垃圾?
ilovehoo
2012-11-23 18:14:38 +08:00
@scg16 Demand Media, Inc.~ (NYSE:DMD)
Mr01
2012-11-23 18:38:55 +08:00
手法不同 国外有专门的机器人软件卖
lentrody
2012-11-23 18:53:44 +08:00
gelbooru.com 纯拷贝danbooru
不过貌似现在是和 danbooru.donmai.us 共享图库……
armoni
2012-11-23 21:14:25 +08:00
国外采集站也不少,只是google反垃圾比百度迅猛,导致垃圾站流量减少,数量日渐消退
Ultratude
2012-11-24 07:38:08 +08:00
@sohoer 做垃圾站的印度哥不要太多。
Semidio
2012-11-24 07:57:32 +08:00
这个我怎么记得国外有好多专门的软件弄的,还是收费的,可以订阅多个RSS,读取其内容后,使用同义词替换的方法来避免Google的惩罚。比如这家: http://wprobot.net/ 还有这家 http://wpturbo.com/ ,搜索Autobloging或者auto posting能出来好多。
maddot
2012-11-24 11:11:50 +08:00
以前做英文博客,被一个中国佬每篇自动采集到goole家的blogspot上,还总排名在我之前。
Mutoo
2012-11-24 11:25:12 +08:00
前阵子不是还有新闻说国外一个19岁的小伙子做了一个自动摘要的IT信息网站,人家同样是采集,但是信息处理得非常棒呐。
nonozone
2012-11-24 12:01:41 +08:00
都说中文文章一大抄,在我的使用经验来看,平时搜索各种教程,英文copy程度一点都不必中文弱,搜来搜去都是一样的,也是一大堆牛头不对马嘴东西。当然搜索英文的好处是,很多排名比较靠前的网站相对比较严谨一些。而中文排名靠前的往往是各种博客(还不是独立博客,而是各种门户站博客),以及各种技术门户(这些技术门户本身就挺良莠不齐的),并且牛逼的SEO的软件(垃圾评论,采集,自动博客,包括各种验证码破解)不都是国外的。
keven
2014-03-23 19:57:17 +08:00
采集器是工具,如果用来作垃圾内容转载,抄袭,伪原创,仿站这些用途就造成了各种垃圾,这种一方面是用的人的问题,另一方面也是大量采集器提供者以此为赢利点,或者以此为主要功能设计目标,做出来的工具就只能干这个。
其实采集器也有做得好的,比如八爪鱼采集器,就不带任何伪原创,一键转帖,自动发布站群等等这些垃圾内容制造的功能,相反,一直提倡的是用采集器来做大数据收集,原始素材整理,以便节省重复性的人力劳动,采集有价值的内容,并且对采集到的数据做深加工,以此来提炼价值。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/53137

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX