有没有办法不让搜索引擎收录

2015-11-11 22:43:22 +08:00
 just1

有个自己用的域名不想被收录,但是居然被收录了。。。 Google 和百度都有。可以防止被收录吗。 robots.txt 只是'由于此网站的 robots.txt ,系统未提供关于该结果的说明 - 了解详情。'

7146 次点击
所在节点    程序员
56 条回复
WenJimmy
2015-11-12 13:03:39 +08:00
@caixiexin 哈哈哈
bk201
2015-11-12 13:07:30 +08:00
既然你自己的限制 ip 访问好了
Shunix
2015-11-12 13:49:39 +08:00
@fengyqf 又碰见老熟人了
Felldeadbird
2015-11-12 13:54:31 +08:00
@kindjeff ajax 返回数据,谷歌照样抓。 太小看现在的技术了
Smilecc
2015-11-12 14:33:45 +08:00
@leavic Google 现在的技术已经可以爬到这种站点了
ilililili
2015-11-12 16:07:49 +08:00
@dphdjy 这么有意思,啥网站
dphdjy
2015-11-12 16:18:05 +08:00
icon
2015-11-12 16:24:27 +08:00
@sneezry 这个看起来挺简单 这个方法有用吗
hantsy
2015-11-12 16:25:47 +08:00
添加 robox 在 HTTP Server 。。。
hantsy
2015-11-12 16:28:01 +08:00
@int64ago AngularJS 就我的经验看,只有百度蠢,解析不了指令,做 SEO 需要额外的步骤。其它的 Google , Yahoo , Bing 不需要任何设置都一样爬得出来。
hantsy
2015-11-12 16:30:12 +08:00
@kindjeff 现在针对 Ajax , SPA 程序的专门 SEO 优化的项目大把。 Google 默认好像就根本不需要优化就可以爬 AngularJS 等。
vmebeh
2015-11-12 16:31:21 +08:00
主页用 js 跳转一下
flowfire
2015-11-12 16:46:35 +08:00
除了 ban ip 之外,其他的都是防君子不防小人的做法。
伪装 UA 又不是什么很难的事
fengyqf
2015-11-12 18:05:03 +08:00
@Shunix 圈子太小,逃走。。。
ericls
2015-11-13 01:22:56 +08:00
放到 tor 里
lenovo
2015-11-14 00:55:50 +08:00
昨天把 36l 的.htaccess 换成这样貌似也可以阻止爬虫, Serf 是 pagespeed 的 UA

Options -Indexes

SetEnvIf User-Agent "^Mozilla" good_UA
SetEnvIf User-Agent "^Serf" good_UA

<Limit GET HEAD POST>
order deny,allow
allow from env=good_UA
deny from all
</Limit>

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/235474

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX