请教关于搜索引擎 robots.txt 的设置

2020-09-03 22:51:14 +08:00

anUglyDog

User-agent: *
Request-rate: 1/2 # load 1 page per 2 seconds
Crawl-delay: 10
Allow: /$
Disallow: /
Allow: /view/article/*

我只需要爬虫爬取 /和 /view/article/下的内容，其它都不希望它爬取。这样设置有问题吗？（另外，知乎的 robots 文件真的啰嗦。。。）

800 次点击

所在节点

1 条回复

anUglyDog

2020-09-04 01:12:13 +08:00

https://technicalseo.com/tools/robots-txt/
我用这个工具查我现在设置的 robots.txt ，好像跟我预想的结果不一样。。。

第 1 页／共 1 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.