请教关于搜索引擎 robots.txt 的设置

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 1601 天前的主题，其中的信息可能已经有所发展或是发生改变。

User-agent: *
Request-rate: 1/2 # load 1 page per 2 seconds
Crawl-delay: 10
Allow: /$
Disallow: /
Allow: /view/article/*

我只需要爬虫爬取 /和 /view/article/下的内容，其它都不希望它爬取。这样设置有问题吗？（另外，知乎的 robots 文件真的啰嗦。。。）

1 条回复 • 2020-09-04 01:12:13 +08:00

anUglyDog

2020-09-04 01:12:13 +08:00

https://technicalseo.com/tools/robots-txt/
我用这个工具查我现在设置的 robots.txt ，好像跟我预想的结果不一样。。。