一直搞不懂 sitemap,是不是就是一个网站的所有 url 列表?

2016-01-23 12:22:11 +08:00
 evakiss

谷歌了很久对 sitemap 的概念还是很模糊, Google sitemap 是不是就是将一个网站的所有 url 以 xml 形式保存下来?

4801 次点击
所在节点    程序员
3 条回复
Septembers
2016-01-23 12:42:55 +08:00
目的是显示的告诉 蜘蛛 “你这个 sitemap 是你需要爬的”
qgy18
2016-01-23 13:02:16 +08:00
sitemap 就是一个 xml ,包含你网站所有的 url ,可以指定更新日期和权重,定期更新。例如我博客的 sitemap 如下:
https://imququ.com/sitemap.xml

生成好 sitemap 之后,你还需要通过站长平台将其主动提交给搜索引擎,当然也可以在 robots.txt 里写上 sitemap 的地址,例如:
https://imququ.com/robots.txt

最后,即使你提交了 sitemap ,还是依赖于搜索引擎的 spider 主动来抓,只不过一般抓 sitemap 的频率会高于主站,因为这相当于种子。所以实际上,更好的做法是有更新之后主动 ping 引擎,例如 Google 就支持 XML-RPC 的 weblogUpdates.ping ;百度也有自己的主动推送方法,可以登录他的站长平台看。
zonzin
2016-01-25 05:54:57 +08:00
你要的说的是一种。

还有一种是按目录来导航的。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/252809

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX