关于谷歌搜索语法,如何限定结果都来自 https://v2ex.com/,而不包括*.v2ex.com 的?

2023-11-13 23:15:34 +08:00
 VisualStudioCode
因为有很多重复的搜索结果,来自 fast.v2ex.com, cn.v2ex.com……。
1889 次点击
所在节点    Google
7 条回复
xmumiffy
2023-11-13 23:31:38 +08:00
hazy
2023-11-13 23:34:33 +08:00
VisualStudioCode
2023-11-13 23:42:01 +08:00
site:www.v2ex.com 虽然能达到去重的目的,但是就完美效果而言欠缺了一点,因为有些帖子的 www 版网页没有被谷歌收录,比如该贴:/t/790313
见: https://www.google.com/search?q=site%3Av2ex.com%2Ft%2F790313

它只有 de, fast 被收录,www 没有被收录。

@xmumiffy @hazy
qilme
2023-11-14 00:23:31 +08:00
刚发现了这个脚本: https://greasyfork.org/zh-CN/scripts/458024-v2ex-%E8%B6%85%E7%BA%A7%E5%A2%9E%E5%BC%BA
可以在设置里面打开 sov2ex ,在站内搜索框搜索。
这个站内搜的网址: https://www.sov2ex.com/
ysc3839
2023-11-14 02:55:23 +08:00
site:v2ex.com -site:*.v2ex.com
这样不行吗?我看搜索结果里已经没有 www 的了
VisualStudioCode
2023-11-14 12:54:11 +08:00
哦对,这个语法我以前也想到过的。只是根据我多年来用谷歌搜索的经验,使用超过一个的语法的话,尤其是不同指令的语法,比如同时使用 site, -inurl, 双点运算符( https://www.googleguide.com/number_range.html)等。会导致个别网页,匹配指令,但却没有出现在搜索结果中。我是有过这样的经历的。

正巧,你给的指令就让我发现了一个。见该图: https://picx.zhimg.com/80/v2-ca00fdfc24b20b31ca24a43094abbadd_1440w.png
左侧网页是简单的一个 site:v2ex.com ,而右侧网页则加入了-site 。关键词是「阮一峰」。
能够观察到,左侧中有个搜索结果叫「读本周阮一峰网络日志有感:什么样的领导算是好领导」,而它在右侧却没有出现。我甚至把右侧网页拉到底,让谷歌加载更多搜索结果,直到不再有结果为止,还是没有那个帖子(好领导)。

@ysc3839
VisualStudioCode
2023-11-14 12:57:37 +08:00
@VisualStudioCode #6

抱歉我例子举错了!因为那个帖子(好领导)只有 fast, jp, www 被谷歌收录了……所以其实是符合预期的。

但是我讲的个别网页,符合指令但没有出现在搜索结果的情况,我是遇到过的。不知道这几年谷歌有没有改进。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/991638

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX