同样的搜索内容,为啥谷歌返回的结果差别那么大?

2023-03-04 09:20:38 +08:00
 OldCarMan

rt ,前两天提了一个问题关于 google 中文搜索结果的问题,结果回复里,有位哥们(#13 楼)跟我用一样的关键词,我们搜出来的结果差异很大(详细大家可以看一下,我在回复里都有截图),然后我做了以下排查:

结果跟我开始搜索到的结果几乎都一样,这里有几个问题:

PS:哈哈,如果问得不好或是我无知,大家尽管吐槽,谢谢大家回复!
2002 次点击
所在节点   搜索引擎技术研究
9 条回复
723X
2023-03-04 09:24:51 +08:00
浏览器指纹,webrtc
OldCarMan
2023-03-04 10:24:46 +08:00
@723X 怎么实现的呢? webrtc 据我所知主要是点到点通信,虽然两端通过 stun 服务器并在服务端注册后就可以通信了,但是全世界那么多台在使用谷歌搜索的设备,它怎么就定位到要通信的是我网络环境下的两台设备的呢?也就是说谷歌服务器是怎么判断不同使用环境的设备是来自同个网络环境的呢?
Herry001
2023-03-04 10:43:26 +08:00
搜索设置里,改下“搜索结果对应的区域”
tcfenix
2023-03-04 10:48:55 +08:00
这是被谷歌用户分类了吗?还是被精确定位了?如果是后者,感觉有点细思极恐,在终端存在差异化环境情况下,谷歌是怎么定位到请求是来自“同个局域网”网络设备的?
tcfenix
2023-03-04 10:52:17 +08:00
抱歉, 刚才按错键了
qqqyh
2023-03-04 11:00:02 +08:00
很久以前试过,Chrome 和 Firefox 用谷歌搜索结果不一样
723X
2023-03-04 11:08:24 +08:00
@OldCarMan #2
个人理解是 webrtc 能穿透 vpn 看到你内网 ip 和设备列表,再结合其他信息分析。深入的我讲不清楚,给两个网站抛砖引玉
https://fingerprint.com/
https://browserleaks.com/
OldCarMan
2023-03-10 16:57:40 +08:00
@Herry001 谢谢大佬,确实少了些,但还是很多广告。
@qqqyh 我这是基本一样,但是跟其他 V 友不一样,而且相差挺大的。
@723X 第二个连接里的,这个“The WebRTC Leak Test is a critical tool for anyone using a VPN, as it leverages the WebRTC API to communicate with a STUN server and potentially reveal the user's real local and public IP addresses, even when using a VPN, proxy server, or behind a NAT. This tool can help verify whether a real public IP is being leaked” 确实存在这种锁定身份的可能性,比如通过 3 楼说的搜索结果区域来选定一台该区域里的 stun 服务器,然后通过某种方式(比如直接 ip 请求 /本地网络服务器)绕过🪜的 dns 解析,直接就能拿到访问者的 ip ,然后根据这个 ip 推送搜索结果,而不是采用你🪜的机器 ip 。
OldCarMan
2023-03-10 17:00:36 +08:00
@723X 你可以看看你的 ip 地址跟这链接( https://browserleaks.com/ip)下的 webRTC 地址是不是一样的。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/920999

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX