搜索引擎是怎么处理零宽字符的?

2020-08-22 23:08:51 +08:00
 Leon6868
举个例子:
如果我在一段文字中加入零宽字符;当我在引擎中查询这段文字,搜索搜索引擎在返回结果时,是否会忽略零宽字符?

如以下字符串:(咱花了好久才试出来的)
unicode:8234 前‪后 1‪2
unicode:8235 这是真的‫可爱 1‫2
unicode:8236 前‬后 1‬2
unicode:8237 前‭后 1‭2
unicode:8203 前​后 1​2
unicode:8204 前‌后 1‌2
unicode:8205 前‍后 1‍2
unicode:8206 前‎后 1‎2
unicode:8207 前‏后 1‏2

我是否可以通过零宽字符来溯源?
2610 次点击
所在节点    Google
5 条回复
billlee
2020-08-22 23:13:18 +08:00
搜索引擎都是要先分词的,零宽字符大概和空格是一样的效果吧
TimePPT
2020-08-23 01:25:34 +08:00
停用词
Leon6868
2020-08-23 11:03:10 +08:00
@TimePPT 就是说,零宽字符不会影响搜索引擎的结果?
TimePPT
2020-08-23 11:41:43 +08:00
@Leon6868 不影响
codehz
2020-08-23 16:38:12 +08:00
你用 chrome 的页内搜索功能搜索前后两个字试试(

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/700587

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX