everything 能否像搜索引擎一样 模糊搜索?

2023-10-22 17:00:00 +08:00
 wty95
比如 关键词写 "北大招办" 可以搜出来 "北京大学招生办"
1438 次点击
所在节点    问与答
8 条回复
Mountain
2023-10-22 17:46:09 +08:00
写正则
shendaowu
2023-10-22 17:53:15 +08:00
*北*大*招*办*。这个顺序必须一样。

北 大 办 招。这个比上面的更好一些,顺序错了也能搜出来。就是所有字中间都加上英文空格。
shendaowu
2023-10-22 17:57:01 +08:00
如果是同义词那种应该就很难搜出来了。另外建议 OP 把各种可能的情况都说一下,模糊搜索好像包含挺多功能的。
shendaowu
2023-10-22 21:16:40 +08:00
还有个更好一点的方法,需要这个软件: https://seekfast.org/seekfast 。这是个全文搜索的软件。用这个软件主要是因为 everything 搜出来的结果不能按照命中的关键词数量排序。

用“北|大|办|招”搜索出所有结果,然后导出搜索结果为 txt 文件,最好是给这个导出的 txt 文件单独建一个文件夹。然后用 seekfast 在那个导出的 txt 文件所在的文件夹建立索引。然后搜索“北 大 招 办”,记得勾选“Any of words”。然后大概就会按命中的关键词的个数排序了。感觉跟搜索引擎的效果差不多了,除了同义词之类的。不过我测试的时候发现好像不是严格按照命中个数排序的,看了一下说明,好像关键词的顺序会显著影响排序。

还有这个软件的排序好像更好一些: https://anytxt.net/ 。不介绍怎么用了,大同小异。我写完上段才发现我下载了这个软件,用了一下发现比上面那个好。

另外有一些 js 全文索引的库,也许可以写一个自动导入上面的 txt 文件的小程序。我搜了半天也没找到现成的在线导入并搜索的网站。不知道为啥没有,感觉好像用不着服务器资源,直接用静态网站就能做。搞得我都想做一个这样的在线工具了。问一下 OP ,你这个功能用得多不多?或者用的人多不多?或者重不重要?如果多或者重要的话我以后有时间可能会写一个放 github pages 上。毕竟那个 seekfast 的搜索功能有点太简单了。另外我看 V2EX 偶尔会有一些找点子甚至给写工具的人,你有兴趣可以站内搜搜。

我花了大概两个小时才解决这个问题,OP 我不求你点感谢,就回复一下解决程度就行了。另外我主要是闲得蛋疼才想要解决这个问题的,另外也感觉自己可能会有这个需求,所以就挑战了一下。
BeautifulSoap
2023-10-22 21:20:38 +08:00
用正则就行,但是结果并不一定符合你预期

比如搜出“东北大基金招募办法“之类的
shendaowu
2023-10-22 21:27:12 +08:00
SeekFast 和 AnyTXT Searcher 好像都只能搜索文件内容,不能搜索文件名。
shendaowu
2023-10-22 21:39:25 +08:00
收回前面的做小工具的话。我感觉我做不出比 AnyTXT Searcher 更好的工具。
em70
2023-10-22 21:53:41 +08:00
这个软件可以出个 embedding 版

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/984250

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX