如何实现快速中文搜索?

2017-05-11 22:24:17 +08:00
 valkyrja
有 500 条中文字符串需要在 13 万条的备选数据里检索相似度最高的五条,请教大佬们有好的实现方法吗?目前的思路是用 bk tree 来做,不知道是否可行?
1537 次点击
所在节点    问与答
3 条回复
valkyrja
2017-05-11 22:25:17 +08:00
标题好像打错了😂是中文近似匹配
luxinxin
2017-05-12 00:33:06 +08:00
得看近似是什么样的近似了,编辑距离是一种近似,同义词也是近似,两者实现的难度完全不一样
valkyrja
2017-05-12 00:43:10 +08:00
@luxinxin 谢谢大佬 我指的就是编辑距离 不需要同义词 所以想到了 bk 树 不知道中文用这个方法靠谱吗

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/360733

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX