V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
valkyrja
V2EX  ›  问与答

如何实现快速中文搜索?

  •  
  •   valkyrja · 2017-05-11 22:24:17 +08:00 · 1538 次点击
    这是一个创建于 2755 天前的主题,其中的信息可能已经有所发展或是发生改变。
    有 500 条中文字符串需要在 13 万条的备选数据里检索相似度最高的五条,请教大佬们有好的实现方法吗?目前的思路是用 bk tree 来做,不知道是否可行?
    3 条回复    2017-05-12 00:43:10 +08:00
    valkyrja
        1
    valkyrja  
    OP
       2017-05-11 22:25:17 +08:00 via Android
    标题好像打错了😂是中文近似匹配
    luxinxin
        2
    luxinxin  
       2017-05-12 00:33:06 +08:00 via iPhone
    得看近似是什么样的近似了,编辑距离是一种近似,同义词也是近似,两者实现的难度完全不一样
    valkyrja
        3
    valkyrja  
    OP
       2017-05-12 00:43:10 +08:00 via Android
    @luxinxin 谢谢大佬 我指的就是编辑距离 不需要同义词 所以想到了 bk 树 不知道中文用这个方法靠谱吗
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5396 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 41ms · UTC 09:13 · PVG 17:13 · LAX 01:13 · JFK 04:13
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.