V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
witcat
V2EX  ›  程序员

词条/关键词匹配的时机

  •  
  •   witcat · 2023-05-17 21:37:42 +08:00 · 445 次点击
    这是一个创建于 554 天前的主题,其中的信息可能已经有所发展或是发生改变。
    现在在做一个小软件,其中大概有这样一个功能:
    有若干的文章(约 1500 篇),还有一些关键词(大约 400 多个)。
    文章中如果出现了关键词,就把这些关键词转换成跳转链接,就是类似维基百科里那种效果。
    目前是在创建文章还有更新文章时,会用 ahocorasick 和关键词列表进行匹配。

    但是一个问题是关键词也在持续更新,这样比较早的文章中就没有新的关键词。
    我想了两个办法:
    1. 当一个文章超过一段时间没人访问,下次访问时会更新关键词列表
    2. 设置一个定时任务,每天都把所有文章的关键词重新匹配一遍

    2 的方法,我个人不是太喜欢定时任务。1 的话个人感觉倒是可以,但感觉会不会过度设计了。
    有人做过类似的功能可以给一些建议吗?
    1 条回复    2023-05-18 14:44:22 +08:00
    Yuan2One
        1
    Yuan2One  
       2023-05-18 14:44:22 +08:00
    其实大部分系统也就是这么设计的,但是考虑到只有 1500 篇文章,那么如果你新词更新频率并不高,其实可以只使用 2 吧
    蹲一个大佬解答
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   4962 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 03:51 · PVG 11:51 · LAX 19:51 · JFK 22:51
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.