首页
注册
登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请
登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
V2EX
›
程序员
论坛的相似帖子的实现
shunai
·
2012-05-16 18:27:37 +08:00
· 2940 次点击
这是一个创建于 4606 天前的主题,其中的信息可能已经有所发展或是发生改变。
对于论坛相关帖子的实现有哪些方案?目前想到用lucene的评分机制,通过帖子的内容去搜索索引库,获取评分最高的前几个帖子,就是相似帖子了。
帖子
评分
相似
2 条回复
•
1970-01-01 08:00:00 +08:00
1
shunai
OP
2012-05-16 18:27:59 +08:00
大家有什么更好的方案吗?
2
hu437
2012-05-18 17:58:33 +08:00
这是目前的主要方法,核心是TFIDF:
http://zh.wikipedia.org/wiki/TF-IDF
lucene里面有直接的方法morelikethis
关于
·
帮助文档
·
博客
·
API
·
FAQ
·
实用小工具
·
3081 人在线
最高记录 6679
·
Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 22ms ·
UTC 13:05
·
PVG 21:05
·
LAX 05:05
·
JFK 08:05
Developed with
CodeLauncher
♥ Do have faith in what you're doing.