有没有熟悉 NLP、话题提取的老司机,请给几个关键字提示

2016-01-29 21:39:12 +08:00
 c3538378

要实现这样一个识别功能:

一篇关于黄晓明和 AB 结婚的文章,全文并无出现「明星」两个字,
但要提取出话题:明星结婚

一篇关于历史上某个人物的文章,全文也没有出现中国、古代史这样的字眼,
但需要提取出话题:中国古代史

感觉有点像 Naive Bayes Classifier ,但好像又不是?
哪个老司机丢几个关键字我去搜索一下?

5593 次点击
所在节点    自然语言处理
7 条回复
billlee
2016-01-29 21:46:15 +08:00
Collaborative filtering?
c3538378
2016-01-29 21:50:08 +08:00
@billlee 这不能算是协同过滤吧
iyuyue
2016-01-29 22:04:55 +08:00
analogical reasoning task

我觉得这些 topics 还是需要事先分好的吧

附上一个上课的 ppt , http://www.inf.ed.ac.uk/teaching/courses/nlu/lectures/nlu_l03-lda-2x2.pdf
c3538378
2016-01-29 22:34:46 +08:00
@iyuyue 感谢

topics 是预先分好的,但是数量会比较多。
另外找到个: Latent dirichlet allocation 好像也是用来解决这类问题的?
iyuyue
2016-01-29 22:48:25 +08:00
LDA 是一个具体的模型。 NLP 很多地方都有用的。
xuwenhao
2016-01-30 01:28:01 +08:00
Topic Model
ljdawn
2016-01-30 08:58:02 +08:00
LDA 吧

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/254329

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX