博客根据文章内容跑自然语言分析自动识别关键字,有什么廉价的实现方法吗?

2022-03-02 14:42:41 +08:00
 LeeReamond

如题,需求是想给个人博客加个关联推荐,类似于 V2 这种给每个文章自动加上关键字 tag 的方式感觉就挺好的。个人小站不需要推荐的太精准,大概差不多就行,有什么计算开销和实现成本都比较低的方案吗?

谢谢大家,不知道站长能不能分享下 v2 实现思路。 @Livid

2774 次点击
所在节点    自然语言处理
7 条回复
westoy
2022-03-02 14:44:18 +08:00
人肉打标啊, 个人博客一个月能有几篇文章啊......
westoy
2022-03-02 14:45:06 +08:00
我记得 V 站好像是用的结巴分词提取的关键词? 可能还带人肉修正的.....
LeeReamond
2022-03-02 14:51:19 +08:00
@westoy 目前一百多吧。。确实不多,但是人肉打也太 low 了。。
Livid
2022-03-02 14:55:34 +08:00
之前用过这个:

https://github.com/fxsjy/jieba

理论有可能也可以用 Swift + Core ML 做,跑在你的任何一台 iOS 或者 macOS 设备上。
LeeReamond
2022-03-02 15:18:50 +08:00
@Livid 感谢,仔细看了一下结巴好像自带 tfidf 抽取,如果我想用这个分词结果做个近似推荐应该怎么做呢,没啥思路
soislom
2022-03-02 15:24:35 +08:00
@LeeReamond 既然已经拿到一篇文章的 TF-IDF 值,感觉可以直接做基于内容的协同过滤了
westoy
2022-03-02 15:38:11 +08:00
@LeeReamond

一百多不多啊, 你自己写的文章一两个钟头就够了吧,

而且你看你这篇

关键词应该是 文章内容 自然语言分析 自动识别 关键字 关联推荐 tag 方案

而 V 站提取出的是 博客 小站 实现 文章

不能说和主题表达关联不大吧, 只能说毫无关系

还是人肉吧......

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/837436

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX