es 检索电影字幕文件应该用什么分词

2020-01-02 16:35:37 +08:00
 alexchinatests

es 检索电影字幕文件应该用什么分词 现在我用的是中文分词 导致一段话被截取了好几个好几个词 查询出来很不准确~

2700 次点击
所在节点    Elasticsearch
3 条回复
THESDZ
2020-01-02 17:05:03 +08:00
看分词插件,得分计算方式
alexchinatests
2020-01-02 17:12:44 +08:00
已解决 使用的 match_phrase ღ( ´・ᴗ・` )比心
JCZ2MkKb5S8ZX9pq
2020-01-03 09:17:03 +08:00
这个我也想过,想抓了配截图玩。
不过有版权问题又没啥盈利,就没实践。
用 OCR 其实电视剧动漫也能搞。
可能还需要评分和投稿,过滤出高质量的。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/634508

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX