大量短记录字段的模糊查询如何实现? es 的分词器如何实现多语种记录的转换和分词呢?

138 天前
 31415926535x

针对按月分片每月近 1ooow 的记录,其中有一个字段是 姓名 (中文居多,存在一部分繁日英,长度在[2, 50]左右,大部分都是 3 个字符)

现在业务侧要求尽量实现:

我的问题是,如何实现这样的分词器呢?

先感谢 dalao 们回复

1359 次点击
所在节点    Elasticsearch
1 条回复
teiboku1
138 天前
自己实现一个 ingest pipeline 就行

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1054373

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX