需要实现 mongodb 所有字段全文检索,大神给点建议

2018-03-29 16:51:52 +08:00
 seraphv3

我们的 CRM 用的 mongodb 存储客户、工单和知识库信息,登录后的主页有一个搜索功能。原来的实现方式是对部分集合指定的几个字段进行正则模糊匹配。现在产品要求搜索所有字段,包括可能出现的客户自定义字段(我们的客户和工单表有自定义字段功能,因为 mongodb 的字段可以不用预先定义,直接给一个 key 值存入)。

百度查到有几种方案:

  1. elastic search,用mongo-connector同步数据
  2. solr,也是用 mongo-connector 同步数据
  3. sphinx,这个的评价好像不如前两个

mongo 自带的全文索引因为不支持未知字段和中文分词,不考虑。

大神给点建议,用什么方案比较好,有没有什么坑。

6790 次点击
所在节点    MongoDB
7 条回复
zhantss
2018-03-29 18:28:15 +08:00
sphinx 没碰过
es 和 solr 我都生产部署过,大概讲一下使用的最大的几点差异吧

1、如果你需要实时索引,用 es,因为 solr 在索引的同时查询效率极低
2、只有 json 格式数据,用 es(只支持 json)
3、solr 分布式使用 zookeeper,es 自己实现
4、solr 稳定性较高(个人实际情况,比较主观),调校时间短,如果已经有高性能 zk 集群的情况下建议 solr
5、solr 自带 web ui,非开发人员可用,较直观,半天上手,当然 es 也有三方的 ui

接口都支持 RESTful
中文分词生产中我用的都是 ansj,需要调教一下,效果比较满意
zhantss
2018-03-29 18:29:57 +08:00
噢,还有,es 大部分情况下平均查询速度快一些
nexusone
2018-03-29 18:37:07 +08:00
用 es,放一两百个字段没问题,自定义字段也没事,动态添加 /查询都能满足
startar
2018-03-30 09:48:11 +08:00
@zhantss es 不是支持分布式么
seraphv3
2018-03-30 11:17:31 +08:00
@zhantss 谢谢
zhantss
2018-03-30 17:23:09 +08:00
@startar 可能是我表述不太清楚,我的意思是 es 他自己实现了分布式,不用其他组件,solr 分布式实现使用 zk
zhantss
2018-03-30 17:23:55 +08:00
@seraphv3 客气

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/442561

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX