MongoDB 2.4 现在可以做全文索引了

2013-08-04 16:35:10 +08:00
 Livid
http://blog.mongodb.org/post/52139821470/integrating-mongodb-text-search-with-a-python-app
6908 次点击
所在节点    MongoDB
10 条回复
reorx
2013-08-05 09:23:00 +08:00
不知道效率比之 ElasticSearch 等如何,若是不错的话倒是可以在一些数据不多的应用中代替独立搜索引擎。
merlin852
2013-08-05 10:33:53 +08:00
lj0014
2013-08-05 10:41:03 +08:00
哇!关注下,应该还不支持中文分词吧
joy2everyone
2013-08-05 13:01:01 +08:00
2.4新增的"Text Search"目前仍是beta版本,还不建议在生产环境使用

http://docs.mongodb.org/manual/tutorial/enable-text-search/
Livid
2013-08-05 16:56:20 +08:00
所以我在考虑的一个可能的应用场景是:

1. 用 Fluentd 收集各台服务器上的错误日志 error_log
2. 汇聚到一个 MongoDB 数据库中
3. 用 MongoDB 2.4 的搜索功能来实现对这些错误日志的分析
felixonmars
2013-08-05 18:35:45 +08:00
我还在用以前推荐的方案, 也就是手动分词后创建一个 array 存进去, 然后加好索引. 这样对分词引擎的选择有较大的自由度, 而且性能还能接受 (当然比 sphinx 等纯索引器差不少).

我用的分词工具是 jieba: https://github.com/fxsjy/jieba
reorx
2013-08-05 20:42:26 +08:00
@Livid 日志分析感觉用正则查询要靠谱一些。
jinbakei
2013-08-05 20:48:21 +08:00
@Livid 我今年实习就做这个,已经做好了
keakon
2013-08-05 20:51:46 +08:00
错误日志别分词了,搜个 __init__.py、C++ 咋办
lenzhang
2013-08-05 22:00:10 +08:00
碉堡了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/77954

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX