求 MongoDB 全文搜索思路指导。

2014-03-16 22:26:30 +08:00
 ooh
数据已经接近700w,在100w的时候只是对标题进行检索就是很让人难以接受的了,为了提供更好的搜索体验,同时也要对内容进行检索,恩,要上全文搜索。以前没接触过,但是听说过sphinx,最近一次在面试的时候,也有提到solr。
我寻思如果能用sphinx,当然最好,但是了解了一下,sphinx对中文支持不是很好;好了来到coreseek,但是我看了一下版本有点老了,这点有点忧虑;最后了解了一下solr,看样子很复杂,要格外装的东西略多。
好了,接触一个新的领域,出现选择困难症状了,上面三个无论选择那个无疑都能轻松的搞定我的问题,但是,想来学一个新的东西,肯定要选个易学易用的,这方面的资料有点匮乏,想让大家给我出出主意,谢谢。
语言用的Python,数据更新不是很频繁,可能也就一天更新一次或一周更新一次。
6241 次点击
所在节点    MongoDB
9 条回复
hpxl
2014-03-16 22:29:38 +08:00
可以用Xunsearch实现,支持php sdk。http://www.xunsearch.com
chloerei
2014-03-16 22:30:09 +08:00
chol
2014-03-16 23:16:48 +08:00
ElasticSearch 10亿没问题,我们做过全面的测试;专门做全文检索的,和关系型数据库、NoSQL的衍生品根本不在一个数量级上
ooh
2014-03-16 23:25:03 +08:00
@hpxl
@chloerei
@chol
脑袋瓜已经不够用了。。。
humiaozuzu
2014-03-20 12:06:42 +08:00
ElasticSearch +1
ooh
2014-03-20 12:13:34 +08:00
@humiaozuzu 听说很耗内存,高富帅产品是真的吗,只是找了个满足需求入门比较简单的。
humiaozuzu
2014-03-20 12:19:07 +08:00
@ooh 点头,java的都烧内存。。。
notnumb
2014-03-20 17:54:48 +08:00
同样的硬件,如果软件优化方面都是一个水平,不会某个特别快,某个特别慢。重要看场景。
不要抱怨mysql的fsync慢。fsync考虑的是操作的可靠性。
重要是看你自己的需求就是需不需要mongodb或者是ElasticSearch某些特性。
偏激的吹嘘ElasticSearch,只能说明盲目而已。
captain234
2014-05-04 23:00:51 +08:00
mongo 2.6已经支持全文索引了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/104589

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX