100G 8000 万条信息全文检索, Elasticsearch 是最优选择吗?

2022-11-17 13:33:46 +08:00
 pysex

数据存 MongoDB ,Elasticsearch 只存索引结果=最优选择
还是数据做双写

2253 次点击
所在节点    Elasticsearch
5 条回复
huangqihong
2022-11-17 17:31:55 +08:00
咦,我好像在掘金看到了的
bjzhush
2022-11-17 21:23:25 +08:00
你没写数据的增长速度,搜索的复杂度的支持,索引的实时程度的要求,查询结果返回时间的需求,还有用户量和查询量,对弹性扩容的需求,这些都需要考虑的
很多年没做搜索了,ES 是比较出名的,但是貌似机器的消耗也比较多
搜索方案很多的,测试起来也很快,都可以考虑考虑
2013 年我曾经单机 sphinx 索引过 10 亿以上数据,响应还不慢,不过需求特殊,单机版就够用哈哈哈
pysex
2022-11-18 09:55:04 +08:00
@bjzhush 那自己买一台 ECS 自建?单机的
bjzhush
2022-11-18 09:58:55 +08:00
@pysex 当初是帮朋友做的,我自己本机的台式机,他拿过去用也是本机。场景不一样,那个是社工库
bigtang
2023-06-02 12:32:40 +08:00
单机不是最优选择,ES 优势在分布式上,可以参考一下 tanglib.com, 单机 800G 文本,可以做到 instant search 。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/895917

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX