有什么好用的轻量级搜索服务?

136 天前
 webeasymail
目前我在做一个 [ SaaS 软件分销平台] ,里面大概会有不超过 1W 条数据吧,假设一年后有 10W 条数据,现在我需要找一个非常轻量级别的搜索组件。

这是一个单机版的系统,未来访问量也不会很大,我希望够对搜索效果进行提升,请问有什么好的技术可以使用?


我不太想使用 es ,主要是 es 很重,我们的数据量很少,而且没有分布式需求,未来数据量稍微多一些,我准备单独拆出来一台机器做 search 服务即可。


目前使用的是 mysql 的 like ,没有权重等等,所以效果还是很差的。

前端使用的是 next.js 后端现在使用的是 java 。



访问这个地址可以预览这个功能:

https://www.cpcat.cn/s/wework
6376 次点击
所在节点    Java
48 条回复
qweruiop
136 天前
今年开发的系统都用 meilisearch 了吧。。。速度奇快。。。
FrankAdler
136 天前
@FrankAdler 试了下内存能接受,那 2000w 的磁盘空间呢
webeasymail
135 天前
@qweruiop 文档看起来也非常简单易用,比 redis search 使用更清晰,我现在使用版本好像有点冲突,默写方法使用会出现错误,提交个 github 看看能不能解决。
yufeng0681
135 天前
@webeasymail #32 其实竞品功能抄抄更快
IT 桔子,专门介绍创业项目的,各种分类都有。https://www.itjuzi.com/
webeasymail
135 天前
@yufeng0681 IT 桔子 还是比较复杂的,我这个是做 SaaS 软件分销 ,差别有点大,而且 IT 桔子涉及面很广,我这个更窄了,做太大了,搞不起来。
pieerepeng
135 天前
我也调研过这个需求,记录下。


我们希望在边缘节点上搭建一个搜索引擎,需要占用的内存开销比较小,同时当数据比较大的时候,可以有效使用硬盘。


我们一开始选择了 zincsearch ,选择它的原因是对 es 接口的兼容,不过这个团队弃坑了,以及它的权限做的比较糙
https://github.com/zincsearch/zincsearch

Github star 比较多的是:
https://github.com/meilisearch/meilisearch
https://github.com/valeriansaliou/sonic
https://github.com/typesense/typesense

我觉得: https://github.com/manticoresoftware/manticoresearch 可能是遗珠
支持少量付费的话,Algolia 也是一个选择

其实: https://www.meilisearch.com/docs/learn/what_is_meilisearch/comparison_to_alternatives
这篇文档做了对比,可以看看。


最后:
1. 我们文档站用了:Algolia
2. 主项目用了 pg 加一堆插件的方案,整体资源的占用最小。因为我们用了 citus ,未来做云原生支持的时候希望也能容易些

op 1 万多条的规模感觉 meilisearch ,typesense 挑一个就好了
ryalu
134 天前
试试 openobserve ,zincsearch 团队搞得
imtflin
134 天前
meilisearch 现在的中文分词有很大的问题,某些情况根本不可用,将文字 pinyin 化,导致一系列的问题,官网目前暂时也没精力解决。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1062181

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX