有什么好用的轻量级搜索服务?

136 天前
 webeasymail
目前我在做一个 [ SaaS 软件分销平台] ,里面大概会有不超过 1W 条数据吧,假设一年后有 10W 条数据,现在我需要找一个非常轻量级别的搜索组件。

这是一个单机版的系统,未来访问量也不会很大,我希望够对搜索效果进行提升,请问有什么好的技术可以使用?


我不太想使用 es ,主要是 es 很重,我们的数据量很少,而且没有分布式需求,未来数据量稍微多一些,我准备单独拆出来一台机器做 search 服务即可。


目前使用的是 mysql 的 like ,没有权重等等,所以效果还是很差的。

前端使用的是 next.js 后端现在使用的是 java 。



访问这个地址可以预览这个功能:

https://www.cpcat.cn/s/wework
6376 次点击
所在节点    Java
48 条回复
dilu
136 天前
meilisearch
2bad4u
136 天前
@dilu 中文分词难搞
dyllen
136 天前
sphinx 老牌的了。
concernedz
136 天前
对文章,博客类来说,meilisearch 够用了
potatowish
136 天前
试试 redis search
2bad4u
136 天前
@concernedz meilisearch 支持拼音搜索吗?
flyingfz
136 天前
https://github.com/zincsearch/zincsearch

看看这个 是否合适。
webeasymail
136 天前
@potatowish 我在考虑 redis search ,我不太清楚使用 redis search 分词、高亮、权重是否能够解决?
webeasymail
136 天前
@dilu Meilisearch 看起来也很轻量级,看资料和 redis search 一样,内置中文分词。
webeasymail
136 天前
@dyllen 我数据用的是阿里云的,sphinx 可以结合云数据库一起用吗?
DefoliationM
136 天前
bleve 嵌入式的,直接存本地。
webeasymail
136 天前
Meilisearch 看起来好像很强大 :

eiliSearch 是一个功能强大、快速、开源、易于使用和部署的搜索引擎,并且 MeiliSearch 的搜索和索引都是高度可定制的,提供开箱即用的功能属性,如错字容忍、过滤器和同义词。而最重要的一点是,它 [支持中文搜索] ,而不需要添加额外的配置。


二、支持的功能
开源
用户量(开源搜索引擎第二名)
中文分词
同义词
纠错
高亮
全文返回
高级搜索
停用词、停用字段
加权、降权
逻辑搜索
唯一字段聚合
分页
重新索引
changdy
136 天前
你这个从产品思路上就错了..
首先要做的是软件分类 ,而不是文章内容查询.
看了下你做的软件分类太过于粗糙了.

其次可以再给文章打标签 ,对标签进行搜索 最后搜索只查标题就好了..谁也不会闲着没事记软件的内容的.
sampeng
136 天前
实在要搜索引擎:sonic ,效率奇高。

10w 就要上搜索引擎了?这是什么赛博世界…100w 数据库你就是一个字段一个字段 like 都够你用了。如果是 pg ,pg 自带的向量 token 存储,我试过亿级数据都是 100ms 就能回来,只要自己随便找个分词引擎。
sampeng
136 天前
连分类都不做,全靠搜索不是自己折腾自己么
webeasymail
136 天前
@changdy 有分类的,现在又 300 多个分类了,分类可以在这个界面看 : https://www.cpcat.cn/categories
webeasymail
136 天前
有分类的 https://www.cpcat.cn/categories

我是想通过关键词能够跟准确一下,例如 title 的权重高一些,description 的权重低一些,现在 like 搜索没有权重数据,会导致搜索出来 产品名称 ,可能会 description 的排在前面。
webeasymail
136 天前
@changdy 请教一下,产品标签是自动打标签,还是发布的时候手动选择标签?
webeasymail
136 天前
@sampeng 实际上主要是解决权重的问题,希望搜索的东西更符合用户需要,例如搜索 “微盟”,title 和 company_name 权重最高,其次就是 description 权重低一些。
Makabaka01
136 天前
这么一点量级,QPS 也很低,数据库 like 都够了,根本不需要纠结

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1062181

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX