如果数据量为 2G, VPS 内存只有 1G,有没有对中文支持好的全文搜索方案? ES 最低推荐为 2G

2016-02-24 08:11:40 +08:00
 WildCat
ES or Solr 似乎是最好的两个选择,对于个人业余项目来说,用主流工具更有意义,坑也比较少。但是这两者对 RAM 对要求都不低吧?

其他基于 C/C++ 的方案不知道有什么可以推荐的吗?比如 Sphinx ?

简单说下需求:
- 有比较好用的中文分词插件
- 内存需求较低
- 准确率一定不能低
- 考虑未来把这个项目转化为营利性项目的情况

感谢。
2491 次点击
所在节点    问与答
13 条回复
vibbow
2016-02-24 08:16:38 +08:00
LZ 这是要把金钱问题转换成技术问题啊……
hellojinjie
2016-02-24 08:21:03 +08:00
mysql
用二分法分词,自己建索引。

以前的 php 论坛有些就是这么做的。
WildCat
2016-02-24 08:27:25 +08:00
@vibbow 学生,没辙啊😭 以前觉得 rails 吃配置,知道我遇到了 ES
bcxx
2016-02-24 08:37:29 +08:00
pg 吧,自己调一下分词方案应该还是能用的
AntonChen
2016-02-24 08:46:22 +08:00
ES 1G 也能用
WildCat
2016-02-24 08:55:54 +08:00
@AntonChen 主要是担心稍微有点用户这个服务就挂掉了
cxh116
2016-02-24 09:05:53 +08:00
把 es 跑到 OpenShift 这样的免费平台,反正 es 只需要 http 通信,完全没问题.
当然前题是 vps 在国外.
AntonChen
2016-02-24 09:05:58 +08:00
看用户数量 和查询效率什么的 我也没详细测过并发 不太好说 如果你说 1000 用户 考虑分散什么的 感觉没什么问题
wohenyingyu01
2016-02-24 09:29:30 +08:00
能用钱解决的为何要用技术解决呢,把这精力花在别的地方不是能赚更多么……
WildCat
2016-02-24 09:56:11 +08:00
@cxh116 好方案,谢谢!


@AntonChen 嗯!


@wohenyingyu01 问题是没有钱,如何解决?
zhjits
2016-02-24 09:56:48 +08:00
Sphinx 之类的?
kran
2016-02-24 10:02:10 +08:00
mysql 本身支持中文分词好久了
即便是旧版,也很容易实现
wklken
2016-02-24 13:42:43 +08:00
可以考虑用下 solr, 占用资源不多

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/258622

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX