有哪个全文检索引擎能好好对应中文?

2015-01-24 21:05:33 +08:00
 cmkpl

Solr? Sphinx?

3511 次点击
所在节点    问与答
16 条回复
abelyao
2015-01-24 21:11:11 +08:00
说个可能不符合楼主需求的,SAE 有个全文检索的接口,因为我的项目是部署在 SAE 上的,打算接下来使用这个服务,效果现在还不清楚: http://sae.sina.com.cn/doc/php/fts.html
cmkpl
2015-01-24 21:42:30 +08:00
我的网站放在国外,SAE似乎不合需求
zeroten
2015-01-24 21:49:38 +08:00
@cmkpl 记得sae有国外的服务器
abelyao
2015-01-24 22:07:54 +08:00
@cmkpl 如果你是面向国内用户的,SAE 其实也可以考虑一下,无备案的域名也可以绑定,原理是绕道 香港 或 美国 或 日本 去代理一下,访问速度稍慢一些而已
fising
2015-01-24 22:13:04 +08:00
阿里云
kslr
2015-01-24 22:25:07 +08:00
资料太少,无法分析,solr还要装java sphinx简单好用,但是要看情况
Tianpu
2015-01-24 23:11:58 +08:00
vibbow
2015-01-24 23:12:28 +08:00
http://azure.microsoft.com/zh-cn/services/search/
不知道对中文支持怎么样。。。
Agromania
2015-01-24 23:15:03 +08:00
sphinx就是个小玩具……solr其实搭起来非常简单的,elastic search也很不错,不过我没用过。
两者都是基于lucene,有很多成熟的中文分词插件。
scarlex
2015-01-25 00:23:16 +08:00
elastic search +1
juicy
2015-01-25 00:31:43 +08:00
elasticsearch不错,前段时间刚用它来做了个全文搜索~
mengskysama
2015-01-25 02:35:27 +08:00
sphinx 中文支持分词的分支 coreseek 已经出到5了。

前几天尝试了xunsearch和sphinx对每个字建立索引,也就是等于没分词,查询速度来说sphinx比sphinx快很多。sphinx用起来也方面,协议也完全兼容mysql,你可以像捅mysql一样捅他的9306。

重点是分词引擎好不好以及词库好不好,直接影响到搜索结果的完整性。(有人和我说分词完整性xunsearch不如coreseek5具体怎么样有待验证)。
pubby
2015-01-25 04:10:59 +08:00
@mengskysama coreseek5跳票一年了都不见更新,估计不再维护了吧
armstrong
2015-01-25 13:14:21 +08:00
推荐ElasticSearch,前段时间刚用过,很不错
mengskysama
2015-01-25 17:45:07 +08:00
pubby
2015-01-26 13:54:19 +08:00
@mengskysama 有用过吗?目前还在用3.2的,csft后来的版本都不稳定,不敢在线上使用。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/165120

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX