做了一个比百度谷歌更流畅更丝滑的搜索引擎,欢迎大家提建议

2023-06-20 08:56:56 +08:00
 bigtang
大家习惯了百度谷歌的用法,以为已经到了极致,其实还可以更快。
大家也习惯了使用 ElasticSearch, 无论大中小公司都在使用。

很难想象一个极度需要性能的业务居然从底层都是基于 java 开发的,大家来对比一下我们基于 c++开发的搜索引擎:
tanglib.com , 从搜索体验上,是否有一些超出。

tanglib.com 目前运行在单机上,接近 1T 的文本,从后台看响应基本在几毫秒内,即是做成集群,聚合搜索结果一般也不会超过十毫秒,人类根本感觉不到。

v2ex 上曾经有几个小搜索引擎,例如 magi.com , 不过看起来最终都没有做起来。

这项技术如何发展,我没有想好,恳求大家发表建议,集思广益一下,谢谢。
3540 次点击
所在节点    互联网
25 条回复
inhzus
2023-06-20 15:45:16 +08:00
对比 sphinx, meilisearch, vespa 这些呢... 一对比就来活了
c2const
2023-06-20 16:57:40 +08:00
感觉数据量不够,还是习惯谷歌的结果
C603H6r18Q1mSP9N
2023-06-20 18:13:12 +08:00
让我想起来一个笑话:
请问 168 乘以 861 等于多少?没任何思考 回答 82128

只保证快,没说答案对
bigtang
2023-06-20 19:26:45 +08:00
#22 #23 应该是非技术人员,本帖本意是说比较搜索体验,不是代替百度谷歌。
tanglib.com 只是源代码搜索,只能搜源代码。
当然如果真有百度谷歌那么多内容,加上 pagerank ,是可以超越百度谷歌的。
tntin
2023-06-21 00:32:31 +08:00
标题党 。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/950176

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX