先贴地址:
http://shixiz.com用 elasticSearch 作为搜索引擎,数据来自 v2ex 的 api 接口
索引了全部主题和大部分回复(主题目前半小时更新一次,回复还未开始更新)
这几天刚刚加上了中文分词,可用性总算达到了及格线。
自己 YY 了一种简单的`综合排序`方法
log2(回复数)* 搜索引擎的匹配得分 * log2(发帖时间 - 建站时间)
同时还可以根据 `发布时间` `回复数` `匹配分` 对结果排序。
部署在 ec2 上,索引全部数据居然用了两天啊,妈蛋。是分词用的词库太大?
p.s. 回贴最好贴下`搜索关键词`和`结果评价`
感恩 :)
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
https://www.v2ex.com/t/131547
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.