最近在折腾 PGSQL 的 FTS 。中文索引支持的好的也就 zhparser 、jieba 几个。
在做索引的时候都是to_tsvector
,结构是: 'keyword':pos1,pos2,pos3
,类型是 text
搜索的时候 是 to_tsquery
结构是 'keyword1' & 'keyword2'
类型是 text
搜索的结果就看分词分的好不好。
测试的时候,看到一个测试的文章标题是'我请你吃一个大瓜吧'。
我就想用'吃瓜'这个词把这条数据检索出来,发现 title 的 吃瓜
不在一起,搜烂了也不可能被搜出来。
最后,问题是,用'吃瓜'来进行检索,这条数据应该能被检索出来吗?
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.