数据对比效率如何更高

2017-11-13 16:18:52 +08:00
 suhui

我现在有一个有 500 个关键词,现在请求一个 API,需要判断 API 里面的文章标题包含这些关键词,将包含这个的 500 个关键词中的一种的文章存下来,这样每一篇文章需要 500 次,效率有点低,有什么效率比较高的方法?用的是 php 语言

1559 次点击
所在节点    问与答
5 条回复
liprais
2017-11-13 16:20:34 +08:00
关键词 bloom_filter
mx1700
2017-11-13 18:59:41 +08:00
AC 多模式匹配应该可以
不过在 php 里不一定快,因为 php 对象没法常驻内存,每个请求都构造字典估计比循环 500 次还慢
另外可以试试搞成一个超大的正则表达式
gouchaoer
2017-11-13 19:04:21 +08:00
gouchaoer
2017-11-13 19:06:16 +08:00
500 次效率不是问题,就笨方法最好
gouchaoer
2017-11-13 19:07:23 +08:00
正则不能提高效率吧

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/406017

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX