5000 多万的文章怎么做相关推荐??

2017-05-05 12:20:13 +08:00
 mon3

以前单独建表,分词,但是 tag 已经有 1 亿多个了,导致网站运行很慢。

还有其他办法么?

2010 次点击
所在节点    问与答
9 条回复
JasperYanky
2017-05-05 12:29:42 +08:00
现在采集站好做么
mon3
2017-05-05 12:57:17 +08:00
@JasperYanky 做了 4 个月,每天 50 刀左右。
uuhp2009
2017-05-05 13:10:34 +08:00
@mon3 网站看可以看看不
martyyyyy
2017-05-05 13:16:31 +08:00
@mon3 很厉害,网站可以看看不
cevincheung
2017-05-05 13:17:25 +08:00
上搜索引擎,缓存
mon3
2017-05-05 13:50:22 +08:00
@cevincheung 文章页调用 elasticsearch 的结果???
cevincheung
2017-05-05 14:03:05 +08:00
@mon3 #6 对啊。可以试试啊。
mon3
2017-05-05 14:12:31 +08:00
@cevincheung 我现在就是这样做的。我当时想了一上午想出了这个办法, 可是我感觉不是太好。 其他过亿数据量的站点也很多是这样做的?
JasperYanky
2017-05-05 15:04:38 +08:00
@mon3 基本就是上 ES 后端直接渲染嫌慢的话 前端去 es 上查询;话说这样好像对 SEO 不太好

对于这种采集类的网站,我的想法是上 ES 然后直接 每篇文章生成的时候就查询好相关文章 ,然后直接写到该数据里,简单粗暴;当然可以只保留 id 然后二次再查询。
仅仅对采集站而言的,采集站有个特点是,用户浏览不多,但是搜索引擎爬的很厉害,所以简单粗暴也许更好点

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/359312

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX