我来讲解之前那个网站猫猫楼的算法原理了,献丑了,别打脸。。。

2015-04-27 14:00:42 +08:00
 questionlin

先附上网址: http://www.maomaolou.com
安卓app: http://pan.baidu.com/s/1jGAEtDk
ios app: https://itunes.apple.com/cn/app/mao-mao-lou-kan-zi-xun-yu/id985938882?l=zh&ls=1&mt=8

原理是这样的:
1.我先从几十个精选的网站抓取文章列表,这里用到scrapy
2.经过分词后和节点的关键词匹配,这里用到结巴分词
3.如果符合精选特征的话,就和精选文章节点匹配
4.如果有匹配的话,就再抓取文章内容,并把链接和节点关系上传到网站上

所以用户可以把自己关心的关键词作为节点推荐到网站上,也可以推荐你希望抓取的网站。当然直接推荐文章最好。
不过这样一来,随着节点越来越多,最终必然会变成rss 阅读器,所以就需要用户订阅自己关心的节点,并且顶/踩文章了。
如果用户参与度够高的话,你看到的猫猫楼应该是所有你关注的、网站推荐的,并且经过大家打分过的内容。

好啦,大致就是这样。我滚了。。。

3307 次点击
所在节点    编程
4 条回复
ilotuo
2015-04-27 14:05:57 +08:00
谁来讲解lz是如何巧妙地打广告
xiaome
2015-04-27 16:27:29 +08:00
这个广告有点厉害
JackNo1
2015-04-28 04:02:22 +08:00
能说一下这网站和Reddit有什么区别么?
questionlin
2015-04-28 10:36:59 +08:00
@JackNo1 区别在于玩法吧, reddit 是论坛,而猫猫楼更像一个有过滤和社交功能的 rss 阅读器。后台程序保证了每次上来都能有新鲜事看。
而且,国内不是还没有 reddit 么,我来填补这个空缺。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/186678

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX