一个简单的网文推荐系统,解决书荒

2016-09-25 14:04:18 +08:00
 shidenggui
最近在学习机器学习,以前很喜欢看网文,当时最烦的就是看完一本书之后找不到其他类似那么好看的书,俗称书荒。就收集了一点数据来做一个书籍相似度的查询,用了最简单的余弦相似度计算。貌似效果比预期中好点。

目前服务托管在 daocloud 上,地址: http://netbook.daoapp.io/ 。 欢迎大家试用 && 提出意见

下面是 《亵渎》 的匹配结果

17519 次点击
所在节点    分享创造
101 条回复
guonning
2016-09-25 14:12:51 +08:00
很好,喜欢网文。希望可以解决书荒问题
guonning
2016-09-25 14:14:26 +08:00
希望可以把代码分享出来
hl284975274
2016-09-25 14:24:39 +08:00
好思路!希望代码分享在 github 大家一块改进!
Abirdcfly
2016-09-25 14:56:20 +08:00
出乎意料的好。测试几本书的结果和我人脑推荐结果差不多。
miyuki
2016-09-25 15:06:29 +08:00
感觉挺准的
qfdk
2016-09-25 15:06:36 +08:00
求源码 spark 的么
zxcasdqwe9
2016-09-25 15:11:04 +08:00
建议结果列表的书名可以直接点击继续搜索
Wyatt
2016-09-25 15:13:25 +08:00
Wyatt
2016-09-25 15:14:05 +08:00
无视上条,回复错了 QAQ
zxcasdqwe9
2016-09-25 15:18:20 +08:00
搜《新宋》的结果很奇怪啊
zxcasdqwe9
2016-09-25 15:21:42 +08:00
书籍重名的搜索结果需要优化
shidenggui
2016-09-25 15:26:57 +08:00
@zxcasdqwe9 为了简化结果,重名的书籍应该是都给我丢弃了
mrfox
2016-09-25 15:30:27 +08:00
试了,书名包括英文就无结果
Troevil
2016-09-25 15:30:59 +08:00
是根据关键词来的吧
hit410
2016-09-25 15:36:51 +08:00
感觉很不错
gimp
2016-09-25 15:45:34 +08:00
很棒!
mosbic
2016-09-25 16:17:42 +08:00
棒!!
nladuo
2016-09-25 16:21:06 +08:00
好东西,有时间自己也写一个。
kikyous
2016-09-25 16:31:43 +08:00
不错,希望能开源学习学习
lujun9972
2016-09-25 16:33:08 +08:00
请问数据从哪爬下来的?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/308827

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX