基于 Bangumi.tv 220 万用户评分的动画推荐工具

2017-06-15 21:40:18 +08:00
 Icemic

这是一个基于 Bangumi.tv 220 万用户评分的动画推荐工具,算是自己在推荐系统方面的入门尝试

如题,能根据你选择的某个动画,推荐与其相似的其他动画。
相似是指「喜欢该动画的人大多也会喜欢」
比如找合适自己的老番来看之类的~

最早是今年年初在 Coursera 学吴恩达的机器学习课程时练手用的,后来发现还挺准确的。
于是花了一些时间把 Matlab 程序改成了 Python 实现,这两周继续做了网站供人查询。

地址:https://search.bakery.moe/ (注:使用前请先阅读「关于」)

网站源码: https://github.com/Icemic/search.bakery.moe (欢迎 pr )

5856 次点击
所在节点    分享创造
74 条回复
rabbbit
2017-06-15 21:45:02 +08:00
https://search.bakery.moe/search/青兰圆舞曲
搜青兰圆舞曲,这给我推荐的啥玩意?
Icemic
2017-06-15 21:46:34 +08:00
@rabbbit 只有在 Bangumi.tv 上有 rank 的才能搜到,青蓝圆舞曲 http://bgm.tv/subject_search/%E9%9D%92%E5%85%B0%E5%9C%86%E8%88%9E%E6%9B%B2?cat=2 不在榜单上,数据量过小,加入了也不会准确的……
Icemic
2017-06-15 21:54:32 +08:00
@rabbbit 而且您是不是没有看说明,搜索出来的也不是推荐内容啊。

首先要通过关键字搜索找到你要找的那个动画,点击链接进入这个动画的页面,才会显示根据该动画给出的相似推荐~
whwq2012
2017-06-15 21:55:15 +08:00
你这个是按关键字推荐的吧,哪里按照兴趣了,我搜我的英雄学院,出来的都是英雄和学院相关的。
Icemic
2017-06-15 21:57:32 +08:00
@whwq2012 看楼上……
rabbbit
2017-06-15 22:04:35 +08:00
这样啊,点进去之后没看见右上角的'关于'按钮,以为搜索作品名会直接显示推荐.
whwq2012
2017-06-15 22:11:45 +08:00
@Icemic 我点进去看了,但这个推荐还是有点坑,我搜的是热血,出来的是恋爱的动漫。。
TriiHsia
2017-06-15 22:13:09 +08:00
先不说操作逻辑,我感觉推荐给我的番剧,基于对原番剧的口味,并不是太感兴趣。没有看代码,所以不知道你是基于什么算法开展训练的。
htfy96
2017-06-15 22:36:36 +08:00
楼主有数据吗?刚好最近想做点类似的东西
Icemic
2017-06-15 22:49:01 +08:00
@whwq2012 注意相似的定义,不管怎么样,给你搜索的那个动画高评分的人,确实也给推荐内容高评分了………要么就是你搜索的是很冷的番……

话说各位说不准的说下搜索的是哪个动画啊,以及,推荐这个东西,本来就是全体概率性的,个体不准确很正常……我抓朋友测的都说还不错……
Icemic
2017-06-15 22:49:18 +08:00
@TriiHsia 协同过滤
Icemic
2017-06-15 22:50:58 +08:00
@TriiHsia
@whwq2012

话说你俩的期望正好相反……一个是希望推荐的内容与原内容相近,一个说相近不感兴趣 😂😂
TriiHsia
2017-06-15 22:53:29 +08:00
@Icemic 正因为不相近于原内容所以不感兴趣...
Icemic
2017-06-15 22:55:04 +08:00
@TriiHsia 搜索的哪个动画?
cqcn1991
2017-06-15 22:55:06 +08:00
@Icemic 我最近也在看推荐系统
所以你只是用的协同过滤?相关的算法 /包是啥?能看看不?
Icemic
2017-06-15 22:57:28 +08:00
@cqcn1991 基本上和吴恩达课上讲的一样,有低秩矩阵分解做 PCA 拿到的特征
cqcn1991
2017-06-15 23:00:08 +08:00
@Icemic 看你 Github 介绍...难道是我土木出身? 然后你 blog https 挂了貌似
cqcn1991
2017-06-15 23:02:17 +08:00
@Icemic 然后,按照我这几天看的推荐系统。。。。
基本的协同过滤,我感觉称为“相关物品”更佳,因为“推荐”不止是相似的东西。但是经典的协同貌似只能做到这个程度。
典型的应用场景就是 Amazon 的相关商品

我们对推荐系统,其实很看重 serendipity,完全是另外一个 measure 了
grzhan
2017-06-15 23:42:09 +08:00
感觉挺不错的。

不准的话
搜了下“永生之酒”,觉得相关的应该会出现“无头骑士异闻录”,没有出现,返回最相关的是 JOJO
搜了下“剑风传奇”,觉得相关的应该会出现“大剑”,没有出现,返回最相关的是 Dimension W
搜了下“白箱”,觉得相关的应该会出现这季的“樱花任务”,或者 “ New Game ” 这样的职场番,没有出现,返回最相关的是蜂蜜与四叶草

不知道作者说的比较准确的例子有哪些,也想看一下。
AstroProfundis
2017-06-15 23:46:52 +08:00
居然没有茶话会联动贴?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/368723

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX