说明:
看了一部评分很高的电影,彗星来的那一夜,发现并不好看, 实在对不起那么高的评分。于是翻了一下 IMDB 的评分,发现差距还是蛮大的, 上图为豆瓣评分,下图为 IMDB 评分.
像白日梦想家, 也是国内的评分很高,但是国外的评论差距就挺大的
你可以看到 IMDB 和豆瓣的评分差别很大,短评差距也很大
再想到以前豆瓣出现过不存在的电影高分评分的现象,于是就想问 —— 豆瓣电影的评分真的"对"吗?会不会有人为了装逼特意打高分 /低分?
于是, 就从 IMDB 和豆瓣电影入手,比较一下两者的差异
从Movieinsider 找到了 2010-2015 国外上映的电影的榜单做了抓取,拿到豆瓣和 IMDB 的评分, 总共 822 部
豆瓣和 IMDB 的分布基本相似,而且有高分有低分,大致呈现正态分布,说明拿到的数据量基本是够的
顺便拿到了 Metacrtic 的评分,他们的评分经过了人工的调整,维持均值在 5 左右, 所以和 IMDB 和豆瓣评分差别很大
具体见notebook
这是因为一些电影国内没什么人看过,评分很少, 所以做了剔除,具体分析见notebook
接下来,我们直接选取豆瓣和 IMDB 评分人数同时大于 2000 的,这个评分就会比较客观, 不会受人数太少评分可能不客观的影响
散点图可以很方便的做出两者的比较,横坐标是豆瓣评分,纵坐标是 IMDB 评分。这个图表是交互式的,大家可以自己看看,地址
这里我们做了一条 IMDB - 豆瓣的回归线,并且画出了 1:1 的线。可以发现
两者斜率不同,而且分数越高,差别越大。个人推测原因,可能是打分制的缘故
IMDB: 10 星制。没有人会打 10 星
豆瓣: 5 星制。 4 星以上都会打 5 星
豆瓣的打分制概念简单,不需要太精确,体验更好
IMDB 比豆瓣要齐整得多。豆瓣确实有一些电影,偏离回归线较大, 集中在 4, 6 分区间
具体做成了交互式的图表,大家可以玩一玩,看看有什么发现
根据豆瓣和 IMDB 的电影评分的差距,可以做绝对分差、相对分差排名的排名, 具体见notebook
仔细看排名,发现像 Eat, Pray, Love, 疯狂原始人, 蓝精灵, 冰川世代的评价差别是很大的
那么,有没有可能因为豆瓣上的用户比较文艺、小清新,所以对于爱情、动画类的电影,评价会偏高。我们可以按分类来画散点图来比较
这里,大家可以把关注点主要放在回归折线和 1:1 直线的关系上。可以发现,对于动作、爱情、喜剧等等类别的电影回归直线的斜率都有不同,但总体相差不大, 而动画类则很明显,都已经平行了。
在 IMDB 的低分区,确实有不少电影被高估了,具体地址散点图
另外一个现象,是国内电影的差距似乎较大. 比如少林,让子弹飞,一代宗师
我们同样也可以画出一条散点图比较
然而其图和之前的并没有太大差别。当然也有可能是样本比较少的原因。
这次特地补充一下恶意差评的现象, 其实这才是现在大家关注的点。这里,我觉得举一个例子就够了
请猜一下,这部电影的 IMDB 评分是多少?
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.