豆瓣网友装逼吗(电影篇)? —— 一个数据分析的视角

2016-12-29 17:58:34 +08:00
 cqcn1991

说明:

0. 问题的介绍

起因

看了一部评分很高的电影,彗星来的那一夜,发现并不好看, 实在对不起那么高的评分。于是翻了一下 IMDB 的评分,发现差距还是蛮大的, 上图为豆瓣评分,下图为 IMDB 评分.

其他的电影也有这个问题

白日梦想家, 也是国内的评分很高,但是国外的评论差距就挺大的

你可以看到 IMDB 和豆瓣的评分差别很大,短评差距也很大 这两部电影的评分是 8.3, 而其他同样评分的电影,我就觉得挺好的,像下面这几部 再比如超人钢铁之躯, 就是我很喜欢,但是分数很低,以前周星驰的功夫也是如此,不过近几年有回升

问题

再想到以前豆瓣出现过不存在的电影高分评分的现象,于是就想问 —— 豆瓣电影的评分真的"对"吗?会不会有人为了装逼特意打高分 /低分?

于是, 就从 IMDB 和豆瓣电影入手,比较一下两者的差异

1. 数据概况

Movieinsider 找到了 2010-2015 国外上映的电影的榜单做了抓取,拿到豆瓣和 IMDB 的评分, 总共 822 部

IMDB/豆瓣 /Metacritic 分布

豆瓣和 IMDB 的分布基本相似,而且有高分有低分,大致呈现正态分布,说明拿到的数据量基本是够的

顺便拿到了 Metacrtic 的评分,他们的评分经过了人工的调整,维持均值在 5 左右, 所以和 IMDB 和豆瓣评分差别很大

基本的电影列表概况展示

具体见notebook

需要注意的是,实际会有一些豆瓣评分为 0 的电影

这是因为一些电影国内没什么人看过,评分很少, 所以做了剔除,具体分析见notebook

接下来,我们直接选取豆瓣和 IMDB 评分人数同时大于 2000 的,这个评分就会比较客观, 不会受人数太少评分可能不客观的影响

2. 散点图比较

2.1 散点图

散点图可以很方便的做出两者的比较,横坐标是豆瓣评分,纵坐标是 IMDB 评分。这个图表是交互式的,大家可以自己看看,地址

这里我们做了一条 IMDB - 豆瓣的回归线,并且画出了 1:1 的线。可以发现

两者斜率不同,而且分数越高,差别越大。个人推测原因,可能是打分制的缘故

IMDB: 10 星制。没有人会打 10 星

豆瓣: 5 星制。 4 星以上都会打 5 星

豆瓣的打分制概念简单,不需要太精确,体验更好

2.2 基本概况观察

根据豆瓣和 IMDB 的电影评分的差距,可以做绝对分差、相对分差排名的排名, 具体见notebook

3. 进一步的观察

3.1 类别会有影响吗?

仔细看排名,发现像 Eat, Pray, Love, 疯狂原始人, 蓝精灵, 冰川世代的评价差别是很大的

那么,有没有可能因为豆瓣上的用户比较文艺、小清新,所以对于爱情、动画类的电影,评价会偏高。我们可以按分类来画散点图来比较

这里,大家可以把关注点主要放在回归折线和 1:1 直线的关系上。可以发现,对于动作、爱情、喜剧等等类别的电影回归直线的斜率都有不同,但总体相差不大, 而动画类则很明显,都已经平行了。

在 IMDB 的低分区,确实有不少电影被高估了,具体地址散点图

3.2 国别会有影响吗?

另外一个现象,是国内电影的差距似乎较大. 比如少林,让子弹飞,一代宗师

我们同样也可以画出一条散点图比较

然而其图和之前的并没有太大差别。当然也有可能是样本比较少的原因。

3.3 恶意差评?

这次特地补充一下恶意差评的现象, 其实这才是现在大家关注的点。这里,我觉得举一个例子就够了

请猜一下,这部电影的 IMDB 评分是多少?

IMDB 链接

4. 结论

最后,请大家猜一下,黑客帝国 3 的豆瓣电影评分IMDB 评分是多少?

11477 次点击
所在节点    分享创造
73 条回复
helloSwift
2016-12-29 22:32:40 +08:00
你还真是较真😂,每部作品都有自己的看法吧

要说装不装逼,不好说。反正我既看不出来别人有没有演技,也看不出来导演编剧工地到底如何。

我只知道,我只要看这部片子难受,我就关视频。一言不发,该干嘛干嘛去😐
ynyounuo
2016-12-29 22:32:54 +08:00
数据呈现看起来非常好
但是对于数据的分析和洞见则并不是很有意思
zingl
2016-12-29 23:57:41 +08:00
IMDB 里随机取 2 组不同的电影,可以做同样的分析,也是同样的没有意义
jedicxl
2016-12-30 00:12:08 +08:00
@lxy IMDB8.1 晓得啥含义不? 8 分以上的商业片有几部呢?前面已经有人说过了, IMDB 上 7 分已经很难(指的至少首映 3 个月以后的稳定期的打分)
cydysm
2016-12-30 00:47:01 +08:00
你这提出的问题和给出的结论 对不上啊
5night
2016-12-30 02:00:05 +08:00
辛苦了。
是否“装逼”就是指和 IMDB 评分差距大 /小么?好像不对吧,标题改为对比分析还是可以的。
豆瓣有防卫水军和恶意差评的机制的。
最后,《彗星》这部片子我很喜欢。
DiamondbacK
2016-12-30 02:24:44 +08:00
楼主为什么把两部电影的 IMDB 和豆瓣评分直接相比呢?楼主不可能不明白这是不可比的啊,而且接下来列出的评分分布数据更直接显示了两个站的分数基准相差明显啊。
DiamondbacK
2016-12-30 02:29:54 +08:00
@lxy IMDb Top 250 里面只有 Top 3 上 9.0 分,而排名第 250 的 Queen 是 8.0 分。
DiamondbacK
2016-12-30 02:34:55 +08:00
@lxy @yexm0 而 8.1 分的是从 151th 到 213th ,《疯狂动物城》此时此刻是 227th 。
cqcn1991
2016-12-30 08:39:35 +08:00
@DiamondbacK 其实就是说的这点,具体比较的时候也按电影的“分位数”做了比较。只是 v 站不能更新主贴,没办法按大家的反馈更新…
DuckJK
2016-12-30 09:08:16 +08:00
自打看了两部豆瓣评分很高其实很渣渣的电影,我再也不信豆瓣了。
mufeng
2016-12-30 09:15:36 +08:00
推荐你去看看《 The Man from Earth 》这片,就知道为什么豆瓣是这口味了,手动 doge 。
joewangyz
2016-12-30 10:01:22 +08:00
@bluecrow 哈哈哈 赞。 没错。
linxiaolin
2016-12-30 10:36:15 +08:00
@DuckJK 希望能分享一下片名 .
Mbin
2016-12-30 11:32:27 +08:00
无聊的时候看了豆瓣 N 多影评,觉得豆瓣就是有相当一群装逼犯-_-
moguiyu
2016-12-30 11:33:58 +08:00
@jedicxl 非常认同关于政治正确和 coherence 的观点。。。后面这个片子实在是精制。
Perry
2016-12-30 11:57:53 +08:00
有没有考虑过豆瓣打分都是偶数打分
2 , 4 , 6 , 8 , 10 这样,所以九分会比较常见
如果豆瓣给十颗星很多电影打五分的我也会打八分
rekulas
2016-12-30 12:06:20 +08:00
一直怀疑豆瓣对国产电影带有歧视但没有确凿证据,可以把所有国产电影数据抓来分析,根据分布图分析,如果跟全种类分布图差异较大,基本可以确认。
cqcn1991
2016-12-30 12:16:00 +08:00
@Perry 我觉得就是这个原因。正文中写了。只是原文写得太长,大家都没读到…
Geeker
2016-12-30 12:24:29 +08:00
哈哈哈哈,知乎笔法

不过楼主较真的精神还是值得肯定

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/331068

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX