豆瓣网友装逼吗(电影篇)? —— 一个数据分析的视角

2016-12-29 17:58:34 +08:00
 cqcn1991

说明:

0. 问题的介绍

起因

看了一部评分很高的电影,彗星来的那一夜,发现并不好看, 实在对不起那么高的评分。于是翻了一下 IMDB 的评分,发现差距还是蛮大的, 上图为豆瓣评分,下图为 IMDB 评分.

其他的电影也有这个问题

白日梦想家, 也是国内的评分很高,但是国外的评论差距就挺大的

你可以看到 IMDB 和豆瓣的评分差别很大,短评差距也很大 这两部电影的评分是 8.3, 而其他同样评分的电影,我就觉得挺好的,像下面这几部 再比如超人钢铁之躯, 就是我很喜欢,但是分数很低,以前周星驰的功夫也是如此,不过近几年有回升

问题

再想到以前豆瓣出现过不存在的电影高分评分的现象,于是就想问 —— 豆瓣电影的评分真的"对"吗?会不会有人为了装逼特意打高分 /低分?

于是, 就从 IMDB 和豆瓣电影入手,比较一下两者的差异

1. 数据概况

Movieinsider 找到了 2010-2015 国外上映的电影的榜单做了抓取,拿到豆瓣和 IMDB 的评分, 总共 822 部

IMDB/豆瓣 /Metacritic 分布

豆瓣和 IMDB 的分布基本相似,而且有高分有低分,大致呈现正态分布,说明拿到的数据量基本是够的

顺便拿到了 Metacrtic 的评分,他们的评分经过了人工的调整,维持均值在 5 左右, 所以和 IMDB 和豆瓣评分差别很大

基本的电影列表概况展示

具体见notebook

需要注意的是,实际会有一些豆瓣评分为 0 的电影

这是因为一些电影国内没什么人看过,评分很少, 所以做了剔除,具体分析见notebook

接下来,我们直接选取豆瓣和 IMDB 评分人数同时大于 2000 的,这个评分就会比较客观, 不会受人数太少评分可能不客观的影响

2. 散点图比较

2.1 散点图

散点图可以很方便的做出两者的比较,横坐标是豆瓣评分,纵坐标是 IMDB 评分。这个图表是交互式的,大家可以自己看看,地址

这里我们做了一条 IMDB - 豆瓣的回归线,并且画出了 1:1 的线。可以发现

两者斜率不同,而且分数越高,差别越大。个人推测原因,可能是打分制的缘故

IMDB: 10 星制。没有人会打 10 星

豆瓣: 5 星制。 4 星以上都会打 5 星

豆瓣的打分制概念简单,不需要太精确,体验更好

2.2 基本概况观察

根据豆瓣和 IMDB 的电影评分的差距,可以做绝对分差、相对分差排名的排名, 具体见notebook

3. 进一步的观察

3.1 类别会有影响吗?

仔细看排名,发现像 Eat, Pray, Love, 疯狂原始人, 蓝精灵, 冰川世代的评价差别是很大的

那么,有没有可能因为豆瓣上的用户比较文艺、小清新,所以对于爱情、动画类的电影,评价会偏高。我们可以按分类来画散点图来比较

这里,大家可以把关注点主要放在回归折线和 1:1 直线的关系上。可以发现,对于动作、爱情、喜剧等等类别的电影回归直线的斜率都有不同,但总体相差不大, 而动画类则很明显,都已经平行了。

在 IMDB 的低分区,确实有不少电影被高估了,具体地址散点图

3.2 国别会有影响吗?

另外一个现象,是国内电影的差距似乎较大. 比如少林,让子弹飞,一代宗师

我们同样也可以画出一条散点图比较

然而其图和之前的并没有太大差别。当然也有可能是样本比较少的原因。

3.3 恶意差评?

这次特地补充一下恶意差评的现象, 其实这才是现在大家关注的点。这里,我觉得举一个例子就够了

请猜一下,这部电影的 IMDB 评分是多少?

IMDB 链接

4. 结论

最后,请大家猜一下,黑客帝国 3 的豆瓣电影评分IMDB 评分是多少?

11348 次点击
所在节点    分享创造
73 条回复
cqcn1991
2016-12-30 12:26:24 +08:00
@rekulas 有高也有低。例子:让子弹飞,一代宗师,太极,英雄
有文化差异的因素,也有情怀的因素。当然最直接的影响因素是影片的质量,总体来说,一代宗师分数再低,也比某些片会高
buckyRRRR
2016-12-30 12:27:39 +08:00
《彗星来的那一夜》不好看?这么屌的电影你一句不好看就否定掉了
forgetandnew
2016-12-30 12:33:00 +08:00
豆瓣不都是文青情节吗?不装逼那还怎么叫文青
aitaii
2016-12-30 12:33:28 +08:00
大数据也得有个背景,国内外的文化环境不同啊。
buckyRRRR
2016-12-30 12:39:32 +08:00
有些人真好笑,看翻译过来的书的人下面评论大多数翻译的不好,推荐去看原版,那你直接去看原版好了,非得看一下翻译的恶心一下自己,然后又跑网上说看原版好,你要英语那么好还需要这么折腾吗?说豆瓣评分不好,那你找一个更好更高效的方式呀。多少人所谓的客观批评都只是为了小透明们刷存在感,知乎上的小透明,豆瓣上的小透明,生活中的小透明,说白了都是一群可怜虫
rekulas
2016-12-30 12:49:59 +08:00
@cqcn1991 我并不是说没有高分,而是指怀疑原本应该给中等分数的电影,被评分为中低或者低等
hotStrip
2016-12-30 12:51:27 +08:00
100 个人看电影, 99 个人喜欢,给了高分,我是那 1 个人,不喜欢,给了 1 分,我算恶意差评吗?看电影就图爽快吧,毕竟专业影评人少,吃瓜群众多,评分大多数吃瓜群众还是看自己喜好。
levn
2016-12-30 13:06:55 +08:00
希望电影公司不要在豆瓣上养那么多水军号了,把好好的一个网站给搞得乱七八糟。也不要花钱在报纸上乱发垃圾文章了。
gfexfizv
2016-12-30 13:12:57 +08:00
这部电影我打了四星,挺好看的觉得…楼主举这个例子不好,这部片可能根本就没在大陆上映过(电影院上映),大家去看就是口口传的(网络)
DuckJK
2016-12-30 13:14:42 +08:00
@linxiaolin 《机动部队》,另外还有个电影刘青云的《神探》,《这个男人来自地球》看得想睡觉。
d7101120120
2016-12-30 13:25:55 +08:00
豆瓣其实挺可怜的,也没赚到什么钱,以前文艺青年扎堆被大众嘲讽,现在大众扎堆人们又觉得他没有逼格了,还天天被各路水军刷分,结果大家还觉得他不客观了。
SeptimusX
2016-12-30 13:39:20 +08:00
@buckyRRRR 对于有能力看原版的人来说,也许他会因为节省时间等考虑而选择翻译版,有些出过不止一版的书也会因为译者不同而质量差别较大,由此发现问题没什么不正常的,这某种意义上说是“排雷”。
fyl00
2016-12-30 14:19:15 +08:00
豆瓣的正确使用方式是友邻评分

另外楼主的文章,分析和结论我没办法连接起因果关系 orz
c0878
2016-12-30 14:30:13 +08:00
imdb 用户和豆瓣用户区别肯定不小 文化差异导致的 imdb 分数其实参考性不大 豆瓣的评分更符合国内观众口味
这里指的是外国电影
国产电影的评分豆瓣完全没有可参考性,国内没有任何一家可以参考,因为都是水军
Domains
2016-12-30 14:32:18 +08:00
要是豆瓣评分都要和 IMDb 一致的,那还要豆瓣做什么? 不干脆 IMDb ?就那张中文外皮? IMDb 现在没和谐吧
电影那么多,有文艺的,有低俗搞笑的,有爆米花的,有深度的,每个人的观赏能力都不一样,甚至每个人看电影的心情都不一样。
------
好消息,据路边社报道,因《摆渡人》评分过低,阿里影业将收购豆瓣,以后通通实名制,凭淘宝 ID 登陆打分,以后凡看国产片,对照淘宝好评均能返现,标准:票根截图+5 星+20 字以上好评。恶意差评者将扣芝麻分,情节严重的将开启专项一对一的电话关怀。
我是认真的。
KidRoland
2016-12-30 14:33:19 +08:00
豆瓣一堆打三星标记三星半的呢其实
sudoz
2016-12-30 14:36:13 +08:00
@jedicxl 并不觉得是无用功,至少说明国师说的一句话是道出一二的,外来的和尚好念经,国外电影多数会上浮 0.5 分
cocacold
2016-12-30 14:50:18 +08:00
感谢 LZ 做的对比和分析。实际上我看豆瓣的时候也会点去 IMDB 看,没有发现差距很大的情况。虽然看电影与个人口味有关。但好电影和烂电影还是有区别的。
ppwangs
2016-12-30 14:56:17 +08:00
不禁让我想起了《即使变成甲壳虫卡夫卡还是进不了城堡》
ppwangs
2016-12-30 15:03:01 +08:00

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/331068

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX