豆瓣网友装逼吗(电影篇)? —— 一个数据分析的视角

2016-12-29 17:58:34 +08:00
 cqcn1991

说明:

0. 问题的介绍

起因

看了一部评分很高的电影,彗星来的那一夜,发现并不好看, 实在对不起那么高的评分。于是翻了一下 IMDB 的评分,发现差距还是蛮大的, 上图为豆瓣评分,下图为 IMDB 评分.

其他的电影也有这个问题

白日梦想家, 也是国内的评分很高,但是国外的评论差距就挺大的

你可以看到 IMDB 和豆瓣的评分差别很大,短评差距也很大 这两部电影的评分是 8.3, 而其他同样评分的电影,我就觉得挺好的,像下面这几部 再比如超人钢铁之躯, 就是我很喜欢,但是分数很低,以前周星驰的功夫也是如此,不过近几年有回升

问题

再想到以前豆瓣出现过不存在的电影高分评分的现象,于是就想问 —— 豆瓣电影的评分真的"对"吗?会不会有人为了装逼特意打高分 /低分?

于是, 就从 IMDB 和豆瓣电影入手,比较一下两者的差异

1. 数据概况

Movieinsider 找到了 2010-2015 国外上映的电影的榜单做了抓取,拿到豆瓣和 IMDB 的评分, 总共 822 部

IMDB/豆瓣 /Metacritic 分布

豆瓣和 IMDB 的分布基本相似,而且有高分有低分,大致呈现正态分布,说明拿到的数据量基本是够的

顺便拿到了 Metacrtic 的评分,他们的评分经过了人工的调整,维持均值在 5 左右, 所以和 IMDB 和豆瓣评分差别很大

基本的电影列表概况展示

具体见notebook

需要注意的是,实际会有一些豆瓣评分为 0 的电影

这是因为一些电影国内没什么人看过,评分很少, 所以做了剔除,具体分析见notebook

接下来,我们直接选取豆瓣和 IMDB 评分人数同时大于 2000 的,这个评分就会比较客观, 不会受人数太少评分可能不客观的影响

2. 散点图比较

2.1 散点图

散点图可以很方便的做出两者的比较,横坐标是豆瓣评分,纵坐标是 IMDB 评分。这个图表是交互式的,大家可以自己看看,地址

这里我们做了一条 IMDB - 豆瓣的回归线,并且画出了 1:1 的线。可以发现

两者斜率不同,而且分数越高,差别越大。个人推测原因,可能是打分制的缘故

IMDB: 10 星制。没有人会打 10 星

豆瓣: 5 星制。 4 星以上都会打 5 星

豆瓣的打分制概念简单,不需要太精确,体验更好

2.2 基本概况观察

根据豆瓣和 IMDB 的电影评分的差距,可以做绝对分差、相对分差排名的排名, 具体见notebook

3. 进一步的观察

3.1 类别会有影响吗?

仔细看排名,发现像 Eat, Pray, Love, 疯狂原始人, 蓝精灵, 冰川世代的评价差别是很大的

那么,有没有可能因为豆瓣上的用户比较文艺、小清新,所以对于爱情、动画类的电影,评价会偏高。我们可以按分类来画散点图来比较

这里,大家可以把关注点主要放在回归折线和 1:1 直线的关系上。可以发现,对于动作、爱情、喜剧等等类别的电影回归直线的斜率都有不同,但总体相差不大, 而动画类则很明显,都已经平行了。

在 IMDB 的低分区,确实有不少电影被高估了,具体地址散点图

3.2 国别会有影响吗?

另外一个现象,是国内电影的差距似乎较大. 比如少林,让子弹飞,一代宗师

我们同样也可以画出一条散点图比较

然而其图和之前的并没有太大差别。当然也有可能是样本比较少的原因。

3.3 恶意差评?

这次特地补充一下恶意差评的现象, 其实这才是现在大家关注的点。这里,我觉得举一个例子就够了

请猜一下,这部电影的 IMDB 评分是多少?

IMDB 链接

4. 结论

最后,请大家猜一下,黑客帝国 3 的豆瓣电影评分IMDB 评分是多少?

11348 次点击
所在节点    分享创造
73 条回复
peartail
2016-12-29 18:01:59 +08:00
不会打分,喜欢的电影就五星,不喜欢的就一星。对我个人来讲赞和踩的评分机制更适合我。
SpicyCat
2016-12-29 18:11:31 +08:00
IMDb 上 7 分以上就很不容易了,不能跟豆瓣 7 分比。
pi1ot
2016-12-29 18:16:58 +08:00
我的豆瓣打分标准:
3 、能看完 3 分;
4 、能被强烈吸引着看完 4 分;
5 、能够不断的重看回味的 5 分,
2 、看完感觉上当的 2 分;
1 、一般没有打 1 分的,因为这样的作品根本没机会让我看完打分,只有那些找不到比 1 分更低的选项来泄愤的,才会打 1 分。
riaqn
2016-12-29 18:42:29 +08:00
我还以为你发明了深度学习算法能识别装逼行为。
单纯拿豆瓣和 IMDB 比没太大意义啊,评分算法不同,文化差异,用户群。
LU35
2016-12-29 18:43:32 +08:00
IMDB 上分高的不一定好看(大众口味),分低的一定不好看.
还有 IMDB 上不少印度电影明显被刷分了,非常多出来就是接近 9 分的水平.比如
http://www.imdb.com/title/tt2631186/
可以看看评论区.
yexm0
2016-12-29 18:48:26 +08:00
动物城 9.2 总觉得有些高...
undeflife
2016-12-29 18:53:49 +08:00
最开始在豆瓣上给电影打分是因为当时的豆瓣猜挺靠谱的,当然也有可能是当时看的电影少.
后来有段时间豆瓣几乎把豆瓣猜这个功能给弄没了 基本都是当前上映新片
现在又有豆瓣猜了,但是累计打分超过 1000 部, 豆瓣猜里出现的电影似乎并不能吸引我...
jedicxl
2016-12-29 18:56:47 +08:00
一本正经的无用功

看电影是非常个人的事情,看的就是个性化。
国内外观影人群由于文化传统、知识背景等大背景,以及个人喜好、生活经历等小背景,都会产生对同一部电影不同的评价,这再正常不过。

IMDB 也不过是一个全球影迷做公众评分的平台,中国影迷只占其中经常打分的人的一小部分,两个平台间出现评分差异简直不能再正常。早年说 IMDB 不客观的也多了去了,可这又如何?本来就不是一本正经的所谓官媒,想那么多干嘛

看电影这东西就和喝饮料一样,彼之蜜糖,我之砒霜,这有什么问题?只要是负责的平台,都会把激动之余的夸张评分、理性思考后的冷静评分的评价机制考虑进去,最终让评分呈现一个尽量客观的结果。机制在,那就不会让最终结果偏的离谱。人为的干预即没必要也很滑稽。

豆瓣比 IMDB 分高,不代表我们高估,相反亦然。这么简单的道理真搞不明白为啥还要这样严肃的说出来才能理解似的
gdtv
2016-12-29 18:57:05 +08:00
我不知大家看电影是为了训练思考能力还是为了消遣放松.

我是为了后者,所以我一般看显浅易懂的电影,我懒得思考.

拿<彗星来的那一夜>来说,如果是为了后面,这部电影就是一部情节狗屁不通的电影,评 1 分都高了.
但如果是为了前者,那么观看者可能会运用大脑最强的处理能力,从自己的角度把它自圆其说,评 10 分都觉得低.

同样的问题还存在于文学作品中.
"大约孔乙己的确死了"这句话,有人觉得这是矛盾的病句,有人会自圆其说给出各种看似合理的解释.
jedicxl
2016-12-29 18:59:42 +08:00
@yexm0 疯狂动物城在国外评价高,是因为他们有反对歧视的“政治正确”的舆论导向,以及切切实实的非常丰富悠久的歧视历史。
咱们国家没有过那么深刻难忘的歧视历史,现在的社会虽然歧视遍地但大家似乎都习以为常,所以其实国内评分本来不该这么高。不过嘛,不打高分怎么表现自己是反歧视的呢,面子大过天的国家,增加自己形象分的动作是一定要做的
jedicxl
2016-12-29 19:01:54 +08:00
@gdtv 每个人的爽点不同。我看《彗星》很爽,打了高分,这很正常。有的人看它觉得好闷好无聊,打了低分。这都再正常不过了。其实什么问题都说明不了,只是总有人喜欢挖空心思找找这个差异背后的东西。
taine
2016-12-29 19:39:08 +08:00
什么样的叫恶意差评?
lxy
2016-12-29 21:12:05 +08:00
@jedicxl 疯狂动物城 豆瓣评分 9.2 , imdb 8.1 ……
ianva
2016-12-29 21:18:26 +08:00
豆瓣的评分其实很大众的
因为本人对欧洲电影,艺术电影看的非常多,一年能看个一二百部,基本上看电影不太会在乎评分,
因为评分太大众化了,会把很多好片子的分数稀释到 7 分左右,而 8-9 分的片子大部分也不一定好,因为观众对人文关怀,莫名敢动之类的片子评分还是会高,当然大片是另一个类型,所以只会关注好的影评人或对口的影评人对他们的评分
从以上来说其实豆瓣的评分很不文艺,很大众
bluecrow
2016-12-29 21:36:23 +08:00
还真有把豆瓣评分当回事的,我都不知道说啥了。
riaqn
2016-12-29 21:57:31 +08:00
@taine 就和恶意唱空一样。
xujinkai
2016-12-29 22:12:09 +08:00
评分这个东西,还是开心就好。
动画类高分是因为会去看动画的就是喜欢动画的那批人。
给不同类型的电影打分,我自己都能感觉到自己的评分标准是不一样的。爆米花电影只要看的开心我就给 4 分,国产好电影一般都会比国外的多打一星作鼓励,一些奇奇怪怪的电影我反而会给五星,比如陈导的《无极》....
kindjeff
2016-12-29 22:25:45 +08:00
好文。最后结论和我直觉有相符的,就是豆瓣的动画电影打分都偏高。
grimpil
2016-12-29 22:26:53 +08:00
刚看了一篇文章,里面说二者的评分算法有很大不同

豆瓣、猫眼和 IMDb 的电影评分是怎么得出来的? http://app.s-reader.com/article/getInfo/3308113?l=4bb7bccef6b7a1fea92af2785f0cdbf9&site_id=703
fatestigma
2016-12-29 22:32:29 +08:00
评分这种东西啊,主要是看这个片是否符合大众喜好,评分的本身更多是「你自己对这个电影的喜好程度」,从而推荐系统可以根据你个人的喜欢来推荐。通常来说容易受大众喜欢的片, IMDB 8.0 以上的,而 8.0 以下可能也会有你个人喜欢的片。有点片我看完给了一分,而别人给了五分,可能对方真心喜欢,而我真觉得糟心。我平时喜欢自己发现式看片,而如果和别人一起看的,才会挑一个高分的(除非知道对方的喜好)。

而 IMDB 和豆瓣评分之间的差别,我觉得 IMDB 作为一个国际性的影评(可能北美用户偏多?),而豆瓣基本都是中国用户,文化差异导致电影分数上的差异也很正常,有些片有些梗,你不知道人家那背景,国产的老外也不一定能懂这设定,光看动作了。

当然, LZ 这个分析感觉还是非常有意义的,明天再好好研究研究。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/331068

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX