基于最近 100 年间上映的电影,选出 https://www.boatsky.com/movie/list 这 700 部高分电影,
做了一个简单的电影数据分析报告:
https://www.boatsky.com/blog/87
包括类型分析、评分分析、时间分析、地区分析等,有兴趣可一阅。
做了一个简单的电影数据分析报告:
https://www.boatsky.com/blog/87
包括类型分析、评分分析、时间分析、地区分析等,有兴趣可一阅。
1
SeaRecluse Aug 27, 2019 分析抓取的数据分布有问题,不同类型的电影不应该用同一分数去切,应该先统计不同类型下的得分分布然后去切。例如动画的得分一般偏高,以及国产标签的 debuff (小声)
|
2
cifermail OP @SeaRecluse 这些也想到了,动画片、同性片、评分基数小于 1000 人的冷门片、部分国产膨胀片、部分媚外片、幸存者偏差片、水军片都是评分虚高的。一方面把这些因素都考虑在内就太复杂了,这些应该是评分网站去评估的事,报告只负责统计;另一方面,如果分开类型统计,数据量就太小了,意义不大。
|
3
ysoserious Aug 27, 2019 via Android
有意思。 可是博客申请通知权限是什么鬼?
|