豆瓣挨了用户的「板子」,冤吗?

2019-02-24 23:40

声明

以下文章由知乎(Zhihu.Inc)提供,本人(吴星)采取非正常手段获取
获取与共享之行为或有侵犯知乎权益的嫌疑
若被告知需停止共享与使用,本人会及时删除此页面与相关源码
请您暸解相关情况,并遵守知乎协议
如何评价《流浪地球》豆瓣评分从 8.5 分掉到 7.9 分? chenqin,数据帝

截止到今天,《流浪地球》总票房已经突破 40 亿,成为中国影史票房第二的作品。与此同时,流浪地球在豆瓣上的评分也从 8.5 下降到 7.9,两者的背离引发的讨论,其热度完全不亚于《流浪地球》内容本身的讨论。

但事实上,这个下跌,从 8.5 到现在的 7.9,或许并没有什么特殊的。正如以下两个答案所说:

如何评价《流浪地球》豆瓣电影评分跌破 8 分?如何评价《流浪地球》豆瓣电影评分跌破 8 分?

1,许多电影上映后都出现了豆瓣分数逐渐下跌的现象。四部春节档电影,分数下跌也都不比《流浪地球》少。而根据 @惊记 抓取的豆瓣数据,在 2018 年的电影里,《唐人街探案 2》、《超人总动员 2》、《李茶的姑妈》、《神奇动物:格林德沃之罪》、《无敌破坏王 2:大闹互联网》,都在上映一周内分数下降 0.5。更别说我最喜欢的《海王》了,人家从 8.5 下降到了 7.7,嘤嘤嘤(拜托可别在本答案下刷海王真难看的评论了)。

2,《流浪地球》的分数下降,和其他分数下降的电影一样,主要是由三星和四星的比例上升导致的。一星比例高达 2%,而虽然偏离同等电影的正常水平,却对总分影响甚小。如下图所示,在当前的分数结构下,即使把 2%的一星全部扔掉,平均分也只能增加 0.1 分。

事实上,豆瓣的抨击者并不是对这些数字一无所知。一开始,他们说豆瓣分数下跌不正常;过几天,他们承认分数下跌幅度或许正常,但一星比例高得不正常;再到后来,发现 2%的一星比例对总分影响不大,但又认为豆瓣热评首页里差评太多……

总之,这个板子,是一定要打到豆瓣身上去了。

但【已经花了 300 块钱购买了 3 张 IMAX 影票带全家去观看了《流浪地球》的】我觉得,因为对网站的评价不满意,就把板子打在豆瓣这个 app 身上,似乎也有些莫名其妙。毕竟一星的评分是用户自己去打的。热评首页中差评排序居多,那几万票「有用」也是用户自己投上去的。

比如豆瓣到现在还排名第一的左丘失明的长评——

人家确实有 5.6 万个踩,但也有 4 万多个赞,这不是一个小数字吧?

再比如对《流浪地球》的短评。上图是热评的前三名,第二和第三名都打了一星,加起来有 10 万个赞。其中排名第二的「嘟嘟熊之父」,现在有 6.5 万个赞,比一星期前增加了 4 万多个。

而《流浪地球》的一星评价数量,在同期只增加了 1.5 万个。

对「嘟嘟熊之父」的一星短评的赞同增量,远远多于实际的一星评价的增量。这意味着什么?

这意味着——很多人确实没有发表评论,也没有给《流浪地球》打一星,也许是因为打一星会显示在页面上。他们只是静悄悄地找到符合自己想法的评论,然后点了一个不能被别人看到的赞。

这让我想到 2016 年的美国总统大选,公开场合下大家都不喜欢特朗普,所有的民调都不看好特朗普,媒体也说特朗普这不好那不好,看上去希拉里民心所向……

然后特朗普赢了。

在大选时,因为不喜欢一个人而选择另外一个人是常见的现象,但对电影来说,不存在直接的反对机制。我不喜欢看这个电影,也没法卖空,也不会拼命去看另一部电影,这没意义。所以要是不喜欢一部电影,除了评论和在软件上打分,其他也啥都做不了。

因此,战场才汇聚到了豆瓣身上。

但正如希拉里败选后没法去怪罪大选制度一样,因为豆瓣上的差评在首页排名很高就去怪罪豆瓣的话,还不如去想一下,那些让你们看不顺眼的一星差评,为啥会拿到 6.5 万个、4 万个、3 万个【有用】?

把这几万个点赞全部当成【牧羊犬】【跪久了】,说几句【尔曹身与名俱灭】之类的漂亮话,对理解这个问题,有帮助吗?

短评第一名是 5.6 万个【爱国者】,短评第二名是 6.5 万只【牧羊犬】,很让人高兴吗?

这篇文章从这里才真正开始。我们想要研究的一个问题是——豆瓣的用户,和真正去看电影的用户,究竟有什么不一样?为什么会不一样?这样的差异会造成什么?

首先,我们给每一部电影做一个用户画像。

电影的用户画像并不好做,首先,在线购票的比例虽然到了九成,但并不知道这些票都是给谁买的。其次,对在线购票者本人来说,他们的画像也不一定准确。

因此,我们使用人口普查分区县数据和各区县的票房和人次数据来完成这个画像,步骤如下:

1,电影

的总观影人次为

,其中在区县

的观影人次为

2,

,表示每一个电影

在不同区县

的观影比例。

3,

表示当年区县

的观影总人次,用每个区县的观影总人次除以当年全国观影人次

,得到

,表示当年所有全国观影人次中不同区县

的观影比例。

4,

,表示区县

在电影

中的观影比例大于区县

在所有电影中的观影比例的程度,可以理解为,是区县 对电影 的「偏爱」程度。

5,对于每一个电影

,回归该式:

,得到一组

。他的含义是,我们要用每一个区县的特征,去解释为何不同的区县会对这部电影有不一样的「偏爱」程度。

举一个例子,现在有 100 个人,50 个男人 50 个女人,今年总共看了 30 次电影,男人看了 15 次,女人看了 15 次。

其中有一部电影叫做《刺激的动作片》,男人看了 10 次,女人看了 5 次。那么

从上式我们发现,当性别从女性变成男性的时候,对《刺激的动作片》的偏爱程度从

上升到

,带来了一个效应为

的上升。因此有:

这样,就把性别对《刺激的动作片》的偏好影响估算出来了。我们对每个电影都做如此回归,相当于是把 3000 多个区市县看成 3000 个具有不同特征的人,通过这 3000 个「人」的不同特征和对电影的不同偏好,把所有人口特征对所有电影的偏好给算出来。

6,使用性别比例、平均教育程度和年龄结构三个特征,我们回归计算了所有电影,记录下所有系数,这样每个电影都会变成一个三维的向量。比如《复仇者联盟》,我们就有三个数值:

对所有的电影,我们都有这三个数值。前 20 名的电影的系数表格如下:

选取 2012 到 2018 年所有观影人次在 1000 万以上的电影,将三个数值分别作为一个三维空间的 x、y 和 z 轴作图,可得下图:

在上面的三维坐标中,大于零的部分表示性别越偏男性 / 教育越高 / 年龄越小 越偏好于这部电影。用观影人次排名前 20 的电影举例,具体表格如下:

这个算法准不准呢?我们可以做一个检验,看每一个点的最近的邻居分别是谁——两个在三维空间里距离较短的点,说明两者的观影人群十分类似。我们实验了四部不同类型的电影,分别找到离这四部电影最近的 5 个点,结果如下:

可以看到,在空间上最接近的几个影片有相同的观众偏好,一般也处在同一个范畴内。比如到《复仇者联盟 2》距离最近的 5 部电影,有 4 部是漫威出品;在距离《熊出没·变形记》最近的 5 部电影中,有 4 部都是熊出没的系列片。

从直觉上看,这个算法还是能非常准确地将电影给划分开来的。

特别有趣的是《战狼 2》,距离他最近的五个点分别是——

1,小时代 3:刺金时代

2,小时代 4:灵魂尽头

3,美人鱼

4,捉妖记

5,小时代:青木时代。

这说明《战狼 2》的观影人群画像,和《小时代》系列是十分类似的。特别让人惊讶的是,和我们的印象不同,《小时代》的性别系数和《战狼 2》一样,都是正的,说明男性越多的地区,反而越偏好《小时代》。

而且我们可以看到一个现象——和战狼 2 最接近的几部电影,都创造了票房佳绩。

每一部小时代都是当年票房的佼佼者,到了《美人鱼》和《捉妖记》,这个偏好的观众人群创造了当年的票房冠军,更别提《战狼 2》了,他创造了中国影史票房冠军。

这个现象也提出了本文的第二个问题——我们应该拍摄什么样的影片,吸引什么画像的人群,才能尽可能吸引更多观众来观影?

我们将性别、教育和年龄这三个指标分别和观影人次的对数作图,可以得到下面三张图:

从上面三张图中,我们可以看到:

1,过于偏向某一种性别的电影,不会有很好的票房,只有性别处在中间的时候,票房才更高。

2,让年龄太低或者年龄太高的人特别喜欢的电影,票房也不会很高,也需要针对中间值来确定观众的偏好。

3,和性别、年龄的图中出现的先上升、再下降的图不同,教育水平的偏好关系和观影人次似乎并没有一个明显的峰值,而是随着教育提升,单调下降——越让高教育人口喜欢的电影,票房越低。

我们将上面的第三张图分成 2015、2016、2017 和 2018 年,可以看到一个更明显的趋势——

上面四条线的斜率,一年比一年大,这意味着低教育偏好的电影,带来的观影人次一年比一年高。

2015 年和 2016 年时,低教育偏好的电影和高教育偏好的电影,在观影人次上还差不多,从 2017 年开始两者的关系变为显著负相关,系数为 -0.17,在 5%水平上显著。

2018 年,低教育偏好能带来更高票房,系数已经达到 -0.22,在 1%水平上显著。

这意味着电影的目标观众教育水平越低,该电影的票房越高,而且两者的相关程度还在不断上升。

为什么会这样?答案非常简单——高教育人口,已经不能贡献增量票房了。

我们将中国 3000 多个区市县按照其平均教育水平分为四个部分,分别是平均教育年限大于 12 年(全国前百分之 1%水平)、10.9 年到 12 年之间(全国前 1%到全国前 10%)、9.6 年到 10.9 年之间(全国前 10%到全国前 25%)、9.6 年以下(全国后 75%水平),他们在 2012 到 2018 年的观影人次如下图所示:

从上图可以看到,在教育水平最高的地区,观影人次从 2015 年到 2018 年已经下降了 6%!

教育水平次高的地区也有同样的现象,从 2015 到 2018 年只上升了 5%。

而平均教育年限在 9.6 年以下的地区,从 2015 到 2018 年的观影人次上升了 55%。

随着中国的电影院在发达地区饱和,并向三四线城市蔓延,未来如果有人能够对电影票房产生新的贡献,那么他们一定是三四线城市的人群。

因此,新的卖座电影,必然是为这批观众量身定做的电影。

回到一开始的问题——为什么会许多电影的豆瓣电影评分逐渐降低?那些豆瓣评分逐渐降低的电影,和电影本身的目标人群特征有什么关系?

我们将 @惊记 提供的豆瓣分数动态变化数据和我们用票房数据计算出的每一部电影的偏好链接在一起,看哪一个维度的指标和豆瓣的评分降低有关。

结果,只有一个指标有显著相关性,他就是一部电影目标人群的教育水平和电影偏好的系数。

上图是豆瓣评分和电影倾向观众的教育年限之间的关系。可以看到,越倾向于高教育地区的电影,在豆瓣上都有越高的评分。

上图是豆瓣开分和十天后的评分差额与电影倾向观众的教育年限之间的关系。散点图的相关性在 1%的水平上显著,说明电影的目标观众人群越倾向于低教育人口,豆瓣给他的评分下降就越多。

其中,位置在最上方,分数提高最多的电影是《无问西东》,豆瓣开画 6.7 分,到第十天是 7.7 分(目前是 7.5 分),票房为 7.5 亿。

而分数降低最多的是《后来的我们》,豆瓣分数从一开始的 7.1,降低到第十天的 5.9(目前仍为 5.9),票房为 13.6 亿。

最后理顺所有的故事:

1,从 2015 年开始,那些比较发达、平均教育水平比较高的地区,观影人次达到饱和,出现增长停滞,甚至下降。而那些欠发达、平均水平比较低的地区,观影人次持续增长。

2,欠发达地区人口偏好度更高的电影,能够带来更高的票房,且两者关系逐年增加。而豆瓣对这批欠发达地区偏好的电影更为苛刻,他们虽然常常拿到很高的票房,但是豆瓣评分却往往逐渐降低。

3,电影的提供者当然会优先满足快速需求的增长。在这种趋势下,我们未来将看到更多为这批快速增长的欠发达地区观影人群量身打造的电影。

4,除非豆瓣的构成和中国观影人群的构成一样快速转变,否则,随着电影供给向欠发达地区的偏好逐渐倾斜,豆瓣评分走低但票房又同时走高的现象,将会越来越频繁地出现。

注:

感谢 @王义之 提供的电影票房分影院的日度数据以及 @惊记提供的从 2017 年开始的豆瓣评分动态数据,其他数据来自第六次人口普查分县资料。由于还没有拿到《流浪地球》的分影院数据,我们暂时无法计算出《流浪地球》的偏好坐标。

以下内容已过滤百度推广

豆瓣挨了用户的「板子」,冤吗?图片:geralt / cc0 如何评价《流浪地球》豆瓣评分从 8.5 分掉到 7.9 分? chenqin,数据帝 截止到今天,《流浪地球》总票房...  普通

2012年11月14日 - 他也由此成为了中国历史上唯一一个被大臣们打了板子的皇帝陛下。 附文:《三朝...「第三封情书」和soulmate结婚 打开应用查看 更多精彩内容 豆瓣 免...  普通

2018年12月21日 - 自己人,淑慧直接问道:“你是因为什么被额娘打板子的...本重生古代言情文,类似《11处特工皇妃》,豆瓣评分9...  普通

知乎用户 hifi 摩旅 爬山 diy 物联网 手工 曾经有个姊子,她经常出差,一出差...被知乎科普 20702 人关注 • 4598 条内容 小说预备 1657 人关注 • 11026...  普通

2016年10月6日 - 刚放好第一张板子,放第二张板子9mm的时候,板子刚...姜文导演的《邪不压正》为什么首映当天豆瓣评分从 8...如何治疗「玻璃心」? 10.6k 关注 · 242 回...  普通

我觉得知乎上许多关于刘慈欣的讨论都是「不足道」的.../ 01 /《亲密关系》罗兰·米勒豆瓣评分:9.0分 ...  普通

2019年1月21日 - 姜文导演的《邪不压正》为什么首映当天豆瓣评分从 8.2 降到 7.2 ? 3.6k ...如何治疗「玻璃心」? 10.6k 关注 · 240 回答 洗衣粉和洗衣液哪个更好? 777...  普通

知友说:别跟我讲lpddr ufs emmc 多少多少nm的cpu,这东西有谁知道 有哪个用户...被知乎科普 20572 人关注 • 4597 条内容 小说预备 1617 人关注 • 11031...  普通

如何评价澎湃新闻对「汤兰兰事件」的报道? 3398 无...因为我在豆瓣上看到了这个,@理智的2b青年douban.com...  普通
2 3 4 5 6 7 8 9 10 >

春江花月夜
夏雨花醉美
秋霜花落泪
冬雪花纷飞