由“文身女孩”讨论帖想到的 Bayes 经验

2023-03-11 08:47:15 +08:00
 sixg0d

背景帖 https://www.v2ex.com/t/922618?p=1

我在这里不想讨论道德伦理,只是想分享一个有点意思的认知观点。假设女孩(被粗暴地)分为好女孩和坏女孩,那么一个文身的女孩更有可能是坏女孩还是好女孩呢?

请先在心里有答案了再看下面的分析。

假设社会上平均每 100 个女孩中有 10 个坏女孩,90 个好女孩。坏女孩中 50%有文身,所以有 5 个;好女孩只有 10%有文身,那就是 9 个。那么对于文身的女孩来说,只有 5/(5+9)≈35.7%的概率是坏女孩,也就是说文身的女孩更可能是好女孩。

其实这就是基本的 Bayes 概率。但我们的直觉 /刻板印象会倾向于认为文身的女孩是坏女孩,这方面心理学家、经济学家们已经有很多讨论了,比如 Kahneman 。我在这里抛砖引玉地分享下我的一些理解。

比如说其实这问题问的是坏女孩和好女孩哪个概率大,但我们脑中更直观的想法是坏女孩和好女孩文身的概率,而概率论告诉我们,P(文身|坏女孩)>P(文身|好女孩) 不代表 P(坏女孩|文身)>P(好女孩|文身)。

或者说人们比较的是相对的概率,并不是看坏女孩的概率是否大于 50%,而是看坏女孩的概率是否变大了。诚然,在文身的条件下,坏女孩的概率是增大了,但增加的幅度没有人们以为得那么大:在我们的例子中,概率只是从 10%增大到 35.7%,哪怕所有坏女孩都会文身,概率也就将将过 50%,远没有达到文身和坏女孩划等号的地步。

3Blue1Brown 有一个关于这个 Bayes 经验的科普视频 https://www.youtube.com/watch?v=HZGCoVF3YvM

再次声明,以上描述纯粹只是讨论数学 /概率,不代表现实观点。

6912 次点击
所在节点    生活
70 条回复
gant
2023-03-11 08:57:06 +08:00
假设社会上平均每 100 个女孩中有 20 个坏女孩,80 个好女孩。坏女孩中 20%有文身,所以有 4 个;好女孩只有 1%有文身,那就是 0.8 个。那么对于文身的女孩来说,只有 4/(4+0.8)≈83%的概率是坏女孩,也就是说文身的女孩更可能不是好女孩。
Donahue
2023-03-11 09:03:15 +08:00
贝叶斯的前提: 假设待分类项的各个属性相互独立
spongeboBoy
2023-03-11 09:03:58 +08:00
我以前对于这种事情第一反应是概率问题,但也从来没有仔细思考具体的数学结果,这次学到了
Jim142857
2023-03-11 09:04:10 +08:00
base rate fallacy 啊
Donahue
2023-03-11 09:05:11 +08:00
噢噢 不对,好坏是分类目标,文身是属性...
totoro625
2023-03-11 09:10:20 +08:00
第一印象,文身的女孩更有可能是坏女孩
这句话的意思不是文身的女孩是坏女孩的概率比是好女孩的概率大;而是文身的女孩比不纹身的女孩更有可能是坏女孩

按你的例子来说,有纹身的一共 14 人,5 坏 9 好;没纹身的一共 86 人 5 坏 81 好;
你在有纹身的 14 人中遇到坏女孩的概率是 35.7%;
你在没纹身的 86 人中遇到坏女孩的概率是 5.8%;

人和人感情成本的投入,让你没有那么多的试错成本,明明有遇到好女孩概率更高的选择,何苦骗自己,把自己框死在纹身女孩的选择里赌概率呢

你需要跳出纹身女孩这个思想洼地,去看一下不纹身的女孩
cmdOptionKana
2023-03-11 09:12:33 +08:00
> 假设社会上平均每 100 个女孩中有 10 个坏女孩,90 个好女孩,坏女孩中 50%有文身。

这个假设比例 50% 不合适。

一楼优化了比例:

> 假设社会上平均每 100 个女孩中有 20 个坏女孩,80 个好女孩,坏女孩中 20%有文身。

但这个假设比例 20% 还是不合适。

为什么坏女孩中 20% 有文身呢?这个其实需要调查数据,否则,如果没有调查数据,也不带偏见的话,那么应该相当于在 100 个女孩子中随机贴一个“纹身”标签,然后对这 100 人随机贴一个“坏”标签,然后看看同时带着这两个标签的人有多少个,我数学不好,但我根据逻辑分析,这样的结果应该是低于 20% 的,因为那两次随机应该不相关,而楼主和一楼采用了相关性很强的计算方法,恰好体现了有偏见的人潜意识里的错误计算方法。
gant
2023-03-11 09:19:00 +08:00
@cmdOptionKana 我是用魔法对魔法。要得出目的结论,这个例子不合适,不合适中更不严谨。
zhang77555
2023-03-11 09:32:41 +08:00
具体这个事情考虑概率意义不大, 因为婚恋试错对男性来说成本可不低,
没有必要为了证明纹身和适婚属性无关而付出成本,
毕竟纹身的可是少数,直接摒弃掉这部分又无所谓
cmdOptionKana
2023-03-11 09:33:51 +08:00
@gant 原来如此,那就对了。

我又想了一下,可以表达得更清楚一点。

楼主的计算方法:在 100 个女孩子中随机贴 10 个“坏”标签,然后对这 10 人随机贴 50 个“纹身”标签。

我认为正确的计算方法:在 100 个女孩子中随机贴 10 个“坏”标签,再对这 100 人随机贴 N 个“纹身”标签。

这样对比,应该很容易看出楼主那个是有偏见的算法。
cmdOptionKana
2023-03-11 09:35:13 +08:00
写错了:50 个 -> 5 个
bigbrother
2023-03-11 09:37:09 +08:00
纹身女孩多少有点特立独行
普通人 hold 不住就说别人是坏女人
sillydaddy
2023-03-11 09:40:47 +08:00
很有趣的主题。感谢楼主分享。贝叶斯概率在生活中,应该是挺常见的。

OP 特意提到:“以上描述纯粹只是讨论数学 /概率,不代表现实观点”。
我试着分析一下,要跟现实关联起来,还需要哪几步:

1. 现实中好坏女孩以及纹身比例的真实数据,并不能说服人们。因为人们可以辩解,他印象中的比例不是这样的。

2. 即使作统计抽样和问卷调查,询问人们印象中的比例,得出结果也不能说服。因为人们的直觉计算并不使用他们在问卷调查中填写的比例。

3. 最后如果追问他们做直觉计算时,到底怎么考虑的呢?他们大概率会说,对不住,我也不知道我怎么就直接产生这么一种直觉了。

死胡同了。
cmdOptionKana
2023-03-11 09:43:44 +08:00
@totoro625

> 第一印象,文身的女孩更有可能是坏女孩
> 这句话的意思不是文身的女孩是坏女孩的概率比是好女孩的概率大;而是文身的女孩比不纹身的女孩更有可能是坏女孩

这楼竟然有两个赞,可见偏见对判断的影响有多大,这个逻辑错误简直像太阳一样巨大耀眼不可忽略。

A. 一个女孩子纹身,她是坏女孩的概率 不大于 她是好女孩的概率 => 可以推理出 一个女孩子纹身,不会增加她是坏女孩的概率

B. 文身的女孩比不纹身的女孩更有可能是坏女孩

楼主说 A 与 B 同时为真。
sillydaddy
2023-03-11 09:44:34 +08:00
@totoro625 #6
你的说法其实跟 OP 主题说的「诚然,在文身的条件下,坏女孩的概率是增大了,但增加的幅度没有人们以为得那么大:在我们的例子中,概率只是从 10%增大到 35.7%」是一个意思。
cmdOptionKana
2023-03-11 09:47:18 +08:00
抱歉,又写错字了: 层主说 A 与 B 同时为真。
kingjpa
2023-03-11 09:55:25 +08:00
文身只是显眼属性,人们认为文身不是好娃娃原因是,干坏事的 进号子的,吸药物的,其中一大部分带有文身这一共同属性。

所以才会这样认为,当然这也是事实。
cssk
2023-03-11 10:01:19 +08:00
我还以为是写熊猫此短信的八爷
clecho
2023-03-11 10:07:06 +08:00
本来对纹身人士没有偏见,看见这么多纹身人士为了证明自己是好女孩,把那么多未纹身人士拉下水就很恶心
kop1989smurf
2023-03-11 10:09:18 +08:00
“那么对于文身的女孩来说,只有 5/(5+9)≈35.7%的概率是坏女孩”
那么对于不纹身的女孩来说,只有 5 / (81 + 5)≈5.8%是坏女孩

楼主搞错了判断标的。普世价值需要的是“好女孩”,而不是“纹身”。
一个按钮 35%的概率中奖,另外一个按钮 5%的概率中奖,只能按一次,你按哪个?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/923074

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX