抛硬币 1000 次其中正面 600 次反面 400 次,那么第 1001 次是正面的概率是 0.5?

2017-08-30 17:09:30 +08:00
 tmkook

虽说硬币正反面的概率各 0.5,但是根据历史的 1000 次实验证明是不是正面的概率更大点?

抛硬币的人力度掌握和硬币正反面微量的构造差异以及硬币掉落的地面是否会对 0.5 的概率产生影响呢?

从这几方面考虑第 1001 次的正面概率是不是 0.6?

13058 次点击
所在节点    奇思妙想
104 条回复
arzterk
2017-08-31 11:17:27 +08:00
就算你扔 1000 次都是正面,下一次概率还是 1/2,除非你扔的硬币不正常
holajamc
2017-08-31 11:21:18 +08:00
如果硬币正常的话,我选择相信马尔科夫…
lusheldon
2017-08-31 11:32:17 +08:00
@northisland 我真是震惊了,一个数学题都能勾起你对一个死去多年的人的咒骂。是非功过自有定论,但你这畜生这句话太过分了
wzha2008
2017-08-31 11:44:38 +08:00
频率派:最大思然估计,估计得正面概率是 0.6 的时候似然函数取最大了;
贝叶斯派:贝叶斯估计,设定先验概率为 0.5,后面每投一次就用贝叶斯公式得到后验概率,直到 1000 次
noNOno
2017-08-31 12:00:52 +08:00
每次投硬币都是独立事件
UnknownR
2017-08-31 12:48:44 +08:00
数学老师要被你气死了,概率只是对于时间可能性的度量,你扔 1000 次都是正面,第 1001 也是正面,但是对于扔硬币这件事的概率不会造成影响,每一次都是一次新事件,不是线性叠加
em84
2017-08-31 12:55:02 +08:00
@Macbooker 我数学系的睡过了 4 年,贝叶斯我知道有这东西但还真不知道是做什么的,概率论与数理统计这本书说起来一点都不厚。另外我这大学虽说不是 211 但在本地找工作不要太简单
loading
2017-08-31 13:00:09 +08:00
不是独立事件?
Taojun0714
2017-08-31 13:28:25 +08:00
@Macbooker 哥们儿,概率与统计是大学本科几乎所有专业基础课啊……
northisland
2017-08-31 13:29:11 +08:00
@lusheldon 我也感觉我这个玩笑开过火了。
其实我也不太恨他,主要是恨他有意建立的一系列体制,曾经并且仍旧在激发着大家人性中的恶。。。

概率论里随机事件的含义是这样:很少几次事件,出现什么情况都是 RP ;但事件一多,就能显现出有规律性的东西。
概率在大规模样本上展现的规律性,跟化学反应一样准。


举个例子,当年,我们老家,康有为被红卫兵开坟戮尸。
如果当时国内就出现这么一起事件,那么也许能归结到 RP 问题。

但是当年,凡是能在古代称上圣人的,无论药圣、书圣、武圣,还是大成至圣,炎黄尧舜,岳王包公文丞相;他们的墓或庙或祠,都被毁了,不光对汉人,而且毁坏被藏民看做观音菩萨、弥勒佛的活佛遗迹遗骨,甚至关押其本人。

这就可以称得上规律了。



另外,假设楼主非得一口咬定,一面朝上的概率 p=0.5,就是 0.5 !
那我们来算一下:
试 1000 次实验,某一面朝上出现 600 次+,这个概率是多少~

那出现的总次数,也是个随机变量,是 N(500, 15.81)一个高斯分布。~~(不懂的其实无所谓,,,,如果想搞明白去看 PRML 第 2 章,或者看这几个材料任意之一
https://math.stackexchange.com/questions/1249602/width-of-gaussian-distribution-from-n-trials-of-coin-tossing
https://www.physics.ohio-state.edu/~gan/teaching/spring04/Chapter3.pdf

在 N(500, 15.81)得到数字 400-或 600+的概率,是

```
from math import sqrt
import scipy.stats

p, N = 0.5, 1000
mu = N*p
sigma = sqrt(N*p*(1.-p))

print(2*scipy.stats.norm(mu, 15.81).cdf(400))

```
结论是:0.5 的硬币,你能抛出 600+或 400-的概率为 2.53e-10。
所以说,楼主你非要一口咬定,单面朝上的 p 就是 0.5,有钓鱼嫌疑。 @tmkook
Xs0ul
2017-08-31 13:47:51 +08:00
看了这么多回复,看的有点尴尬,我来写一段,希望能粗浅地解释一下频率学派和贝叶斯学派。

这两个学派的核心区别在于,是否认为概率是一个确定的数值。频率学派的一个说法大家可能都听过,类似于概率是频率的极限,在这里就是扔硬币扔的足够多,概率很接近频率了,也就是 0.6。

更高级一点的方法有极大似然法,就是设这个确定的扔正面的概率是θ,那扔出 600 正 400 反的概率就是θ^600 * (1-θ)^400。极大似然法希望求出一个θ,使得发生这样 600 正 400 反的概率最大。标准做法就是取对数以后求导,过程不详细写了,结论依然是 0.6。

值得注意的是,以上过程完全不存在也不涉及“硬币正反面的概率各 0.5 ”这个假设或者前提。频率学派没法说,我按常理认为是 0.5,但是做了实验又觉得是 0.6 了,因为频率学派认为概率是一个完全确定的数值,定了 0.5 就改不了了。只有按照实验结果,得到是 0.6。

因此就有了贝叶斯学派。贝叶斯学派认为,正面的概率本身不必是一个定值,也可以是一个分布。比如说,虽然正常的硬币是 0.5,但这个硬币是张三给我的,这家伙就喜欢恶作剧,我估计了一下,这个硬币有 50%的可能是普通硬币,也有 50%可能是个 0.6 的硬币。这称为先验分布,给出了一个具有不同可能性的假设。之前有人说先验概率是多少多少,其实是没有意义的。

具体到计算,400 和 600 有点大算起来不方便,我就用扔一次和两次举个例子。假如第一次扔了正面,这个正面来自普通硬币的概率是 0.5*0.5,来自恶作剧硬币的概率是 0.5*0.6。很明显,直观看来,它更有可能是一个恶作剧硬币。具体计算,此时的概率分别是 0.25:0.3≈0.45:0.55 ,和我们直观相符。注意,此时结果仍然是一个分布,称为后验分布。

假如我们再扔一次,扔出了反面,结果就变成了一正一反,直观来看,这样更可能是普通硬币了。计算上,概率分别是(0.5*0.5)*0.5:(0.5*0.6)*0.4≈0.51:0.49 。确实是更有可能是个普通硬币。

之前提到,0.51:0.49 仍然是个分布,而不是具体给出了概率。还是依据直观,要给出一个概率的数值,可以选可能性最大的 0.51 对应的 0.5,这叫做最大后验概率。也还有其他选取数值的方法,不详细写了。

所以,贝叶斯学派的结果,既依赖实验,也依赖先验的假设。按之前的假设,即使 1000 次中次次正面,我也只能说 0.6 和 0.5 比,0.6 更有可能,而不可能得出是 1。假如我的假设是正面概率是 0-1 的均匀分布,600 正 400 负的结果恰好就是 0.6,这也和直观相符,因为均匀分布基本相当于没有提供信息。

有手滑打错的欢迎指出。希望有所帮助(
northisland
2017-08-31 14:02:19 +08:00
@Xs0ul 纠结频率学派贝叶斯派,跟纠结茴香豆的 6 种写法一样无聊,属于被某些中文教科书带进歧途了。
都是 PRML 第一章的内容。一个叫 discriminative,一个叫 generative,都是必修课,解决问题互有短长。
纯抠概念,深度学习是概率学派,但照样吊打贝叶斯门派的 MRF,CRF。
Xs0ul
2017-08-31 15:53:32 +08:00
@northisland 1. 不要用 machine learning 的分类来分概率论的东西吧?这不等于有人在讨论说养猫好还是养狗好,你说别争了都是活的
2. 我学的英文教材照样会提频率学派和贝叶斯学派的问题
3. 深度学习也不就是概率学派,就你说的 CRF,搜搜看 CRF as RNN 吧,在 semantic segmentation 上可是有很好的结果的。
Xs0ul
2017-08-31 15:56:58 +08:00
@northisland 另外单纯因为 2.53e-10 值小而否定结论可是不符合逻辑的。0.5 抛出 500/500 的概率照样是个超小的数。假设检验的问题,是另一个话题了。
northisland
2017-08-31 16:12:19 +08:00
@Xs0ul 分布的 cdf 是怎么定义的?🙈哈哈你别找我漏洞了,因为你把你自己知识漏洞暴露了,我说 cdf,你拿 pdf 反驳我😄

0.5 抛出 500/500 的概率照样是个超小的数



另外记住深度学习,无论 CNN 还是 RNN,还是 GANs,本质上都是 discriminative 方法。
saran
2017-08-31 16:17:36 +08:00
一个问题,硬币正反两面其实并不是一致的对吧,正面的质量往往要比背面大些的吧。
所以实际上抛硬币并非完全是 .5 而是下面 >.5 才对吧。
saran
2017-08-31 16:18:09 +08:00
修改#96: >= .5
northisland
2017-08-31 16:21:47 +08:00
@Xs0ul 我只是单纯看不起贝叶斯学派说自己比概率学派高明。。。
natforum
2017-08-31 16:34:33 +08:00
不说了,先送你 5 个铜币吧
Xs0ul
2017-08-31 16:53:34 +08:00
@northisland 94 楼的回复确实不对,感谢指出,我把你的 600+误认为 600 正面了,回头看了眼代码明白了。

关于我提到的 CRF as RNN,我说的频率和贝叶斯的区别,和 discriminative 与 generative 无关,表达的是深度学习并不是只有概率学派。

当然贝叶斯确实不比频率高明,因为在一些合适的假设下结果都是 0.6,频率的方法还更简洁一些。但是要解释怎么从 0.5 变成 0.6 的,确实是需要贝叶斯来解释的。

和你交流挺有收获,感谢

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/386935

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX