Benford's law 与 COVID19

2022-10-31 21:53:33 +08:00
 secsilm

之前在看课的时候学到一个概念叫 Benford's law ,用来描述真实数字数据集中首位数字的频率分布,数字越大出现概率越低,比如以 1 为首位数字的数的出现概率约为总数的三成。但有个前提,这些数字必须是没有范围限制且没有人为干预的,举个例子电话号码就明显不符合。

那么,这一定律在疫情数据上表现如何呢?

我简单做了一个数据 app 来看各国分布与标准分布的差距,仅供娱乐 👇

https://benfords-law-covid19.streamlitapp.com/

预览:

2176 次点击
所在节点    分享创造
9 条回复
Macolor21
2022-10-31 22:03:07 +08:00
大胆!
ruxuan1306
2022-10-31 22:06:09 +08:00
国内确诊人数肯定是远高于卫健委统计值的,就和失业率一样。
luckykong
2022-10-31 22:38:11 +08:00
哈。。你们有没有看数据到底揭示了什么结果?
imes
2022-10-31 22:51:45 +08:00
本福特“定律”应用的前提是事件之间没有依赖 /从属关系,医疗事件具有群体性、地域性和时空性,加上疫情本身被人力干涉。我在生物医学行业这么多年,从来没有见过哪个医学人员会用这玩意去说明事情。按照你这个逻辑,拜登选票也不符合本福特定律。你这么干,和拿绿茶送检,然后宣布医院说绿茶有糖尿病一样离谱。
imes
2022-10-31 22:55:36 +08:00
@imes 4# [补充] 再贴一个知乎的解释,说明为什么这玩意不可靠( https://www.zhihu.com/question/49661986/answer/1565667783 ),已经很简洁易懂了。学医,最忌讳看到了的新东西,就瞎 jb 乱用。
zagfai
2022-10-31 22:57:27 +08:00
@imes 拜登那个我记得有个统计是说,前面几任都符合,就拜登不符。。
Leviathann
2022-10-31 23:58:58 +08:00
然后他们看到了,说对,现有的清零政策导致了这些假数据,要加大力度真正做到清零。
或者 lz 本来就是清零派?
Zhengqing
2022-11-01 05:32:50 +08:00
挺好玩
albert0yyyy
2022-11-01 08:28:53 +08:00
反思,立刻就反思

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/891593

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX