之前在看课的时候学到一个概念叫 Benford's law ,用来描述真实数字数据集中首位数字的频率分布,数字越大出现概率越低,比如以 1 为首位数字的数的出现概率约为总数的三成。但有个前提,这些数字必须是没有范围限制且没有人为干预的,举个例子电话号码就明显不符合。
那么,这一定律在疫情数据上表现如何呢?
我简单做了一个数据 app 来看各国分布与标准分布的差距,仅供娱乐 👇
https://benfords-law-covid19.streamlitapp.com/
预览:
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.