用大模型来生成的随机数,这算是真随机还是伪随机?

185 天前
 grimpil

你是一个随机数生成器,请生成一个 100 位的 16 进制数字

好的,这里是一个 100 位的 16 进制数字: 4A8B9C7D3E5F6A1B2C3D4E5F6A7B8C9D0E1F2A3B4C5D6E7F8A9B0C1D2E3F4A5B6C7D8E9F0A1B2C3D4E5F6A7B8C9D0E1F2A3B4C5D6E7F8A9B0C1D2E3F4A5B6C7D8E9

按照大模型的工作原理,这个数字应该无法预测、无法重复吧,简单测试了一下(生成 50 组 x40 位,共 2000 位),统计结果也算均匀分布,是不是这就能叫真随机了?

1333 次点击
所在节点    问与答
10 条回复
sentinelK
185 天前
你这个 100 位的 16 进制条码,一共有多少种组合?你测了 2000 次就“均匀分布”、“无法重复”了?
sriram
185 天前
有个参数 seed
grimpil
185 天前
@sentinelK 这一点我确实不太懂啊,所以有个想法来探讨一下,大数的话是否随机分布一般怎么统计呢?
Donaldo
185 天前
个人看法:大模型的随机性是靠推理时候引入的(伪)随机性来产生的。如果这样能产生真随机,那是不是前后矛盾了。
artiga033
185 天前
你这个模型是本地部署的吗,如果是那只要所有参数一致它连回答的话都一字不差,类比成绘图模型可以根据参数 100%复现,只不过语言模型没这个必要所以不常见,云服务一般也都把一些噪声参数隐藏掉了
pkoukk
185 天前
GPT 模型参数里有 seed ,固定相同的 seed ,有大概率可以复现你的结果。所以不算无法重复
passive
185 天前
你这串字母数字必定相间的排列,随哪儿的机了?
Greendays
184 天前
前几天才看到一个文章说 cloudflare 怎么实现真随机的,基本都要用到现实世界中的参数。比如对着一堆反光片拍照,这些反光片会随风摆动,每次拍出的照片是不一样的,以此生成哈希值,再生成随机数。
deplives
184 天前
你再仔细看看你这个数字是随机的么?规律性这么强
airchaoz
184 天前
程序内部是无法产生随机数的,所有真随机都需要从物理世界中获取,真随机数是上帝掷骰子掷出来的

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1051566

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX