强人工智能的实现代码量估计只有 0.65952MB?

2023-10-13 09:43:32 +08:00
 fanym
现在没有出现强人工智能,但是有强智能的人类可以参考。
一个碱基对有 4 中可能,计算机的一个位有 0 ,1 两种可能。
32 亿碱基对就算全是有效信息也就
32 亿×2/8/1024/1024 = 762.94MB
其中人的 DNA 有效基因不会超过 10%,有很多没表达的基因
762.94×10% = 76.294 MB
还有 DNA 翻译成蛋白质会造成信息的损失(要 3 个碱基对确定 20 个氨基酸构成蛋白质)
76.294×log64 ( 20 ) = 54.96MB
人和大猩猩基因相似度大约 98.8%,粗略的将差异的 1.2%当成导致智能差异的基因,估计人智能所需的信息量只有
54.96*1.2% = 0.65952MB
计算和实际的误差应该挺大的,但是数量级差不多了。
为什么这么小的信息量现在还无法在计算机中模拟出强人工智能?难道瓶颈在显存和算力而不是算法上?
假设一滴水的水分子只有像 0 和 1 的两种状态数据量就达到了,
1.67 * Math.pow(10,21)/8/1024/1024/1024/1024 = 189857019 TB
还有现实中的数据大多是连续的无理数,而计算机只能进行离散的有理数进行存储计算导致丢失精度。
所以还是要堆存储算力或者改计算机的底层设计(像量子计算机)才可能实现强人工智能吗?
6708 次点击
所在节点    问与答
77 条回复
jazzg62
2023-10-13 10:01:35 +08:00
不懂人工智能,也不懂生物,吃瓜群众,给你顶下
jenlors
2023-10-13 10:02:56 +08:00
我猜可能和真随机有关
0x2CA
2023-10-13 10:02:57 +08:00
不能实现的根本原因还是不理解为什么,现在也只是进行模拟生物神经元,但是为什么这样就可以有智能,实际上没有研究透彻,会导致没有办法随心改进,根据原理实现,当然现在计算机的设计也导致了不能更强原因。所以现在有科学家培育生物神经元进行机器学习
linksNoFound
2023-10-13 10:05:50 +08:00
人和大猩猩基因相似度大约 98.8%,粗略的将差异的 1.2%当成导致智能差异的基因

你吃饱饭是因为最后那一口,前面的都可以不吃
xJogger
2023-10-13 10:06:24 +08:00
现在的问题不是代码,毕竟基因组已经测序完毕了。现在的问题是怎么把代码从碳基运行时移植到硅基运行时。在碳基运行时的代码很小不代表相同的功能到硅基运行时也很小。
youngce
2023-10-13 10:06:35 +08:00
其中人的 DNA 有效基因不会超过 10%,有很多没表达的基因——有效基因这种概念似乎不太合适,即使是不表达的基因本身也可能参与启动子、增强子、基因沉默区域,以及在遗传的过程中发生突变以后,也可以重新直接参与表达。

DNA 翻译成蛋白质会造成信息的损失——实际上不存在信息的丢失,反而在翻译过程增加了信息的复杂度,翻译过程中 rna 和蛋白质都有各种相互变化和作用,可以直接影响最后的基因功能

以及 3d 基因组、表观遗传这些东西,实际上也说明现代遗传学作为一门类似逆向研究工程,还存在大量未知的领域。
rookie4show
2023-10-13 10:07:30 +08:00
先不说你这个思路对不对,即使你是对的,你这算的是硬件啊,相当于用多大的存储可以完全描述 cpu 和硬盘的信息
allforone
2023-10-13 10:08:29 +08:00
地球从无生命到有生命花了几亿年,有生命到有文明花了几百万年,有文明到信息文明花了几千年。初略的将信息文明当作地球存在文明的证明,换算得出地球从无生命到有信息文明花了几千年。
cxtrinityy
2023-10-13 10:17:09 +08:00
不懂人工智能,不懂生物,吃瓜群众,随便唠唠。

你这个计算的前提是,智能是基因形成并运行的,这个前提是对的么?比如我保存电脑的设计图,假设文档图纸一共 1 个 t 吧,某个完全没见过电脑的文明知道这个数据量能再造一台么?相对于一个文明,t 应该不是一个很大的量级,但关键是不是可能不在量级上?
fanym
2023-10-13 10:26:44 +08:00
@linksNoFound 不算最后一口,那全算下去也才 762.94MB
icyalala
2023-10-13 10:31:25 +08:00
也来随便唠唠。。
DNA 表达也要依赖现实世界的蛋白质等物质的实际特性。
就像你用高级语言写一段程序,几行代码就能表达复杂的功能,但它后面编译器和运行环境是一大坨东西,远超源代码的大小。
particlec
2023-10-13 10:34:35 +08:00
我想的是计算机只是模拟人神经网络,不能把人脑与计算机数据量 画等号
soupu626
2023-10-13 10:35:27 +08:00
是,可执行文件就这么大,但是运行时你都不考虑下么,DNA 的运行时,转录出来的蛋白质之间的作用机制,还有各种理化生物机理,外界环境刺激的机理巴拉巴拉,这个运行时做好了,DNA 也就可执行了。。。
sofukwird
2023-10-13 10:41:04 +08:00
DNA 可能是一个压缩文件包,要解压后才能运行,我们不知道压缩包的算法,所以尚未知道压缩文件包实际有多大
fanym
2023-10-13 10:48:39 +08:00
@cxtrinityy 如果设计图包含的信息足够是可以做的,毕竟之前我下载的中文书库才 800g ,而且如果是人 dna 的信息要在计算机中模拟一个人很难,但是现实世界用克隆技术做一个反而很容易。
0TSH60F7J2rVkg8t
2023-10-13 10:51:37 +08:00
楼主只考虑到“信息”本身占用的存储量,没有考虑到“生命”的本质是细胞核。细胞核生产使用 dna (实际上是 rna 转录)产生蛋白质,蛋白质组成酶,再通过化学和物理反应产生能量,能量维持生命体循环,构成细胞核,单细胞生物,再到多细胞,最后才有复合生物体,发展出器官组织生命形态。这里面是一整套东西啊,单单把 dna 提取出来扔原始海洋汤里也不会有生命出现,更别提生成孕育智能生命体了。

所以真要类比,楼主的意思是,写多少行代码能让计算机实现自己造出 cpu ,内存,硬盘,然后不断进化成一个房子(略微类似于一个细胞核),再扩展成能自我复制繁衍的生命体。然后再考虑怎么进化吧。
Nzelites
2023-10-13 10:54:42 +08:00
0.65952MB 应该是设计图纸 or 设计文档的最小大小,实际产物肯定不止,智能最后来源于细胞蛋白质什么的,dna 保存的只是的设计
AwsShopUK
2023-10-13 11:02:47 +08:00
"""
还有 DNA 翻译成蛋白质会造成信息的损失(要 3 个碱基对确定 20 个氨基酸构成蛋白质)
76.294×log64 ( 20 ) = 54.96MB
"""
这里不是这么算的吧
32 亿碱基对可以确认 32 亿/3 个氨基酸
又氨基酸共有 20 种可能
包含的信息不应该是 20 ** (32 亿/3)
这个数字就巨大无比了
ytgui
2023-10-13 11:03:14 +08:00
楼上没有一个人学过初中数学? 32 亿碱基对,有效组合是 pow(4, 3.2B)

IPv4 地址有多少个?是 256 + 256 + 256 + 256 么?
rrfeng
2023-10-13 11:05:34 +08:00
你的大脑里只有一个 DNA ???
就算 DNA 是核心算法,还得有个操作系统,这个操作系统深度定制的只支持 DNA 这种算法。要一起算进去才行。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/981540

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX