强人工智能的实现代码量估计只有 0.65952MB？

现在没有出现强人工智能，但是有强智能的人类可以参考。
一个碱基对有 4 中可能，计算机的一个位有 0 ，1 两种可能。
32 亿碱基对就算全是有效信息也就
32 亿×2/8/1024/1024 = 762.94MB
其中人的 DNA 有效基因不会超过 10%，有很多没表达的基因
762.94×10% = 76.294 MB
还有 DNA 翻译成蛋白质会造成信息的损失（要 3 个碱基对确定 20 个氨基酸构成蛋白质）
76.294×log64 （ 20 ） = 54.96MB
人和大猩猩基因相似度大约 98.8%，粗略的将差异的 1.2%当成导致智能差异的基因，估计人智能所需的信息量只有
54.96*1.2% = 0.65952MB
计算和实际的误差应该挺大的，但是数量级差不多了。
为什么这么小的信息量现在还无法在计算机中模拟出强人工智能？难道瓶颈在显存和算力而不是算法上？
假设一滴水的水分子只有像 0 和 1 的两种状态数据量就达到了，
1.67 * Math.pow(10,21)/8/1024/1024/1024/1024 = 189857019 TB
还有现实中的数据大多是连续的无理数，而计算机只能进行离散的有理数进行存储计算导致丢失精度。
所以还是要堆存储算力或者改计算机的底层设计（像量子计算机）才可能实现强人工智能吗?

0x2CA

2023-10-13 10:02:57 +08:00

不能实现的根本原因还是不理解为什么，现在也只是进行模拟生物神经元，但是为什么这样就可以有智能，实际上没有研究透彻，会导致没有办法随心改进，根据原理实现，当然现在计算机的设计也导致了不能更强原因。所以现在有科学家培育生物神经元进行机器学习

xJogger

2023-10-13 10:06:24 +08:00

现在的问题不是代码，毕竟基因组已经测序完毕了。现在的问题是怎么把代码从碳基运行时移植到硅基运行时。在碳基运行时的代码很小不代表相同的功能到硅基运行时也很小。

youngce

2023-10-13 10:06:35 +08:00

其中人的 DNA 有效基因不会超过 10%，有很多没表达的基因——有效基因这种概念似乎不太合适，即使是不表达的基因本身也可能参与启动子、增强子、基因沉默区域，以及在遗传的过程中发生突变以后，也可以重新直接参与表达。

DNA 翻译成蛋白质会造成信息的损失——实际上不存在信息的丢失，反而在翻译过程增加了信息的复杂度，翻译过程中 rna 和蛋白质都有各种相互变化和作用，可以直接影响最后的基因功能

以及 3d 基因组、表观遗传这些东西，实际上也说明现代遗传学作为一门类似逆向研究工程，还存在大量未知的领域。

allforone

2023-10-13 10:08:29 +08:00

地球从无生命到有生命花了几亿年，有生命到有文明花了几百万年，有文明到信息文明花了几千年。初略的将信息文明当作地球存在文明的证明，换算得出地球从无生命到有信息文明花了几千年。

cxtrinityy

2023-10-13 10:17:09 +08:00

不懂人工智能，不懂生物，吃瓜群众，随便唠唠。

你这个计算的前提是，智能是基因形成并运行的，这个前提是对的么？比如我保存电脑的设计图，假设文档图纸一共 1 个 t 吧，某个完全没见过电脑的文明知道这个数据量能再造一台么？相对于一个文明，t 应该不是一个很大的量级，但关键是不是可能不在量级上？

icyalala

2023-10-13 10:31:25 +08:00

也来随便唠唠。。
DNA 表达也要依赖现实世界的蛋白质等物质的实际特性。
就像你用高级语言写一段程序，几行代码就能表达复杂的功能，但它后面编译器和运行环境是一大坨东西，远超源代码的大小。

soupu626

2023-10-13 10:35:27 +08:00

是，可执行文件就这么大，但是运行时你都不考虑下么，DNA 的运行时，转录出来的蛋白质之间的作用机制，还有各种理化生物机理，外界环境刺激的机理巴拉巴拉，这个运行时做好了，DNA 也就可执行了。。。

fanym

2023-10-13 10:48:39 +08:00

@cxtrinityy 如果设计图包含的信息足够是可以做的，毕竟之前我下载的中文书库才 800g ，而且如果是人 dna 的信息要在计算机中模拟一个人很难，但是现实世界用克隆技术做一个反而很容易。

0TSH60F7J2rVkg8t

2023-10-13 10:51:37 +08:00

楼主只考虑到“信息”本身占用的存储量，没有考虑到“生命”的本质是细胞核。细胞核生产使用 dna （实际上是 rna 转录）产生蛋白质，蛋白质组成酶，再通过化学和物理反应产生能量，能量维持生命体循环，构成细胞核，单细胞生物，再到多细胞，最后才有复合生物体，发展出器官组织生命形态。这里面是一整套东西啊，单单把 dna 提取出来扔原始海洋汤里也不会有生命出现，更别提生成孕育智能生命体了。

所以真要类比，楼主的意思是，写多少行代码能让计算机实现自己造出 cpu ，内存，硬盘，然后不断进化成一个房子（略微类似于一个细胞核），再扩展成能自我复制繁衍的生命体。然后再考虑怎么进化吧。

AwsShopUK

2023-10-13 11:02:47 +08:00

"""
还有 DNA 翻译成蛋白质会造成信息的损失（要 3 个碱基对确定 20 个氨基酸构成蛋白质）
76.294×log64 （ 20 ） = 54.96MB
"""
这里不是这么算的吧
32 亿碱基对可以确认 32 亿/3 个氨基酸
又氨基酸共有 20 种可能
包含的信息不应该是 20 ** (32 亿/3)
这个数字就巨大无比了

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/981540

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.