AI 直接写机器码目前是否可行？一朋友公司准备下半年全面开始推广机器码开发

昨天和某大厂朋友吃饭，聊了些闲话。目前某厂是准备下半年全面开始推广机器码开发，并开始弱化，直至取消软件工程工作流。因为投资公司要求在软件开发全流程 AI 自动化，以降低风险。

开发这块，目前主要思路是基于主流指令集和 ABI 来区分版本，暂时先复用现存的 so 库。

软件验收和测试，已经部署好了独立的 Agent ，正确率基本可以达到 100%。

问题定义，领域建模，组织管理，舆论引导，辅助决策，是这几个月 AI 增长最快的能力。Anthropic 和 OpenAI ，在帮助产品经理理清思路，洞悉甲方的心理、社交尺度管理等效果不错。此外，帮助管理者从错综复杂的不确定的客观世界中，把握确定的部分，并高效辅助管理人员博弈，

举个例子，产品已经开发好对应的 prompt 和 skill,Codex 可以根据代码的版本历史，将甲方抽象为一个单独的实体，并推理其人格和对应的心理和行为。目前可以给出可用的甲方需求变更预测，甲方 UI 审美的发展（主要还是甲方领导的审美）；对管理者而言，有效平衡公司各个派系的利益均衡，提升自我决策的正确性，提升领导魅力；对公司而言，不同地域的合规、税务优化、政府关系管理、市场公关，都可以使用现有的大模型快速得到最优的 to do list ，只要有一个人或者 agent 执行即可。

理想状态是，任何个人或者资本注册一个公司，投资雇人部署好几百个 Agent 和 2-3 名管理员，即可批量构建和迭代大型软件。OPC 这个概念目前来看还是理想状态，有客户关系、有能跑通的盈利模式，才是未来的核心竞争力，Marketing 和 Manager 的含金量还在上升。这往往也是投资公司、资本管理公司较擅长的领域

Supplement 1 · 3 days ago

@lujiaosama 运维靠 agent 的推理能力和知识库解决； AI debug 这个我也没想清楚～但是我觉得如果一定要，也可以直接往 elf 文件里多塞一些调试信息和 symbol 等，然后由 AI 封装 gdb 之类的或自己写的调试器，来辅助人类工程师调试。

@Eillott 这种一站式解决方案已经有很多人在做了，编码工程能力能够及格，但软性能力还是差一些。比如不能说的信息不足，导致训练的模型还是不够“懂事儿”，比如必须采购哪个厂商的灭火器才能通过消防检查，过车辆年检必须去哪家修理厂，某市某区领导班子的权力布局...

@andforce CPU 指令集，不是 intel/att assembly, 更不是高级语言或解释性语言

@YanSeven 这么搞确实容易扯着蛋，但保守恐怕更难生存。看人家管理层怎么想了哈哈～

@malusama 硬件、token 成本和管理员薪资，还有公司注册资本。需求和测试已经由 AI 帮人类理清，并且比人类更加精细。

@sagnitude 一句话就是 AI 算力远超人类，人类眼中“规模庞大复杂”的软件项目在 AI 眼中或许只是“1+1=2”，“足够健壮”自然不是问题。其实健壮性本身也是相对的，bug free 是理想状态只能无限接近。如果“足够健壮”的定义是，经过 code review 和长期稳定运行的验证，那么 AI 目前也可以做到。现状是“足够健壮”的代码在 AI 看来依旧漏洞百出，anthropic 最新推出的 mythos 已经在众多流行的软件里发现了很多人类尚未发现 bug ，因此都不能对公众开放。

@night98 之所以会出现“合理的封装以降低复杂度”这类软件工程方法，就是因为人类大脑算力不足，无法掌控规模日益庞大复杂的软件项目。进入 AI 时代，复杂度不再是问题后，猛犸象也就不需要在焦油坑里挣扎了，而只需在岸边欣赏工业化机器人如何自动化采集、运输、精炼焦油这一整套产业链的运作。你现在不需要直接看 0101 的机器语言，只需要看机器语言的说明文档：高级语言源代码，就可以了。AI 时代后，你也不需要再看源代码了，只需要看自然语言和插图分析好的业务逻辑和用例。

@AhFei 令人一言难尽的编译器优化？还是交给 AI 统一管理吧～

@Melanthius 说的好，上下文长度这个我也没想清楚怎么解决。现在应该有 10M 级的模型了。

@billccn 确实是，但有没有一种可能，就是未来 debug 这种活动也是多余的了。

@ntdll 说的有道理，现代大型软件开发牵扯面太广了，合规、HA 、稳定性、支付和安全、隐私、灾备...AI 全覆盖或许能力并不足以支撑

自动化

软件

管理

41 replies • 2026-05-12 11:25:34 +08:00

3 days ago

你朋友公司叫什么，送财童子我一定要认识。

sagnitude

3 days ago

这是默认 LLM 能直接一次性写出 gcc 级别的健壮代码？

lujiaosama

3 days ago

生产也靠 AI DEBUG 吗

chandler0149

3 days ago

没看懂

strobber16

3 days ago

冲，再不冲 LLM API 就要涨价了

himawari8

3 days ago

@sagnitude 不好说，但“健壮”这一需求的根源，在于人类大脑的局限性。如果这一问题不复存在了，本世代的软件工程就可以成为历史了。Next-Level Software Engineer 是基于 AI Agent 协作的，或许内容和当代软件工程查不多，但当前人类在用的软件规模看，对 AI Agent 来说或许还很小儿科，“硅基码农”单打独斗就能搞定。

longaiwp

3 days ago

看起来人类的幻觉也没比大模型更低啊

Eillott

3 days ago via iPhone

非常不错的 idea ，建议赶紧落地不然被别人抢先了！时不我待！

hhhfhhf

3 days ago

@longaiwp 哈哈哈，明天就快进到不写程序了，AI 直接操作内存和显存

mqnu00

3 days ago

@longaiwp 你这句话太好笑了

ktyang

3 days ago

必须立刻开展，建议投资公司跳过投资，直接原地解散某厂。

andforce

3 days ago via iPhone

你说的机器码，是我理解的那个通用的机器码吗？

YanSeven

3 days ago

机器码开发的意思就是人类完全无法参与研发与 debug 了，那前置步骤不应该是在高级语言的场景下做到完全无人化吗。

这么搞不怕步子太大扯到蛋吗。

malusama

3 days ago

扯那么多，能接受一个软件开发成本是多少钱嘛。。测试覆盖率是多少嘛

sagnitude

3 days ago

@himawari8 健壮需求是人类的局限性，你的意思是 AI 跑程序，崩了也无所谓吗

7beloved

3 days ago

这个问题为什么不让你朋友来问

w568w

3 days ago

何意味

night98

3 days ago

可行个鸡毛，计算机的魅力就在于合理的封装以降低复杂度；

AhFei

3 days ago via Android

抽象是为了简化，即便 AI 越过奇点，也没有必要没苦硬吃吧。就好比有加工中心却硬要工人拿锉刀去制造。

高级语言不只是为了人类可读，其本身的约束就能避免很多错误，况且编译器优化可以不断改进，如果真有必要写机器码，那也可以分而治之。再者，如果硬件改动，全重写吗？

qazwsxkevin

3 days ago

挺好的，炼出来的成果，少了很多套接套，件接件的屁事，间接依赖过程造成的性能开销，全要回来了，给到正事业务去了，事能把硬件资源全给正事吃，计算机本来就应该如此啊

honjow

3 days ago

怕不是想多了

bkmi

3 days ago via Android

楼上的不知道有啥好嘲笑的，两年前还一群人嘲笑 AI 写代码呢

remarrexxar

3 days ago

AI 解决了软件工程领域缺乏民科的问题

Melanthius

3 days ago

目前 AI 能做的事情会受限于上下文长度，所以工程上一直需要优化上下文。

怎么说呢，直觉上直接生成机器码上下文会爆炸，相比编程语言+框架这种组合，抽象能力不太行。

billccn

3 days ago

有经验的人类用高级语言加各种人工、静态、动态检查还能写出问题百出的底层软件；目前的 AI 各种幻觉、遇到复杂的问题脑子也不是很灵光，让它直接写机器码？

这种东西先不说难以 debug ，就连 stack trace 都没有意义，全是 AI 生成的函数名，要不改成显示：“用户于某年某月某日的某某 prompt 里面有逻辑错误”？或者说干脆不 debug ，遇到错了重新生成一个，换个完全不同的方法崩溃？

tairan2006

3 days ago

不可以，你特么不用审计了是吧

ETiV

3 days ago via iPhone

我也觉得这是必然的未来
AI 写高级语言、低级语言只是暂时的，未来会直接产出 JVM 字节码、CPU 汇编…
就像 AlphaGo ，会下出人看不懂的棋路，但一样能赢一样。
在追求效率的社会，让 AI 干活儿，其实没有让人懂的义务。

nVoxel

3 days ago via Android

看这种积极的态度盲猜字节

crocoii

3 days ago via Android

到那时就没人类啥事了。ai 掌握世界，人类是抵抗组织了。参照终结者。

MuyuQ

3 days ago

@ETiV 还写 JVM 和汇编干嘛。。反正人类审不过来，让 AI 直接写 1 和 0 不是更好。。

ntdll

3 days ago

我认为可行性极低，现阶段 Vibe Coding ，如果把编译器砍掉，让 AI 盲写，那是几乎没有跑起来的可能，全靠编译器做强制检查。各种 SKILL 也是人为上各种限制条件。

而低级语言的编译器就简单得多了，几乎可以认为对 AI 起不到任何帮助作用，跑起来大概率也就是空转，写不出任何可用的东西，最后变成了 Authentic/OpenAI/Google 战略合作伙伴。

退一万步，就是 AI 写出来了，调试呢，也自己写个调试器出来吗，个人认为 [要求在软件开发全流程 AI 自动化，以降低风险] ，这才是最大的风险。

现阶段的 AI 只是拔高了下限，让本来啥也不会的人，能写个小玩具，原本能写小玩具的人，能写个有生产能力的工具，但并没有改变上限。

你说让 AI 搓个成熟的商业软件，比如搓个 QQ 出来，也许能实现个基本功能，也能抄个 UI ，但也还是玩具，我不认为靠 AI ，或者少数几个人+AI 的组合，能做出来一个承载上亿人使用的商业软件。

extrem

3 days ago

马斯克之前就提出过了，应该是说今年年底还是什么时候，ai 直接产出机器码而不是高级语言代码

我认为这不是不可能，而且显然效率更高

但应该不是今天能做到的，因为现在大模型能 work 这是因为互联网上有无数的语料能给他练出来了，然而汇编/机器码少之又少，人话与汇编代码合在一起的语料更是罕见，所以这是打标都没法打，哪来的 ai 按照你的需求去生成能跑的机器码

你可以做个实验，要求 ai 用个冷门语言，比如 Elixir 、erlang 去写个稍微有点难度的 demo 看看，再对比 python ，看看后者是否效率更高

ETiV

3 days ago

@MuyuQ 打比方而已…
用来表达从高级语言到更低级语言的演进方向，当然最后都是 0 和 1 就是了

MuyuQ

3 days ago

@ETiV 这个想法太扯淡了。本身 AI 就是黑箱。让它直接写低级语言，那就是黑箱+黑箱，完全不可控了。如果在里面加一点私货，人类根本无法识别。