himawari8

AI 直接写机器码目前是否可行?一朋友公司准备下半年全面开始推广机器码开发

  •  
  •   himawari8 · 3 days ago · 2749 views

    昨天和某大厂朋友吃饭,聊了些闲话。目前某厂是准备下半年全面开始推广机器码开发,并开始弱化,直至取消软件工程工作流。因为投资公司要求在软件开发全流程 AI 自动化,以降低风险。

    开发这块,目前主要思路是基于主流指令集和 ABI 来区分版本,暂时先复用现存的 so 库。

    软件验收和测试,已经部署好了独立的 Agent ,正确率基本可以达到 100%。

    问题定义,领域建模,组织管理,舆论引导,辅助决策,是这几个月 AI 增长最快的能力。Anthropic 和 OpenAI ,在帮助产品经理理清思路,洞悉甲方的心理、社交尺度管理等效果不错。此外,帮助管理者从错综复杂的不确定的客观世界中,把握确定的部分,并高效辅助管理人员博弈,

    举个例子,产品已经开发好对应的 prompt 和 skill,Codex 可以根据代码的版本历史,将甲方抽象为一个单独的实体,并推理其人格和对应的心理和行为。目前可以给出可用的甲方需求变更预测,甲方 UI 审美的发展(主要还是甲方领导的审美);对管理者而言,有效平衡公司各个派系的利益均衡,提升自我决策的正确性,提升领导魅力;对公司而言,不同地域的合规、税务优化、政府关系管理、市场公关,都可以使用现有的大模型快速得到最优的 to do list ,只要有一个人或者 agent 执行即可。

    理想状态是,任何个人或者资本注册一个公司,投资雇人部署好几百个 Agent 和 2-3 名管理员,即可批量构建和迭代大型软件。OPC 这个概念目前来看还是理想状态,有客户关系、有能跑通的盈利模式,才是未来的核心竞争力,Marketing 和 Manager 的含金量还在上升。这往往也是投资公司、资本管理公司较擅长的领域

    Supplement 1  ·  3 days ago
    @lujiaosama 运维靠 agent 的推理能力和知识库解决; AI debug 这个我也没想清楚~但是我觉得如果一定要,也可以直接往 elf 文件里多塞一些调试信息和 symbol 等,然后由 AI 封装 gdb 之类的或自己写的调试器,来辅助人类工程师调试。

    @Eillott 这种一站式解决方案已经有很多人在做了,编码工程能力能够及格,但软性能力还是差一些。比如不能说的信息不足,导致训练的模型还是不够“懂事儿”,比如必须采购哪个厂商的灭火器才能通过消防检查,过车辆年检必须去哪家修理厂,某市某区领导班子的权力布局...

    @andforce CPU 指令集,不是 intel/att assembly, 更不是高级语言或解释性语言

    @YanSeven 这么搞确实容易扯着蛋,但保守恐怕更难生存。看人家管理层怎么想了哈哈~

    @malusama 硬件、token 成本和管理员薪资,还有公司注册资本。需求和测试已经由 AI 帮人类理清,并且比人类更加精细。

    @sagnitude 一句话就是 AI 算力远超人类,人类眼中“规模庞大复杂”的软件项目在 AI 眼中或许只是“1+1=2”,“足够健壮”自然不是问题。其实健壮性本身也是相对的,bug free 是理想状态只能无限接近。如果“足够健壮”的定义是,经过 code review 和长期稳定运行的验证,那么 AI 目前也可以做到。现状是“足够健壮”的代码在 AI 看来依旧漏洞百出,anthropic 最新推出的 mythos 已经在众多流行的软件里发现了很多人类尚未发现 bug ,因此都不能对公众开放。

    @night98 之所以会出现“合理的封装以降低复杂度”这类软件工程方法,就是因为人类大脑算力不足,无法掌控规模日益庞大复杂的软件项目。进入 AI 时代,复杂度不再是问题后,猛犸象也就不需要在焦油坑里挣扎了,而只需在岸边欣赏工业化机器人如何自动化采集、运输、精炼焦油这一整套产业链的运作。你现在不需要直接看 0101 的机器语言,只需要看机器语言的说明文档:高级语言源代码,就可以了。AI 时代后,你也不需要再看源代码了,只需要看自然语言和插图分析好的业务逻辑和用例。

    @AhFei 令人一言难尽的编译器优化?还是交给 AI 统一管理吧~

    @Melanthius 说的好,上下文长度这个我也没想清楚怎么解决。现在应该有 10M 级的模型了。

    @billccn 确实是,但有没有一种可能,就是未来 debug 这种活动也是多余的了。

    @ntdll 说的有道理,现代大型软件开发牵扯面太广了,合规、HA 、稳定性、支付和安全、隐私、灾备...AI 全覆盖或许能力并不足以支撑
    41 replies    2026-05-12 11:25:34 +08:00
    v1
        1
    v1  
       3 days ago
    你朋友公司叫什么,送财童子我一定要认识。
    sagnitude
        2
    sagnitude  
       3 days ago   ❤️ 2
    这是默认 LLM 能直接一次性写出 gcc 级别的健壮代码?
    lujiaosama
        3
    lujiaosama  
       3 days ago
    生产也靠 AI DEBUG 吗
    chandler0149
        4
    chandler0149  
       3 days ago
    没看懂
    strobber16
        5
    strobber16  
       3 days ago
    冲,再不冲 LLM API 就要涨价了
    himawari8
        6
    himawari8  
    OP
       3 days ago
    @sagnitude 不好说,但“健壮”这一需求的根源,在于人类大脑的局限性。如果这一问题不复存在了,本世代的软件工程就可以成为历史了。Next-Level Software Engineer 是基于 AI Agent 协作的,或许内容和当代软件工程查不多,但当前人类在用的软件规模看,对 AI Agent 来说或许还很小儿科,“硅基码农”单打独斗就能搞定。
    longaiwp
        7
    longaiwp  
       3 days ago   ❤️ 32
    看起来人类的幻觉也没比大模型更低啊
    Eillott
        8
    Eillott  
       3 days ago via iPhone
    非常不错的 idea ,建议赶紧落地不然被别人抢先了!时不我待!
    hhhfhhf
        9
    hhhfhhf  
       3 days ago   ❤️ 1
    @longaiwp 哈哈哈,明天就快进到不写程序了,AI 直接操作内存和显存
    mqnu00
        10
    mqnu00  
       3 days ago
    @longaiwp 你这句话太好笑了
    ktyang
        11
    ktyang  
       3 days ago
    必须立刻开展,建议投资公司跳过投资,直接原地解散某厂。
    andforce
        12
    andforce  
       3 days ago via iPhone
    你说的机器码,是我理解的那个通用的机器码吗?
    YanSeven
        13
    YanSeven  
       3 days ago
    机器码开发的意思就是人类完全无法参与研发与 debug 了,那前置步骤不应该是在高级语言的场景下做到完全无人化吗。

    这么搞不怕步子太大扯到蛋吗。
    malusama
        14
    malusama  
       3 days ago
    扯那么多, 能接受一个软件开发成本是多少钱嘛。。测试覆盖率是多少嘛
    sagnitude
        15
    sagnitude  
       3 days ago
    @himawari8 健壮需求是人类的局限性,你的意思是 AI 跑程序,崩了也无所谓吗
    7beloved
        16
    7beloved  
       3 days ago
    这个问题为什么不让你朋友来问
    w568w
        17
    w568w  
       3 days ago
    何意味
    night98
        18
    night98  
       3 days ago
    可行个鸡毛,计算机的魅力就在于合理的封装以降低复杂度;
    AhFei
        19
    AhFei  
       3 days ago via Android
    抽象是为了简化,即便 AI 越过奇点,也没有必要没苦硬吃吧。就好比有加工中心却硬要工人拿锉刀去制造。

    高级语言不只是为了人类可读,其本身的约束就能避免很多错误,况且编译器优化可以不断改进,如果真有必要写机器码,那也可以分而治之。再者,如果硬件改动,全重写吗?
    qazwsxkevin
        20
    qazwsxkevin  
       3 days ago
    挺好的,炼出来的成果,少了很多套接套,件接件的屁事,间接依赖过程造成的性能开销,全要回来了,给到正事业务去了,事能把硬件资源全给正事吃,计算机本来就应该如此啊
    honjow
        21
    honjow  
       3 days ago
    怕不是想多了
    bkmi
        22
    bkmi  
       3 days ago via Android
    楼上的不知道有啥好嘲笑的,两年前还一群人嘲笑 AI 写代码呢
    remarrexxar
        23
    remarrexxar  
       3 days ago   ❤️ 1
    AI 解决了软件工程领域缺乏民科的问题
    Melanthius
        24
    Melanthius  
       3 days ago
    目前 AI 能做的事情会受限于上下文长度,所以工程上一直需要优化上下文。

    怎么说呢,直觉上直接生成机器码上下文会爆炸,相比编程语言+框架这种组合,抽象能力不太行。
    billccn
        25
    billccn  
       3 days ago
    有经验的人类用高级语言加各种人工、静态、动态检查还能写出问题百出的底层软件;目前的 AI 各种幻觉、遇到复杂的问题脑子也不是很灵光,让它直接写机器码?

    这种东西先不说难以 debug ,就连 stack trace 都没有意义,全是 AI 生成的函数名,要不改成显示:“用户于某年某月某日的某某 prompt 里面有逻辑错误”?或者说干脆不 debug ,遇到错了重新生成一个,换个完全不同的方法崩溃?
    tairan2006
        26
    tairan2006  
       3 days ago
    不可以,你特么不用审计了是吧
    ETiV
        27
    ETiV  
       3 days ago via iPhone
    我也觉得这是必然的未来
    AI 写高级语言、低级语言只是暂时的,未来会直接产出 JVM 字节码、CPU 汇编…
    就像 AlphaGo ,会下出人看不懂的棋路,但一样能赢一样。
    在追求效率的社会,让 AI 干活儿,其实没有让人懂的义务。
    nVoxel
        28
    nVoxel  
       3 days ago via Android
    看这种积极的态度盲猜字节
    crocoii
        29
    crocoii  
       3 days ago via Android
    到那时就没人类啥事了。ai 掌握世界,人类是抵抗组织了。参照终结者。
    MuyuQ
        30
    MuyuQ  
       3 days ago
    @ETiV 还写 JVM 和汇编干嘛。。反正人类审不过来,让 AI 直接写 1 和 0 不是更好。。
    ntdll
        31
    ntdll  
       3 days ago
    我认为可行性极低,现阶段 Vibe Coding ,如果把编译器砍掉,让 AI 盲写,那是几乎没有跑起来的可能,全靠编译器做强制检查。各种 SKILL 也是人为上各种限制条件。

    而低级语言的编译器就简单得多了,几乎可以认为对 AI 起不到任何帮助作用,跑起来大概率也就是空转,写不出任何可用的东西,最后变成了 Authentic/OpenAI/Google 战略合作伙伴。

    退一万步,就是 AI 写出来了,调试呢,也自己写个调试器出来吗,个人认为 [要求在软件开发全流程 AI 自动化,以降低风险] ,这才是最大的风险。

    现阶段的 AI 只是拔高了下限,让本来啥也不会的人,能写个小玩具,原本能写小玩具的人,能写个有生产能力的工具,但并没有改变上限。

    你说让 AI 搓个成熟的商业软件,比如搓个 QQ 出来,也许能实现个基本功能,也能抄个 UI ,但也还是玩具,我不认为靠 AI ,或者少数几个人+AI 的组合,能做出来一个承载上亿人使用的商业软件。
    extrem
        32
    extrem  
       3 days ago
    马斯克之前就提出过了,应该是说今年年底还是什么时候,ai 直接产出机器码而不是高级语言代码

    我认为这不是不可能,而且显然效率更高

    但应该不是今天能做到的,因为现在大模型能 work 这是因为互联网上有无数的语料能给他练出来了,然而汇编/机器码少之又少,人话与汇编代码合在一起的语料更是罕见,所以这是打标都没法打,哪来的 ai 按照你的需求去生成能跑的机器码

    你可以做个实验,要求 ai 用个冷门语言,比如 Elixir 、erlang 去写个稍微有点难度的 demo 看看,再对比 python ,看看后者是否效率更高
    ETiV
        33
    ETiV  
       3 days ago
    @MuyuQ 打比方而已…
    用来表达从高级语言到更低级语言的演进方向,当然最后都是 0 和 1 就是了
    MuyuQ
        34
    MuyuQ  
       3 days ago
    @ETiV 这个想法太扯淡了。 本身 AI 就是黑箱。让它直接写低级语言,那就是黑箱+黑箱,完全不可控了。如果在里面加一点私货,人类根本无法识别。
    kuhung
        35
    kuhung  
       3 days ago
    AI native 玩疯魔了,不尊重客观事实和工程原理的人,等着火箭爆炸吧
    ppxppx
        36
    ppxppx  
       3 days ago via Android
    我觉得做个 AI 的优化编译器还更有可行度,起码有现成的编译器和代码库可以作为验证。直接生成机器码步子怕不是太大了。
    tootfsg
        37
    tootfsg  
       3 days ago via Android
    这很明显,是水硬币来了,还真有人上当,一本正经的讨论。
    jackOff
        38
    jackOff  
       2 days ago
    ai 开发汇编?这么硬核吗
    charlie21
        39
    charlie21  
       2 days ago
    感觉骗子越来越多了
    rickiey
        40
    rickiey  
       2 days ago
    我写 0 和 1 吗?感觉先直接写汇编应该好点
    workbest
        41
    workbest  
       2 days ago
    不符合第一性原理,应该直接写 01010101
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1043 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 104ms · UTC 18:38 · PVG 02:38 · LAX 11:38 · JFK 14:38
    ♥ Do have faith in what you're doing.