zhwguest
V2EX  ›  OpenAI

续 claude 降智严重后, codex 也在步其后尘

  •  
  •   zhwguest · 22h 37m ago · 4350 views

    你说这是为什么呀为呀么为什么?

    38 replies    2026-05-19 22:51:40 +08:00
    neuthself
        1
    neuthself  
       22h 33m ago
    可能是算力不够?
    MX123
        2
    MX123  
       22h 31m ago
    这两天 claude 明显比 Codex 强
    lujiaosama
        3
    lujiaosama  
       22h 31m ago
    无它,算力不足,好日子还在后头呢
    longxinglink
        4
    longxinglink  
       22h 26m ago
    我的模型和 Mythos Preview 差在哪里?我的 GPT5.5:这里可能有一个漏洞,根据文档我新建了三个漏洞来修补这个漏洞,Mythos Preview:这里有漏洞,我写了 PoC ,跑通了,还能把它和另一个低危点串成攻击链。
    https://www.v2ex.com/t/1213773#reply1

    GPT 幻觉特别强,经常去用错误文档且不加以检验,也是酱汁导致的吗?
    kloudmuka
        5
    kloudmuka  
       22h 25m ago
    GPT 这两天拉完了,吐一大堆没用的垃圾,又只能回去用 Claude 了
    MuyuQ
        6
    MuyuQ  
       21h 50m ago
    这两天 image2 也经常抽风。
    deplives
        7
    deplives  
       21h 48m ago
    gpt 的降职已经不是这几天才开始的,我的官方 gpt 已经吃灰很久了,上周让他写一个 需求,弯弯绕绕改了一堆又一堆,编译都过不去,最后自己都快无限循环了,claude 4.7 一把梭解决,顺便还找出来了 gpt 写的屎一样代码的 20 多个 bug
    prosgtsr
        8
    prosgtsr  
       21h 47m ago
    一般都是有新模型在研发中,占用算力了
    qingjin
        9
    qingjin  
       21h 42m ago
    算力倾斜,逼你用更高倍的新模型。
    evan1
        10
    evan1  
    PRO
       21h 34m ago
    gpt 是最先开启降智的。。。好几年了都。

    当时 claude 还只会封号。
    evan1
        11
    evan1  
    PRO
       21h 34m ago
    可能是为了节省成本。
    bush911
        12
    bush911  
       21h 32m ago
    各位大佬,Claude 手机号码验证你们都是去淘宝搞定的吗?
    glouhao
        13
    glouhao  
       21h 3m ago
    其实我感觉啊 这几家都是刚发布出来新东西可劲搞 后面慢慢下滑
    kkth
        14
    kkth  
       20h 28m ago
    哇擦,难怪这几天感觉不对劲,这可咋办呀
    zhwguest
        15
    zhwguest  
    OP
       20h 8m ago
    最恐怖的事情是,网络明明牛逼轰轰,但是广大码畜只能使用弱智工具了。
    xjoker
        16
    xjoker  
       20h 5m ago
    怪了 我今天体感是 GPT 比 Claude 好用
    imchrisorz
        17
    imchrisorz  
       19h 58m ago
    这两天感觉 Codex 确实有点降智,一个需求怎么讲都讲不明白,plan 生成质量很差
    huangpingdong
        18
    huangpingdong  
       19h 50m ago
    @MX123 claude 不是租到了马斯克的算力了吗
    chunqiuyiyu
        19
    chunqiuyiyu  
       19h 46m ago
    现在真的蠢得用不了……
    JerningChan
        20
    JerningChan  
       19h 46m ago
    感觉本地部署的 qwen3.6-27b 都比 opus 4.7 要用,写代码的话

    今天消耗了 21%的 token opus4.7 居然对话了 3 次都处理不好一个 bug ,还来来回回 3 次都说他已经修改了代码,看输出他是改了,但是完全不知道他改的什么东西,反正就是没效果

    然后,换回本地 qwen3.6-27b 一次解决问题
    NerbraskaGuy
        21
    NerbraskaGuy  
       19h 41m ago
    感觉都在试探用户底线,测试降智到哪种程度会导致用户流失太多,用来制定成本。
    x86
        22
    x86  
       19h 40m ago
    故意开白嫖的口子呗,这个月到期不续费,不如白嫖
    iFlicker
        23
    iFlicker  
       19h 40m ago
    新模型训练会占用大量算力
    MEIerer
        24
    MEIerer  
       19h 29m ago
    额度又少,还降智,难受
    jackqian
        25
    jackqian  
       19h 28m ago
    我一直用 xhigh ,没感觉到降智
    diudiuu
        26
    diudiuu  
       19h 24m ago
    @JerningChan 方便分享一下哪个量化版本的吗
    JerningChan
        27
    JerningChan  
       18h 40m ago
    @diudiuu 就用 unsloth 的 Qwen3.6-27B-UD-Q4_K_XL.gguf 就很不错,我家里自己用的 35b-a3b 也很不错
    teaguexiao
        28
    teaguexiao  
       18h 33m ago
    这种节点通常是新版本发布前后的算力调度问题,Claude Sonnet 4 发布前 3.7 也来过一次差不多的波动。等一周左右一般会恢复,实在不行就先请 ds v4 我来做客。
    wdv2ly
        29
    wdv2ly  
       16h 48m ago via Android
    同感,Opus 4.7 明显比之前苯了很多,现在有点像豆包了,说啥只会迎合
    diudiuu
        30
    diudiuu  
       16h 45m ago
    @JerningChan #27 一会在本地试下
    commoccoom
        31
    commoccoom  
       16h 44m ago
    @JerningChan 请问下 3060 12G 能跑吗😂
    iorilu
        32
    iorilu  
       15h 21m ago
    不会把, 真不如本地

    这两公司得瞬间破产
    icaca
        33
    icaca  
       15h 1m ago
    一两周前就降智了
    JerningChan
        34
    JerningChan  
       14h 58m ago
    @commoccoom 不太行喔,除非你把大部分的层卸载到 cpu+内存,这样稠密型的模型就会比较慢了,moe 的话,我就不太清楚,我之前是 1660s 6g ,跑那种 9b 模型,设大了上下文,就得卸载到 cpu ,就会很慢
    JerningChan
        35
    JerningChan  
       14h 55m ago
    @iorilu 你自己试试就知道了,问题是即便你想 27b 用的爽,不想折腾,单卡跑,成本是多少?随便起码一张 4090 吧,反正我自己用 2080ti 22g 跑 27b 模型,都只有 20t/s 左右,要用得爽,起码 60t/s 才有一点点效率
    sead
        36
    sead  
       13h 56m ago
    最近写的确实缺点意思, 我还以为是错觉。。。
    chen27
        37
    chen27  
       13h 49m ago
    算力用来训新模型了
    eventlooped
        38
    eventlooped  
       13h 47m ago
    我最近觉得 claude 比 gpt 强太多了
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3624 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 82ms · UTC 04:39 · PVG 12:39 · LAX 21:39 · JFK 00:39
    ♥ Do have faith in what you're doing.