V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
donggua997
V2EX  ›  问与答

国产模型能不能不吹牛逼

  •  
  •   donggua997 · 46 天前 · 2689 次点击
    这是一个创建于 46 天前的主题,其中的信息可能已经有所发展或是发生改变。
    今天没事做,用 claude code 接入了两个模型测试一下:kimi2 和 glm4.5
    k2 说很强大实测也很一般般;
    glm4.5 也是说什么全面领先,实测代码方法级别优化,他总是忍不住优化这个类(明确说别修改其他方法都拦不住),优化后的代码还出现报红,相同提示词输出内容,和 sonnet-4 差距太明显了。

    测试一天总结: 与 sonnet-4 根本就不是一个维度的东西,甚至我感觉单就写代码而言,连 sonnet-3.5 都没法比。
    如果没用过 claude 模型,是可以当个辅助工具用一用的。
    23 条回复    2025-08-25 19:55:06 +08:00
    Clannad0708
        1
    Clannad0708  
       46 天前
    老哥现在有什么平台可以稳定使用 claude-4 的 api 吗。我之前用的几个都很卡
    7gugu
        2
    7gugu  
       46 天前
    @Clannad0708 raycast
    donggua997
        3
    donggua997  
    OP
       46 天前
    @Clannad0708 #1 这么很多吗,cursor 、claude code ,海外的 trae
    Haaaaaat
        4
    Haaaaaat  
       46 天前
    不吹牛逼的话 哪还有人会去用?
    Clannad0708
        5
    Clannad0708  
       46 天前
    @donggua997 #3 我的意思是专门的 sonnet-4 api 站,比如 raycast 但是我用的经常 502 ,不稳。claude code 直冲又没国外支付途径
    nealHuang
        6
    nealHuang  
       46 天前
    glm 4.5 真的一坨,吗的,骗我 50
    maocat
        7
    maocat  
       46 天前
    正宗的也不太靠谱啊,我贼



    donggua997
        8
    donggua997  
    OP
       46 天前
    @maocat #7 失误肯定是有的,正宗的可以完全当生产力工具,其他智能当辅助工具
    donggua997
        9
    donggua997  
    OP
       46 天前
    @nealHuang #6 新用户注册送那么多 token 都用完了?
    duuu
        10
    duuu  
       46 天前
    自夸就算了,有种感觉现在还收买自媒体去夸。。真无语。当然有可能自媒体是为了流量去夸。
    最近出的几个试用下来是能用,但真没夸的那么厉害
    nealHuang
        11
    nealHuang  
       46 天前
    @donggua997 #9 冲动付费了
    jamesxu
        12
    jamesxu  
       46 天前
    qwen coder 感觉还行
    donggua997
        13
    donggua997  
    OP
       46 天前
    @jamesxu #12 有空再试试
    qiaobeier
        14
    qiaobeier  
       46 天前
    能和 sonnet 3.5 差不多的就已经超一线了。。。
    hanqian
        15
    hanqian  
       46 天前
    昨天不是还出了个 XBai-o4 ,一个源自 Qwen3 32B 的模型宣称各种跑分全面超越 Claude Opus 4 我也是醉了
    phrack
        16
    phrack  
       46 天前
    为了钱和为了理想为了改变历史的人,

    你猜哪个会刷 benchmark
    Mark24
        17
    Mark24  
       46 天前
    K2 骗了我 22 元
    connecting
        18
    connecting  
       46 天前
    claude code 是专门为 claude 优化的,有没有提示词不能很好的适配的?
    vivcha
        19
    vivcha  
       46 天前 via Android
    我在 cursor 中 roo code 使用 glm-4.5-air 感觉还行
    iv8d
        20
    iv8d  
       46 天前
    自从冲过一次,再冲是🐕
    donggua997
        21
    donggua997  
    OP
       46 天前
    @iv8d #20 还是老老实实用国外的吧 ,要么就不用
    liulicaixiao
        22
    liulicaixiao  
       45 天前
    我觉得现在最喜欢吹牛逼的就是 openai ,已经变成一个营销公司,奥特曼比雷军还能营销
    catwalk
        23
    catwalk  
       25 天前
    @Mark24 骗了我 50
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2756 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 109ms · UTC 06:12 · PVG 14:12 · LAX 23:12 · JFK 02:12
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.