V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
gnash
V2EX  ›  程序员

antigravity 中的模型清单列表都是骗人的, gemini 3 pro 实际是 Gemini 2.0 Flash, claude Opus 4.5 实际是 Claude 3.5 Sonnet

  •  
  •   gnash · Jan 31 · 5703 views
    This topic created in 89 days ago, the information mentioned may be changed or developed.

    实操:使用 gemini 3 pro(high) 问题:你现在思考用的是哪个模型? 回答:我现在用于思考和回答您问题的模型是 Google Gemini 2.0 Flash ( Thinking process is powered by Gemini 2.0 Flash )。

    实操:使用 gemini 3 flash 问题:现在是对话模式,你现在思考用的是哪个模型? 回答:我现在用于思考和回答您问题的模型是 Google Gemini 2.0 Flash ( Thinking process is powered by Gemini 2.0 Flash )。

    实操:使用 claude Opus 4.5(Thinking) 问题:你现在思考用的是哪个模型? 我现在使用的模型是 Claude 3.5 Sonnet (由 Anthropic 开发)。 刚才您切换了模型设置,因此我从 Gemini 2.0 Pro 切换到了 Claude 3.5 Sonnet 。

    太垃圾了,活生生的欺骗,难怪越调 bug 越多。

    发现场景,做了一个功能图片识别文字,我让他用 gemini-2.5-flash 模型,它一直反馈 Google Gemini 系列目前的最新 Flash 版本是 2.0 Flash Experimental (gemini-2.0-flash-exp)。我推测您提到的“2.5”可能是指代这个最新的 2.0 版本(目前尚无官方 2.5 发布)。

    33 replies    2026-02-01 16:58:25 +08:00
    renchong
        1
    renchong  
       Jan 31   ❤️ 1
    谷歌顶不住了,这波估计涌进来的人太多了
    asen001
        2
    asen001  
       Jan 31
    最近一个星期,gemini3 pro,连把接口文档丢过去生成一下定义文件( api/*.js )写完都会有错误,还不如 deepseek 网页端
    germain
        3
    germain  
       Jan 31
    无法复现
    YanSeven
        4
    YanSeven  
       Jan 31   ❤️ 9
    早期我记得使用这种问模型的方式不是说判断不准吗,从什么时候开始,变得可信了。
    metalvest
        5
    metalvest  
       Jan 31
    程序员基操:进度条基本全是骗人的
    YanSeven
        6
    YanSeven  
       Jan 31   ❤️ 1
    用 antigravity 的至少有一半人是为了用 claudeopus ,给谷歌用破防了。
    QS0x01
        7
    QS0x01  
       Jan 31
    反正我没花钱,我觉得有的用就不错了
    freefcw
        8
    freefcw  
       Jan 31
    这你也信。。。如果谷歌能够靠其他能力把 sonnet 3.5 的智商优化到 opus 4.5 的水准,那真是功德无量了
    evilcat
        9
    evilcat  
       Jan 31
    啊这,刚整的 antigravity 会员
    iorilu
        10
    iorilu  
       Jan 31
    opus 表现还是可以的

    但 gemini-pro 基本垃圾, 还不如 gemini-flash
    actopas
        11
    actopas  
       Jan 31
    @germain 可以复现确实 3.0flash 是 2.0flash
    zhang2e
        12
    zhang2e  
       Jan 31   ❤️ 22
    2026 年了,还有人在问大模型「你是谁」这种问题。真的以为大模型会思考有智商吗。
    zjttfs
        13
    zjttfs  
       Jan 31
    碰到过一次, 用的 Sonnet 4.5 , 报错返回说 Gemini Pro 网关错误....
    mitu233
        14
    mitu233  
       Jan 31   ❤️ 1
    怎么所有人都在用这种方法测试模型? gemini1.5 的时候问他是谁他还会说自己是百度的混元呢,测试模型不是有一堆方法吗看知识库截止日期之类的?
    billzhuang
        15
    billzhuang  
       Jan 31 via iPhone   ❤️ 2
    不可能的,OP 你这个方法是不准确的
    msg7086
        16
    msg7086  
       Jan 31   ❤️ 1
    你这调教得不行啊。我之前在网页端问 Gemini 他是什么模型,他还告诉我他是 Claude 的呢。
    lscho
        17
    lscho  
       Jan 31   ❤️ 2
    2026 年了,还有人在问大模型「你是谁」这种问题。真的以为大模型会思考有智商吗?
    NewMoorj
        18
    NewMoorj  
       Jan 31   ❤️ 1
    兄弟真把大模型当人了,大模型之间会互相拿对方的数据来训练的,数据流里不认识真实的自己太正常了。
    korvin
        19
    korvin  
       Jan 31   ❤️ 1
    今惜是何年~😅
    hash
        20
    hash  
       Jan 31   ❤️ 1
    我以为不要问 Transformer 模型你是谁这种常识应该 GPT3 时代大家就明白了
    hanssx
        21
    hanssx  
       Jan 31
    这种问法是不对的,实际模型到底是多少,只有背后做的人和少部分人会调优的人知道
    yuuluu
        22
    yuuluu  
       Jan 31   ❤️ 1
    日经贴,只能说骗回复你成功了
    kimaky
        23
    kimaky  
       Jan 31   ❤️ 1
    antigravity 模型造假吗?
    deplives
        24
    deplives  
       Jan 31   ❤️ 1
    6202 年了还有人这么判断模型???
    saaak
        25
    saaak  
       Jan 31
    你怎么确定这不是大模型幻觉呢
    CodeLaunchur
        26
    CodeLaunchur  
       Jan 31
    那么到底怎么判断大模型版本呢?
    acisky
        27
    acisky  
       Feb 1
    Antigravity Tools 使用 claude 模型,都映射到了 gemini ,额度也是用的 gemini 的
    YanSeven
        28
    YanSeven  
       Feb 1
    @acisky ...google 至少是国际性大厂吧。。。不至于这么没品吧
    qq316107934
        29
    qq316107934  
       Feb 1
    额,谷歌前两天刚到发邮件说要把 2.0 系列模型从 GCP 下架了,要用也是 2.5 Flash 啊...
    coolmenu
        30
    coolmenu  
       Feb 1
    不能这么判断,可能是基座的训练集,最好你弄个比较难的问题,比较回答,能看的清楚点
    realpg
        31
    realpg  
    PRO
       Feb 1
    @lscho #17
    大模型能直接对话的一般会有一个 overwrite 的配置应对这种问题

    一般是写死的配置 且更新了总忘改

    本身也是形象宣传的一种

    这个相对可信的, 因为我用 claude sonnet 时 对话到一半给我报 gemini 的错误代码
    realpg
        32
    realpg  
    PRO
       Feb 1
    @qq316107934 #29
    同一系列的版本号不对很常见

    一般在对话网关, 都直接固化一个配置 "我是谁" 本身也是品牌宣传策略的一种

    一般这种是一个独立的覆盖拦截配置 很多时候升级后端对接总忘这种接口

    比如我在 chat 的前端
    给对接 gemini 2.x 做一个配置 我是 gemini 2.0
    给对接 gemini 3.x 做一个配置 我是 gemini 3.0

    当后端 2.0 升级到 2.5 时候 很容易忘了改这个配置里的文字
    ethusdt
        33
    ethusdt  
       Feb 1


    即使不清楚,也要做多方面实验。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   849 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 84ms · UTC 22:17 · PVG 06:17 · LAX 15:17 · JFK 18:17
    ♥ Do have faith in what you're doing.