antigravity 中的模型清单列表都是骗人的， gemini 3 pro 实际是 Gemini 2.0 Flash， claude Opus 4.5 实际是 Claude 3.5 Sonnet

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

For Existing Member Sign In

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

This topic created in 89 days ago, the information mentioned may be changed or developed.

实操：使用 gemini 3 pro(high) 问题：你现在思考用的是哪个模型？回答：我现在用于思考和回答您问题的模型是 Google Gemini 2.0 Flash （ Thinking process is powered by Gemini 2.0 Flash ）。

实操：使用 gemini 3 flash 问题：现在是对话模式，你现在思考用的是哪个模型？回答：我现在用于思考和回答您问题的模型是 Google Gemini 2.0 Flash （ Thinking process is powered by Gemini 2.0 Flash ）。

实操：使用 claude Opus 4.5(Thinking) 问题：你现在思考用的是哪个模型？我现在使用的模型是 Claude 3.5 Sonnet （由 Anthropic 开发）。刚才您切换了模型设置，因此我从 Gemini 2.0 Pro 切换到了 Claude 3.5 Sonnet 。

太垃圾了，活生生的欺骗，难怪越调 bug 越多。

发现场景，做了一个功能图片识别文字，我让他用 gemini-2.5-flash 模型，它一直反馈 Google Gemini 系列目前的最新 Flash 版本是 2.0 Flash Experimental (gemini-2.0-flash-exp)。我推测您提到的“2.5”可能是指代这个最新的 2.0 版本（目前尚无官方 2.5 发布）。

模型

欺骗

版本

33 replies • 2026-02-01 16:58:25 +08:00

renchong

Jan 31

谷歌顶不住了，这波估计涌进来的人太多了

asen001

Jan 31

最近一个星期，gemini3 pro,连把接口文档丢过去生成一下定义文件（ api/*.js ）写完都会有错误，还不如 deepseek 网页端

germain

Jan 31

无法复现

YanSeven

Jan 31

早期我记得使用这种问模型的方式不是说判断不准吗，从什么时候开始，变得可信了。

metalvest

Jan 31

程序员基操：进度条基本全是骗人的

YanSeven

Jan 31

用 antigravity 的至少有一半人是为了用 claudeopus ，给谷歌用破防了。

QS0x01

Jan 31

反正我没花钱，我觉得有的用就不错了

freefcw

Jan 31

这你也信。。。如果谷歌能够靠其他能力把 sonnet 3.5 的智商优化到 opus 4.5 的水准，那真是功德无量了

evilcat

Jan 31

啊这，刚整的 antigravity 会员

iorilu

Jan 31

opus 表现还是可以的

但 gemini-pro 基本垃圾, 还不如 gemini-flash

actopas

Jan 31

@germain 可以复现确实 3.0flash 是 2.0flash

zhang2e

Jan 31

2026 年了，还有人在问大模型「你是谁」这种问题。真的以为大模型会思考有智商吗。

zjttfs

Jan 31

碰到过一次, 用的 Sonnet 4.5 , 报错返回说 Gemini Pro 网关错误....

mitu233

Jan 31

怎么所有人都在用这种方法测试模型？ gemini1.5 的时候问他是谁他还会说自己是百度的混元呢，测试模型不是有一堆方法吗看知识库截止日期之类的？

billzhuang

Jan 31 via iPhone

不可能的，OP 你这个方法是不准确的

msg7086

Jan 31

你这调教得不行啊。我之前在网页端问 Gemini 他是什么模型，他还告诉我他是 Claude 的呢。

lscho

Jan 31

2026 年了，还有人在问大模型「你是谁」这种问题。真的以为大模型会思考有智商吗?

NewMoorj

Jan 31

兄弟真把大模型当人了，大模型之间会互相拿对方的数据来训练的，数据流里不认识真实的自己太正常了。

korvin

Jan 31

今惜是何年~😅

hash

Jan 31

我以为不要问 Transformer 模型你是谁这种常识应该 GPT3 时代大家就明白了

hanssx

Jan 31

这种问法是不对的，实际模型到底是多少，只有背后做的人和少部分人会调优的人知道

yuuluu

Jan 31

日经贴，只能说骗回复你成功了

kimaky

Jan 31

antigravity 模型造假吗?

deplives

Jan 31

6202 年了还有人这么判断模型？？？

saaak

Jan 31

你怎么确定这不是大模型幻觉呢

CodeLaunchur

Jan 31

那么到底怎么判断大模型版本呢？

acisky

Feb 1

Antigravity Tools 使用 claude 模型，都映射到了 gemini ，额度也是用的 gemini 的

YanSeven

Feb 1

@acisky ...google 至少是国际性大厂吧。。。不至于这么没品吧

qq316107934

Feb 1

额，谷歌前两天刚到发邮件说要把 2.0 系列模型从 GCP 下架了，要用也是 2.5 Flash 啊...

coolmenu

Feb 1

不能这么判断，可能是基座的训练集，最好你弄个比较难的问题，比较回答，能看的清楚点

realpg

PRO

Feb 1

@lscho #17
大模型能直接对话的一般会有一个 overwrite 的配置应对这种问题

一般是写死的配置且更新了总忘改

本身也是形象宣传的一种

这个相对可信的, 因为我用 claude sonnet 时对话到一半给我报 gemini 的错误代码

realpg

PRO

Feb 1

@qq316107934 #29
同一系列的版本号不对很常见

一般在对话网关, 都直接固化一个配置 "我是谁" 本身也是品牌宣传策略的一种

一般这种是一个独立的覆盖拦截配置很多时候升级后端对接总忘这种接口

比如我在 chat 的前端
给对接 gemini 2.x 做一个配置我是 gemini 2.0
给对接 gemini 3.x 做一个配置我是 gemini 3.0

当后端 2.0 升级到 2.5 时候很容易忘了改这个配置里的文字

ethusdt

Feb 1

即使不清楚，也要做多方面实验。