🚀根据 DeepSWE (最佳编码基准)排名:
gpt-5.5 xhigh 完胜 opus-4.8 max
所以,聪明的你,选 Codex 还是 Claude code ?🙂

🚀根据 DeepSWE (最佳编码基准)排名:
gpt-5.5 xhigh 完胜 opus-4.8 max
所以,聪明的你,选 Codex 还是 Claude code ?🙂

1
cairnechen 4h 57m ago
4.8 等这波付费用户测试弄完了应该是会回升的,当然,这不影响我骂 A➗
|
2
409164 4h 50m ago
claude max 连 gpt5.5 high 都打不过吗?真的假的
|
3
Retas 4h 50m ago
聪明的人会选择双持~
|
4
lujiaosama 4h 49m ago
@Retas 两个都同时拉裤子呢。得等外星人发模型了。
|
5
409164 4h 47m ago
看了一下,做的只是 PASS@1 情况下的排行榜,实际上经过简单修正,还是 claude 的结果可用性更高
|
6
AS4694lAS4808 4h 33m ago via Android
没人用 gemini 3.5 flash 么,我觉得也挺好用的,而且速度能到 300+
|
7
Retas 4h 19m ago
@lujiaosama 两个都拉了就是天才程序员陨落了
|
8
lujiaosama 4h 8m ago
@Retas 天才程序员选择用国模凑合,天才程序员发现自己服务器被干崩了
|