感觉一些人对 claude 3.7 sonnet 有误解,以为是编程领域最强的模型。

2 天前
tool3d  tool3d
其实只是“某种意义”上的最强。编程分两种,一种是 CURD 工程化,也就是 claude 3.7 sonnet 擅长的领域,用朴实无华的编程技能,把整个页面写完善,出成品,这是 claude 3.7 的强项。

另一种编程领域,是竞赛制编程,和数学推理能力很接近,在这一点上 o3-mini-high 要明显强过 claude 3.7 ,所以 claude 3.7 编程专项领域的跑分,看起来并不算太亮眼。

下图是最新的编程竞赛跑分,3.7 连 deepseek r1 都没能打过,实在很遗憾。但是论项目开发,claude 3.7 舍我其谁!

5734 次点击
所在节点   程序员  程序员
47 条回复
uncleroot
uncleroot
2 天前
一种是 CURD 工程化,也就是 claude 3.7 sonnet 擅长的领域 —— 这个不正是大多数人所需要的
gigishy
gigishy
2 天前
@seven777 最近连续喂 ai 数竞题,谷歌双 2 最差,grok 能接受,o3mini 最好——截止到今晚。
crackidz
crackidz
1 天前
说了,模型是不是最强,是要看使用领域的,没有一个模型现在是六边形战士...

怎么就不会在不同的领域选择不同的模型呢?什么精神钢印啊...
xiexiping
xiexiping
1 天前
claude 是不是最强没感知到,但是我用这么多 AI 唯一一个封号的,我也是强迫症,想着再注册一个吧,万一以后能用上呢,好嘛不接受新用户注册,不知道的还以为他垄断了呢,除了他没得可用了?
greygoo
greygoo
1 天前
sonnet 没加 thinking 在这里比什么,再说了他们用吹自己 OlympicCoder 的,无论怎么说还是动摇不了 claude 3.7 sonnet thinking 编程领域之神的地位
sohoorc
sohoorc
1 天前
已经知道 claude 3.7 最强了,没必要再次强调了吧 0.0
xausky
xausky
1 天前
什么 QwQ-32B 这么强的么

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1119002

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX