Claude 3 超越 ChatGPT 4

266 天前
 Davy
https://arena.lmsys.org/
6036 次点击
所在节点    OpenAI
39 条回复
PaiDaTun
266 天前
Claude 3 还会骂人呢
iamshang
266 天前
跟 claude 和 gemini 比的话,gpt 的理工科包括代码能力他完胜
momobear
266 天前
tool2d
266 天前
claude 3 是文科生
gpt4 就理科生

评分应该分文科榜和理科榜,才足够公平。
easing
266 天前
@tool2d #24 看到#20 楼贴的对比,claude 3 的文科水平也不咋地啊
tool2d
266 天前
@easing 这题属于脑筋急转弯了,应该划分到理科。大部分情况下,claude 3 回答都挺能吹的。
MapleEve
266 天前
天天在这里对比,其实构建好万 token 左右的 agent prompt 就能知道 GPT4 被 Opus 吊着打了
234ygg
266 天前
这种对比没用的,至少要保证人均计算资源相同才能比,gpt 用户数和友商根本不是一个级别的
tsohgdivil
266 天前
@easing #25 这贴的是 sonnet ,免费模型。付费的 opus 是能回答正确的。
skydcnmana
266 天前
能搞清楚八王之乱的八个王都跟司马懿是什么关系了吗?
dbliu
266 天前
z 这货风控封号啥时候不搞那么严格啊
pkoukk
266 天前
楼上这种脑筋急转弯的对比毫无意义,这些问题根本不能体现出 AI 的能力

claude 的文字能力完爆 GPT 不止一条街
它写的小黄文是真的可以直接当小说发出去,GPT 会有些奇怪的遣词造句,人物语言奇奇怪怪,场景和气氛的渲染也不对
Fred18
266 天前
@willx12123 一加 12 的马达还挺猛的
mxT52CRuqR6o5
266 天前
gpt 都出多久了,咋还有人拿心算题考察大语言模型的能力的,一个人不用草稿纸心算个 2333 天后是哪一天有个几个能算出来的
s1084796293
266 天前
Claude 怎么写小黄文
CruelMoon
266 天前
@easing 你得用 opus...
Liftman
266 天前
gpt 的会员我都停掉了。直接转 opus 了。。。。最近写材料跟神附体一样。。。

opus 对文章的展开。跟 gpt 完全不是一个水平。。。

gpt 就跟小学生写作一样。。1.2.3 点。然后展开角度很窄,而且几乎是蜻蜓点水,绝对不深入一点。。

举个简单的例子。假设我们写一个文章关于某个行业。。gpt 最多说些无关痛痒的软废话。。

claude 能直接说出其中的很多国标,专有名词,专有的体系。能直接深入的给你列出来完整的内容。。。。

其实我觉得不能完全怪 gpt 。毕竟他老了。4.0 已经很久没有真的更新了。

但是主要我觉得用户对 4.0 的不满意集中在。。gpt 这个狗东西他越来越笨。而且他其实什么都知道,但是他就是不给你好好回答。。扩散性拓展性极差。。。


不过 4.0 还是有优点的。毕竟有多模态。而且相比而言,gpt 读文件的速度也很快。claude 的起步会慢一点,但是后期的生成速度巨快。opus 有的时候速度起飞了就跟 3.5 一样快。尤其是涉及到英语部分。haiku 就更离谱了。
Pichai
266 天前
@Lyv5 可以试着申诉一下,Claude 3 出来的时候,我登录上去试试,结果提示账号被封了。然后过了几天我进行了申诉,结果刚才在邮箱看到一条垃圾邮件,点进去一看是 Claude 的解封邮件。从申诉到解封大概花费了两周时间。
tangxiangpi325
265 天前
各有优势。https://arena.lmsys.org/ 大部分模型 aichatone.com 都支持,更好用

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1027329

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX