openai o1 有哥们体验吗?说说感受

6 天前
 kai4tech111

个人感觉还是不如 claude 家 3.5 强,没有续费的必要

5009 次点击
所在节点    OpenAI
44 条回复
ibazhx
6 天前
一周只能 30 次
zmxnv123
6 天前
听说擅长的方向是推理,比如做做奥赛什么的?,跟 claude 的使用场景不太一样
hardto
6 天前
推理吊打 claude ,感觉 o1-mini 吊打 o1
Avafly
6 天前
感觉就是话贼多, 一个回答能老长了看起来都费劲.
话说从 4o 开始回答就变得长了很多, 是不是以为字越多回答越有含金量啊.
haoji
6 天前
o1-preview 一个劲的给你分析,最后出结果,适合需要“解题过程”的场景
kai4tech111
6 天前
@Avafly #4 是的 gpt 家族风格,应该和后期人工对齐有关
cherryas
6 天前
cot 是数学推理的必要方向这是楼下李奶奶都知道的事。强是强,也确实跨时代,但是本质就是 cot+agent ,其它模型半年内应该能追上来
kai4tech111
6 天前
@haoji #5 有点像做数学题多写解题过程就能多拿分一样
kai4tech111
6 天前
@ibazhx #1 看看公开的 api 价格就知道了,15$/1M input token, 60$/1M output token
(之前还听说要增加一个 pro 套餐才能用,看来还是太人道了)
kai4tech111
6 天前
@cherryas #7 虽然大家都知道,但敢为先还是值得肯定的,不然都等着抄别人那就完了
yena
6 天前
出了一道补全至完全二叉树的题,还是做不出来
bhy
6 天前
@yena 能具体说说,或者分享下对话记录吗?
wweerrgtc
6 天前
肯定是比以前厉害不少, 但是和 claude 3.5 比, 我不知道, 只开了一个会员

看演示视频, 其实也是一些简单问题, 不是很复杂的
lunafreya
6 天前
但人家拿出了新的 Scaling Law, 把玄学变成了科学,至少是经验科学
wweerrgtc
6 天前
kyro00000
6 天前
到底有 ai 能做有机化学题吗? 头疼..
otakustay
6 天前
@Avafly 因为 Transformer 注定了前文越准确生成就越准确嘛,话多不就是为了替用户你把前文补上
easyii
6 天前
那写代码的话 是 Claude 好用 还是 ChatGPT 现在是 ChatGPT 会员
meeop
6 天前
用我最喜欢的写 todolist 测试,和之前的 4o 差不多,但是因为新模型多了一个分析用户输入的步骤,自动扩展完善了我的 promot,todolist 自带了删除,划掉按钮,还有已完成的 todo 的过滤器

但是上述要求我并没有说

对于普通用户,这可能更好,输出效果变好
对于生产或者更专业的用户,这就有点坑了,ai 自动帮你脑补了你没要求的功能
lihanst
6 天前
@ibazhx poe 一个月只能用 30 来次..,

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1072482

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX