openai o1 有哥们体验吗？说说感受

个人感觉还是不如 claude 家 3.5 强，没有续费的必要

ibazhx

179 天前

一周只能 30 次

zmxnv123

179 天前

听说擅长的方向是推理，比如做做奥赛什么的？，跟 claude 的使用场景不太一样

hardto

179 天前

推理吊打 claude ，感觉 o1-mini 吊打 o1

Avafly

179 天前

感觉就是话贼多, 一个回答能老长了看起来都费劲.
话说从 4o 开始回答就变得长了很多, 是不是以为字越多回答越有含金量啊.

haoji

179 天前

o1-preview 一个劲的给你分析，最后出结果，适合需要“解题过程”的场景

kai4tech111

179 天前

@Avafly #4 是的 gpt 家族风格，应该和后期人工对齐有关

cherryas

179 天前

cot 是数学推理的必要方向这是楼下李奶奶都知道的事。强是强，也确实跨时代，但是本质就是 cot+agent ，其它模型半年内应该能追上来

kai4tech111

179 天前

@haoji #5 有点像做数学题多写解题过程就能多拿分一样

kai4tech111

179 天前

@ibazhx #1 看看公开的 api 价格就知道了，15$/1M input token, 60$/1M output token
（之前还听说要增加一个 pro 套餐才能用，看来还是太人道了）

kai4tech111

179 天前

@cherryas #7 虽然大家都知道，但敢为先还是值得肯定的，不然都等着抄别人那就完了

yena

179 天前

出了一道补全至完全二叉树的题，还是做不出来

bhy

179 天前

@yena 能具体说说，或者分享下对话记录吗？

wweerrgtc

179 天前

肯定是比以前厉害不少, 但是和 claude 3.5 比, 我不知道, 只开了一个会员

看演示视频, 其实也是一些简单问题, 不是很复杂的

lunafreya

179 天前

但人家拿出了新的 Scaling Law, 把玄学变成了科学，至少是经验科学

wweerrgtc

179 天前

@bhy #12
chatgpt.com/share/66e3930f-1694-8013-bdeb-62849a73883b

kyro00000

179 天前

到底有 ai 能做有机化学题吗? 头疼..

otakustay

179 天前

@Avafly 因为 Transformer 注定了前文越准确生成就越准确嘛，话多不就是为了替用户你把前文补上

easyii

179 天前

那写代码的话是 Claude 好用还是 ChatGPT 现在是 ChatGPT 会员

meeop

179 天前

用我最喜欢的写 todolist 测试,和之前的 4o 差不多,但是因为新模型多了一个分析用户输入的步骤,自动扩展完善了我的 promot,todolist 自带了删除,划掉按钮,还有已完成的 todo 的过滤器

但是上述要求我并没有说

对于普通用户,这可能更好,输出效果变好
对于生产或者更专业的用户,这就有点坑了,ai 自动帮你脑补了你没要求的功能

lihanst

178 天前

@ibazhx poe 一个月只能用 30 来次..,

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1072482

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.