openai o1 有哥们体验吗?说说感受

6 天前
 kai4tech111

个人感觉还是不如 claude 家 3.5 强,没有续费的必要

5028 次点击
所在节点    OpenAI
44 条回复
NiaoBlush
5 天前
搜了好几道题目分别用 4o 和 o1 试了下,大多数给的答案是对的,以下是一道给出答案不一样的:

题目:一个人在林中散步时,无意中听到了几个强盗在商量如何分赃。强盗们说,如果每人分 6 匹布,则剩余 5 匹;如果每人分 7 匹布,则少 8 匹。请问:共有几个强盗?几匹布?

4o 给的答案:设共有 \( x \) 个强盗,布匹总数为 \( y \)。

根据题意,列出以下方程:
1. 每人分 6 匹布,剩余 5 匹:即 \( y \equiv 5 \pmod{6} \),表示 \( y = 6x + 5 \)。
2. 每人分 7 匹布,少 8 匹:即 \( y \equiv -8 \pmod{7} \),也就是 \( y \equiv -8 + 7 = -1 \equiv 6 \pmod{7} \),表示 \( y = 7x - 8 \)。

于是我们有两组同余条件:
\[
y \equiv 5 \pmod{6}
\]
\[
y \equiv 6 \pmod{7}
\]

通过解这组同余方程,可以求出总共有多少强盗以及多少匹布。根据求解得出,最终答案为:
**总共有 59 匹布,9 个强盗**。


o1 给的答案:
NiaoBlush
5 天前
接上面,o1 给的答案:**答案:**

共有 **13** 个强盗,**83** 匹布。

---

**解题过程:**

设强盗人数为 \( x \),布的总数为 \( y \)。

1. **每人分 6 匹布,剩余 5 匹:**

\[
y = 6x + 5 \quad \text{( 1 )}
\]

2. **每人分 7 匹布,还差 8 匹:**

\[
y + 8 = 7x \quad \text{( 2 )}
\]

3. **解方程组:**

将方程( 1 )代入方程( 2 ):

\[
6x + 5 + 8 = 7x \\
6x + 13 = 7x \\
7x - 6x = 13 \\
x = 13
\]

4. **求布的总数:**

将 \( x = 13 \) 代入方程( 1 ):

\[
y = 6 \times 13 + 5 = 78 + 5 = 83
\]

**结论:**

共有 **13** 个强盗,**83** 匹布。
assassing
5 天前
怼了两天把额度用完,结论是在编程方面不如 GPT-4 。注意不是 4o ,这个 o1 像在 4o 路线上演变出来的。o1mini 回答大概率和 o1 一模一样,不用纠结他们之间的区别。

特点 1:输出超长,但如果持续对话会发现它经常重复前面回答过的内容。生成代码方面会有优势,以前代码要分多次输出,有时会中断,现在不担心这个问题。当然我还没来得及考察代码质量。

特点 2:输出稳定,多次问同一个问题,回答大概只有 10% 不同,如果应用在图像生成上会很有用。但由于幻觉依旧,也就是你的问题它给你错误回答,重复问它还是给你同样的错误答案,而不像以前重新生成会有改观。

特点 3:有所保留,这点从 4o 开始感受明显。就像一个高中数学老师被调任教小学,你问它初中数学知识,它反复给你讲解小学数学概念。只有在追问 5 轮之后它才开始说一些真正的重点,浪费很多时间。

也许是时候试试 Claude 了?
rebeccaMyKid
4 天前
@Avafly 输出太长+1 ,日常使用感觉有点倒退。可能适合拿来一些需要详细 reasoning 的问题?目前就我浅浅的常识,感觉还是 4o 好用。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1072482

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX