今天看新闻 kimi 的数理化远超 gtp-4o,我用了一个小学三年级奥数题目考它,它竟然无限循环了

84 天前
 changyang

如题 题目是:

请你帮我做一个数学习题 请你使用加号,减号,乘号,除号,括号,填入下面几个数之间,让结果等于 24 10 10 4 4 = 24

它不停的输出应该是 xx 答案,但是这么算好像不对,重新计算答案。 所以这样的成绩真的能高考拿到一本分数吗?

6594 次点击
所在节点    OpenAI
68 条回复
lyyQAQ
83 天前
o1
不过思考了 1 分钟= =

**一种解法:**

在数字之间添加括号和运算符:

```
10 + 10 + 4 * (4 / 4) = 24
```

解释:

1. 首先计算括号内的 `(4 / 4) = 1`。
2. 然后 `4 * 1 = 4`。
3. 接着 `10 + 10 + 4 = 24`。

这样就使用了给定的四个数字 10 、10 、4 、4 ,并通过加、减、乘、除及括号得到了结果 24 。
hertzry
83 天前
Llama 3.1 8B

(10 + 10) × (4 ÷ 4) =?

= (20) × (1)

= 20

这不等于 24 ,所以我们再试一次:

(10 × 10) - (4 ÷ 4) =?

= (100) - (1)

= 99

这也不等于 24 ,所以我们再试一次:

(10 + 10) + (4 × 4) =?

= (20) + (16)

= 36

这仍然不等于 24 ,所以我们再试一次:

(10 × 10) - (4 × 4) =?

= (100) - (16)

= 84

这也不等于 24 ,所以我们再试一次:

(10 + 10) ÷ (4 ÷ 4) =?

= (20) ÷ (1)

= 20

这不等于 24 ,所以我们再试一次:

10 × (10 - (4 ÷ 4)) =?

= 10 × (10 - 1)

= 10 × 9

= 90

这也不等于 24 ,所以我们再试一次:

10 × ((10 ÷ 4) × 4) =?

= 10 × (2.5 × 4)

= 10 × 10

= 100

这不等于 24 ,所以我们再试一次:

(10 + 10) × (4 ÷ 4) =?

= (20) × (1)

= 20

这不等于 24 ,所以我们再试一次:

10 + (10 × (4 ÷ 4)) =?

= 10 + (10 × 1)

= 10 + 10

= 20

这不等于 24 ,所以我们再试一次:

(10 × 4) + (10 ÷ 4) =?

= (40) + (2.5)

= 42.5

这不等于 24 ,所以我们再试一次:

(10 + 4) × (10 ÷ 4) =?

= (14) × (2.5)

= 35

这不等于 24 ,所以我们再试一次:

10 × (10 - 4) + 4 =?

= 10 × 6 + 4

= 60 + 4

= 64

这不等于 24 ,所以我们再试一次:

10 + 10 + 4 ÷ 4 =?

= 20 + 1

= 21

这不等于 24 ,所以我们再试一次:

10 × 4 - 10 + 4 =?

= 40 - 10 + 4

= 34

这不等于 24 ,所以我们再试一次:

10 + (10 - 4) × 4 =?

= 10 + (6) × 4

= 10 + 24

= 34

这不等于 24 ,所以我们再试一次:

10 + 10 + (4 × 4) ÷ 4 =?

= 20 + (16) ÷ 4

= 20 + 4

= 24

是的!我们成功了:

10 + 10 + (4 × 4) ÷ 4 = 24
lyyQAQ
83 天前
xw340721
83 天前
我给他的答案他竟然加戏起来了()[]
![]( https://imgur.com/a/gpVoeZg)
wudanyang
83 天前
文心一言 3.5 和豆包好像都可以,ChatGPT4o 不行
llanero
83 天前
deepseek 的 api 试了好多次,都不行,最后都是胡说八道
gemini2.0flah 秒答
chatgpt 4o 直接胡说八道了
orangeD
83 天前
@360dust lobechat
LXchienne
83 天前
通义千问 2.5 都行,gpt4o 在忽悠我,24-10=24 ,验证正确!!
a1b2c3T
83 天前
@yinmin #3 用的哪个模型啊老哥,我这咋不好使
cyrivlclth
83 天前
我问 10 10 4 4 怎么组成 25 ,这下好了,都开始胡说八道了
snw
83 天前
24 点除了尝试凑凑 3×8, 4×6 之类常规解,较难的组合都是靠穷举法吧?如果没见过的话确实很难在有限时间内想出答案。
chiaf
83 天前
gpt4o 问了之后,接着输入可以使用 python ,是可以得到答案的。下面是代码:

from itertools import permutations, product

# 数字
numbers = [10, 10, 4, 4]
# 运算符
operators = ['+', '-', '*', '/']
# 存储表达式结果等于 24 的表达式
solutions = []

# 尝试所有数字的排列和操作符组合
for nums in permutations(numbers):
for ops in product(operators, repeat=3):
# 所有可能的括号位置
expressions = [
f"(({nums[0]} {ops[0]} {nums[1]}) {ops[1]} {nums[2]}) {ops[2]} {nums[3]}",
f"({nums[0]} {ops[0]} ({nums[1]} {ops[1]} {nums[2]})) {ops[2]} {nums[3]}",
f"({nums[0]} {ops[0]} {nums[1]}) {ops[1]} ({nums[2]} {ops[2]} {nums[3]})",
f"{nums[0]} {ops[0]} (({nums[1]} {ops[1]} {nums[2]}) {ops[2]} {nums[3]})",
f"{nums[0]} {ops[0]} ({nums[1]} {ops[1]} ({nums[2]} {ops[2]} {nums[3]}))"
]
# 检查表达式是否等于 24
for exp in expressions:
try:
if eval(exp) == 24:
solutions.append(exp)
except ZeroDivisionError:
pass

# 去重并显示结果
solutions = list(set(solutions))
solutions[:5]

结果是 ((10 * 10) - 4) / 4 = 24

#10 楼的建议很好👍
ovtfkw
83 天前
grok2 破防了

当然可以!这是一个经典的数学游戏。以下是一个解法:

\[ (10 - 4) \times (10 / 4) = 24 \]

解释如下:
- 先计算 \(10 - 4 = 6\)。
- 然后计算 \(10 / 4 = 2.5\)。
- 最后,\(6 \times 2.5 = 15\)。

哦,等一下,这样算错了。让我们重新计算:

\[ \left(\frac{10}{4} + 4\right) \times (10 - 4) = 24 \]

解释如下:
- 先计算 \(10 / 4 = 2.5\)。
- 然后计算 \(2.5 + 4 = 6.5\)。
- 再计算 \(10 - 4 = 6\)。
- 最后,\(6.5 \times 6 = 39\)。

再试一次:

\[ \left(10 - \frac{10}{4}\right) \times (4 + 4) = 24 \]

解释如下:
- 先计算 \(10 / 4 = 2.5\)。
- 然后计算 \(10 - 2.5 = 7.5\)。
- 再计算 \(4 + 4 = 8\)。
- 最后,\(7.5 \times 8 = 60\)。

错了,再次尝试:

\[ \left(10 - \frac{10}{4}\right) \times (4 + 4) = 24 \]

啊,错了:

\[ \left(10 - \frac{10}{4}\right) \times (4 + 4) = 24 \]

不好意思,我犯了错误。这里是正确的解法:

\[ (10 - \frac{10}{4}) \times 4 = 24 \]

解释如下:
- 先计算 \(10 / 4 = 2.5\)。
- 然后计算 \(10 - 2.5 = 7.5\)。
- 最后,\(7.5 \times 4 = 30\)。

啊,仍然错了。我再试一次:

\[ (10 - 4) \times (4 + \frac{10}{4}) = 24 \]

解释如下:
- 先计算 \(10 - 4 = 6\)。
- 然后计算 \(10 / 4 = 2.5\)。
- 再计算 \(4 + 2.5 = 6.5\)。
- 最后,\(6 \times 6.5 = 39\)。

再次错了。最后一次:

\[ \left(\frac{10}{4} \times 4\right) + (10 - 4) = 24 \]

解释如下:
- 先计算 \(10 / 4 = 2.5\)。
- 然后计算 \(2.5 \times 4 = 10\)。
- 再计算 \(10 - 4 = 6\)。
- 最后,\(10 + 6 = 16\)。

啊,错误了!

最后一次尝试:

\[ \left(10 + \frac{10}{4}\right) - (4 \times 4) = 24 \]

解释如下:
- 先计算 \(10 / 4 = 2.5\)。
- 然后计算 \(10 + 2.5 = 12.5\)。
- 再计算 \(4 \times 4 = 16\)。
- 最后,\(12.5 - 16 = -3.5\)。

对不起,我犯了一个错误。这里是正确的方法:

\[ \frac{(10 - 4) \times 10}{4} = 24 \]

解释如下:
- 先计算 \(10 - 4 = 6\)。
- 然后计算 \(6 \times 10 = 60\)。
- 最后,\(60 / 4 = 15\)。

不对,再试一次:

\[ 10 + (10 / 4) \times 4 = 24 \]

解释如下:
- 先计算 \(10 / 4 = 2.5\)。
- 然后计算 \(2.5 \times 4 = 10\)。
- 最后,\(10 + 10 = 20\)。

啊,错了:

\[ (10 / 4) \times (4 + 4) = 24 \]

解释如下:
- 先计算 \(10 / 4 = 2.5\)。
- 然后计算 \(4 + 4 = 8\)。
- 最后,\(2.5 \times 8 = 20\)。

最后一次:

\[ \left(10 - \frac{10}{4}\right) \times 4 = 24 \]

解释如下:
- 先计算 \(10 / 4 = 2.5\)。
- 然后计算 \(10 - 2.5 = 7.5\)。
- 最后,\(7.5 \times 4 = 30\)。

不对:

\[ (10 + 4) \times \left(\frac{10}{4} - 4\right) = 24 \]

解释如下:
- 先计算 \(10 + 4 = 14\)。
- 然后计算 \(10 / 4 = 2.5\)。
- 再计算 \(2.5 - 4 = -1.5\)。
- 最后,\(14 \times -1.5 = -21\)。

错了:

\[ \left(\frac{10}{4} + 4\right) \times (10 - 4) = 24 \]

解释如下:
- 先计算 \(10 / 4 = 2.5\)。
- 然后计算 \(2.5 + 4 = 6.5\)。
- 再计算 \(10 - 4 = 6\)。
- 最后,\(6.5 \times 6 = 39\)。

对不起,我花了很长时间才找到正确的解法:

\[ (10 - \frac{10}{4}) \times (4 + 4) = 24 \]

解释如下:
- 先计算 \(10 / 4 = 2.5\)。
- 然后计算 \(10 - 2.5 = 7.5\)。
- 再计算 \(4 + 4 = 8\)。
- 最后,\(7.5 \times 8 = 60\)。

错了:

\[ (10 / 4) \times (10 - 4) + 4 = 24 \]

解释如下:
- 先计算 \(10 / 4 = 2.5\)。
- 然后计算 \(10 - 4 = 6\)。
- 再计算 \(2.5 \times 6 = 15\)。
- 最后,\(15 + 4 = 19\)。

对不起,我再次犯了错误。正确的解法应该是:

\[ (10 / 4 \times 4) + (10 - 4) = 24 \]

解释如下:
- 先计算 \(10 / 4 = 2.5\)。
- 然后计算 \(2.5 \times 4 = 10\)。
- 再计算 \(10 - 4 = 6\)。
- 最后,\(10 + 6 = 16\)。

啊,再次错误:

\[ \frac{(10 + 4) \times 10}{4} = 24 \]

解释如下:
- 先计算 \(10 + 4 = 14\)。
- 然后计算 \(14 \times 10 = 140\)。
- 最后,\(140 / 4 = 35\)。

错了:

\[ \left(\frac{10}{4} + 4\right) \times (10 - 4) = 24 \]

解释如下:
- 先计算 \(10 / 4 = 2.5\)。
- 然后计算 \(2.5 + 4 = 6.5\)。
- 再计算 \(10 - 4 = 6\)。
- 最后,\(6.5 \times 6 = 39\)。

对不起,我犯了太多错误。最后一次尝试:

\[ \left(10 - \frac{10}{4}\right) \times 4 = 24 \]

解释如下:
- 先计算 \(10 / 4 = 2.5\)。
- 然后计算 \(10 - 2.5 = 7.5\)。
- 最后,\(7.5 \times 4 = 30\)。

不对:

\[ (10 - 4) \times (4 + \frac{10}{4}) = 24 \]

解释如下:
- 先计算 \(10 - 4 = 6\)。
- 然后计算 \(10 / 4 = 2.5\)。
- 再计算 \(4 + 2.5 = 6.5\)。
- 最后,\(6 \times 6.5 = 39\)。

对不起,我再次犯了错误。最后的解法:

\[ \frac{(10 - 4) \times 10}{4} = 24 \]

解释如下:
- 先计算 \(10 - 4 = 6\)。
- 然后计算 \(6 \times 10 = 60\)。
- 最后,\(60 / 4 = 15\)。

不对:

\[ (10 / 4) \times (10 - 4) + 4 = 24 \]

解释如下:
- 先计算 \(10 / 4 = 2.5\)。
- 然后计算 \(10 - 4 = 6\)。
- 再计算 \(2.5 \times 6 = 15\)。
- 最后,\(15 + 4 = 19\)。

最后一次:

\[ \left(\frac{10}{4} + 4\right) \times (10 - 4) = 24 \]

解释如下:
- 先计算 \(10 / 4 = 2.5\)。
- 然后计算 \(2.5 + 4 = 6.5\)。
- 再计算 \(10 - 4 = 6\)。
- 最后,\(6.5 \times 6 = 39\)。

对不起,我再次犯了错误。正确的解法是:

\[ \left(10 - \frac{10}{4}\right) \times 4 = 24 \]

解释如下:
- 先计算 \(10 / 4 = 2.5\)。
- 然后计算 \(10 - 2.5 = 7.5\)。
- 最后,\(7.5 \times 4 = 30\)。

啊,我终于找到了:

\[ (10 - 4) \times (4 + \frac{10}{4}) = 24 \]

解释如下:
- 先计算 \(10 - 4 = 6\)。
- 然后计算 \(10 / 4 = 2.5\)。
- 再计算 \(4 + 2.5 = 6.5\)。
- 最后,\(6 \times 6.5 = 39\)。

不对:

\[ \left(\frac{10}{4} \times 4\right) + (10 - 4) = 24 \]

解释如下:
- 先计算 \(10 / 4 = 2.5\)。
- 然后计算 \(2.5 \times 4 = 10\)。
- 再计算 \(10 - 4 = 6\)。
- 最后,\(10 + 6 = 16\)。

我终于找到了正确的解法:

\[ (10 - 4) \times \left(4 + \frac{10}{4}\right) = 24 \]

解释如下:
- 先计算 \(10 - 4 = 6\)。
- 然后计算 \(10 / 4 = 2.5\)。
- 再计算 \(4 + 2.5 = 6.5\)。
- 最后,\(6 \times 6.5 = 39\)。

错了:

\[ \left(\frac{10}{4} \times 4\right) + (10 - 4) = 24 \]

解释如下:
- 先计算 \(10 / 4 = 2.5\)。
- 然后计算 \(2.5 \times 4 = 10\)。
- 再计算 \(10 - 4 = 6\)。
- 最后,\(10 + 6 = 16\)。

对不起,我第二次犯了错误。这里是正确的解法:

\[ (10 - 4) \times (4 + \frac{10}{4}) = 24 \]

解释如下:
- 先计算 \(10 - 4 = 6\)。
- 然后计算 \(10 / 4 = 2.5\)。
- 再计算 \(4 + 2.5 = 6.5\)。
- 最后,\(6 \times 6.5 = 39\)。

对不起,我又犯了错误。正确的解法是:

\[ (10 - 4) \times \left(4 + \frac{10}{4}\right) = 24 \]

解释如下:
- 先计算 \(10 - 4 = 6\)。
- 然后计算 \(10 / 4 = 2.5\)。
- 再计算 \(4 + 2.5 = 6.5\)。
- 最后,\(6 \times 6.5 = 39\)。

不对:

\[ \left(\frac{10}{4} \times 4\right) + (10 - 4) = 24 \]

解释如下:
- 先计算 \(10 / 4 = 2.5\)。
- 然后计算 \(2.5 \times 4 = 10\)。
- 再计算 \(10 - 4 = 6\)。
- 最后,\(10 + 6 = 16\)。

我终于找到了:

\[ (10 - 4) \times \left(4 + \frac{10}{4}\right) = 24 \]

解释如下:
- 先计算 \(10 - 4 = 6\)。
- 然后计算 \(10 / 4 = 2.5\)。
- 再计算 \(4 + 2.5 = 6.5\)。
- 最后,\(6 \times 6.5 = 39\)。

错了:

\[ \left(\frac{10}{4} \times 4\right) + (10 - 4) = 24 \]

解释如下:
-
aarontian
83 天前
用 API 各跑了两遍
claude 3.5 sonnet 失败
gpt 4o 失败
deepseek 成功
gemini 1.5 pro exp 成功

设置的模型温度=0.7 (跟前面的同学结果不太一致,似乎这个参数也有影响?)


最近跟代码相关的问题我都找 claude sonnet 了,比 4o 表现好太多,现在有点找不着 4o 适合的场景了,感觉干啥啥不行吹牛第一名
levn
83 天前
因为高考根本不会出这种题
hondaya
83 天前
pplx 数学模式 gpt-4o ,sonnet 3.5 都能算对。

from itertools import permutations, product

# Define the numbers and target
numbers = [10, 10, 4, 4]
target = 24

# Define possible operations
operations = ['+', '-', '*', '/']

# Function to evaluate an expression
# This function will safely evaluate the expression
# It will return None if the expression is invalid (e.g., division by zero)
def safe_eval(expr):
try:
return eval(expr)
except ZeroDivisionError:
return None

# Try all permutations of numbers and operations
for nums in permutations(numbers):
for ops in product(operations, repeat=3):
# Generate all possible expressions with parentheses
expressions = [
f'({nums[0]} {ops[0]} {nums[1]}) {ops[1]} ({nums[2]} {ops[2]} {nums[3]})',
f'(({nums[0]} {ops[0]} {nums[1]}) {ops[1]} {nums[2]}) {ops[2]} {nums[3]}',
f'({nums[0]} {ops[0]} ({nums[1]} {ops[1]} {nums[2]})) {ops[2]} {nums[3]}',
f'{nums[0]} {ops[0]} (({nums[1]} {ops[1]} {nums[2]}) {ops[2]} {nums[3]})',
f'{nums[0]} {ops[0]} ({nums[1]} {ops[1]} ({nums[2]} {ops[2]} {nums[3]}))'
]
for expr in expressions:
if safe_eval(expr) == target:
print(expr)

我找到了一个解决方案:
((10 * 10) - 4) ÷ 4 = 24
让我解释一下计算过程:
首先计算括号内的 10 * 10 = 100
然后减去 4 ,得到 96
最后除以 4 ,得到最终结果 24
这个算式完美地使用了所有给定的数字(两个 10 和两个 4 ),并且只使用了基本的运算符(乘号、减号和除号)来得到目标数字 24 。
llanero
83 天前
@aarontian 为啥我的 deepseek 没有成功,难道是因为用的免费额度,会有歧视
weyou
83 天前
我的 gemini2.0 flash 和 sonnet 3.5 也答不上来,看起来有点撞概率的样子
lihaokey
83 天前
O1 没问题,4o 不行。几次都是错的。
cocong
83 天前
AI 目前还不太会使用工具而已,要用发展的眼光看待问题。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1098158

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX