V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
changyang
V2EX  ›  OpenAI

今天看新闻 kimi 的数理化远超 gtp-4o,我用了一个小学三年级奥数题目考它,它竟然无限循环了

  •  1
     
  •   changyang · 6 小时 16 分钟前 · 2708 次点击

    如题 题目是:

    请你帮我做一个数学习题 请你使用加号,减号,乘号,除号,括号,填入下面几个数之间,让结果等于 24 10 10 4 4 = 24

    它不停的输出应该是 xx 答案,但是这么算好像不对,重新计算答案。 所以这样的成绩真的能高考拿到一本分数吗?

    45 条回复    2024-12-17 17:43:13 +08:00
    LanhuaMa
        1
    LanhuaMa  
       6 小时 10 分钟前
    训练数据集大量加入历年试题,高考拿到一本分数可能很轻松,但是基础逻辑问题/四则运算绝对会错。什么样的做题家训练出什么样的 AI ,很合理。
    lance07
        2
    lance07  
       6 小时 9 分钟前
    如果是今天的新闻那可能还真没问题,4o 最近都快成智障了。。。
    lance07
        3
    lance07  
       6 小时 6 分钟前
    我就知道,md oai https://imgur.com/a/XNyKSJj
    yinmin
        4
    yinmin  
       6 小时 5 分钟前 via iPhone   ❤️ 3
    提问改成:请使用 html+javascript 写一个程序求解:请你使用加号,减号,乘号,除号,括号,填入下面几个数之间,让结果等于 24 10 10 4 4 = 24

    然后运行 html 获取结果: ( 10*10-4 )/4=24
    changyang
        5
    changyang  
    OP
       6 小时 2 分钟前 via iPhone
    @yinmin 厉害,看来代码能力还是强些,它好像触发 bug 了,无限循环,输出了一段时间停了
    changyang
        6
    changyang  
    OP
       6 小时 1 分钟前 via iPhone
    @lance07 gpt4o 是解不出来的,但是它至少没有无限循环😂
    infun
        7
    infun  
       5 小时 58 分钟前
    试了一圈,只有豆包能解出来
    lovestudykid
        8
    lovestudykid  
       5 小时 55 分钟前
    Gemini 2.0 基础智力遥遥领先,几乎不逊于 o1 ,其他模型做这种推理都是弱智
    yinmin
        9
    yinmin  
       5 小时 52 分钟前 via iPhone
    @changyang 你把 ai 理解成一个博士只能笔算,除非这个博士爱好 24 点(针对 24 点专项训练过)

    ai 算数学题,我用 chatgpt o1 mini 解高三数学题的准确性还是蛮高的(有些用作业帮扫不到的题目,80%能做对,15%能提供解题思路)
    yinmin
        10
    yinmin  
       5 小时 47 分钟前 via iPhone
    接#9 另外,用程序解数学题,让 ai 用 python 是最佳的,因为 python 有科学运算库,能解出带分数、根号的答案,只是你需要有 python 运行环境( chatgpt 内置 python 运行环境,可以直接出答案。其他的 ai 大都集成 html 运行环境不如 chatgpt )
    chiaf
        11
    chiaf  
       5 小时 45 分钟前
    gemini 2.0 也不行,3.8 and 3.11 which is bigger 回答的还是 3.11 大🤣
    orangeD
        12
    orangeD  
       5 小时 43 分钟前


    这个问题貌似让 gpt4o 破防了
    changyang
        13
    changyang  
    OP
       5 小时 43 分钟前
    @yinmin 又涨知识了,谢谢,跟 ai 沟通确实需要经验
    xiaoxt
        14
    xiaoxt  
       5 小时 39 分钟前 via iPhone
    试了下,并没有无限循环,一下就解出来了
    changyang
        15
    changyang  
    OP
       5 小时 35 分钟前
    @xiaoxt
    我的是循环了的
    mingyn
        16
    mingyn  
       5 小时 2 分钟前
    试验了下:
    chatgpt 4o ,失败
    grok2 ,失败,10 * 10 - 4 / 4 = 24
    claude 3.5 ,成功,((10 * 10) - 4) / 4 = 24
    sonar huge ,成功,((10 * 10) - 4) / 4 = 24
    elevioux
        17
    elevioux  
       4 小时 56 分钟前
    gemini 2 flash 一次成功
    sikex
        18
    sikex  
       4 小时 43 分钟前
    deepseek 失败
    COW
        19
    COW  
       4 小时 34 分钟前 via Android
    gpt4 我也遇到过循环输出,之前让他把一个 ipv6 地址转成 PTR 记录,然后它就一直输出一个数字停不下来
    ty29022
        20
    ty29022  
       4 小时 1 分钟前
    gpt 阵亡
    但是 32b 的 qwq 答出来了

    ====================
    请你使用加号,减号,乘号,除号,括号,填入下面几个数之间,让结果等于 24 10 10 4 4 = 24
    ...
    ... - 只使用加号、减号、乘号、除号和括号。
    ... - 使用数字 10 、10 、4 、4 各一次。
    ... - 数字出现的顺序不能更换。
    ... - 结果必须是 24 。
    ...
    让我来尝试解决这个数学难题。题目是用加号、减号、乘号、除号和括号,把数字 10 、10 、4 、4 组合起来,得到 24 ,而且数字的顺序不能改变。

    首先,我需要理解题目的约束条件:

    1. 必须使用给定的四个数字:10, 10, 4, 4 。

    2. 数字必须按照这个顺序使用,不能更改顺序。

    3. 只能使用基本的 arithmetic 运算符:加、减、乘、除,以及括号来改变运算顺序。

    4. 最终的结果必须是 24 。

    好的,开始思考。首先,我注意到有两个 10 和两个 4 ,而且顺序是 10, 10, 4, 4 。

    我想,可能需要结合乘法和加法来达到 24 。比如,如果我能得到 6 和 4 ,然后相乘就是 24 。因为 6×4=24 。或者,也许可以通过其他组合,比如 8×3=24 ,但看起来不太容易从 10,10,4,4 得到 8 和 3 。

    让我尝试一下:

    首先,10 + 10 = 20 ,然后 20 加上 4 是 24 ,但是还有另一个 4 没用上。如果我写成 (10 + 10) + 4 + 4 ,等于 28 ,超过了 24 。不行。

    或者,10 + 10 + 4 - 4 = 10 ,太小了。

    maybe 10 + 10 - 4 + 4 = 20 ,还是不到 24 。

    看来加减法不太直接得到 24 。

    那试试乘法。10 × 10 = 100 ,然后怎么办呢? 100 再怎么操作也难得到 24 。

    或者,10 × (10 - 4) = 10 × 6 = 60 ,还是大了。

    再减去 4 ,60 - 4 = 56 ,还是不是 24 。

    看来这样不行。

    也许应该考虑除法。比如,10 / 10 = 1 ,然后 1 乘以 4 是 4 ,再加上另一个 4 是 8 ,还是不够。

    或者,(10 + 10) / 4 = 20 / 4 = 5 ,然后 5 加上另一个 4 是 9 ,还是不到 24 。

    不行。

    也许需要更复杂的组合。比如,先用前两个数字做某运算,再用后两个数字做另一运算,然后再结合起来。

    让我再想想。

    或者,考虑把一些数字结合成分数或者其他形式,但题目里只有基本运算符,没有提到分数,所以可能不行。

    或者,尝试使用除法来缩小数的大小。

    比如,10 / 4 = 2.5 ,然后 10 减去 2.5 是 7.5 ,再加另一个 4 是 11.5 ,还是不到 24 。

    或者,(10 - 4) / 10 = 6 / 10 = 0.6 ,然后乘以 4 是 2.4 ,再加上另一个 4 是 6.4 ,还是不行。

    看来这样也不行。

    也许我需要重新思考策略。既然有两个 10 和两个 4 ,可能需要利用数字的重复性。

    或者,考虑把某些数字组合成更大的数,但题目要求只能使用给定的运算符,不能拼接数字,所以这个想法可能不适用。

    或者,试试先用后面的数字进行运算,再与前面的数字结合。

    比如,4 + 4 = 8 ,然后 10 × (10 - 8) = 10 × 2 = 20 ,还是不到 24 。

    或者,10 × 10 = 100 ,然后减去 4 + 4 = 8 ,得到 92 ,不是 24 。

    不行。

    也许需要更激进的组合。比如,使用除法在分子或分母中。

    比如,(10 × 10 - 4) / 4 = (100 - 4) / 4 = 96 / 4 = 24 。

    嗯,这个表达式是 (10 × 10 - 4) / 4 = 24 。

    但是,这里数字的顺序是 10, 10, 4, 4 ,而且运算符可以任意放置,包括括号。

    不过,这个表达式中,数字的顺序是 10, 10, 4, 4 ,符合要求。

    让我们再检查一下:

    先计算括号内的 10 × 10 = 100 ,

    然后 100 - 4 = 96 ,

    最后 96 / 4 = 24 。

    完美,得到了 24 。

    所以,答案是 (10 × 10 - 4) / 4 = 24 。

    不过,题目要求必须按照数字出现的顺序,而且这个表达式中确实保持了 10, 10, 4, 4 的顺序。

    所以,这是一个有效的解。

    但是,也许还有其他的解法。

    让我再想想。

    另一个想法是:10 + (10 - 4) × 4 。

    计算一下:10 - 4 = 6 ,然后 6 × 4 = 24 ,再加上 10 是 34 ,不对,顺序错了。

    wait, 按照顺序是 10 + (10 - 4) × 4 。

    先算 10 - 4 = 6 ,然后 6 × 4 = 24 ,再加 10 是 34 ,不是 24 。

    所以,这不是正确的组合。

    或者,10 + 10 + 4 × 4 。

    按照运算顺序,先乘后加:4 × 4 = 16 ,然后 10 + 10 + 16 = 36 ,不是 24 。

    不行。

    或者,10 + 10 × 4 - 4 。

    先算 10 × 4 = 40 ,然后 10 + 40 = 50 ,再减 4 是 46 ,不是 24 。

    不对。

    或者,(10 + 10) × (4 - 4) = 20 × 0 = 0 ,不是 24 。

    不行。

    或者,10 × 4 + 10 - 4 = 40 + 10 - 4 = 46 ,不是 24 。

    不对。

    或者,10 × 4 - 10 + 4 = 40 - 10 + 4 = 34 ,还是不对。

    看来之前的 (10 × 10 - 4) / 4 = 24 是一个有效的解法。

    让我再确认一下运算顺序:

    先计算括号内的乘法:10 × 10 = 100 ,

    然后减去 4:100 - 4 = 96 ,

    最后除以 4:96 / 4 = 24 。

    没错,符合要求。

    也许还有其他的方法,但我现在想不出来了。

    所以,最终的答案是 (10 × 10 - 4) / 4 = 24 。

    **Final Answer**

    \[ \boxed{\frac{10 \times 10 - 4}{4} = 24} \]
    PROJECT
        21
    PROJECT  
       3 小时 47 分钟前
    O1 好像算不出来

    思考过程:
    探索不同组合

    我试着将两个 10 结合,使用其余的数字和操作,但得到的结果不是 24 。这个问题要我如何有效地处理这些数字?

    尝试不同方式

    我在探索各种组合和操作,比如加法、减法、乘法和除法,还有很多组合,但始终无法得到 24 这一结果。这真的让人头疼。

    探索不同路径

    试图解决问题时,我测试了各种组合和操作,包括指数运算,但始终无法得到 24 。可能需要尝试新的方法来找到答案。

    试探不同组合

    我尝试了各种加法、乘法和括号组合,包括将两个 10 相加,再减去一个 4 ,确保所有数字都被使用。但结果无法达成 24 。

    探索新方式

    我尝试了更多组合和操作,如乘法、除法和括号,但始终未能得到 24 。这让我意识到,可能需要用不同的方法来解决这个问题。

    尝试多个方法

    我试图用各种组合和操作,包括加法、乘法、除法和括号,但始终无法得到 24 。这让我思考可能需要寻找新的解决方式。

    尝试新的方法

    在测试了多种操作和组合后,仍未能得到 24 。思考可能需要不同的策略来解决此问题。

    重新开始

    尝试使用小数和不同顺序的操作,但仍无法得到 24 。这让我意识到需要新的方法或策略来解决这个问题。

    多重运算尝试

    我尝试了不同的运算方式,如小数、组合和重新排列,但始终没有得到 24 。这让我意识到可能需要更创意的解决思路。

    尝试不同组合

    我探索了各种组合和运算方式,比如乘法、除法和加法,但都没有得到 24 。这让我认为可能需要更深入的思考或创新的解决方案。

    试探各种组合

    我尝试了不同的运算方式和组合,如乘法、除法和加法,始终未能得到 24 。我开始思考是否需要新的方法来解决这个问题。

    探索添加和乘法
    我尝试了多个计算方法,如将 10 与 4 相加,然后再乘以 10 ,结果是 54 ;但始终未能得到 24 。

    用分数和多重运算尝试
    我正在探索使用分数和多重运算,尝试不同的排列和组合,但仍然无法得出 24 。可能需要更创新的方法.

    提出创意方法

    尝试了各种运算组合,包括乘法和加法。即使使用小数和分数,还是未能得到 24 。这让我怀疑可能没有解决方案。


    答案:

    **解答:**

    您提供的数学习题要求使用加号(+)、减号(-)、乘号(×)、除号(÷)和括号,将数字 10 、10 、4 、4 组合,使结果等于 24 。经过多次尝试,发现使用这些数字和运算符号难以得到精确的结果 24 。以下是详细分析:

    ### **尝试的组合方法**

    1. **基本运算组合:**
    - \(10 + 10 + 4 + 4 = 28\)
    - \(10 \times 4 - 10 - 4 = 26\)
    - \(10 \times (10 - 4) / 4 = 15\)
    - \( (10 + 10) / (4 + 4) = 2.5 \)
    - 等等。

    2. **使用括号调整优先级:**
    - \((10 + 10) \times (4 / 4) = 20 \times 1 = 20\)
    - \(10 \times (4 + 4) / 10 = 8\)
    - \((10 - (10 / 4)) \times 4 = 30\)
    - 等等。

    3. **尝试使用分数和组合:**
    - \(10 / (10 - (4 + 4)) = 10 / 2 = 5\)
    - \((10 + (10 / 4)) \times 4 = 60\)
    - 等等。

    ### **结论**

    经过多种组合和计算,发现无法通过加、减、乘、除和括号,将数字 10 、10 、4 、4 组合得到精确的结果 24 。可能需要使用其他运算符(如指数运算)、数字拼接(如将两个 4 拼接成 44 )或其他高级数学技巧才能实现目标,但在仅限于加、减、乘、除和括号的情况下,无法达成。

    ### **建议**

    1. **检查题目要求:** 确认是否允许使用其他运算符或数学操作。
    2. **重新排列数字顺序:** 有时改变数字的排列顺序可能会带来不同的结果。
    3. **咨询老师或参考资料:** 如果这是学校的作业题,建议与老师确认是否有特殊的解题方法或是否存在误差。

    如果有其他问题或需要进一步的帮助,请随时告知!
    justdoitzZ
        22
    justdoitzZ  
       3 小时 46 分钟前
    感觉豆包有点强啊
    豆包测试通过,言简意赅,小菜一碟
    justdoitzZ
        23
    justdoitzZ  
       3 小时 45 分钟前
    也测试了 cursor 里面的 gpt-40, claude-3.5-sonnet 都是失败了
    Donaldo
        24
    Donaldo  
       3 小时 22 分钟前
    kimi 这不是秒解 反而是 4o 直接瞎扯淡。。
    yuewolf
        25
    yuewolf  
       3 小时 21 分钟前
    @sikex 我用 deepthink 可以,耗费了 20s
    kingcanfish
        26
    kingcanfish  
       3 小时 17 分钟前
    @ty29022 qwen 这么厉害吗 还会自校验结果?
    360dust
        27
    360dust  
       3 小时 14 分钟前 via iPhone
    @orangeD 这个是什么平台?
    mumbler
        28
    mumbler  
       3 小时 13 分钟前
    chatgpt 现在已经毫无优势了,看好 gemini ,google 这样拥抱开发者才是正确道路
    winterx
        29
    winterx  
       3 小时 10 分钟前
    元宝
    leiletter
        30
    leiletter  
       2 小时 47 分钟前
    哈哈,我今天也遇到了,用了他那个最新的视觉思考版,拍张电脑屏幕问他一个问题,他就不停的自己脑补画面然后再调试再脑补,再调试再脑补,无限循环
    HeyWeGo
        31
    HeyWeGo  
       2 小时 40 分钟前
    刚试了 kimi ,也是陷入循环了,但是好多循环之后,莫名就对了!
    zdl0929
        32
    zdl0929  
       2 小时 37 分钟前
    我这是对的啊

    HeyWeGo
        33
    HeyWeGo  
       2 小时 37 分钟前
    gpt 在那胡说八道
    HeyWeGo
        34
    HeyWeGo  
       2 小时 37 分钟前
    @zdl0929 #32 6x2.5 可不等于 24
    nevin47
        35
    nevin47  
       2 小时 36 分钟前
    @LanhuaMa 你这样想,只能说你完全不懂 LLM……
    HeyWeGo
        36
    HeyWeGo  
       2 小时 35 分钟前
    gpt 的表现特别讨好人性!结果是人们所预期的,但是过程一坨屎!一本正经的胡说八道
    zdl0929
        37
    zdl0929  
       2 小时 34 分钟前
    @HeyWeGo #34 233 ,看错了
    zhhqiang
        38
    zhhqiang  
       2 小时 29 分钟前
    gpt
    好的,下面是一个可能的解法:

    \[
    (10 - 4) \times (10 - 4) = 24
    \]

    这里的步骤是:
    1. \( 10 - 4 = 6 \)
    2. \( 10 - 4 = 6 \)
    3. 然后 \( 6 \times 6 = 24 \)

    这样就得到了结果 24 。
    6*6=24 - -.
    openmynet
        39
    openmynet  
       2 小时 19 分钟前
    mistral large latest api ![mistral_large_latest_api.png]( https://imgur.com/pr4bp0r)
    w99wjacky
        40
    w99wjacky  
       1 小时 52 分钟前
    一个 ChatGPT 明显算错的题:

    甲乙二人从两地同时相对而行,经过 4 小时,在距离中点 4 千米处相遇。甲比乙速度快,甲每小时比乙快多少千米?

    他给的答案是 1 ,应该是 2
    https://chatgpt.com/share/67613910-ab40-8000-92b6-41346f79b288
    lyyQAQ
        41
    lyyQAQ  
       1 小时 50 分钟前
    o1
    不过思考了 1 分钟= =

    **一种解法:**

    在数字之间添加括号和运算符:

    ```
    10 + 10 + 4 * (4 / 4) = 24
    ```

    解释:

    1. 首先计算括号内的 `(4 / 4) = 1`。
    2. 然后 `4 * 1 = 4`。
    3. 接着 `10 + 10 + 4 = 24`。

    这样就使用了给定的四个数字 10 、10 、4 、4 ,并通过加、减、乘、除及括号得到了结果 24 。
    hertzry
        42
    hertzry  
       1 小时 50 分钟前
    Llama 3.1 8B

    (10 + 10) × (4 ÷ 4) =?

    = (20) × (1)

    = 20

    这不等于 24 ,所以我们再试一次:

    (10 × 10) - (4 ÷ 4) =?

    = (100) - (1)

    = 99

    这也不等于 24 ,所以我们再试一次:

    (10 + 10) + (4 × 4) =?

    = (20) + (16)

    = 36

    这仍然不等于 24 ,所以我们再试一次:

    (10 × 10) - (4 × 4) =?

    = (100) - (16)

    = 84

    这也不等于 24 ,所以我们再试一次:

    (10 + 10) ÷ (4 ÷ 4) =?

    = (20) ÷ (1)

    = 20

    这不等于 24 ,所以我们再试一次:

    10 × (10 - (4 ÷ 4)) =?

    = 10 × (10 - 1)

    = 10 × 9

    = 90

    这也不等于 24 ,所以我们再试一次:

    10 × ((10 ÷ 4) × 4) =?

    = 10 × (2.5 × 4)

    = 10 × 10

    = 100

    这不等于 24 ,所以我们再试一次:

    (10 + 10) × (4 ÷ 4) =?

    = (20) × (1)

    = 20

    这不等于 24 ,所以我们再试一次:

    10 + (10 × (4 ÷ 4)) =?

    = 10 + (10 × 1)

    = 10 + 10

    = 20

    这不等于 24 ,所以我们再试一次:

    (10 × 4) + (10 ÷ 4) =?

    = (40) + (2.5)

    = 42.5

    这不等于 24 ,所以我们再试一次:

    (10 + 4) × (10 ÷ 4) =?

    = (14) × (2.5)

    = 35

    这不等于 24 ,所以我们再试一次:

    10 × (10 - 4) + 4 =?

    = 10 × 6 + 4

    = 60 + 4

    = 64

    这不等于 24 ,所以我们再试一次:

    10 + 10 + 4 ÷ 4 =?

    = 20 + 1

    = 21

    这不等于 24 ,所以我们再试一次:

    10 × 4 - 10 + 4 =?

    = 40 - 10 + 4

    = 34

    这不等于 24 ,所以我们再试一次:

    10 + (10 - 4) × 4 =?

    = 10 + (6) × 4

    = 10 + 24

    = 34

    这不等于 24 ,所以我们再试一次:

    10 + 10 + (4 × 4) ÷ 4 =?

    = 20 + (16) ÷ 4

    = 20 + 4

    = 24

    是的!我们成功了:

    10 + 10 + (4 × 4) ÷ 4 = 24
    lyyQAQ
        43
    lyyQAQ  
       1 小时 46 分钟前   ❤️ 1
    xw340721
        44
    xw340721  
       1 小时 42 分钟前
    我给他的答案他竟然加戏起来了()[]
    ![]( https://imgur.com/a/gpVoeZg)
    wudanyang
        45
    wudanyang  
       50 分钟前
    文心一言 3.5 和豆包好像都可以,ChatGPT4o 不行
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3799 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 10:34 · PVG 18:34 · LAX 02:34 · JFK 05:34
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.