chatGPT 的数学计算貌似存在一些问题

2023-02-15 13:57:44 +08:00

Kiwifruit08

使用 chatGPT 计算密度，发现计算思路基本正确，但是计算数据明显错误或偏差较大，如下：
ASK：
a cubic box containing 93 Si atoms, 1 Ti atom, and 6 B atoms, with a side length of 12.43975 Angstroms, please calculate the density

ANSWER 中的计算错误部分:
mass = 93 * 28.0855 + 1 * 47.867 + 6 * 10.81 = 2735.1285 g/mol （正确答案为：2724.6785 ）
提示相关错误，其再次输出
mass = 93 * 28.0855 + 1 * 47.867 + 6 * 10.81
mass = 2613.4565 g/mol （正确答案为：2724.6785 ）
再次提醒后输出
total mass = 2608.7315 g + 47.867 g + 64.86 g
total mass = 2721.4595 g （比较接近了，正确答案为：2724.6785 ）

大家可以测试一下，使用其做一些简单计算时请小心，注意核对。

7681 次点击

所在节点

程序员

53 条回复

murmur

2023-02-15 13:59:47 +08:00

也就是说 chatgpt 的数学采用估值，类似 7*7 大概应该是 40 多的样子？而不是真的去计算

vsitebon

2023-02-15 14:02:43 +08:00

它是在猜下一个词是什么，而不是做数学推理，所以肯定会有误差，之前有一篇文章提到 chatgpt 如果能结合 wolfram 那就很牛逼了 https://writings.stephenwolfram.com/2023/01/wolframalpha-as-the-way-to-bring-computational-knowledge-superpowers-to-chatgpt/

liuidetmks

2023-02-15 14:03:44 +08:00

让他计算第 99 个斐波那契是什么，也有问题

shinession

2023-02-15 14:05:23 +08:00

是不是精度不够引发的问题? 我记得做过鸡兔同笼的问题, 都是整数, 计算没问题

fgwmlhdkkkw

2023-02-15 14:06:24 +08:00

"二分之一加上三分之一等一五分制二"

cxtrinityy

2023-02-15 14:12:30 +08:00

Chatgpt 那个不是算出来的吧，就算让他做简单加法 10000+1234567 都可能错，不过最近没试过不知道有没有进化

string2020

2023-02-15 14:26:43 +08:00

使用方式错了。这是聊天机器人，不要让聊天机器人去做很容易做的事情

jklove123bai

2023-02-15 14:26:49 +08:00

从开始就说 chatgpt 数学不行了，因为不是真的在做计算

caomu

2023-02-15 14:27:57 +08:00

ChatGPT 没有逻辑意识

jmc891205

2023-02-15 14:29:37 +08:00

人家只是语言模型
你们这些人非要把它当万事通

Lefi

2023-02-15 14:29:37 +08:00

你可以问它有没有通过图灵测试

Procumbens

2023-02-15 14:30:07 +08:00

ChatGPT 是语言模型语言模型语言模型

qq316107934

2023-02-15 14:30:17 +08:00

transformer：我太难了

kop1989smurf

2023-02-15 14:31:34 +08:00

所有的机器学习 AI ，基于的都是统计学原理。
所以任何因果论的输出都是不 100%准确的。

oldshensheep

2023-02-15 14:36:10 +08:00

如楼上所说，ChatGPT 并不存在真正的逻辑能力，回答的文字只是一些概率统计。
好久前看的视频 <amp-youtube data-videoid="e0aKI2GGZNg" layout="responsive" width="480" height="270"></amp-youtube>

vlgs

2023-02-15 14:36:42 +08:00

@fgwmlhdkkkw 什么小学生

king888

2023-02-15 14:41:07 +08:00

就像#2 说的，她是在猜输入的下一个词是什么，这里是 GPT3 的原理介绍： https://jalammar.github.io/how-gpt3-works-visualizations-animations/

ChatGPT 不仅数学计算这方面不可靠，在她模型覆盖不够的领域，也是会杜撰内容的

probe301

2023-02-15 14:57:53 +08:00

正好见到个集成 WolframAlpha 的例子
https://huggingface.co/spaces/JavaFXpert/Chat-GPT-LangChain

qdk0901

2023-02-15 14:59:20 +08:00

alpha go 刚出来的，也有很多专业棋手，甚至不专业的臭棋篓子这啊那的挑刺
没过两年一个一个都没脾气了

chatgpt 的浮点运算是有点小问题，但绝不是靠猜
大整数运算，只要不是特别离谱的大数，都是没问题的
尤其是运行脚本程序(没错，它可以运行脚本，只不过需要一些技巧)，结果是准确的

binux

2023-02-15 15:04:20 +08:00

这台洗碗机有问题，洗衣服不干净。

第 1 页／共 3 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/916314

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.