chatGPT 的数学计算貌似存在一些问题

2023-02-15 13:57:44 +08:00
 Kiwifruit08
使用 chatGPT 计算密度,发现计算思路基本正确,但是计算数据明显错误或偏差较大,如下:
ASK:
a cubic box containing 93 Si atoms, 1 Ti atom, and 6 B atoms, with a side length of 12.43975 Angstroms, please calculate the density

ANSWER 中的计算错误部分:
mass = 93 * 28.0855 + 1 * 47.867 + 6 * 10.81 = 2735.1285 g/mol (正确答案为:2724.6785 )
提示相关错误,其再次输出
mass = 93 * 28.0855 + 1 * 47.867 + 6 * 10.81
mass = 2613.4565 g/mol (正确答案为:2724.6785 )
再次提醒后输出
total mass = 2608.7315 g + 47.867 g + 64.86 g
total mass = 2721.4595 g (比较接近了,正确答案为:2724.6785 )

大家可以测试一下,使用其做一些简单计算时请小心,注意核对。
7610 次点击
所在节点    程序员
53 条回复
murmur
2023-02-15 13:59:47 +08:00
也就是说 chatgpt 的数学采用估值,类似 7*7 大概应该是 40 多的样子?而不是真的去计算
vsitebon
2023-02-15 14:02:43 +08:00
它是在猜下一个词是什么,而不是做数学推理,所以肯定会有误差,之前有一篇文章提到 chatgpt 如果能结合 wolfram 那就很牛逼了 https://writings.stephenwolfram.com/2023/01/wolframalpha-as-the-way-to-bring-computational-knowledge-superpowers-to-chatgpt/
liuidetmks
2023-02-15 14:03:44 +08:00
让他计算第 99 个斐波那契是什么,也有问题
shinession
2023-02-15 14:05:23 +08:00
是不是精度不够引发的问题? 我记得做过鸡兔同笼的问题, 都是整数, 计算没问题
fgwmlhdkkkw
2023-02-15 14:06:24 +08:00
"二分之一加上三分之一等一五分制二"
cxtrinityy
2023-02-15 14:12:30 +08:00
Chatgpt 那个不是算出来的吧,就算让他做简单加法 10000+1234567 都可能错,不过最近没试过不知道有没有进化
string2020
2023-02-15 14:26:43 +08:00
使用方式错了。这是聊天机器人,不要让聊天机器人去做很容易做的事情
jklove123bai
2023-02-15 14:26:49 +08:00
从开始就说 chatgpt 数学不行了,因为不是真的在做计算
caomu
2023-02-15 14:27:57 +08:00
ChatGPT 没有逻辑意识
jmc891205
2023-02-15 14:29:37 +08:00
人家只是语言模型
你们这些人非要把它当万事通
Lefi
2023-02-15 14:29:37 +08:00
你可以问它有没有通过图灵测试
Procumbens
2023-02-15 14:30:07 +08:00
ChatGPT 是语言模型 语言模型 语言模型
qq316107934
2023-02-15 14:30:17 +08:00
transformer:我太难了
kop1989smurf
2023-02-15 14:31:34 +08:00
所有的机器学习 AI ,基于的都是统计学原理。
所以任何因果论的输出都是不 100%准确的。
oldshensheep
2023-02-15 14:36:10 +08:00
如楼上所说,ChatGPT 并不存在真正的逻辑能力,回答的文字只是一些概率统计。
好久前看的视频 <amp-youtube data-videoid="e0aKI2GGZNg" layout="responsive" width="480" height="270"></amp-youtube>
vlgs
2023-02-15 14:36:42 +08:00
@fgwmlhdkkkw 什么小学生
king888
2023-02-15 14:41:07 +08:00
就像#2 说的,她是在猜输入的下一个词是什么,这里是 GPT3 的原理介绍: https://jalammar.github.io/how-gpt3-works-visualizations-animations/

ChatGPT 不仅数学计算这方面不可靠,在她模型覆盖不够的领域,也是会杜撰内容的
probe301
2023-02-15 14:57:53 +08:00
正好见到个集成 WolframAlpha 的例子
https://huggingface.co/spaces/JavaFXpert/Chat-GPT-LangChain
qdk0901
2023-02-15 14:59:20 +08:00
alpha go 刚出来的,也有很多专业棋手,甚至不专业的臭棋篓子这啊那的挑刺
没过两年一个一个都没脾气了

chatgpt 的浮点运算是有点小问题,但绝不是靠猜
大整数运算,只要不是特别离谱的大数,都是没问题的
尤其是运行脚本程序(没错,它可以运行脚本,只不过需要一些技巧),结果是准确的
binux
2023-02-15 15:04:20 +08:00
这台洗碗机有问题,洗衣服不干净。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/916314

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX