AI 关于字符串回答总是错误的问题 - V2EX

首页注册登录

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 527 天前的主题，其中的信息可能已经有所发展或是发生改变。

提问 AI ，waterTemperature 总共多少字符，AI 总是会发生错误，换了几个平台都这样

17 条回复 • 2024-05-13 10:02:11 +08:00

1

chris850527

2024-05-11 17:36:51 +08:00

用了 claude 没问题，你可以试试

2

AoEiuV020JP

2024-05-11 17:38:18 +08:00

ai 睁着眼镜说瞎话的问题还是没解决，目前依然算是语言模型，只能保证语言正确，

3

zsh2517

2024-05-11 18:42:22 +08:00

@chris850527 顺便测试了一下 poe.com 上的 GPT4 ，也没有问题。

4

matrix1010

2024-05-11 20:37:45 +08:00

你要知道 LLM 是没有智能的, 更不可能去进行准确数学计算。简单的统计 AI 也许能答对, 但稍微复杂点就完全不行了。比如这个:
how many "r" and "a" in "strawberry"

Gemini 1.5 Pro 的回答

Let's count:
R: There is one "r" in "strawberry".
A: There are two "a"s in "strawberry".

5

yorhaha123

2024-05-11 22:18:59 +08:00

2

看我写的文章

https://zhuanlan.zhihu.com/p/696192942

6

Procumbens

2024-05-11 22:38:37 +08:00

1

你要知道在语言模型里看到的不是词而是 token...

7

mightybruce

2024-05-11 22:43:14 +08:00

出这种蠢的问题，意义何在？为了显示比 AI 聪明？
这个调用一下函数库就能得到结果，还不如让 AI agent 根据自然语言生成相应的函数调用回答准确。

8

ibegyourpardon

2024-05-11 22:48:23 +08:00

https://chat.openai.com/share/6ea160fe-b150-444c-a860-0da7ebac9171

9

R4rvZ6agNVWr56V0

2024-05-11 23:18:55 +08:00

@chris850527 Claude 3 Opus 不行，回答也是错误

10

R4rvZ6agNVWr56V0

2024-05-11 23:19:23 +08:00

我的测试题目是 #4 提供的这道题

11

Solix

2024-05-11 23:19:48 +08:00 via iPhone

这个写个脚本就行了吧，没必要问大模型

12

taotaodaddy

2024-05-11 23:49:21 +08:00

OP 和 4#的问题,poe 上的 GPT4 都能做对,是不是生成并调用了 python 程序做对的呢?

13

billccn

2024-05-11 23:58:33 +08:00

@taotaodaddy 可能性大，要不然得训练模型记住每个 token 里面多少个字符，还得训练模型做心算。前者好像不值得花这个时间，后者还是个技术难题。

14

dayeye2006199

2024-05-12 01:42:53 +08:00 via Android

因为现在主流的 tokenization 是 subword ，没法很好的处理字符串 level 的问题。

15

yadam

2024-05-12 10:45:19 +08:00

#5 的文章写的很详细, 学习了
如果 op 的流程里一定依赖这种数长度流程的话, 会不会用 tool calling 可以比较完美的解决?

16

Meteora626

2024-05-12 21:18:02 +08:00

输入是 token ，而且还要切分，现在基本上都是 bpe ，输入文本都不知道被切成啥样了，除非有标识符来标识每个字

17

SmiteChow

2024-05-13 10:02:11 +08:00

因为目前都是人工智障，别抱太大希望。

关于 · 帮助文档 · 自助推广系统 · 博客 · API · FAQ · Solana · 978 人在线 最高记录 6679 ·

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 · 25ms · UTC 19:53 · PVG 03:53 · LAX 12:53 · JFK 15:53
♥ Do have faith in what you're doing.