现在公认 ChatGPT 已通过了图灵测试,但没有见过的数学题,现在的 AI (GPT) 还是不会解。这是 AI 还不会思考,还是 AI 已经达到了大多数人类的思维水平,即能通过图灵测试,但不会解初中或高中数学题? (像姜萍一样)

31 天前
 shyangs

如下的高中數學題,AI 會用向量法解. 這道題我第一次在別的論壇發帖時 AI 還不會,但現在 ChatGPT 學會了,我懷疑是我發帖後,友壇壇友反覆地問,導致 OpenAI 背後的智能工人注意到了這一題,讓 ChatGPT 背會了.

https://chatgpt.com/share/d4fe9bc6-f62f-408f-b188-4a2fa333e57b

降低難度到初中數學題(如下),ChatGPT 不會了,讓人懷疑 AI 還不會思考,但這樣考慮的話,能通過圖靈測試但不會初中高中數學題的人類(如姜萍)都不會思考?

https://chatgpt.com/share/67451648-ae74-8003-b6ef-332c10d43a12

7664 次点击
所在节点    程序员
95 条回复
llxvs
31 天前
小學生也能通過圖靈測試,小學生會解初中數學題嗎?
shyangs
31 天前
@llxvs

小學生會解小學數學題,用思考解的.

AI (GPT) 看過的題目,可以解到研究所等級,沒看過的題目,小學題都解不出來。
songray
31 天前
大语言模型相当于看到第一个字,计算概率最高的第二个字。
o1 相当于计算完之后,再算一次,自我纠正。
上次南航一个博士来公司介绍大模型的时候说的。
elevioux
31 天前
GPT 并不具备所谓的智能。1+1 ,人类能够理解,在此基础上得出结论=2 。对于 GPT 来说,是根据训练的资料,得出结论,“最有可能=2”。
ZeawinL
31 天前
AI: 我故意的
HTML001
31 天前
目前的 AI 只能对已有的"知识"做整合,没有知识创新,现在的 AI 只能算是一本高级的工具书,和真正类人的智能、智慧不挂钩
COW
31 天前
如果有人大批量的恶意给 AI 提供错误的结论,那 AI 大概率也会给出错误的结论。
superrichman
31 天前
目前的 GPT 就是赛博鹦鹉,它能说出你喜欢听的东西,仅此而已。
xw340721
31 天前
@elevioux 看你训练时候对准确度怎么看待,ai 在预测方面已经很不错了。定理一般通过两种方法得到,一是得出定理,然后证明,然后根据数据进行修改。二是通过共性然后得出规律。人类也不是凭空想象得到的定理。
Garphy
31 天前
换个说法,1+1=2 ,对大模型来说 1 到底是啥,它不懂,它只知道基于语料匹配,概率最大的结果是 2 。数学算的好的,一般是识别出是数学问题,直接套数学公式,不走搜索,就准了。所以本质上还是个搜索引擎,只不过是带上下文和重组能力。
Jim142857
31 天前
你犯了一个非常基础的错误:「是否通过 Turing Test 」和「一个东西是否具有智能」毫无关系。

Turing Test 背后的哲学假设是 logical behaviorism ,这一假设在上世纪 60 年代就已经被心灵哲学家广泛抛弃了。今天还拿着 Turing Test 说事儿的人完全不了解近 60 年的哲学学术发展。

如果你感兴趣的话可以问问 ChatGPT:Turing Test 和 behaviorism 的关系; Putnam 对 behaviorism 的著名反驳; Searle 的 Chinese Room 思想实验。
cwyalpha
31 天前
@Jim142857 以下是关于 Turing Test 与行为主义的关系、Putnam 对行为主义的著名反驳,以及 Searle 的 Chinese Room 思想实验的概述:

---

### **1. Turing Test 和行为主义的关系**

Turing Test 是由艾伦·图灵( Alan Turing )提出的,用于回答机器是否能像人类一样进行思考的问题。测试的核心思想是,如果一个机器能在一段对话中成功地模仿人类,且观察者无法区分出它与人类的区别,则可认为该机器具备智能。

- **行为主义的视角**:
Turing Test 与行为主义有相似之处,因为两者都强调“外在可观察的行为”而非内在的心理状态。行为主义是心理学和哲学中的一种理论,它主张只研究外在行为,而忽略内部的主观经验或意识。Turing Test 的设计符合这一哲学立场:只关心机器的行为输出,而不试图分析其内在过程或状态。

- **批判性观点**:
Turing Test 的这种行为主义取向也引发了哲学家的批评。一些人认为,模仿人类行为并不等于真正具备思维或意识,因为“行为”可以被机械地复制,而不需要涉及理解或意图。

---

### **2. Putnam 对行为主义的著名反驳**

希拉里·普特南( Hilary Putnam )是哲学和计算机科学领域的重要人物,他对行为主义提出了重要反驳,其中最著名的是“超人机反例”( Super-Spartan )和“多重实现性”。

- **超人机反例( Super-Spartans )**:
Putnam 假设了一种生物群体——“超人机”,它们在强烈痛苦的情况下仍能完全压抑痛苦行为,不表现任何外在的痛苦迹象。这一设想表明,心理状态(如疼痛)不一定伴随可观察的行为,因此行为无法完全定义心理状态。

- **多重实现性( Multiple Realizability )**:
Putnam 进一步批评行为主义的简化性。他指出,心理状态可以以不同的方式在不同物种或系统中实现,例如疼痛可能在人类的大脑、动物的大脑,甚至在某些人工系统中以完全不同的物理形式存在。这说明心理状态不能被简单地归结为特定的行为或生理机制。

这些反驳动摇了行为主义在哲学和科学中的地位,促成了功能主义的兴起。

---

### **3. Searle 的 Chinese Room 思想实验**

约翰·塞尔( John Searle )提出的中文房间思想实验是对强人工智能( Strong AI )的批判。这一思想实验挑战了 Turing Test 的充分性,特别是对智能和理解的本质进行了深刻探讨。

- **思想实验内容**:
假设有一个人( Searle 本人)在一个房间里,房间里有一本规则书(程序)告诉他如何根据输入的中文字符组合生成合适的中文输出。这个人完全不懂中文,但通过规则书,他可以生成完全合乎语法的中文对话。外部观察者会认为房间里的人理解中文,但实际上,这个人并没有真正的理解。

- **核心论点**:
Searle 认为,像 Turing Test 这样的行为标准不能证明机器具有理解能力。中文房间中,“人+规则书”系统可以模仿理解中文的行为,但这并不意味着系统真的理解中文。这表明语义(理解的内容)与语法(符号操作的规则)是不同的。

- **结论**:
强人工智能(即认为机器可以通过程序实现真正的心智或理解)是不成立的,因其缺乏语义理解。Searle 用此实验反对了“心智等同于符号处理”的观点。

---

### **总结**
1. **Turing Test 与行为主义**都关注外在行为,但忽视内在意识,这种行为导向的观点受到了哲学家如 Putnam 和 Searle 的批评。
2. **Putnam 的反驳**从理论上否定了心理状态和外在行为的简单对应关系,指出心理状态的复杂性和多样性。
3. **Searle 的中文房间实验**进一步质疑了人工智能是否能超越符号处理,真正实现理解。

这些讨论为人工智能、心理学和哲学之间的交叉研究奠定了重要基础。
edwardzcn98
31 天前
可以合理怀疑目前最好的数学模型也是靠人力堆起来的(让模型去学习严格的机器推理+证明),他们的训练集覆盖了你给出的第一题。

Something relevant information

```
Project Numina is hiring Lean 4 contributors to work on formalizing competitive math problems and proofs! If you're passionate about mathematics, formal methods, and contributing to groundbreaking AI research, this could be the perfect opportunity for you.
Project Numina is a non-profit dedicated to advancing human and AI capabilities in mathematics. They've already achieved remarkable milestones:
```

补充资料:
Hugging Face 上[Numina 项目获得了第一届 AIMO 进步奖]( https://projectnumina.ai/publications/),也发布了相关数学解题模型。

公开的在近 AI 领域你可能看不到他们联合数学家所做的努力,但是你会发现 Advisory Committee 下有 Tao 和另外几名 Lean FRO (包括语言的发明者)。
frayesshi1
31 天前
@Jim142857 非常赞同,西方的哲学最在意的是实践和思想的关系,柏拉图说人的思想来自另外一个世界,亚里士多德说人的思想来自物质,康德说人的部分思想来自另外一个世界,部分思想来自物质。但是科学到现在都没有办法在任何东西上实现“我”这个概念。
edwardzcn98
31 天前
@edwardzcn98 排版好像乱掉了,对这个感兴趣的话可以看一下这篇中文 blog: https://huggingface.co/blog/zh/winning-aimo-progress-prize

无意义去讨论是否通过图灵测试或者有没有智能这些。
xw340721
31 天前
其实可以理解为,通过训练,ai 从更高维度总结出了规律,但对人类来说还是黑盒。ai 是有发散思维的,看你对发散思维怎么理解,如果认为合理推导结论不是发散思维,只是根据以前的知识进行拼凑,那人类其实也是这样的一套思维方式。
Jim142857
31 天前
@xw340721 AI 没有发散思维。因为 AI 根本没有思维。
ZztGqk
31 天前
不过是一种高阶搜索罢了,training 和 input 没有的东西,它就不知道
a570295535
31 天前
AI 本来就不会思考,它只是调用庞大的数据来模拟思考,不管它多么像人,它从根本上始终不是人。
就算未来 AI 智能到发生所谓的 AI 暴乱,那也只能说是数据混乱导致的,模拟永远只是模拟,而不能真正的拥有。
glacer
31 天前
目前的 AI 还不具备逻辑推理能力,本质上仍然是一个海量知识库的索引。chatgpt 在文本,图像等领域的输出只是基于已输入的先验知识进行计算得出的正确率最高的结果,对文本或图像内容中包含的逻辑信息(比如数学题目中提供的推理信息)基本无法处理。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1092630

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX