感觉 claude 逻辑性还是不如 gpt3.5

2023-06-17 21:13:03 +08:00
 hckisme
问题:“有两扇门,其中只有一扇门背后是天堂,每扇门口都有一个守卫,一个只说真话,一个只说假话,你不知道谁说真话谁说假话。你想进天堂之门,但是你只能问其中一个守卫且只能问一个问题,那么你应该问什么问题,才能够得知哪一扇门背后是真正的天堂之门?”

此时 gpt3.5 回答一下子就给出了正确答案,只是有几个论证的地方词语给错了,但是逻辑和结论是正确的,此时我给他纠正一下,它就反应过来了;而 slack 里的 claude ,甚至是 poe 里的 claude+,回答都是错的,尤其是 claude ,无论我怎么引导,指出它的逻辑错误,它只是一直自说自话,又把错误答案换个意思表达出来(认错态度还挺好的),即使我最终把正确答案告诉它,并且把逻辑论证过程给它,然后让它再答一遍,虽然它此时能照搬我给它的答案,可是推理论证过程还是那老一套错误的,给人气得够呛。看样子它是无法理解这个答案背后的逻辑。

各位感兴趣的可以自己尝试一下。
1910 次点击
所在节点    OpenAI
7 条回复
hckisme
2023-06-17 21:16:42 +08:00
纠正之后,gpt3.5 回答:
在这个问题中,您可以向其中一个守卫提问:“如果我问另一个守卫哪扇门通向天堂,他会告诉我哪一扇门?”。

由于其中一个守卫只说真话,另一个守卫只说假话,因此,无论您问的是哪个守卫,他们的回答都会是错误的。当您问完这个问题后,您可以根据守卫的回答来确定哪扇门通向天堂。

例如,如果您问的是说真话的守卫,他会告诉您说假话的守卫会指向不是天堂的门。这意味着,真实的天堂门是另一扇门。反之,如果您问的是说假话的守卫,他会告诉您说真话的守卫会指向正确的门,这也意味着真实的天堂门是另一扇门。因此,通过这个问题,您可以确定哪扇门通向天堂。
laila
2023-06-17 21:20:40 +08:00
hckisme
2023-06-17 21:27:44 +08:00
@laila 难道是我的调 jiao 成功了?😂
laila
2023-06-17 21:50:52 +08:00
@hckisme 这个是用 claude api 回答的,感觉比 poe 里的两种 claude 好用
hckisme
2023-06-18 12:44:31 +08:00
@laila 好的,谢谢😃
xdygxh
2023-06-19 20:07:29 +08:00
Poe 里面的 Claude 感觉都是削弱过的,Claude 甚至比 Slack 中的能力差很多,Slack 中虽然废话多,但是某些情况下很有用,逻辑性也还算行,Poe 感觉就是傻子。Claude 100k 对比国内某套壳网站搭载的 Claude 100k ,感觉思维发散程度很低,让他写点东西,支支吾吾憋出一点,套壳网站就能哗啦啦给你写一大堆,而且写的很好,不知道是参数设置问题还是什么。
laila
2023-06-22 19:47:53 +08:00
@xdygxh poe 里的是 claude-instant-100k ,实际上还有 claud-1.3-100k,带 instant 的只是回答速度快

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/949605

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX