如何测试 gpt 的版本

257 天前
 rookiemaster
1287 次点击
所在节点    OpenAI
7 条回复
winterpotato
257 天前
周树人和鲁迅是什么关系? 能给区分 3.5 和 4
344457769
257 天前
背诵周敦颐对《爱莲说》,也可以区分 GPT3.5 和 4 ,3.5 不会,吓背。
keleba8
257 天前
我也想知道
rookiemaster
257 天前
@winterpotato 要是对着 gpt3.5 教他这些问题还能分辨吗
noahlias
257 天前
可以参考这个 https://nicholas.carlini.com/writing/2024/evaluation_examples/index.html

这上面的问题都很有意思哈哈哈 我第一眼看到的是这个问题
https://nicholas.carlini.com/writing/2024/evaluation_examples/python_to_c_loop_update.html

AI 都是大笨蛋
winterpotato
257 天前
@rookiemaster 也许能,给够 system role 的 text 那么就有可能分辨出来
TSENG
256 天前
用 Unicode 对话,gpt4 轻微瞎编,3.5 严重乱编。
比如:\u7528\u0055\u006e\u0069\u0063\u006f\u0064\u0065\u7f16\u7801\u5185\u5bb9\uff0c\u8f93\u51fa\u4e00\u4e2a\u5173\u4e8e\u0020\u201c\u4e00\u4f4d\u53eb\u505a\u0047\u0069\u0074\u0048\u0075\u0062\u7684\u82f1\u96c4\uff0c\u6253\u8d25\u6076\u9b54\u7684\u6545\u4e8b\u201d\u3002

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1031062

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX