装了个 ChatALL,里面集成了一堆各种类 GPT 服务,除了 Bing Chat 跟 GPT,其他服务有好用的么?

2023-06-06 16:12:22 +08:00
 cy18

这软件集成了:

ChatGPT Bing Chat Baidu ERNIE Bard Poe MOSS Tongyi Qianwen Dedao Learning Assistant iFLYTEK SPARK Alpaca Vicuna ChatGLM Claude Gradio HuggingChat

一个个试太麻烦了,请教下站里的大神,有哪几个服务值得尝试一下?

1937 次点击
所在节点    程序员
8 条回复
sjn9588
2023-06-06 17:10:19 +08:00
claude 很厉害。https://lmsys.org/blog/2023-05-25-leaderboard/ 这个是有人做的最新排名
locoz
2023-06-06 19:02:38 +08:00
@sjn9588 #1 claude 的水平属实不行,逻辑性太差了,而且很喜欢缩略内容,真要实际使用还是排不到那么高的排名的。
MartinWu
2023-06-06 19:39:07 +08:00
poe.com ? 里面的机器人 Sage 宣称是 Good in languages other than English, and also in programming-related tasks. Powered by gpt-3.5-turbo. 我用起来感觉不错。
zzNucker
2023-06-06 19:50:48 +08:00
注册一下不是很快吗,反正都一起输出的

自己试试

我觉得 ChatGLM, Claude ,HuggingChat 都还好
cPO3Im7cn3lD39cU
2023-06-06 19:53:33 +08:00
@locoz 同意
wong2
2023-06-06 20:01:38 +08:00
locoz
2023-06-06 20:25:23 +08:00
@zzNucker #4 ChatGLM 、HuggingChat 实测也都是逻辑性差,水平还不如 Claude...
locoz
2023-06-06 20:32:18 +08:00
说实在的,除了 GPT4 以外,其他的大多都还是不太行。之前被 OpenAI 因为 Depay 问题封号后我特意做过测试,测试下来开源模型里面也就比较新的 Guanaco 33B ( 65B 版本应该效果更好)能在一定程度上做到同等水平(注意只是一定程度上),甚至部分超越,至于其他开源模型普遍都很差,基本属于不可用的水平。闭源模型的话,只找一个朋友测试了他们合作的国内某头部水平的研究院的大模型(未公开发布),逻辑水平基本跟 GPT4 差不多,只是输出还没那么对齐。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/946331

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX