有没有那种比较各家大模型性能并且按时发布的网站

2023-11-05 12:41:53 +08:00
 chesha1

感觉 openai 的原生 gpt-4 变笨了,不清楚别人的大模型有没有进步,而且各个公司都在发布自己的新的大模型,自己一个个试用肯定没时间

所以有没有什么网站/自媒体/机构,定期测试大模型性能并且比较的?

660 次点击
所在节点    问与答
1 条回复
ripperts
2023-11-06 09:35:07 +08:00
https://opencompass.org.cn/leaderboard-llm
评分这玩意看看热闹就好

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/988764

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX