走在开源的路上一发而不可收!继上次开源 UnionLLM 之后,这次我决定将出海业务的核心功能进行开源,未来的商业模式都将在开源项目的基础上构建。
PolyEval 是一个面向 LLM 系统的多语言评估框架。它继承了众多基于大语言模型提示语和算法规则的评估器,原生支持多语言的提示语模版和评估理由,方便接入各种生成和嵌入模型,可以基于 YAML 轻松扩展自己的评估器,它能够帮助生成式 AI 的开发者高效评估自己的应用程序提示语,克服大语言模型生成的不稳定性,打造更好的产品。
项目的地址: https://github.com/EvalsOne/PolyEval
希望得到大家的星标支持,同时也希望大佬们多提建议!🙏
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.