有没有方便微调各种大模型的工具

9 天前
 WinG

如题,有个数据集,想对比下在各个模型下微调后的表现。

744 次点击
所在节点    问与答
4 条回复
handuo
9 天前
有很多微调的库啊,llama-factory 和 swift 都可以,我在用,还有很多比如 unsloth, axolotl 等等
WinG
9 天前
@handuo 谢谢大佬 顺便问一下现在租什么云比较方便运行 llama-factory?微调 32B 的模型
handuo
9 天前
国内比较主流的有 UCloud( https://www.ucloud.cn/),商汤云大装置( https://www.sensecore.cn/product),我还在 B 站上看到一些 up 主推广过 https://gpuez.com/ ,看你预算了呗。我公司现在刚刚从 ucloud 迁移到 sensecore ,其实都差不多
handuo
9 天前
本质上没有什么放不方便,大部分就是用 docker 来跑现成的 llama-factory 的镜像,如果是多实例多机跑稍微注意一下环境变量配置就行,都一样的。可能有的厂商有自己配置好的镜像,但是也是以 deepseek 和 megatron 为主的,建议自己构建比较好

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1100556

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX