4060 本地部署 LLM 求推荐？

173 天前

KIRAYOMATO

不训练，就用来自己推理玩玩，4060 能跑的起来的模型哪个效果最好？

1370 次点击

所在节点

问与答

2 条回复

dyexlzc

173 天前

2060s 跑 llama3.1 ，qwen2 7b 都是 20+ token/s ，你的 4060 应该速度更快，13B 以下的都可以玩玩（显存够就可以）
显存不够用内存跑也可以。

Nosub

173 天前

虚拟机搭建本地 LLM ，各种 LLM 可以随便换，真的可以随便折腾，不会污染操作系统，做个虚拟机快照就可以了，对显卡无要求，可以先练习下，熟悉流程后，可以在真机上跑。

使用 Ollama 和 AnythingLLM 搭建 AI 和本地知识库
https://nosub.net/posts/p/219

第 1 页／共 1 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1074437

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.