V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
V2EX  ›  mmjy  ›  全部回复第 1 页 / 共 1 页
回复总数  1
2024 年 12 月 2 日
回复了 fid 创建的主题 Local LLM 8x4090 离线部署 Qwen2.5 求助
vllm 文档是有量化实验特性支持的,可以试试好不好用: https://docs.vllm.ai/en/latest/quantization/auto_awq.html
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1018 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 14ms · UTC 19:15 · PVG 03:15 · LAX 12:15 · JFK 15:15
♥ Do have faith in what you're doing.