$V2EX
Solana
Give SOL to Copy Address
使用 SOL 向 hanli 打赏,数额会 100% 进入 hanli 的钱包。
 hanli's recent timeline updates
hanli

hanli

V2EX member #99602, joined on 2015-02-23 21:46:27 +08:00
Today's activity rank 10297
hanli's recent replies
1 day ago
Replied to a topic by davidyin Local LLM 想折腾一个 AI 主机,请行家出手
前面研究过这个问题,新配显卡的话显存至少考虑 24G 以上,不然模型效果都比较一般。现在用的 12G 的 3080ti ,都跑 QWEN Q4 量化模型,跑 27b 稠密架构的基本用不了,35b 的 moe 架构勉强能用下。
FRE-e7bde8b6
感谢
FRE-978ee2c6
感谢
ID:80
感谢
@KaiWuBOSS 我意思是思考开关,有时候用思考模式太慢了。另外运行 Qwen3.5-35B-A3B Q4 量化,最终的运行显存占用 5.6/12 GB ,是不是尽量用到 10G 以上更合适?具体日志提了一个 issue 。
支不支持思考模式的开关?有时候快速任务不需要冗长时间的思考
@youknowsomething 看了下,在用的 1.27.2 版本是可以自定义的,也没有新版本提示。
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5638 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 34ms · UTC 08:41 · PVG 16:41 · LAX 01:41 · JFK 04:41
♥ Do have faith in what you're doing.