V2EX › hanli 的所有回复 › 第 1 页 / 共 5 页

Home Sign Up Sign In

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

Sign Up Now

For Existing Member Sign In

1 2 3 4 5

❮

❯

2 天前

回复了 davidyin 创建的主题 › Local LLM › 想折腾一个 AI 主机，请行家出手

前面研究过这个问题，新配显卡的话显存至少考虑 24G 以上，不然模型效果都比较一般。现在用的 12G 的 3080ti ，都跑 QWEN Q4 量化模型，跑 27b 稠密架构的基本用不了，35b 的 moe 架构勉强能用下。

3 天前

回复了 l534891619 创建的主题 › 推广 › [压力测试] Codex GPT-5.5 新中转站开业，人人免费领 3 亿 token，评论立送 300 美刀/月会员

FRE-e7bde8b6
感谢

4 天前

回复了 l534891619 创建的主题 › 推广 › [压力测试] Codex GPT-5.5 新中转站开业，人人免费领 3 亿 token，评论立送 300 美刀/月会员

FRE-978ee2c6
感谢

4 天前

回复了 cxzweb 创建的主题 › 推广 › # GPT-5.4 / 5.5 / 5.3-codex / image2 中转站，评论送 15 美刀

ID：80
感谢

4 月 26 日

回复了 KaiWuBOSS 创建的主题 › Local LLM › 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

@KaiWuBOSS 我意思是思考开关，有时候用思考模式太慢了。另外运行 Qwen3.5-35B-A3B Q4 量化，最终的运行显存占用 5.6/12 GB ，是不是尽量用到 10G 以上更合适？具体日志提了一个 issue 。

4 月 26 日

回复了 KaiWuBOSS 创建的主题 › Local LLM › 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

支不支持思考模式的开关？有时候快速任务不需要冗长时间的思考

4 月 16 日

回复了 youknowsomething 创建的主题 › 浏览器 › 浏览器插件沉浸式翻译是不支持自定义模型了吗？

@youknowsomething 看了下，在用的 1.27.2 版本是可以自定义的，也没有新版本提示。

3 月 23 日

回复了 Brightt 创建的主题 › 分享创造 › 撸了日本小电影提取字幕并翻译的工具

环境能不能保存在软件目录？ C 盘空间不多了

3 月 11 日

回复了 Joker520 创建的主题 › 投资 › 闲来无聊，又加上最近公司管得严，所以用 ai 搞了一个上班摸鱼盯盘利器

我的股票和 ETF 只有 2 种预测，高位滞涨/低位抢筹

2 月 24 日

回复了 hao7Chen 创建的主题 › 问与答 › 市场上有没有人能将 AI 与打印机结合一下

@marcong95 现在用的的施乐打印机就有啊，我记得叫 ID 卡复印吧

2 月 24 日

回复了 xiaofangcode 创建的主题 › 推广 › 开工福利： Codex 免费蹬， Claude 低至 0.03 一次。助力 v 友开工

参与一下

1 月 28 日

回复了 xiaofangcode 创建的主题 › 推广 › 逆向 Claude，已送 1w 刀。送每个老哥 117 刀蹬着玩~

支持一下

1 2 3 4 5

❮

❯

About · Help · Advertise · Blog · API · FAQ · Solana · 5002 Online Highest 6679 ·

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 · 35ms · UTC 09:46 · PVG 17:46 · LAX 02:46 · JFK 05:46
♥ Do have faith in what you're doing.