V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  wwhc  ›  全部回复第 1 页 / 共 28 页
回复总数  543
1  2  3  4  5  6  7  8  9  10 ... 28  
34 天前
回复了 stillsilly 创建的主题 生活 我有小猫啦
猫猫很可爱,替楼主高兴,侍候猫主子要有耐心,祝好运
背唐诗宋词 Qwen3 2507 版很强,openai_gpt-oss-20b-MXFP4 在 Epyc 7532 8 通道 ddr4 系统上的速度是:
prompt eval time = 113.29 ms / 14 tokens ( 8.09 ms per token, 123.58 tokens per second)
eval time = 12243.52 ms / 466 tokens ( 26.27 ms per token, 38.06 tokens per second)
total time = 12356.81 ms / 480 tokens
llama.cpp 运行 gpt-oss-20b-mxfp4 生成回答的速度比 Qwen3 30B 快一倍,一般的电脑就完全可用,但生成回答的质量略不如 Qwen3 30B ,如果内存足够大,gpt-oss-120b-mxfp4 的速度也只比 Qwen3 30B 慢一点,但生成回答的质量要高。但 openai 的这两个模型就像是开源模型的初学者,仍不成熟,实际上不如 Qwen 好用
55 天前
回复了 chanlk 创建的主题 汽车 高速超大车的时候要鸣笛吗?
需要而且必须打方向灯,其它任何动作除非在确定有额外安全风险情况下都属于干扰正常驾驶行为
57 天前
回复了 henji 创建的主题 生活 求助兄弟们一个情侣现实问题
移风易俗,做新时代的现代人,拒绝彩礼嫁妆,不办婚宴,不要红包,自由结婚,你们可以做到的
63 天前
回复了 Sh1xin 创建的主题 程序员 私有化部署 OCR 解决方案请教
Qwen 2.5 vl 有 72B 的,性能很好了,建议楼主可以试试
67 天前
回复了 zzjcool 创建的主题 问与答 刚做完近视手术,我也来聊聊
@sinxccc 我只是想提醒做近视手术的网友对手术要做出足够的研究考虑再作决定,并没有针对是哪种类型的近视手术。这有个关于 ICL 手术的案例,供您参考: https://zhuanlan.zhihu.com/p/137720244
67 天前
回复了 zzjcool 创建的主题 问与答 刚做完近视手术,我也来聊聊
建议看了这类方案而想要做近视手术的网友也看看失败的案例,综合考虑清楚再作决定
https://zhuanlan.zhihu.com/p/84060563
70 天前
回复了 xinbinhan 创建的主题 问与答 谁有稳定的电视源
76 天前
回复了 zhuyao 创建的主题 健康 近视手术的一些分享
79 天前
回复了 a253164149 创建的主题 电动汽车 都在说特斯拉更安全,体现在哪啊?
83 天前
回复了 Noby 创建的主题 Local LLM 目前哪个大模型适合本地部署用来纯翻译?
Qwen3 30B-A3B ,可以直接部署到任何有足够内存的电脑,包括笔记本电脑,使用/no_think 参数生成 token 的速度应该能满足大部分需求
楼主的 NUC i5-10310U 是双通道 ddr4 2933 么?如果金牌 6133 服务器的内存配置是 32gbx2 的话,内存带宽就要慢上一倍
楼主如果能提供本地部署时的配置及参数或许会比较有助于了解原因
算卦是信仰的一种,与科学研究属于不同的领域,相信算卦纯粹是个人信仰,应予以尊重
1  2  3  4  5  6  7  8  9  10 ... 28  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5164 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 37ms · UTC 08:10 · PVG 16:10 · LAX 01:10 · JFK 04:10
Developed with CodeLauncher
♥ Do have faith in what you're doing.