老黄新出的这台设备有点意思,感觉目前实验室、小公司本地部署推理模型的最优解了

2 天前
 yishibakaien
老黄新出的这台设备有点意思,感觉目前实验室、小公司本地部署推理模型的最优解了,1Pb FP4 算力,约等于 4090 ,给了 128G 通用显存,支持多台互联,带宽可能只有 512gb 。

关键是只要 3000 刀,不要盯着游戏卡了。

https://www.nvidia.com/en-us/project-digits/
2418 次点击
所在节点    硬件
24 条回复
yishibakaien
1 天前
@pakro888 噢噢 那看起来不够,要 4 台,目前还不知道支不支持 4 台互联
lovestudykid
1 天前
瓶颈除了显存,还有显存带宽。给你一秒 5 个 token 写代码,你等得起吗?
twinsant
1 天前
想买
HelixG
1 天前
估计这玩意还需要几年才能成熟,什么时候能单机跑 500b 才有的谈

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1103438

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX