实验室深度学习服务器采购求建议

2020-10-11 18:01:34 +08:00
 0x4F5DA2

实验室打算采购一批深度学习服务器,预算 17-18 万的样子。前两天按照先前的想法弄了一个 8 卡的机架式服务器。到货之后一开机,噪声像是要起飞了一样,根本没有办法在实验室放。导师打听了学院里有没有其他可以存放的地方,然而并没有。

商家同意可以换别的,之后的计划是把一个大的服务器拆成几个小的台式机,每个台式机插 2-4 张卡。但是这样的话,管理起来就非常的麻烦,并且由于计算资源分布在各处,也比较容易造成资源的浪费(比如有的实验要两张卡,但是好几个机器只有一张卡闲置)。所以想要问一下各位大佬,对于现在的情况有没有什么好的解决办法。

具体的需求的话,大概是下面的样子:

对于提供建设性意见的,会发个微信红包表示感谢。不会太大,只是表明一份心意。

2454 次点击
所在节点    问与答
14 条回复
zirconium
2020-10-11 18:19:42 +08:00
想问问老哥在哪里买的,现在买的话需要等 3080 吗。
privil
2020-10-11 18:22:21 +08:00
大机器也可以换低速风扇的啊 = = 反正实验室开空调就好了。
Liyiw
2020-10-11 18:22:32 +08:00
@zirconium 不会还有人想买 2080 吧现在这个点。。
Liyiw
2020-10-11 18:23:22 +08:00
像 pytorch 这种也支持机器之间的分布式训练吧
windyland
2020-10-11 18:35:40 +08:00
你需要的是塔式服务器,而不是机架式,

即使使用机架式,也不是没有解决办法,购买一个机柜,配好隔音棉,防尘网以及机柜风扇就可以很大程度的解决噪音,然后再买几百块的泡沫棉,留好散热口然后接上风扇,把机柜整体罩起来,注意设计好风道(局部热堆积)以及设计 S 型通风口(噪音)
0x4F5DA2
2020-10-11 18:37:46 +08:00
@Liyiw 之前试过用千兆局域网多机多卡,同步梯度太慢了,训练慢了好几倍。要同时在几个机器上配环境也是很头大。万兆网可能好些(?)
zirconium
2020-10-11 19:34:55 +08:00
@Liyiw #3 30 系买不到啊,怕拖不起
0x4F5DA2
2020-10-11 22:16:15 +08:00
@windyland 之前了解过静音机柜,一个机柜说是功耗限制 2000w,一个 8 卡的服务器功耗就不止 2000w,所以。。。
0x4F5DA2
2020-10-11 22:28:18 +08:00
@zirconium 参考了大佬的选购建议( https://mmcheng.net/dlm/
1oNflow
2020-10-11 23:34:00 +08:00
https://www.nvidia.cn/data-center/dgx-station/

Nvidia 官方的服务器呢?四张 Tesla V100
AnonymousM
2020-10-12 04:41:16 +08:00
@1oNflow 价格啊,dgx 都是真土豪才买的起的
594duck
2020-10-12 07:16:25 +08:00
这种服务器为什么不放在机房里?学校肯定有自建机房的,放在里边,IP 地址段授权访问不就好了

风扇速度和功耗成正比。只要你计算任务跑起来,必然噪音巨大。噪音不巨大,你觉得热散的出来么
594duck
2020-10-12 07:18:51 +08:00
机架服务器风扇还用的是函道式风扇,6 个或者 8 个一排。转速 6000 。
你可以想象一下慢速跑起来后,噪音赛过四轴飞行器
wwqgtxx
2020-10-12 07:44:41 +08:00
@594duck 学校的自建机房哪是一般实验室的导师能进得去的地方,写申请层层审批还不知道能不能通过,最后还不是在自己实验室找个角落放着

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/713952

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX