请问深度学习真的需要吃大量的资源吗？

一个成绩很好的同学在读硕士，背景是国内排名很靠前的高校，非计算机和软工专业。总是需要一些高配的深度学习平台（例如 16 核+4 张 P100 及以上）来完成他的实践。

外行人觉得这个配置真的是很高很费钱了。有没有 cs 专业的大佬能够科普一下，日常科研的场景？请问什么体量的任务，需要这样的配置，连续不断跑一周才能完成？深度学习是否可能因为算法和设置不当，导致效率低下？

azh7138m

2019-09-03 13:07:24 +08:00

唔，前几天华为云开车的 AI 实例不都是 32C 128G 16 张加速卡，这种规格的吗？

shikimoon

2019-09-03 13:17:46 +08:00

和模型关系很大，本人是做 nlp 的，之前用的 svm 和 cnn 做语义相似度还有意图识别，这几个模型参数量不是很大，普通的 gpu 甚至是 cpu 一天足够训练出模型了，自从出了 bert 后，参数量达到上 e，甚至数十 e，我们用 p4 训练 1 周多才能出模型

Pho3nix

2019-09-03 13:33:51 +08:00

4 张 P100 也就是 DGX-STATION 入门配置，图像方面的基本一个人就要吃一台。ps：16 核是很不专业的说法，家里那台破烂有 20 核

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.