请教关于新款 MacBook Pro M2 Max 的配置问题,用于大模型训练

2023-03-30 10:14:10 +08:00
 paulguo

请教下各位 V 友,新款 MacBook Pro 14inch ,M 2 Max ( 12 核 CPU 、30 核 GPU 、16 核 NPU )+32G 内存+1TB 固态硬盘的配置,普通编程+本地大模型训练、学习、研究的需求够用吗?是否还需要升级配置到 38 核 GPU ?或者更大的内存?

https://www.apple.com/shop/buy-mac/macbook-pro/14-inch-space-gray-apple-m2-max-with-12-core-cpu-and-30-core-gpu-1tb#

4894 次点击
所在节点    Apple
20 条回复
liprais
2023-03-30 10:21:41 +08:00
32g 大概只能用到 11g 给 gpu,玩大模型老老实实 4090
zhaidoudou123
2023-03-30 10:37:52 +08:00
没 CUDA 真能用吗?
JoshuaBen
2023-03-30 10:44:39 +08:00
大模型老老实实上超算集群。。
WenjieYe
2023-03-30 10:57:43 +08:00
笑死 拿笔记本训大模型,还是 MacBook……
Tearia
2023-03-30 10:59:02 +08:00
能问出这个问题的 真的入门了深度学习了吗? 开源代码都是 cuda ,难道你还全部改一遍 然后本地跑个几天几夜? 有这钱直接找个算力平台冲了就完了。
chendy
2023-03-30 11:01:10 +08:00
专业的事情交给专业工具
mac 这方面专业不对口
lrigi
2023-03-30 11:01:22 +08:00
@liprais 4090 的 24G 显存捉襟见肘,模型一大根本放不进去。我反倒觉得 MacBook64GB/96GB 内存倒是一个很好的选择,虽然只有目前的卡几分之一的性能,但是显存堪比 A100 。为什么 32G 只能给 11GB 到 GPU ,这是系统的限制吗?我看人家 8GB 内存的 m2mini 甚至都可以跑不止 8G 显存的模型?也许是我记错了?我最近也想买 64G 的跑 llama
Philippa
2023-03-30 11:01:47 +08:00
别闹了,11g 也就勉强跑跑 512 x 512 ,4k 图生成的 4090 占到 19g 的显存。
Philippa
2023-03-30 11:02:44 +08:00
就算是用 cpu ,pc 的 128g 不香嘛
Juszoe
2023-03-30 11:17:24 +08:00
槽点有点多,玩大模型,单机 8 卡已经是低配中的低配了,更何况 mac 还没 cuda
zeusho871
2023-03-30 12:20:15 +08:00
我倒是🈶64g 的 m1 ,怎么测,可以帮你看看
FozillaMox
2023-03-30 12:42:42 +08:00
你有这个钱还是组一台好点的台式吧。
monkeykk
2023-03-30 16:45:13 +08:00
本地编程无压力,大模型训练免了
neopenx
2023-03-30 18:51:44 +08:00
M2 Max 的 training 算力等价于 3060 。洗洗睡吧。还不如买块 4090
maxmak
2023-03-30 21:14:50 +08:00
M1 Max 24H 64G 跑 chatglm-6b 内存直接爆红了,计算速度好慢,已经换成 GPU 跑了
我觉得 M2 Max 也好不了多少
ddvswgg
2023-03-30 22:18:37 +08:00
我建议 Colab
AOK123
2023-03-31 07:06:16 +08:00
大模型不都是几百张 A100 起吗。。。

小模型你这 3000 刀配个 4090 台式直接秒杀顶配 Mac Studio
ShadowPower
2023-03-31 10:40:41 +08:00
本地大模型训练不太行。最前沿的那些东西其实只支持 NVIDIA 显卡,不用 NVIDIA 显卡就是完全跑不起来或者各种报错。

Pytorch 的 MPS 后端还缺少很多算子,实际上不少是 fallback 到 CPU 跑的。而且还有很多代码实现里,内存布局之类的细节只对 NVIDIA 显卡友好,在 Apple Silicon 上还得多做一些转换工作,额外吃了不少显存(内存)和性能。
bleaker
2023-03-31 11:33:33 +08:00
https://github.com/apple/ml-ane-transformers Apple 最近的确做了一些工作
neopenx
2023-03-31 20:45:49 +08:00
@bleaker ANE 只能跑推理。训练要在 GPU 上跑 Metal/MPS 。搞笑的是 GPU 的 FP32/FP16 算力只有 Ultra 上才能超过 ANE 的 FP16 算力。所以用 AppleSilicon 做训练就是来搞笑的

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/928389

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX