搞 AI 的兄弟们都选的多大的内存？ 32 还是 64？

lrigi · 2023-07-26T04:22:40Z

（别都选个 8GB 然后远程

远程

兄弟

内存

GB

64 replies • 2023-08-21 00:41:27 +08:00

1

swulling

Jul 26, 2023 via iPhone

搞 AI 用 Macbook 不太行吧。

MPS 跑跑推理还行，训练什么的行么。

2

deplivesb

Jul 26, 2023

搞 ai 用 MacBook ？
我的 m2 max 64G ，跑 sd 能吃掉 50G 左右的内存，
训练过一个小小的 cnn ，mac gpu 跑了 70 多个小时，相同的项目，4090 跑了 50 小时左右

3

vtemp249

Jul 26, 2023

本地需要堆的不都是显存，管什么内存

4

deplivesb

Jul 26, 2023

@vtemp249 Apple silicon 的内存就是显存

5

lrigi

OP

Jul 26, 2023 via iPhone

@swulling 训练肯定不行，内存大就可以平时玩玩推理么（不过好像也没时间

@deplivesb 和 4090 的差距不应该这么小吧，难道是 batch 大了一倍？你这个 sd 是不是 batch 开的很大还是怎么样，sd 的参数量好像不多，请问除了 sd 的话 64G 显存还有什么玩耍的场景吗？

6

nonevs

Jul 26, 2023

16g + vscode remote

7

murmur

Jul 26, 2023

@deplivesb 我看专业评测是只能有一半内存当显存用？

8

lrigi

OP

Jul 26, 2023 via iPhone

@murmur 我也想问这个问题，之前有人说 32G 的内存只能让 22G 当显存，有这样的限制吗？

9

lrigi

OP

Jul 26, 2023 via iPhone

@ZedRover 我现在就是 16G+vs remote ，但既然买电脑了，要求不高（ 7B 到 65B 都能推理不过分吧

10

8355

Jul 26, 2023

之前看到有大佬 Mac Studio 192g 内存跑模型用

11

nonevs

Jul 26, 2023

@lrigi #9 不太清楚 mac 上的 torch 现在适配的怎么样了，之前跑 MAE 的代码跑不通，有几个库都不支持，之后就不怎么在 mac 上跑模型了，aws autodl 什么的随便开个按量的服务器跑不香么

12

jr55475f112iz2tu

Jul 26, 2023

搞 AI ，想本地跑，还用 Mac ？

13

lrigi

OP

Jul 26, 2023 via iPhone

@ZedRover 现在适配的应该不错了，毕竟 llama 和 sd 里面都有包含很多比较新的算子吧。服务器不缺，但不是要换机吗，3000 块加 32G 显存打着灯笼也找不到吧，还是挺心动的。

14

lrigi

OP

Jul 26, 2023 via iPhone

@czfy 😏时代变了大兄弟，m2 max 已经和 v100 计算力差不多了，以后可能真的很多论文用 mac 实现了。毕竟学界很多组还在 2080ti 和 titan 呢

15

YsCi2

Jul 26, 2023

我感觉相比 N 卡还是速度太慢了，N 卡能够节省数倍的时间，Mac 本地也就看看代码能不能跑。（我测试的是 ChatGLM 和 YOLO ）

16

jr55475f112iz2tu

Jul 26, 2023

6

@lrigi 你还真信林亦的视频啊？
尊重，祝福

17

046569

Jul 26, 2023

原则上越大越好,目前 MPS 确实存在限制,粗略估算三分之二当显存.
一旦内存爆了,速度会立刻降到没法使用.
实测 32G 内存跑 70B 量化只有 0.03 tokens/s.

18

RoccoShi

Jul 26, 2023

你想用 mac 搞 ai?

19

lrigi

OP

Jul 26, 2023 via iPhone

2

@czfy 我没怎么看过那个视频，你觉得我哪里说的不对你可以反驳我，而不是说一些没意义的话。相比专业的计算卡，mac 是不是在价格和显存容量上都有优势？ m2 max 的 tflops 是不是跟 v100 差不多？

20

shwnpol

Jul 26, 2023

mac 不行，pytorch 适配得再好没意义，解决不了训练的问题，最多只能微调，皮衣的护甲现在打不穿的

21

shwnpol

Jul 26, 2023

用 cpu 跑模型至少 64g ，32 太小了塞不下

22

AOK123

Jul 26, 2023

@lrigi #19
cuda 生态不是那么容易跳出去的，显存再高没有 cuda 还是跑不了

23

Pteromyini

Jul 26, 2023

2

@lrigi #14 你想的太多了，这个理论性能指的是推理性能，训练和推理完全不是一回事，M2MAX 反向性能打不打得过 3080 都不好说，更别提 V100 了

24

AnsonUTF8

Jul 26, 2023

搞深度学习的用 16 的就够了哈哈哈，因为肯定得用服务器的～

25

winson030

Jul 26, 2023 via iPhone

大家预判下一个在计算领域吊打英伟达企业会是谁，赶紧买股票

26

lrigi

OP

Jul 26, 2023 via iPhone

@AnsonUTF8 你说的也有道理，现在用了快十年的 Mac 就是 16G ，总是要升级一点的嘛

27

qzwmjv

Jul 26, 2023

@lrigi 据说 50%，16GB

28

LaurelHarmon

Jul 26, 2023

没必要本地搞，服务器很香，已经习惯 ssh Linux pytorch cuda 生态了

29

neopenx

Jul 26, 2023

1

@lrigi M2Max 只是 FP32 的 FLOPS 接近 V100 而已。FP16 的硬件加速在 ANE 上，做不了训练而且峰值还不如 FP32 。

30

lrigi

OP

Jul 26, 2023 via iPhone

@neopenx 确实，你说到重点了，这里是问题

31

ShadowPower

Jul 26, 2023

买 8G 内存，加内存的钱拿去买 NVIDIA 显卡

32

6i3BMhWCpKaXhqQi

Jul 26, 2023

一定要 64 ，32G 路过，太惨了

33

6i3BMhWCpKaXhqQi

Jul 26, 2023

@czfy Mac 优势挺大的，统一内存会解决一些显存不够的问题。

34

ShadowPower

Jul 26, 2023

1

关于“M2 Max 的 TFLOPs 是不是跟 V100 差不多”这一点，可以参考这个：
https://sebastianraschka.com/blog/2022/pytorch-m1-gpu.html
虽然是去年测的 M1 ，但 M2 和 M1 没有本质区别，只是晶体管规模比 M1 大了一点而已

其实连 3060 都赢不过，然后 3060 比 V100 差多了，差在显存带宽和 Tensor Core 上，可以各租一台 VPS 对比测试

35

dlwlrm

Jul 26, 2023

我是单独组了台 windows 远程跑 ai 的……mac gpu 和内存加的钱都能买两台 windows 机子了

36

lrigi

OP

Jul 26, 2023 via iPhone

@ShadowPower 显卡肯定不缺啊😂各种都有

37

lrigi

OP

Jul 26, 2023 via iPhone

1

@ShadowPower youtube 看了下确实有差距😌和 4090 差距在十倍吧我笑死。V100 都是要淘汰的卡了，那苹果这个确实不太行，那感觉 64G 内存确实没啥用，甚至 max 都没必要上了

38

mmdsun

Jul 26, 2023 via iPhone

AI 买 Mac 你会后悔的，
建议选至少 16GB 显存的 N 卡的 Windows 电脑，WSL 2 乌班图性能可以跑满，或者不玩游戏直接装乌班图就行

39

Aspector

Jul 26, 2023 via iPhone

@murmur 应该不止一半，我的 32GB 能正常跑 INT4 的人 30B ，这个理论占用是 20GB 的。再往上就不行了

40

Xie123

Jul 26, 2023 via iPhone

我是新人，求问，手机的 V 社没办法发帖子吗？我用的谷歌

41

siriussilen

Jul 26, 2023

老哥，我们都是代码提交到服务器上，本机的要求就是内存大就好了（ 30 个网页 idea pycharm dataspell 同事打开不卡哪种）

42

lrigi

OP

Jul 26, 2023 via iPhone

@mmdsun 都用了快十年 Mac 了，就从来没考虑过 Windows 。没事俺有服务器，显卡其实无关紧要

43

lrigi

OP

Jul 26, 2023 via iPhone

@siriussilen 我也是这样想的呀😌本地要是能高速跑跑大模型 int4 推理就更好了。我就用 vscode ，transmit ，pdf ，网页一般不超过十个。之前试过 8G 的 mac mini 完全够了。

44

lrigi

OP

Jul 26, 2023 via iPhone

@Aspector 能跑 30B 其实就够了，再大的话不如直接模型并行丢服务器了

45

mauis

Jul 26, 2023

完 ai 就别折腾 mac 了。省下来钱租 v100 吧。要说纯推理买张 t4 也很香

46

izzy27

Jul 26, 2023

就是选低配然后远程连到服务器呀，把钱省下来花在显卡上面不香吗

47

zhouyg

Jul 26, 2023

搭楼问，普通玩家，搞 AI 用什么机器，显卡和系统比较好？

48

asdgsdg98

Jul 26, 2023

还不如买个 4070 以上的卡

49

WuSiYu

Jul 26, 2023

mac 炼丹图一乐，除了跑龟速的 LLM 推理/ft ，没别的用

50

qweruiop

Jul 27, 2023

玩 ai 就算了吧，nvidian 的 cuda ，搞了十年了，apple 和他谈不拢，现在业界的生态基本上都是 cuda 上的吧。。。

51

murmur

Jul 27, 2023

@zhouyg 个人玩家就是 2080ti 魔改 22g ，或者等新的 3070 魔改卡，想微调或者炼丹就去租服务器

52

lchynn

Jul 27, 2023

M2 上据说跑 LLAMA.C 的编译版本，推理速度大概就有几十个 token/s ；
赶得上英伟达单卡 V100+原始的 llama2 模型了吧？

53

terminals

Jul 27, 2023

A100 80G 显存的够用了，ubuntu 系统跑

54

terminals

Jul 27, 2023

普通玩家，3090ti ，除了大语言模型，其他都够用了，用 ubuntu 系统跑，用 ubuntu 系统跑，用 ubuntu 系统跑

55

ShadowPower

Jul 27, 2023

@lchynn 那是 15M 参数量的模型……
其实普通的电脑也可以，那个项目优化并不好，是教学用途的

56

iamqk

Jul 27, 2023

@ShadowPower 最新评测结果 https://www.lightly.ai/post/apple-m1-and-m2-performance-for-training-ssl-models m2 max 的 gpu 性能应该是 4070 左右吧？

57

iamqk

Jul 27, 2023

应该是 m2 ultra ，记错了

58

summersun2021

Jul 27, 2023

@lrigi #14 m1 max 64g ，跑 sd ，风扇像拖拉机一样，跑了 30 分钟就关了，不敢试了。

59

EchoAI

Jul 27, 2023

使用服务器跑，ubuntu 系统 384GB 的内存。

60

lrigi

OP

Jul 27, 2023 via iPhone

@EchoAI 服务器内存再大都不妨碍思考是买 32G 还是 64G 的 Mac😌

61

lrigi

OP

Jul 27, 2023 via iPhone

@summersun2021 风扇拖拉机就拖拉机吧，我现在的 Mac 用 vscode 远程终端多输出一点内容就开始很吵了。风扇转一转应该没啥

62

EchoAI

Jul 28, 2023

@lrigi 有条件就上最高配，我当年买的时候最高只有 16G 。不过折腾 AI 的话，mac 目前还是有很多的不方便的地方，我的 Intel 的处理器基本上就不去想了。

63

lrigi

OP

Jul 30, 2023 via iPhone

@EchoAI https://developer.apple.com/forums/thread/729560
Apple 论坛里也有相关的讨论，这个人直接买了 m2 max 96GB 我服了。

64

nyxsonsleep

Aug 21, 2023

@deplivesb #2 但是 4090 理论性能是 m2 ultra 的三倍，更别说 m2max ，你这个例子怎么搞的 mac 速度变快了。