• 请不要在回答技术问题时复制粘贴 AI 生成的内容
sjmcefc2
V2EX  ›  程序员

买 macbook pro 笔记本,跑本地模型,怎么配置性价比比较高?

  •  
  •   sjmcefc2 · 9h 51m ago · 966 views

    macbook pro 跑本地模型,64g 内存够用吗? 64g 可以跑哪些模型呢? 等 9 月新品还是现在呢? 不懂 mac 的商品啊

    21 replies    2026-06-13 02:42:33 +08:00
    NASK
        1
    NASK  
       9h 46m ago
    macbook Pro 跑本地模型没有意义,如果真想本地跑的话,可以用 mac mini 来跑.
    ssack9
        2
    ssack9  
       9h 40m ago
    MacMini 需要什么样的配置来跑本地模型
    wuxilaoshiren
        3
    wuxilaoshiren  
       9h 40m ago
    伪需求
    et5494
        4
    et5494  
       9h 37m ago
    25 年购入了一台 MAC MINI M4 PRO 64G 版
    实际测试下来,跑模型的 token/S 很慢,GPU 全程 102°,完全等不及的那种(我忘记上的多大模型了,反正 64 是低不成高不就)
    这钱直接花在订阅上,这不香吗?
    sjmcefc2
        5
    sjmcefc2  
    OP
       9h 24m ago
    @et5494 多大的配置才能比较顺利的跑呢?
    mbooyn
        6
    mbooyn  
       8h 23m ago
    一般推荐显存几百 G 的才跑本地模型,否则一律走云端 api
    YanSeven
        7
    YanSeven  
       8h 20m ago via Android
    就算能顺利跑了,堆到顶级了。那个智力可能都不如现在有些厂商发善心给你免费用的 API ,都不必花钱。
    sjmcefc2
        8
    sjmcefc2  
    OP
       8h 5m ago
    @YanSeven 那就剩下一个苹果开发了。对吧。只是想着顺带跑跑本地模型,有个高中生水平就可以简单执行任务了。
    ntedshen
        9
    ntedshen  
       8h 2m ago
    9 月不涨价就不错了。。。618 的货还是年初的价
    ysn2233
        10
    ysn2233  
       7h 36m ago
    伪需求,不跑最好
    foxio2
        11
    foxio2  
       7h 35m ago via Android
    这个好办。选内存带宽超过 800G/s 的。
    foxio2
        12
    foxio2  
       7h 34m ago via Android
    4 万以下根本不用看。4 万以上的那种。本地跑的,主要是是为了保护宝贵的私有数据。所以。这点钱也值得。
    409164
        13
    409164  
       7h 21m ago
    你能跑的都是弱智模型
    Mandelo
        14
    Mandelo  
       7h 1m ago
    本地模型要好用,卖 token plan 的早倒闭了
    onetown
        15
    onetown  
       6h 55m ago
    我现在很多代码是用 m5 max + 128g 内存跑的 qwen3.6 35b 的模型跑的。65k 上下文, 模型本身支持 128k , 但是我为了可以并发, 限制到 65k 。
    sjmcefc2
        16
    sjmcefc2  
    OP
       3h 2m ago
    @foxio2 能列一下配置吗
    sjmcefc2
        17
    sjmcefc2  
    OP
       2h 57m ago
    @onetown 也就是 128g 就可以跑目前的新模型了?
    coefu
        18
    coefu  
       2h 55m ago
    mac 系列只有 ultra 能用,别的都不用试了。
    sjmcefc2
        19
    sjmcefc2  
    OP
       2h 55m ago
    @coefu 能具体说说吗?
    coefu
        20
    coefu  
       2h 48m ago
    @sjmcefc2

    推理第一要素,gmem/umem 的带宽,越大越好。
    第二要素才是算力本身,prefill 阶段,context 太长,Nvidia 的 cuda 擅长的地方。

    mac 系列只有 ultra 的带宽>= 800GB/s ,这是第一个要素。 至于 apple metal gpu 的 core 数量,讲真,再多一倍也无济于事。算力对于 mac 系列来说,聊胜于无。
    felixcode
        21
    felixcode  
    PRO
       55 mins ago
    建议拔网线,关网卡,再也不联网,然后再跑本地模型。
    这样就能发挥本地模型保护隐私数据的优势了。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   970 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 70ms · UTC 19:37 · PVG 03:37 · LAX 12:37 · JFK 15:37
    ♥ Do have faith in what you're doing.