要真的用来跑 AI ,m1 的 NPU 太老了,m1 max 的算力也只有 m4 的三分之一,应该等等 m4 max 的 MacBook Pro
246 天前
> With this set of optimizations, on iPhone 15 Pro we are able to reach time-to-first-token latency of about 0.6 millisecond per prompt token, and a generation rate of 30 tokens per second.
苹果的端侧模型才 3B ,M1 随便跑无压力
246 天前
iphone 上可以跑 m1max 跑不了这个听起来不太可能吧
246 天前
你说的端侧大模型是指啥?如果是指苹果自家上的模型的话肯定够用,如果是 SOTA 的开源大模型,就算能跑也快不了,哪怕是最新的 M3 Max 也就那么回事,不要有太高期待