M1 和 i7 对比

2020-11-13 14:37:55 +08:00
 johnsonyeen

看到 apple 的介绍 都是和 i7 对比,性能翻了几倍.. 有些想买

不知道这些对比, 把 i7 的睿频算进去或者考虑了没有,我记得 i7 睿频后,短时性能会猛的上升非常多。

13284 次点击
所在节点    Apple
95 条回复
dalabenba
2020-11-14 10:41:06 +08:00
翻几倍的是加速单元吧,咋可能计算性能翻几倍
TStealer
2020-11-14 10:46:35 +08:00
@jiayuan0215 苹果官方的数据有备注,对比的是 i7 款
THP301
2020-11-14 10:48:15 +08:00
就是说台式机的 CPU 的市场 英特尔已经出局了,还剩下 AMD 和 苹果 CPU 的竞争 ?
minsheng
2020-11-14 10:52:13 +08:00
其实就 A 系列和 X86 性能之争由来已久,令人搞笑的是两套完全相反的理论一直在循环出现,看的我非常难受:

1. 苹果不行,Geekbench 不行,靠的都是专门的 ASIC,若论通用计算 X86 吊打苹果。
2. 苹果也就通用计算能看一点,Intel 可是有高贵的 AVX512 !专业应用全看 SIMD !果必输!

先说 1 。搜一下我的记忆,大约三四年前的时候 Twitter 上已经有人拿当时的 iPad 用 Z3 跑了分,吊打 i7 。Z3 是个什么呢,输入一套逻辑约束,构造一个解满足这些约束,或者告诉你找不到解。这玩意够通用计算了吧?这还是几年前。

看看 Anandtech 的文章,A 系列的 U 在各个参数的堆料上都是压着 Intel 打,发射宽度,乱序窗口,老生常谈的缓存系统……ARM 新的内存模型可以让 A14/M1 的原子操作在没有竞争的情况下比 X86 快一个数量级。这样的例子有很多。前段时间看到的数据大约是 A 系列的 IPC 比 X86 高近一倍,指令多 10%,一个频率 3GHz,一个睿频 5-6GHz (顶级散热了),勉强能打了吧?

然鹅 5-6GHz 是桌面上的情况。MacBook Pro 的散热跑不到那么高的。所以现在的情况就是,单论通用计算,跑跑 JS,MacBook Pro 16/iMac 已经在 Mac 家族要垫底了。

其实 performance per watt 就是性能。现在 CPU 的问题就真的只是散热上不去。不知道你们有没有床上写代码的经历,我的顶配 16,只要不小心挡住出风口,kernel_task 就会疯狂占用 CPU 时间。以至于我最近行成条件反射,听到风扇就会查一下是不是有东西挡我 Mac 了。换了 M 系列,不论是峰值性能,持久性能,还是糟糕散热的性能,都会有显著提升。日常写代码操作还没有独立显卡抢散热。

回到 2,先吐槽下 AVX512:Intel 在执行 AVX512 的时候会自动全 CPU 降频。我记得之前有在某个数据中心的博客上讨论过,假如代码跑在虚拟机上,隔壁邻居跑了个 AVX512……

这玩意真的就完全看你的应用场景,软件适配了。很多人这辈子用的最刺激的应用估计就是某个没写好疯狂重渲染的 React/Vue 了,根本轮不到这类操作。我上半年做了一些简单的深度学习工作,同样的显卡( Titan RTX ),我的代码比学术界的某个库(上层应用,不是底层框架)快了 10 倍,GPU 占用率拉到满,可惜必须用那个库,哎。

比如说你要做矩阵计算,然后手撸了两层循环,那 A14 和 i9 就……很难说了,拼的是编译器。可是苹果又不是没有提供 Accelerate,你用它的矩阵乘法,数据量大了直接帮你放到专门的电路上,压着 X86 打。跑模型也不需要自己拿 C++写个 RNN,用系统 /Tensorflow,专用电路肯定是比 Intel 快得多的。要知道老黄直播带货的时候最喜欢说他的加速卡一个机柜干掉 Intel 一个机房了。

说到底,2 真的没啥好说的,要是你用的专业软件真的就非常 Windows,非常的没有用 GPU,非常的依按照 Intel 优化了自己的 SIMD……那你就继续用呗。我平时写码编译反正没有这个需求。

分享一个优化 ARM SIMD 最后比 Intel 省钱的例子: https://blog.cloudflare.com/neon-is-the-new-black/

最后,感觉 M1 显然是不够大。内存上限,核心数,IO 带宽……这一代只有两个 Thunderbolt 3,很难受。这玩意你不能说苹果搞不出大的,但肯定需要时间,所以就坐着等好了。看看明年的 MBP 16,后年努力一把 Mac Pro 。我自己是买了个 Mac Mini 放公司玩,反正便宜,再不济当个 CI 服务器好了。
xfrgux
2020-11-14 10:55:09 +08:00
@zartouch intel 的版本是在卖,但是 arm 版买回去现在只能当上网办公本,发不发有什么意义呢。另外目前 M1 上的 gpu 还达不到 MBP16 的独显的性能,所以高配版会有更强的芯片,但不代表 M1 cpu 打不过 mbp 上的标压 u,现在单核直接吊打了,多核因为散热原因 intel 8 核只能降到 3Ghz,像 GB5 这种短时间峰值性能测试都不如 M1
Lemeng
2020-11-14 11:01:43 +08:00
主要用途呢
expy
2020-11-14 11:02:32 +08:00
如果实际使用 x264/x265 转码,gcc 编译速度能翻几倍,那必须买买买了。Intel 每代好像就 10%提升。
reus
2020-11-14 11:03:57 +08:00
急什么,过几天,等有人拿到实机了,实际跑一下日常编译、视频编码等等实际负载了,看是不是真的有几倍提升,再考虑也不迟。
反正我是不信这些广告词的。
zartouch
2020-11-14 11:08:41 +08:00
@minsheng 编译器用的什么版本,代码实现是什么。 什么叫红黑树的跑分?做的什么操作,数据集是什么一概没有,你这回复连最基本的程序员的素养都没有就别浪费我的时间了好吧。

况且就算你所谓的什么跑分高吧,这就代表 m1 强于 i9 ?苹果 m1 机器学习模块还吊打 i9 呢,是不是也直接等于 m1 强于 i9 了?还是先提升下专业素养,再来回帖吧。
zartouch
2020-11-14 11:16:48 +08:00
@xfrgux 算了,你要硬要认为 10 多 W 的 U 能打标压我也懒得和你多扯,等过几天测试数据出来就明白了。架构不同,GB5 的跑分我不认为对实际应用有什么意义,几年前 A 系列 U 就各种赶超 intel U,然而有什么用呢? 对 x86 平台的用户而言,你还得看在各自的场景有提升。在后端开发这快,短期内我是不乐观。
charlie21
2020-11-14 11:40:11 +08:00
既然这么牛逼,苹果公司内部怎么不用自产 ARM 芯片的果机替换 X86 果机呢?
denvi
2020-11-14 11:46:36 +08:00
@zartouch M1 实际应用性能如何这几天都会有测试数据,但纸面性能图有了选择看不见?实际应用上 x86 优化得,ARM 优化不得吗?时间问题罢了,即使性能持平,但功耗几倍的优势足以让多数应用行业和公司转向,还是选择看不见。
xfrgux
2020-11-14 11:46:40 +08:00
@zartouch 功耗大就是牛逼? intel 标压移动 u 怎么被 amd 吊打的?而且 M1 全核功耗应该在 20w 左右。2 年前我就用 ffmpeg 测过 a12x 对比 7700hq 视频软解,a12x 就比 7700hq 强了
irelandken
2020-11-14 11:47:58 +08:00
@minsheng 非常专业, 赞同~
denvi
2020-11-14 11:54:23 +08:00
@zartouch 另外,看性能趋势,intel 还不能突破的话,在同功耗或者同价格段的市场里被甩开不是铁定的吗?我对 M1 性能也不抱过高期望,这点和你一致,但我倾向认为不是苹果现阶段做不到,而是市场策略、成本限制、芯片外围如内存和 io 限制还没 /不愿做到很高而已。其中原因我们无法得知,但 cpu gpu 等核心性能上我反而毫不怀疑。
2kCS5c0b0ITXE5k2
2020-11-14 12:06:35 +08:00
@denvi 而且积热问题有没有解决。这是一个问题
denvi
2020-11-14 12:16:20 +08:00
@emeab 积热?苹果就是统一规格用散热来区分产品线,积热是 feature 好吗😂
minsheng
2020-11-14 12:45:42 +08:00
@zartouch

> 编译器用的什么版本,代码实现是什么。 什么叫红黑树的跑分?做的什么操作,数据集是什么一概没有,你这回复连最基本的程序员的素养都没有就别浪费我的时间了好吧。

我说了,你,不服,你用 Swift 写,数据你来生成,操作你来选。你这么缺少探索精神也好意思叫自己程序员?
minsheng
2020-11-14 12:47:07 +08:00
@denvi 说到积热,看前两天 Mini 和 Pro 的 GB 跑分没有 Air 高,非常令人迷惑
Aspector
2020-11-14 12:58:36 +08:00
@blackcatxh 你这个上万也太离谱了。我在 cpu-monkey 找了 53 个 CPU 的 R23 、GB5 单核跑分,linear fit 出来的 R^2 有 0.8277,M1 推算下来 R23 单核分数的 95%置信区间在[1558,1769],按照 DTK 流出 MP Ratio=4.59 ,多核顶破天就 7000 多。当然了我这个也是 xjb 算的,由于没有 ARM 处理器的数据点,dummy 都没法设置,最后 M1 的单核分数出来只有 1400 多也很有可能。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/724846

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX