没学过强化学习,现在 M1 训练性能已经这么强了吗?

2021-07-03 11:21:51 +08:00
 paopjian
https://zhuanlan.zhihu.com/p/384531874
按作者的理论,M1 已经吊打 V100 了,10%价格获取 200%性能,简直离谱
2698 次点击
所在节点    问与答
9 条回复
microyu
2021-07-03 11:39:27 +08:00
真有这么强吗?做强化学习的表示心动了
dayeye2006199
2021-07-03 13:39:52 +08:00
这得放个代码 peer review 一下才好,否则有种搞个大新闻的感觉。
有些简单的算法训练,GPU 构不成性能瓶颈,V100 这么大的显存都是空置,这时候再去比较谁训练快没啥意义。
takato
2021-07-03 14:00:24 +08:00
取决于任务,有些任务是 env 密集,会使用更多的 CPU,这种情况下主要瓶颈的确在于把数据从内存放进显存的过程。。

还是看用来干嘛。。
Issacx
2021-07-03 14:22:14 +08:00
文章说得很含糊,听起来是因为内存在 M1 内减小了 CPU 和 GPU 的通讯开销导致采样速度提升。不太懂 PPO 的细节,这是一个具体的模型还是优化框架?猜测可能是网络比较小,GPU 提升不明显。
felixcode
2021-07-03 14:30:09 +08:00
不放出用例,就放个结果,无法重现,不像是专业从业者的做事水准。
microyu
2021-07-03 14:43:42 +08:00
PPO 是一个算法,网络只有几层全连接层,GPU 确实不是瓶颈,主要还是和环境交互开销比较大
Cielsky
2021-07-03 14:48:45 +08:00
发这种文章,不如跑几个模型说服力高
ZRS
2021-07-04 13:22:43 +08:00
特殊场景而已,也就 RL 可以这么玩
ZRS
2021-07-04 13:26:11 +08:00
不过他这里提到的使用 Thunderbolt 互联,应该只能以万兆以太网模式来跑,达不到设备间 40Gbps 的

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/787271

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX