深度学习 1660s AMP 加速问题

2021-04-20 22:16:27 +08:00
 faller

使用 apex amp 后内存占用下降,但时间是原来的 5 倍, 前 5 耗时如下,切换 O1 O2 会导致其发生变化, 应该?换卡?!

ncalls tottime percall cumtime percall filename:lineno(function)
82 342.244 4.174 342.244 4.174 {method 'item' of 'torch._C._TensorBase' objects}
91411 65.138 0.001 65.138 0.001 {method 'decode' of 'ImagingDecoder' objects}
1280 8.153 0.006 8.153 0.006 {imread}
80 1.464 0.018 1.464 0.018 {method 'run_backward' of 'torch._C._EngineBase' objects}
1280 0.654 0.001 0.654 0.001 {built-in method PIL._imaging.new}
861 次点击
所在节点    问与答
0 条回复

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/772013

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX