CUDA 里面,一个 SM 里面的不同 block,是不能共享 shared memory 的吗?

2022-10-31 21:53:03 +08:00
 movq

假设一个 SM 有 40K 的 shared memory ,然后能运行 4 个 block ,那么

  1. 是不是说每个 block 最多用 10K ?

  2. 是不是然后这些 block 用的 shared memory 都是对彼此不可见的?

1141 次点击
所在节点    程序员
2 条回复
leimao
2022-10-31 23:01:53 +08:00
不同 block 不能共享
有可能可以使用更大的 shared memory
https://leimao.github.io/blog/CUDA-Shared-Memory-Capacity/
leimao
2022-10-31 23:06:15 +08:00
另外 SM 的分配不是由你直接决定的,得看系统资源
https://leimao.github.io/blog/CUDA-Occupancy-Calculation/

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/891591

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX