结构体作为函数参数/返回值无脑指针效率反而底下?

2018-04-11 22:31:39 +08:00

MungBeanSoup

最近看到一篇文章

https://segment.com/blog/allocation-efficiency-in-high-performance-go-services/

里面关于指针提到了一点

Copying objects within a cache line is the roughly equivalent to copying a single pointer. 
CPUs move memory between caching layers and main memory on cache lines of constant size. On x86 this is 64 bytes. 
Further, Go uses a technique called Duff ’ s device to make common memory operations like copies very efficient.

大致意思是现代 CPU 从缓存和主存储器之间移动数据存在一个固定的尺寸,即使使用指针也最少会产生这个尺寸的交换.所以函数参数如果是一个不大的结构,使用指针还是拷贝原变量并没有很大的区别.

再加上使用指针的话会导致 Go 把变量逃逸到堆而不是分配在栈上,结果是函数参数使用指针反而效率不如使用拷贝.

看完之后对我之前几乎无脑传入 /返回指针的代码方式产生了很大的 shock

想问一下有关于 CPU 这块策略的学习资料嘛?

1763 次点击

所在节点

Go 编程语言

Go 编程语言

5 条回复

x86vk

2018-04-11 22:34:00 +08:00

感觉 lz 可以看一看组成原理方面的书

tempdban

2018-04-11 22:44:38 +08:00

Intel® 64 and IA-32 Architectures Software Developer Manuals
你会震惊的

MungBeanSoup

2018-04-11 22:50:20 +08:00

@tempdban
emmmmm...其实最后一句话我斟酌过采用的"学习资料"而不是"文档",这种官方的文档实在是啃不动哎...

buliugu

2018-04-11 22:54:26 +08:00

面向 cpu cache 优化，lz 大概需要去补一下组成

a1717177

2018-04-12 00:50:44 +08:00

CPU 寻址时会从缓存中查找，从一级缓存到二级缓存等，而 CPU 缓存被分割为多个 cache line，cache line 是缓存中最小的单元，寻址时会从内存中将 cache line 大小的内存数据拷贝到 CPU 缓存，再传送到寄存器，应该是这样。

第 1 页／共 1 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/446068

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX