结构体作为函数参数/返回值无脑指针效率反而底下?

2018-04-11 22:31:39 +08:00
 MungBeanSoup

最近看到一篇文章

https://segment.com/blog/allocation-efficiency-in-high-performance-go-services/

里面关于指针提到了一点

Copying objects within a cache line is the roughly equivalent to copying a single pointer. 
CPUs move memory between caching layers and main memory on cache lines of constant size. On x86 this is 64 bytes. 
Further, Go uses a technique called Duff ’ s device to make common memory operations like copies very efficient.

大致意思是现代 CPU 从缓存和主存储器之间移动数据存在一个固定的尺寸,即使使用指针也最少会产生这个尺寸的交换.所以函数参数如果是一个不大的结构,使用指针还是拷贝原变量并没有很大的区别.

再加上使用指针的话会导致 Go 把变量逃逸到堆而不是分配在栈上,结果是函数参数使用指针反而效率不如使用拷贝.

看完之后对我之前几乎无脑传入 /返回指针的代码方式产生了很大的 shock

想问一下有关于 CPU 这块策略的学习资料嘛?

1720 次点击
所在节点    Go 编程语言
5 条回复
x86vk
2018-04-11 22:34:00 +08:00
感觉 lz 可以看一看组成原理方面的书
tempdban
2018-04-11 22:44:38 +08:00
Intel® 64 and IA-32 Architectures Software Developer Manuals
你会震惊的
MungBeanSoup
2018-04-11 22:50:20 +08:00
@tempdban
emmmmm...其实最后一句话我斟酌过采用的"学习资料"而不是"文档",这种官方的文档实在是啃不动哎...
buliugu
2018-04-11 22:54:26 +08:00
面向 cpu cache 优化,lz 大概需要去补一下组成
a1717177
2018-04-12 00:50:44 +08:00
CPU 寻址时会从缓存中查找,从一级缓存到二级缓存等,而 CPU 缓存被分割为多个 cache line,cache line 是缓存中最小的单元,寻址时会从内存中将 cache line 大小的内存数据拷贝到 CPU 缓存,再传送到寄存器,应该是这样。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/446068

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX