1
yangqi May 6, 2017
|
3
denghongcai May 6, 2017
|
4
denghongcai May 6, 2017
循环次数这么一点点就不要搞 OpenMP 了
|
5
aliipay OP @yangqi
gcc version 4.8.5 20150623 warning: ignoring #pragma omp parallel [-Wunknown-pragmas] 我单独编译一个 demo 是正常的 加入到现有工程就报这个警告 |
6
Fishdrowned May 6, 2017 via Android
|
7
aliipay OP @Fishdrowned
这个试过了,能提高 10%左右 |
8
zk8802 May 6, 2017 via iPhone
开启优化之后,编译器应该可以自动进行 loop unrolling 的。你编译之后的汇编代码长什么样?
|
9
zwzmzd May 6, 2017 via iPhone
|
10
billlee May 6, 2017
你编译的时候加了 -march=native 吗?
|
11
aliipay OP @billlee 每加,加了更慢
现在用的是-fprefetch-loop-arrays -g -ggdb -D__USE_ISOC99 -DNDEBUG -Ofast -fPIC -Wall -std=c++11 |
12
linux40 May 7, 2017 via Android
不考虑 memcpy 吗
|
14
linux40 May 7, 2017 via Android
不考虑 restrict 吗
|