使用递归计算fibonacci测试c,java,go的性能,意外出现了!!!

2012-09-28 12:45:51 +08:00
 guotie
测试环境:
centos liinux 64位
gcc 4.4.4
go 1.0.3
java:
java version "1.7.0_05-icedtea"
OpenJDK Runtime Environment (rhel-2.2.1.el6_3-x86_64)
OpenJDK 64-Bit Server VM (build 23.0-b21, mixed mode)

计算fibonacci的代码用的这里的代码:
http://fengmk2.github.com/blog/2011/fibonacci/nodejs-python-php-ruby-lua.html

c,go,java计算的结果如下:
java:
real 0m1.233s
user 0m1.220s
sys 0m0.019s

go:
real 0m1.719s
user 0m1.718s
sys 0m0.001s

c:
real 0m1.762s
user 0m1.760s
sys 0m0.001s

运行速度竟然是java > go > c

c编译的时候,还是用-O2编译的啊!
7392 次点击
所在节点    编程
26 条回复
guotie
2012-09-28 12:47:11 +08:00
补充一点,当把c的递归算法改成非递归时,执行时间不到0.001s,为什么c的递归这么慢?!
hu437
2012-09-28 13:45:49 +08:00
java的编译器有优化,一般的情况下java虚拟机优化的代码,性能还是很高的
Js
2012-09-28 13:57:40 +08:00
c那个加个inline试试
fanzeyi
2012-09-28 14:15:10 +08:00
这是一个典型的陷阱啊

非递归的算法大概是 O(n) 的…… 递归的版本大概是 O(n^2) 的. 明显不能这么看.
clowwindy
2012-09-28 14:26:38 +08:00
C 加个 inline 之后:

$ gcc -O2 -s test.c && time ./a.out
102334155

real 0m0.679s
user 0m0.678s
sys 0m0.001s

$ gcc -O2 -fno-optimize-sibling-calls -s test.c && time ./a.out
102334155

real 0m0.337s
user 0m0.335s
sys 0m0.001s

$ time java test
102334155

real 0m0.524s
user 0m0.535s
sys 0m0.017s
bulldozer
2012-09-28 14:31:58 +08:00
毫秒级别的,估计差异主要是系统如何载入程序,而不是语言跑的速度。
fanzeyi
2012-09-28 14:35:37 +08:00
http://gist.github.com/3798284

Java 可敢一战?
fanzeyi
2012-09-28 14:37:33 +08:00
算 99999999 次 fibonacci(40) 用了 0.28s ..... PS 一样是递归
clowwindy
2012-09-28 14:44:56 +08:00
打开或关闭 -fno-optimize-sibling-calls 开关,两种不同的优化方式,导致速度相差一倍以上,一种比 JVM 快,一种比 JVM 慢。

https://gist.github.com/3798298
aligo
2012-09-28 14:49:16 +08:00
@fanzeyi 本来从昨天晚上搞那个东西到现在,脑袋涨得很大,你给我发来这个太治愈了

哈哈哈,太萌了XD
clowwindy
2012-09-28 14:52:22 +08:00
@fanzeyi

连你的错误一起 copy 了……

http://gist.github.com/3798325
fanzeyi
2012-09-28 14:54:01 +08:00
@clowwindy 郁闷…… 本来是想把 printf 去掉的…… 我改过了
guotie
2012-09-28 14:54:16 +08:00
@bulldozer 不是
用一个稍微比40大的数来验证,例如45,结果会更明显。
guotie
2012-09-28 14:58:16 +08:00
c版本,gcc仅用-O来编译的版本是最快的,计算45 时,快了40%
keakon
2012-09-28 15:01:18 +08:00
这个以前反编译过,GCC -O2直接把函数展开了几层,所以计算量少了很多。JIT估计也会这样作弊。

说真的这样测性能很不靠谱,学了汇编就知道,函数调用没啥可优化的,CPU指令都一样,再想快点只能不当成函数调用。
clowwindy
2012-09-28 15:01:58 +08:00
@fanzeyi

fibonacci 的 divide and conquer 算法通常是用来演示 divide and conquer 的 bad case 的……我想原文作者拿它作为测试不同语言的一个有趣的方法再合适不过了
fanzeyi
2012-09-28 15:05:41 +08:00
@clowwindy gcc 对于这样的 bad case 优化无力啊…… 所以会导致这个测试的不公平……
guotie
2012-09-28 15:06:07 +08:00
还有一点,
go编译出来的文件很大,有1.5M,c编译的版本约6~8k,java的版本700多个字节。
clowwindy
2012-09-28 15:11:12 +08:00
@fanzeyi 看我 5 楼的结果,gcc O2 + no-optimize-sibling-calls 比 jvm 快。对这个递归,就相当于是遇到了 optimize-sibling-calls 的 bad case 了……
lldong
2012-09-28 17:33:50 +08:00
用clang编译C看看,clang貌似已经支持尾递归优化了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/48917

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX