关于哪种语言速度执行速度最快，画了张图表，顺带吐槽

起因：昨天论坛老哥分享 Python 性能提升计划，其中一些涉及性能的讨论，27 楼老哥自己画了个图表看起来挺不错的。原贴链接

我个人是因为对 python 性能提升很感兴趣，对其他语言的语言性能比较也很感兴趣，有大版本更新的时候都会搞一些简单算法看看到底快了多少。这回看到这个老哥的图感觉挺不错的，该老哥称自己定期爬取 the benchmarks ganme 画出来的图，我感觉不如直接搞成一个自动维护项目，以后也省得手贱再自己动手跑了。

鼓捣了一下，大概思路就是基于 github 的分发特性，一个图片链接可以一直保持在最新数据，然后我在原版数据的基础上添加了两个 python 的 jit 解释器（ pypy 和 pyston ），最后结果如下：

数据来源 https://benchmarksgame-team.pages.debian.net/benchmarksgame/index.html

=====================

几点说明：

1 、语言性能讨论一直是引战话题，我不是很理解为什么有人会在这个问题上被摸到 G 点，为了避免被喷，我先声明我这个不是严谨性能测试，只是基于开源跑分的爬虫并绘制图表而已。这个项目产生的原因是希望为需要的人提供一些定性结论（或者是定性结论的参考，毕竟它有可能不准），而不是严谨的定量结论。

2 、以前虽然跟别人讨论经常引用 the benchmarks game 的结论，但从来没仔细研究过这个网站。这次顺带仔细看了一下算法，我觉得它这些设计有几个可能本身也并不严谨。本身对比语言性能就是很难设计的一件事，理解。

3 、我在做这张图表的时候遇到一个统计学问题，由于一张图里要汇总多项测试的平均水平，一个最简单的想法是求平均耗时。但是需要考虑到一种极端情况就是，假设大部分测试都以非常短的耗时（比如 10 秒以内）完成，而个别测试极端情况的项目的总体时间消耗都很高（比如超过 600 秒），那么如果单纯做加和的话，整体的平均值会很大程度上取决于这个极端情况的结果，而削减了其他项目的影响力，为了避免这种情况发生，需要对数据加权。

我的方案是采用了如下图所示的运算得到最终结果，其中σ是方差，L 是常数，V 代表输出值。

大体思路就是，当一个项目整体测试时间较长的时候，我们会略微削弱这个项目的权重，让他不要影响那么大。同时考虑到如果用离散度描述整体测试时间的跨度，方差的比例差可能是一个非常大的数，所以需要进行某种压限，以确保权重最低的项目不会比权重最高的项目低出太多。算法是拍脑袋想的，有兴趣的欢迎看源码，或提意见。

4 、the benchmarks game 这个网站算是比较熟了，隔一段时间总会看到，但是说实话这次跑出来比例挺多反常识的，大概有以下几点：

Java 比 Go 快，而且领先幅度不小。
Go 和 javascript 速度居然差不多。
Python 比 Ruby 快，而且领先还有一定幅度，我印象中最近一两年听说的都是 ruby 比 python 快一丢丢。
Pypy 出乎意料的慢，打破固有印象。我印象中 Pypy 不会比 java 慢出 8 倍。
c++和 c 的差距比我想想中大很多，倒是 rust 确实符合印象，也许逐渐蚕食 c++的市场也是必然。

我后面手动检查了一下数据，应该不是我写错了，确实测试结果加权平均算下来就是这样的，可能是由于这个跑分本身也没那么严谨，或者是特定语言在一些大量使用场景（比如正则）有让效率接近原生级的优化所导致的。