cuDNN：基于 GPU 的卷积神经网络计算库

近年来深度学习领域的突破与计算能力的进步是分不开的，如何更快的处理更大的数据也是我们需要关注的对象。既然是大规模的计算，GPU 的使用也就顺利成章。下图是这几年来 GPU 在 ILSVRC 中的应用比例：

如何快速在 GPU 上开发深度学习的应用呢？一个简单的方法就是使用 cuDNN 这个计算库。通过将卷积神经网络的计算变换为更加规则的（GPU友好的）矩阵乘法运算，cuDNN 可以有效提高整个网络的训练速度：

Caffe 的 CPU 和 GPU 实现与 cuDNN 的性能比较：

参考：
cuDNN 可以从这里下载: https://developer.nvidia.com/cuDNN
一篇更详细的介绍: http://arxiv.org/abs/1410.0759

P.S. 最近我们组在进一步优化 cuDNN，通过应用 Direct Convolution，最多可以达到 90% 的 GPU 利用率，有兴趣的同学可以关注今年 GTC 上的相关 Talk。

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/171610

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.