半路出家的 IT 请教一下服务器读取性能该怎么优化

佬们好，我是一个影视行业的从业工作者。喜欢在家捯饬一些 linux 的东西。
最近公司有钱买了一台华为 2288H ，64G 内存，10 核 CPU ，一张 SR430 阵列卡。装了 unbuntu 18.04
我因为是最熟悉这方面的人，就被临危受命拉过去调试阵列储存什么的事情。

公司内部是万兆网的架构
网络拓扑图大概是这个样子

光猫
|
华硕 AX86U
|
1.一台 24 口千兆 RJ45 ，2SFP+交换机 - 用多模光模块多模线连接到服务器 SFP+1 号光口
2.一台 8 口万兆 RJ45 交换机 - 用 cat7 ，转接成光口连接服务器 SFP+ 2 号光口

硬盘选用的是 16TB 的西数黑盘，做了一个 R0 缓存盘给剪辑用。

客户端是 windows10 ，网卡是 TL-NT521 单口万兆 RJ45 ，M2 硬盘

经过实测，客户端向 M2 传输数据可以跑满 600MB/s 的速度。
但是从 R0 的机械盘读取数据的时候只有 160MB/s 的速度。

我一度以为这是机械盘在 R0 的时候，随机读取性能过差造成的。

但是似乎也太慢了。

所以特地来这里请教一下各位大神，这个情况正常么？
如果可能的话，这个体系还有没有可能优化？
R0 的阵列是缓存盘。里面的数据都无所谓。所以把这个 R0 格掉也是可以的。
我的目标速度是大文件 400MB/s 的读取速度。希望能给同事在服务器上 4K 剪辑的可能性。

再次感谢能进来看帖子的你，十分感谢

ccde8259

2021-12-03 12:33:02 +08:00

先 dd 确认一下速率
有可能是网络协议开销
整存储前考虑过其他方案吗？
硬阵列方案优缺点？
阵列级别带来的容灾能力差异？
软阵列方案优缺点？
阵列校验开销能不能 cover ？
ZFS/GlusterFS/Ceph 方案优缺点？
发生阵列降级以后怎么处理？
磁盘真的是越大越好吗？

lovejunjie1

2021-12-03 12:47:03 +08:00

@ccde8259 感谢回复
1.网络协议的开销方向我尝试做一下调查，感谢指导方向
2.考虑过 SSD 直通，因为费用开销的问题可能要延后才能实施了。并且因为钱的问题，没能上支持 SSD 阵列的卡。
3.硬阵列可以节省一些服务器性能的开销。因为服务器上我还跑着几个虚拟机。这是我选择硬阵列的理由之一。
4.这组 R0 阵列的内容是缓存内容。我会监控硬盘健康状态。在发生无法挽回的事情之前会转移数据。即使因为突发情况数据丢失，也可以通过另一组 R1 恢复数据。或者重新生产数据。耽误两三天的时间，是我们可以容忍的。
5.软阵列因为没有接触过。所以对他的了解并不充分。
6.感谢提供了几个方案的研究方向，我会一一搜索的。
7.我这边数据有 4 个备份。工作盘>成果盘>冷备份>个人硬盘备份。充分考虑了容灾措施。
8.是的。影视行业是重数据，一个文件 1G 还是很常见的。10 分钟的解算缓存，按照每 0.5 帧一个缓存文件的共极端情况计算。需要 28,800 帧，每帧平均 800MB ，需要约 20T 左右容量。

lovejunjie1

2021-12-03 12:54:44 +08:00

@ccde8259 测试了一下读取速度，512MB 。这个速度很理想
root@nas:~$ sudo time dd if=/dev/sdb of=/dev/null bs=4k
^C 记录了 2213858+0 的读入
记录了 2213857+0 的写出
9067958272 bytes (9.1 GB, 8.4 GiB) copied, 17.7102 s, 512 MB/s
Command terminated by signal 2
0.42user 5.75system 0:17.71elapsed 34%CPU (0avgtext+0avgdata 2452maxresident)k
17711520inputs+0outputs (1major+88minor)pagefaults 0swaps

ccde8259

2021-12-03 13:01:08 +08:00

@lovejunjie1
大致就是不考虑容灾，只考虑性能对吧。
双 16T 和 4 块 8T 甚至 8 块 4T 构筑 R0 阵列，对于吞吐量问题上会带来什么差异？
读写场景是读多还是写多？
读写场景是顺序读写还是随机读写多？
不妨看下硬阵列卡是否有缓存？是否有缓存配置优化空间？
软硬阵列在缓存层面的差异能带来什么样不同的优劣势？

ccde8259

2021-12-03 13:06:22 +08:00

@lovejunjie1
那现阶段问题基本就是网络协议开销问题，至少本地 dd 性能没出问题。
一方面 iperf3 打一下带宽，是否需要修改 MTU ？
一方面猜你用的 SMB 协议，是否有其他协议可以使用？ NFS FTP WebDAV ？

lovejunjie1

2021-12-03 13:16:02 +08:00

@ccde8259 感谢，不愧是神佬。经验丰富。我也是疏忽了忘记告知是 SMB 协议。
我尝试一下 iperf3 。等会吃完午餐把数据发上来。
SMB 协议是我用的比较熟悉的。趁着午饭我也把这三个稍微摸一下。
回 7 楼的疑问：
是的，只考虑性能就可以。
1.目前服务器上 3.5 寸口的 slot 已经基本上告罄，没有硬盘也没有 slot 来测试这个问题了。
2.读写都比较多，我把这块视作一个公共的网络缓存。
3.大概是随机读写会比较多。目前已有的序列帧，单文件 15MB 到 50MB 居多，一次缓存任务，读取 200 到 600 个左右。
4.好的，我去咨询一下。这里或许是有优化的空间的。
5.这个点我还需要继续做一些调查。以我目前的知识储备还需要一些时间才能作答……

lovejunjie1

2021-12-03 13:19:51 +08:00

@choury 额。伪装成 IO 的话，似乎就重现了我之前的问题

me@nas:~$ sudo time dd if=/dev/sdb of=/dev/null bs=4k iflag=direct
[sudo] huawei 的密码：
^C 记录了 1353482+0 的读入
记录了 1353481+0 的写出
5543858176 bytes (5.5 GB, 5.2 GiB) copied, 37.218 s, 149 MB/s
Command terminated by signal 2
0.34user 4.82system 0:37.23elapsed 13%CPU (0avgtext+0avgdata 2344maxresident)k
10827880inputs+0outputs (1major+86minor)pagefaults 0swaps

gam2046

2021-12-03 13:29:29 +08:00

我也使用了 RH2288 V2 ，LSI 2288 的 RAID 卡，如果是单盘的话，RAID 配置时，可以选择读写操作都通过缓存，也许有所提升。

至于协议层看应用场景，如果需要经常读取某个大文件中的一部分，而不是全部，建议通过 iSCSI 共享。
如果是大量小文件的读取，iSCSI 和 NFS 都可以考虑。
如果是读写体积完整文件，则各种共享方式差距不明显（都在可接受范围内）。

lovejunjie1

2021-12-03 15:56:50 +08:00

@gam2046 中午调查服务器 bios 和设备管理器的时候。看到了我这边有 iSCSI 的字样。这个似乎是一个硬件的 iSCSI 设备？看来可以尝试一下这个了。
@CallMeReznov 目前 read cache policy 是 read ahead, dirver cache 是 unchanged.中午把 IO 项从直连 direct 改成缓存 cached 了。目前还在试

lovejunjie1

2021-12-03 15:59:39 +08:00

喜报。打开缓存之后，并把 MTU 设置为 9000 后，有了 10%的性能提升
^C 记录了 301749+0 的读入
记录了 301748+0 的写出
1235959808 bytes (1.2 GB, 1.2 GiB) copied, 7.61762 s, 162 MB/s
Command terminated by signal 2
0.05user 1.06system 0:07.61elapsed 14%CPU (0avgtext+0avgdata 2384maxresident)k
2414144inputs+0outputs (1major+87minor)pagefaults 0swaps

lovejunjie1

2021-12-03 16:04:28 +08:00

@ccde8259 我现在十分怀疑是我的网络配置出现了问题，dd 模拟 IO 的情况下和我实际使用中的情况是一直的。

iperf3 相关的数据目前没有条件做，我这边可以让我拿来测试的只有一台 linux 服务器，另一台万兆 win10 机器时不时会有人使用。

其他协议我中午也摸过了一圈。NFS 或者 iSCSI 可能会纳入选择。但是因为用户的习惯，现在 SMB 依然是首选。

gam2046

2021-12-03 16:10:20 +08:00

@lovejunjie1 #15 iSCSI 并不需要硬件支持，纯软件方案，而且 iSCSI 挂载后访问与本地磁盘一致，由于是挂载的块设备，因此兼容性上远比其他文件挂载（ NFS/SMB/WebDAV/etc...）的好，如果文件比较打，可以适当调高 MTU 。

同时 Linux 、Windows 作为访问的客户端都支持的比较完备。如果 macos 的话...我猜应该也还不错吧，主要是自己没有 macos 设备

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/819759

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.