HDFS 的 RAM DISK 和普通 HDD 上传速度经测试区别不大,是哪环节做错了吗?

2020-04-14 19:32:16 +08:00
 cernard

测试环境:

  1. 1 个 namenode,2 个 datanode (其中一个 datanode 和 namenode 一台机器)
  2. RAM DISK 最大大小理论上配置的是 20G

测试方法:

  1. Python 生成 1K~10G 的若干个 CSV 文件,每个文件上传 10 次,每次上传完毕后删除。
  2. 统计每个大小文件的 10 次上传平均时间

测试结果: RAM DISK 和 HDD 几乎没有速度上的区别,只有几秒的差异。

请问下造成这个结果的可能性有哪些?

1047 次点击
所在节点    问与答
6 条回复
cernard
2020-04-14 20:38:51 +08:00
忘了说了,是写入速度
OSDI
2020-04-14 20:48:59 +08:00
网络带宽多少呢
Aruforce
2020-04-14 21:06:15 +08:00
带宽小于硬盘的读写速度…?
cernard
2020-04-14 21:47:55 +08:00
@OSDI #2
@Aruforce #3 局域网百兆带宽,暂时接的路由器
OSDI
2020-04-15 01:54:11 +08:00
@cernard 是不是由单个节点发起的 I/O 测试?可以尝试多个节点并发 I/O
Aruforce
2020-04-15 16:58:44 +08:00
@cernard 机械硬盘的读写速度 几乎没见过 100Mbyte/S 以下的 局域网的才 100Mbits/S....你换个 1000mbits 的网络吧

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/662396

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX