@
CloudRaft 专业术语我不太懂,比如读写一致性。
我按照我实际使用场景来描述。
数据运算过程中,最多同时又 72 个进程对读写缓存进行读写,但是这 72 个读写进程相互独立,不需要访问其他任何一个进程写的数据。 纯粹的已经算完的占用空间,导致后来算完的没有地方存放。
现在修改了以下控制脚本,任何一个计算,算完毕后,就地提取数据,而后就拿走。
这样操作之后,空间问题基本解决了。
RAID0 的可靠性问题,可以忽略不计。
我的场景中,仅仅用于读写缓存。
当然也可能涉及,比如 A 机器的读写放在本地的 RAID0 阵列; B 机器的读写放在其本地的 RAID0 阵列。
对,最开始就是每个机器都有本地读写。
后来也面临一个实际的问题,
如果要“续算”,我用到的计算程序,需要知道之前运行用过的原始路径。
而后续的计算,负责计算的机器,未必是同一个(由 slurm 负责分派机器),
所以就拿到共享的读写空间了。
不过稍微变通一下思路,暂时解决问题了。
感谢各位提供思路,我也借鉴了部分灵感。 多谢多谢。