13T 的文件:近千万个几兆的小文件,在两台服务器之间备份同步,最好的方法是?

2019-06-13 08:35:54 +08:00
 kisshere

近千万个几百 K~几兆的小文件,目录存放是以 MD5 分割出来的四级目录,形如:/static/ac/bd/ef/blahblah.zip ,并且每天文件数量以几百个的增加,目前想要实时备份此服务器的数据:

  1. 看中了一台 4x12T 的服务器,想把生产环境和数据全部转移到这上面去,做 RAID10,我都不用考虑两台服务器同步备份的软件了,有硬盘坏了直接替换上去是不是就 OK 了,美滋滋
  2. rsync+inotify 对这种海量数据备份效果如何,新增一个文件,可不可以做到不扫描全部的“ static ”文件夹?立马将主服务器的该文件传输至备份服务器。有没有更好的专门针对这种海量数据备份软件?

先谢为敬

9847 次点击
所在节点    程序员
49 条回复
hugee
2019-06-13 16:38:28 +08:00
按天存储多好啊
jaskle
2019-06-13 20:49:54 +08:00
git,很好用
glfpes
2019-06-13 22:06:13 +08:00
lsyncd,更简单的 rsync+inotify
glfpes
2019-06-13 22:07:09 +08:00
@glfpes 支持正则配置哪些想同步
AlloVince
2019-06-13 23:19:27 +08:00
@zelin44913 Cloud Sync 在文件数百万级别就已经不好使了
mattx
2019-06-19 18:17:40 +08:00
@ldrljq 有没有对应的资料可以查看的?
ldrljq
2019-06-20 10:21:09 +08:00
@mattx 不同厂家的技术都是不一样的,比如 Netapp 叫 SnapMirror,不过总体来说都是镜像数据,主要是用于数据迁移以及备份和恢复。
mattx
2019-06-20 11:06:57 +08:00
@ldrljq #47 有没有用这个做 数据中心内部强一致备份的,做到可以随时切换。
ldrljq
2019-06-20 14:03:08 +08:00
@mattx 有的,基本所有存储厂商都有这种解决方案,双活甚至多活,完全镜像数据,可以跨楼宇甚至城市实现异地容灾,不过是另外一套技术了。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/573415

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX