帮一个朋友写爬虫爬东西。
数据库和文件系统中都要存。
单个文件都很小,但数量有接近70-80万,总大小有20多G。
放在服务器爬了5天,爬完了,发现很多数据库中有的条目,在文件系统中并不存在。
找原因才发现是inode用完了,TAT。Google后发现,ext3好像默认16K分配一个inode,挂载的磁盘是40G(ext3),所以最大可用的inode大概是2600000左右个。但关键在于文件一般都小于16K,所以把inode耗完了...
目前有一种解决方法是格式化EXT3,格式化的同时指定每4K分配一个inode,这样就把最大可用的inode数量扩大到4倍。
但往长远看,感觉EXT3还是不太适合这种场景,所以求推荐一种适合海量存储小文件的文件系统。
谢谢。
数据库和文件系统中都要存。
单个文件都很小,但数量有接近70-80万,总大小有20多G。
放在服务器爬了5天,爬完了,发现很多数据库中有的条目,在文件系统中并不存在。
找原因才发现是inode用完了,TAT。Google后发现,ext3好像默认16K分配一个inode,挂载的磁盘是40G(ext3),所以最大可用的inode大概是2600000左右个。但关键在于文件一般都小于16K,所以把inode耗完了...
目前有一种解决方法是格式化EXT3,格式化的同时指定每4K分配一个inode,这样就把最大可用的inode数量扩大到4倍。
但往长远看,感觉EXT3还是不太适合这种场景,所以求推荐一种适合海量存储小文件的文件系统。
谢谢。