想用爬虫抓 2TB 的数据,怎么存放比较好呢?

2015-12-04 21:41:30 +08:00
 jin5354
业余练手玩,抓点羞羞的东西 > _ <
主要是图片资源,可以收藏。

手头只有个 256G 的 rmbp 。
打算把脚本放到 VPS 上,数据每爬够 10GB 存一份( VPS 只有 20G 磁盘)。印象中好像百度网盘有 linux 端的包,可以直接调用上传过去。
有没有什么好用的云存储呢?还是说直接买个移动硬盘好了。
求建议~
3286 次点击
所在节点    问与答
15 条回复
crazyyao
2015-12-04 23:07:38 +08:00
msg7086
2015-12-04 23:25:57 +08:00
2TB 并不大啊,用硬盘存吧。
放在网上的东西是不属于你的,特别是没付费的网盘。
sinker
2015-12-04 23:31:08 +08:00
百度盘最大空间 2T 多一点,上传要看数据是否能秒传,不能秒的话国外 vps 传百度云速度比较捉急。但考虑国内从云端下载的速度还是推荐百度云。其实更推荐用个树莓派接个硬盘挂脚本下载。
66CCFF
2015-12-04 23:35:26 +08:00
买个移动硬盘好。
jin5354
2015-12-04 23:40:40 +08:00
好哒,打算买硬盘去咯。
canky
2015-12-05 00:06:31 +08:00
求分享 2TB
yxling
2015-12-05 00:22:48 +08:00
求分享
kslr
2015-12-05 01:39:10 +08:00
我爬了几十万照片才几个 G 你这该多大啊
Marfal
2015-12-05 01:43:44 +08:00
Amazon Cloud Drive 无限容量现在一年只要 5 刀,有 API ,可以在国外 VPS 上跑爬虫,然后上传。
tSQghkfhTtQt9mtd
2015-12-05 12:37:19 +08:00
@sinker 国内从云端下载的速度还是推荐百度云
你确定?百度云非会员没人权啊
sinker
2015-12-05 13:42:06 +08:00
@liwanglin12 aria2+BaiduExporter
tSQghkfhTtQt9mtd
2015-12-05 13:43:04 +08:00
@sinker 没限速么?
sinker
2015-12-05 14:26:15 +08:00
@liwanglin12 有的话我也不会提了。想了解详情自己去项目主页看吧
herozzm
2015-12-05 15:11:14 +08:00
自己配一个 nas ,用脚本定时从 vps 下载到 nas 中,然后 vps 上定时删除
jin5354
2015-12-06 00:03:39 +08:00
@kslr 大概七十多万本,每本 5-500 张图片不等。。。而且只是普通清晰度的 jpg 格式

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/241244

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX