求推荐云盘或其他方案用于分享数据集(2T)

154 天前
 xyyandxyy

学术工作需要开源对应的数据集,大小约 2T, 但不到 2T. 需要让其他使用者下载.

这个数据集开源后应该国内外都要可以下载, 国内计划直接用百度网盘(SVIP 过期后文件好像还是可以继续分享下载). 国外的话求大佬们推荐!

希望:

目前考虑提供国外下载服务的方式:

求大佬推荐!

2988 次点击
所在节点    问与答
26 条回复
gaobh
153 天前
cf 的 r2 不行么,接上 cdn 我记得是免费的吧
NewHere
153 天前
自己有服务器的话,放在服务器上就好了,弄一下 http 服务放在实验室网站上提供下别人下载
xyyandxyy
153 天前
是这样的...

主要是组内一般只维护一个静态的官网, 对外开放的存储还没有人来做, 要做也得抓其他同学(会维护且愿意做的同学不多)或自己来做, 整个流程更麻烦(因为还要去和管理的老师对接), 不如我在自己的服务器上写一个.

我们领域有一些数据集是如佬所说的附属 edu/ac 机构页面, 也是比较大的数据集, 但是时间久了(5 年往上), 很多也断了维护, 或者是下载速度龟速. 也基本是靠社区分享才能获取. 确实审核也就维持个前一段时间的几年, 之后就不在了...

所以综合时间和精力成本还是自己来研究下... 寄希望能少折腾点. 数据集还是有价值的, 我希望能送到需要的研究者手上, 减少他们去翻找的痛苦. 但是大组可能确实不 care, 每年三大会一堆, 不差我一个小小数据集.
xyyandxyy
153 天前
@gaobh 谢谢佬, 从你这才知道 cf 有这个, 看了一下好像我的数据这么大还是要比较高的费用的, 但是 mark 了!
@xianghaolin 嗯嗯我看了一下确实是

@NewHere 没有公网 IP 呜呜

@NSAgold
@IvanLi127
@XiLingHost
谢谢佬的建议! mark 了!
yufeng0681
152 天前
@XiLingHost #18 这样的规则还不够细化,群主开一台机器成本也不低。 最好是弄成好几个地方的电脑不用关,或者说不会一起关的形态。 保证随时能下载到
nakroy
71 天前
既然都开源了,那可以放在 huggingface 上,国内可以用同步的镜像站 hf-mirror.com 下载,很适合直接在服务器上用 huggingface-cli 命令行直接下载

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1060465

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX