V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Recommended Services
Amazon Web Services
LeanCloud
New Relic
ClearDB
pc10201
V2EX  ›  云计算

海量数据回国方案

  •  
  •   pc10201 · 2 天前 · 7148 次点击

    海量数据存在 cloudflare r2 对象存储中,要回传到国内阿里云、腾讯云等对象存储 每个月的量挺大,差不多 5-10PB ,有量大管饱的便宜的拉取方案吗?

    预算每个月几千美金

    目前想到方案是买一批不限流量的 G 口服务或一堆小的 vps

    第 1 条附言  ·  1 天前
    拿一个美国独服做了一下测试,普通线路
    1G 的独立带宽,回传速度只有几百 K 到几 M
    所以普通线路的大带宽独服是不行的
    78 条回复    2026-02-03 19:55:38 +08:00
    MFWT
        1
    MFWT  
       2 天前   ❤️ 3
    这样的数据量,建议还是物理寄送存储设备比较好
    yjsdaniel
        2
    yjsdaniel  
       2 天前
    肉身搬运的带宽更大。
    kidtx
        3
    kidtx  
       2 天前 via iPhone
    物理吧 虽然写的不限量 但是 pb 级的很可能违反 tos 被干
    wujinyiwjy
        4
    wujinyiwjy  
       2 天前 via iPhone   ❤️ 1
    老哥咱这边要是考虑代理商的资源的话 可以看看我主页帖子还有联系方式的呀 可以给咱这边出个方案聊聊看的呢 折扣也给咱这边尽量争取
    mytsing520
        5
    mytsing520  
    PRO
       2 天前
    建议在阿里或腾讯开工单咨询

    虽然物理寄送比较好,但是 CloudFlare 的话,还真没遇到过
    zyq2280539
        6
    zyq2280539  
       2 天前
    都 PB 级别买大容量硬盘发快递回国吧。
    chen88ijn
        7
    chen88ijn  
       2 天前 via iPhone
    这么多资源吗
    KenGe
        8
    KenGe  
       2 天前
    如果你要跑 5PB/月,你至少需要准备 20Gbps 的国际互联带宽。

    如果你要跑 10PB/月,则需要 40Gbps 甚至更高的国际互联带宽储备。

    可以留个联系方式讨论下方案?
    dianso
        9
    dianso  
       2 天前
    邮寄硬盘,但是花费也不小,我之前有 188TP 的数据。
    走的是 CF 的企业通道。
    就是当时联系的中国客服,开的 3000 刀的 CDN 服务,可以用中国区。
    然后慢慢下载。
    pc10201
        10
    pc10201  
    OP
       2 天前
    @KenGe 你可以留一个地球号
    fortytwo
        11
    fortytwo  
       2 天前
    物理寄送最便宜了
    Oni
        12
    Oni  
       2 天前
    这个量能把很多商家的大陆方向口子直接打满
    bugcoder
        13
    bugcoder  
       2 天前
    几千美金可以头等舱来回
    rb6221
        14
    rb6221  
       2 天前
    不 er ,你这种量的跨国数据传输,不会被信息安全部门审查吗?就算是肉身搬运,不用经历各种漫长的审批渠道吗?
    folnet
        15
    folnet  
       2 天前
    拉条专线到本地腾讯云
    allplay
        16
    allplay  
       2 天前
    这也算是月经贴吧。每次这种月经贴写都会有人告诉你:物理搬运
    fstab
        17
    fstab  
       2 天前
    @allplay #16 肉身带硬盘,数据离境的安全问题,硬盘托运的风险一点也不提,
    而且这么多硬盘数据离境,美国国土安全是一点都不审查???我不信。

    还不如 9 楼的建议,慢慢下载就行了。
    sayyiku
        18
    sayyiku  
       2 天前
    直接开对应云的工单之类的,让他们给你取回,像阿里和 cf 是数据联盟。你这么大量他们有单独的方案
    realpg
        19
    realpg  
    PRO
       2 天前
    这个预算 2PB 没啥问题 再往上不是技术原因 是管理成本暴增

    之前搞过的不是 CF R2 是 AWS 的对象存储 1~2PB/月

    而且要看你这单文件大小 是什么格式文件

    5PB 这预算兜不住的 你可以忽悠忽悠阿里云的直营销售 至少他们发现亏本以前 能低价解决几个月
    realpg
        20
    realpg  
    PRO
       2 天前   ❤️ 19
    @fortytwo #11
    @zyq2280539 #6
    @kidtx #3
    @MFWT #1

    各位是不是看快递硬盘的故事看多了...

    这个数据量 跨国 邮寄硬盘一点也不便宜

    假设 20TB 硬盘 5PB 数据量为 250 块 约 180KG 假如按美国算 毕竟他用美元单位 折扣运费大约人民币 1500 美元

    20TB 硬盘 按正规企业采购价 就算他 6000 元一块 价格约 150 万人民币 约 18 万美元

    跨境是没法保税的, 你进境要关税增值税申报, 而且你想循环起来重复利用也难


    而且还有一个重大问题, 数据源在 R2 上 你从 R2 弄到硬盘里 周期可能都得按月计 而且基本要求每次提供新硬盘或者干脆是云厂商提供硬盘你付钱

    然后到了国内 5PB 硬盘你把数据弄到云上 这个成本你核算过吗? 阿里云腾讯云一个月能给你导完吗?


    然后, 运输过程中假如有一块两块硬盘坏了 这个怎么做预案?


    当文件真的多了, 快递硬盘只是"理论带宽大" "实际带宽"一点也不大

    我为什么知道? 因为我干过大卡车运硬盘... 最后结论是 不如网络传输一点点
    bullfrog
        21
    bullfrog  
       2 天前
    r2 本来就流量免费,阿里云入站免费,直接申请一堆阿里云的小 vsp 分包下载就完啦,让 ai 给你写个脚本
    lekai63
        22
    lekai63  
       2 天前
    @realpg 老哥 你说的在理
    kingba
        23
    kingba  
       2 天前   ❤️ 1
    假如 10T 每月,那带宽至少要达到 50Gbps
    中国大陆的总出口带宽是 40T (大模型说的)=40000Gbps
    也就是说为了满足你的需求,你可能会占用全国总出口带宽的千分之一???
    Rnreck
        24
    Rnreck  
       2 天前
    @realpg #20 看完了,请问一下老哥对于这种大量数据远距离传输有什么比较好的解决方法吗?
    SilencerL
        25
    SilencerL  
       2 天前
    😅这数据量要是人肉运输,不止楼上的成本问题,而且 100% 会触发中美(假设从美国运回来)的数据出入境审查,并且是完全无法解释的巨大数据量,没有任何法务会同意这种方案,拿刀架脖子上都不敢签字
    realpg
        26
    realpg  
    PRO
       2 天前   ❤️ 1
    @Rnreck
    有的, 要根据实际情况做方案 不能直接套公式 有些场景就是无解的 比如你有 1PB 的文件要传, 单文件<20KB

    而且, 这是最核心的挣钱的地方... 不要指望动动嘴就能获得价值六位数的技术方案

    有的时候 运硬盘也是最优解 要不我怎么知道运硬盘的事儿

    各种方法都有各种方法的适用范围 全部要定制
    realpg
        27
    realpg  
    PRO
       2 天前   ❤️ 2
    @lekai63 #22

    因为这些我都真的干过...

    什么运硬盘 跨境传输大视频 oss 上下云 异地 100PB 级数据搬迁

    我业余就吃这碗饭的 我这边老板专门投个公司做云规划 基本就是我一个人在干
    levelworm
        28
    levelworm  
       2 天前
    @realpg #27
    看来大量数据的传输的确是个难题啊,不知道磁带怎么样。话说楼主是抖音的吗。。。
    realpg
        29
    realpg  
    PRO
       2 天前
    @SilencerL #25
    其实触发不了, 没人管的, 你着急走 UPS 快递进境申报的也只是硬盘而不是数据. 你不着急走集装箱那申报就更邪门了, 货代各种歪门邪道的申报法, 他们对缝的很多都给你拼到跨国公司的附加申报, 因为你没有支付采购外汇, 这是半残交易, 所以大部分无货款的找货代申报的话, 他们给你拼到一些外企的设备流动里他们还能挣一大堆差价


    如果你走个人, 那这个体量, 申报大概率也进不来, 会被退运.
    realpg
        30
    realpg  
    PRO
       2 天前   ❤️ 1
    @levelworm #28

    难者不会, 会者不难, 外部风险较大(主要是方案有可能在真实世界并不 work)

    外部风险如果甲方协同分担, 那可以便宜, 甲方不承担一点风险, 搞不定就退款, 风险全部乙方承担, 那服务费就很贵
    levelworm
        31
    levelworm  
       2 天前
    @realpg #30
    求问一下,是不是技术上没啥难点,主要是法律上的问题?楼上有人算过了,开高带宽花时间就行了,反正已经有这种带宽的服务了。
    saranz
        32
    saranz  
       2 天前
    你这个,还是和 Cloudflare 的客服联系一下看看能不能弄到物理硬盘吧。
    如果在线回传,时间久不说,成本也高。
    realpg
        33
    realpg  
    PRO
       2 天前   ❤️ 2
    @levelworm #31

    没任何法律上的问题

    觉得这个简单的 可以自己试试就知道难不难了

    除非他是单文件 TB 级 总共就没几个文件

    而且他是每个月累计 5PB 流量 可没说是要等你冷传输

    大概率人家是要很快同步过来的 CF 上的文件 几小时内就得到国内 是这个工作累计每个月 5PB 流水滚动

    而不是 现在有 5PB 死文件 你一个月内给我搬回来
    miniliuke
        34
    miniliuke  
       2 天前
    理论带宽 4w 打满的......这还是跨洋网络,够呛,估计还是得物理搬运
    steven0018
        35
    steven0018  
       2 天前
    专线肯定需要的,下行带宽费用肯定免不了,需要配合托管物理机+专线的方案,这样才有可能成本比较低,有需要的话可以具体沟通下
    mengyx
        36
    mengyx  
       2 天前
    比较稳定的方式是开 IEPL 专线+IX/PNI ,整体成本可以比走互联网低不少;
    我们在国内与阿里、腾讯有> 100Gbps 的互联;在香港与 Cloudflare 的互联、IEPL 的容量也可以按需提升到 100Gbps ;

    有需要了解的话可以联系
    ```bash
    echo "V2VDaGF0OiBjbi1taXgK" | base64 -d
    ```
    iseki
        37
    iseki  
       2 天前 via Android
    @realpg 搬硬盘/不搬硬盘应该是有一个平衡点的吧,一般什么情况下会比较便宜呢
    iseki
        38
    iseki  
       2 天前 via Android
    我看现实世界中的快递硬盘服务,基本上都是云厂商上云附带服务。
    realpg
        39
    realpg  
    PRO
       2 天前   ❤️ 1
    @iseki #37
    我给你举个例子, 阿里云 OSS 上 10PB 的小碎文件, 你告诉阿里云你要导出到硬盘, 一个月都不一定能存到硬盘里, 且不说运输, 从他们的存储集群到你的硬盘, 一个月都不一定能导完
    shmilypeter
        40
    shmilypeter  
       2 天前
    我能想到的是你公司开发一个客户端软件,类似于 QQ 或者 360 ,并且占领一定的市场,你把 cloudflare r2 上的分卷压缩让美国那边的客户端下载,按照 10PB 也就是 10240T 来算,每个用户 102.4M (每个用户直接给干 1T 流量太明显了),那么你需要十万个用户。假设你中国那边也有十万个用户。你可以让美国那边十万个用户点对点传给中国那边十万个用户,然后在中国那边十万个用户自动传到你的服务器,分片合并。

    就是如何让中美两边都有十万用户量是一个问题。

    或者你能搞一万台手机一万个账户,一个账户传 1T 也行。一万台手机估计一个大 house 放不下,管理起来难度也颇大,并且为了账户不被封,还不能用一个 IP 的。
    shmilypeter
        41
    shmilypeter  
       2 天前
    @realpg 我算错了,0.1T 是 102.4G 不是 102.4M ,脑子昏了,每个用户偷跑那么多流量,那么客户端只能是快播之类的了,并且即便是快播一个人一个月也看不掉 0.1T ,在美国十万用户级别那都是很恐怖的量了。

    你要是每个月 5-10PB 的量的话,在这个网站免费问到答案的可能性不大,AI 也不靠谱,你真敢中美搞一万个账户搞喵喵池子,恐怕会进去,总归还是挺难办的。
    l1ve
        42
    l1ve  
       2 天前
    WTF ?这问题
    腾讯云/阿里云都在 Cloudflare 的带宽联盟中,具体结算方式肯定比市场价低几个数量级
    我记得境外部分的流量应该是互免的(腾讯云有一定门槛,好像 100TB)
    直接找他们的商务,这个级别的已经可以让他们负责迁移了
    rrfeng
        43
    rrfeng  
       2 天前
    每个月 10PB ??你造嘛呢?
    seenthewind
        44
    seenthewind  
       2 天前
    不太可能了,数据量太大了。

    现在数据方面的玩法也不一样了,你如果不太懂法的话,可以理解下相当于数据世界发送了大清亡了这样的变革。


    按以前的说法是找几个盘,打个飞滴,几天搞定,但现在你揣着这种盘跑一趟,有可能佛波了会把你抓起来坐 lao 。

    传输也不是不行,但是数据量太大还是比较明显。

    建议精简下数据,别整这么多了,小部分然后从网络蚂蚁搬家。
    hanxu317138
        45
    hanxu317138  
       2 天前
    找阿里云实施. 只要消费够. 人家去帮你搞定
    haorrs
        46
    haorrs  
       2 天前
    找国内云的人给你搞方案就好了。从他们的海外节点转一下。
    lbunderway
        47
    lbunderway  
       1 天前
    这么大的数据啊 我所接触过的就 fil 封装 每天有几十个 t
    xkeyC
        48
    xkeyC  
       1 天前
    oss cos 之类的都支持回源访问,即访问一个 url ,文件不存在时去一个指定 url 前缀下载。

    把 r2 桶导出个 lsit ,然后 http head 全访问一遍(
    GodIsJasonBourne
        49
    GodIsJasonBourne  
       1 天前
    @realpg 为什么这种离线数据离境,会没有法律上的问题呢?我主要觉得美国肯定会审查吧?
    likooo125802023
        50
    likooo125802023  
       1 天前
    话说你们搬数据

    CF 云上的,你把数据从云上导到当地的硬盘上,这数据量大的我感觉就不太靠谱啊。
    Actrace
        51
    Actrace  
       1 天前
    这个数据量,头部 AI 企业搬运训练数据吗。
    byweilong
        52
    byweilong  
       1 天前
    我们是买 vps ,直接传回阿里的国内桶,日峰值带宽十几个 Gbps ,几年了也没封过
    dolee
        53
    dolee  
       1 天前
    没点进来以前,我以为是几 TB 的事,还想着说搞个大宽带服务器就解决了,点进来后……我承认是我想多了
    vopsoft
        54
    vopsoft  
       1 天前
    题外话 5PB 存阿里云上要多少钱
    ggabc
        55
    ggabc  
       1 天前
    买云盘的会员吧
    realpg
        56
    realpg  
    PRO
       1 天前   ❤️ 1
    @vopsoft #54
    1PB 2~4 万每月

    @Actrace #51
    我上次接类似的活的客户自动化搬运 youtube 4K 视频 流水线 AI 翻译 打字幕 然后分号投国内平台, 人工打切片, 半自动的内容工厂...
    他们虽然流量大 但是视频文件总数相对少 所以成本就低 且实时性要求可以容忍延迟 1 天回来 但是不能堆积
    他们不是 cf 是 aws 的有地域存储,很好优化, cf 是无地域对象存储, 你根本没法保证冷数据能很快拉回来, 冷数据可能给你丢印度节点去, 下载速度几十 KB/s

    @dolee #53
    看文件构成 要是大文件 其实会玩的普通服务器就解决了

    @likooo125802023 #50

    所以都是些自己觉得很聪明的..
    我们曾经搬过 1PB 的阿里云 oss 碎文件 阿里云发硬盘 每 200TB 数据从 oss 导到硬盘就得导 1 周... 阿里云之前应该是被撸过, 单次导出 oss 到硬盘只支持 200TB(20TB*10)
    且不说每次得 150 万人民币的硬盘周转钱..国内卖出还得损耗

    @shmilypeter #41 ↑ && ↓
    免费得不到不是因为我不说, 是因为这种都要根据实际文件大小, 存储情况, 高度定制方案, 没有任何通解.

    @GodIsJasonBourne #49
    你不申报谁知道你是数据离境啊, 大哥你出口的是硬盘啊, 报关单也没有"数据"这一选项
    你太小看"国家"这个体量有多大了, 几百块硬盘的出口要是上面都事无巨细的监控, 行政体系早崩溃了, 这玩意正常运输都按吨算的
    目的地是中国, 是一次性硬盘中国入境, 中国的现行海关政策也不支持短期进境再出去的免税, 旧硬盘进不来中国(禁止洋垃圾进口政策), 新硬盘进来就是视同对方销售, 13%增值税, 0%关税, 都是一次性的, 一个月 150 万人民币的硬盘采购钱, 到了国内你想套现还得折价出, 这种 used hard drive 你能回收几个钱

    你国内不付硬盘采购钱, 货代大概率是给你拼到别的贸易里进来, 尤其是电子相关的比如跨国企业几种采购分配(早年 IBM 那种你买个电脑买个鼠标都是美国公司买给你邮寄中国分公司来)的补单, 否则三流不一致的, 是有退运风险的. 这种货代还有套利空间
    xing7673
        57
    xing7673  
       1 天前
    @realpg #20 专业
    realpg
        58
    realpg  
    PRO
       1 天前
    @xing7673 #57
    必须专业 下次你公司有 公有云大用量开源节流 云服务统筹规划的活找我 hhh

    新时代运维也就能干点这类活没有竞争压力了 纯靠积累的知识挣钱
    pc10201
        59
    pc10201  
    OP
       1 天前
    @byweilong 哪家的性能这么好?
    lasuar
        60
    lasuar  
       1 天前
    由此可见,v2 的大部分人也都是半斤八两的口嗨级别,你这个上了规模,就需要找专业人士咨询,出了问题需要有人兜底。
    Twelveeee
        61
    Twelveeee  
       1 天前
    好奇,蹲一个实际解决方案。

    我看阿里云的离线传输文档: https://help.aliyun.com/zh/data-transport/product-overview/billing-description

    也得 单次 1PB 24000 rmb/45day
    cigarzh
        62
    cigarzh  
       1 天前
    搞一堆 DMIT 往回拉
    DGideas
        63
    DGideas  
       1 天前
    搜了一下上边的评论,还是没有那句经典的话

    > 永远不要忽略一辆载满磁带的在高速公路上飞驰的卡车的带宽

    来自 Modern Operating Systems (3rd Edition)
    julyclyde
        64
    julyclyde  
       1 天前
    硬盘显然不现实啊

    如果数据已经在硬盘上了,倒是可以考虑。现在是数据在云,你难道要在境外先下载到硬盘、然后再运输吗?
    还得考虑这边要重新上传呢,要两倍传输时间+物流破损风险
    julyclyde
        65
    julyclyde  
       1 天前
    @DGideas 2007 年那会还没宽带网呢
    pc10201
        66
    pc10201  
    OP
       1 天前
    @Twelveeee 这个只在中国大陆提供服务
    iseki
        67
    iseki  
       1 天前
    @realpg
    > 阿里云之前应该是被撸过, 单次导出 oss 到硬盘只支持 200TB(20TB*10)

    这有点没看懂,导个数据能被咋撸,能咋滴
    mytsing520
        68
    mytsing520  
    PRO
       1 天前
    我呢,刚刚又想到一个馊主意
    CF R2 -> 阿里云(美国) -> 阿里云 OSS (传输加速) -> OSS 中国存储
    多了一笔传输加速的费用,但你这个数据量,和阿里云应该有的谈
    pc10201
        69
    pc10201  
    OP
       21 小时 50 分钟前
    @mytsing520 传输加速非常非常贵
    kk58
        70
    kk58  
       21 小时 19 分钟前
    租 50 台 LAX SG 的 G 口独服吧
    mytsing520
        71
    mytsing520  
    PRO
       21 小时 5 分钟前
    @pc10201 找阿里云商务可以谈一下折扣
    DGideas
        72
    DGideas  
       21 小时 4 分钟前
    @julyclyde
    > @DGideas 2007 年那会还没宽带网呢

    这个场景是国内-国外跨境网络,这个带宽并不是很大(相对于几 PB 数据)
    realpg
        73
    realpg  
    PRO
       19 小时 46 分钟前
    @iseki #67

    以下为猜测 :

    跟网友一样 对数据没概念 一次接了很大的单 觉得几天导出完了
    接完以后发现, 预计导出完成时间大概要 7 个月后 你要是干活的...
    pc10201
        74
    pc10201  
    OP
       18 小时 44 分钟前
    @mytsing520 打完折也挺贵
    MindMindMax
        75
    MindMindMax  
       16 小时 45 分钟前
    这个体量还是问问 CDN 厂商吧,任何中小规模的云服务无法保障带宽的。毕竟你入流量到中国大陆,需要大陆的 T1 运营商转接,费用超高。自己对接,你这预算不现实。

    得走个批发价,这个价格只有 CDN 厂商能拿到,btw 可以问问 UCloud (合作过,比阿里云便宜) 和 蓝讯
    MindMindMax
        76
    MindMindMax  
       16 小时 42 分钟前
    对了, 如果是 cf 直接拉流,可以问问京东云,他们是战略合作关系。或许,有优惠的价格?
    Akasoent
        77
    Akasoent  
       14 小时 36 分钟前
    @realpg
    请教下大佬。
    “每 200TB 数据从 oss 导到硬盘就得导 1 周”
    这个为什么导出数据这么慢?
    难道是一块硬盘写满再写下一块?
    还是因为文件都是零碎的小文件?
    20TB*10 这种不能 10 块硬盘同时导入么?
    realpg
        78
    realpg  
    PRO
       14 小时 31 分钟前
    @Akasoent #77
    没提供文件格式 默认按照最差场景考虑啊
    碎文件是很正常的
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   4951 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 39ms · UTC 02:27 · PVG 10:27 · LAX 18:27 · JFK 21:27
    ♥ Do have faith in what you're doing.