V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
allegory
V2EX  ›  程序员

DPDK 如何学习才能就职相应的岗位

  •  
  •   allegory · 353 天前 · 2186 次点击
    这是一个创建于 353 天前的主题,其中的信息可能已经有所发展或是发生改变。

    本人 25 届毕业生,主语言 C++, 想从事网络开发相关工作。

    目前的想法是毕业前这几个月啃一啃 DPDK, 写点项目。奈何 B 站搜出来的视频教程 98%都是出自某机构引流卖课的, YouTube 上则更少,阅读官方文档的话周期长不说,还容易找不到重点,得不到及时的练习。

    各位前辈 你们是怎么学习/掌握它的,能否在此帖中分享一些经验、资料?(引流卖课勿扰~ 谢谢

    我想知道/获得的信息:

    1. 如何学习(路线、重点)
    2. 适合练手和写在简历上找工作的项目
    3. 资料(书籍、博客、视频都可)
    4. 其他学习建议

    不胜感激~

    21 条回复    2025-11-29 13:22:45 +08:00
    AFOX
        1
    AFOX  
       353 天前
    这种是不是只有去企业实习才能入门?不然找找 mit 的公开课吧
    datou
        2
    datou  
       353 天前
    看成 DPRK
    FlashEcho
        3
    FlashEcho  
       353 天前
    没有建议,单纯分享下经历:

    我也是用 c++技术栈面的后端,多学了点网络,把 webserver ( io_uring 版)写完就深入看了点 DPDK ,不得不说资料是真的少,比较长的就一个零声教育的

    不过面试写这种其实不是特别讨好,因为做业务的面试官不懂这个,不会多问,懂的面试官又很容易非常懂,会用刁钻的角度拷打你,除非你确实是在大厂的鸡架组实习过,自学这些偏底层的技术还是太难了
    allegory
        4
    allegory  
    OP
       353 天前
    @datou 想吃广东菜了你是[doge]
    hiplon
        5
    hiplon  
       353 天前
    曾经通信核心网设备上云用过一段时间
    RangerWolf
        6
    RangerWolf  
       353 天前
    @allegory DPRK 跟广东菜有什么关系? 这是什么梗
    FlashEcho
        7
    FlashEcho  
       353 天前   ❤️ 1
    @RangerWolf #6 有一个 bgm 经常作为朝鲜视频的配乐,有一句歌词听起来很想“想吃广东菜”,你可以去 b 站搜关键词“想吃广东菜”
    carmark
        8
    carmark  
       353 天前
    建议找个实习搞 RDMA ,这个可能方向性上面更好,AI 强依赖这个。

    无论从需求到场景都会更多。
    allegory
        9
    allegory  
    OP
       353 天前
    @carmark 搞 RDMA 的岗有哪些啊,能不能列举一些,岗位或单位
    carmark
        10
    carmark  
       353 天前
    @allegory BOSS 搜一下呢?这个主要是搞 RoCE 拥塞控制,各种监控,各种识别,然后与 nccl 协同。

    当然还有比如新华三这种做 RoCE 协议开发的。
    FabricPath
        11
    FabricPath  
       353 天前   ❤️ 5
    DPDK 和 RDMA 都不建议,建议远离网络。
    对于 DPDK:
    1. DPDK 太成熟了,成熟到每个会用 DPDK 的公司都一堆 DPDK 的开发
    2. DPDK 大部分场景都是和虚拟机、L4LB 、NAT 相关,这些场景都有低性能的现成的替代品,DPDK 只适合对性能有要求的场景(比如 L4LB ,小规模场景 ipvs 跑个几十 Gbps 妥妥没问题)
    3. 随着容器化推进,随着虚拟机场景的收缩,DPDK 会集中在 L4LB 之类的集中式网关场景,容器化场景无法使用 DPDK (浪费 CPU 、相比 ebpf 没有带来性能优势、ebpf 吊打 vduse 这种强行在容器场景上 dpdk 的方案)

    对于 RDMA:
    1. 纯硬件实现,你在其中能做的事情不多,大量的时间会用在性能测试、拥塞控制测试、监控开发、配置脚本开发
    2. RDMA 中短期场景有限,对于小公司来说,只有 AI 和存储场景有优势;在 rpc 场景是负向收益(或者说收益是否值得全网采购 mellanox 的网卡);在低于 100Gbps 的带宽下 RDMA 相比 tcp 没有优势( rdma 延迟稍微低一点,但是你真的需要低这几 us 的延迟?)
    3. rdma 领域,mellanox 一家独大,mellanox 在 20 年前开始搞 infiniband ,被以太网压了 20 几年,这两年终于出头了,那不大赚特赚一波;再加上 nvidia 收购 mellanox 之后 GPU+网卡的强绑定,导致 RoCE 生态被 mellanox 独占
    4. 最近几年 mellanox 吹他的 ProgrammableCC ,但是真的用 PCC 的公司屈指可数,DCQCN 能满足 99%的场景
    5. RDMA 的应用层开发如上所说,AI 和存储场景有优势,但是存储领域,现在 kernel 的 nvme-of 很成熟,SPDK 也很成熟; AI 领域,NCCL 虽然 bug 很多,但是也能用,而且一般公司也不会选择去大规模修改 NCCL


    你还想听我能给你扯一堆理由,简单学学可以,要变现很难;当成兴趣爱好学习一下没啥问题。
    RDMA 和 DPDK 都可以闲鱼买 mellanox cx4 (几十块钱)、cx5 (几百块钱)来入门
    kuanat
        12
    kuanat  
       352 天前
    楼上看 id 就知道靠谱。

    网络这个领域一定要先有市场需求才有岗位需求,由于相关技术往往和硬件以及架构强绑定,离开了这个环境这些技术就没有用武之地了。

    如果你真的想学,DPDK 建议往 ebpf 方向走,RDMA 往分布式存储方向走。
    lzZzeucJri6FcR0o
        13
    lzZzeucJri6FcR0o  
       352 天前
    @FabricPath #11 是的,现在分布式全闪都是用的这些技术,但是门槛也比较高,打铁还得自身硬,虽然前景一片蓝海,但是国内市场并不明朗,全闪太贵了
    dododada
        14
    dododada  
       352 天前
    硬件领域不了解,唯一接触过 dpdk 的工作就是流量镜像分析,根本不懂
    allegory
        15
    allegory  
    OP
       352 天前
    @FabricPath 感谢老哥,像我这种小白就是容易过多关注技术本身,忽略最重要的市场。看了你的回复决定换别的方向。(老哥有建议/推荐的吗)
    FabricPath
        16
    FabricPath  
       347 天前
    @allegory 追热点去搞 AI 吧,infra 最近两年没啥新活了
    jackgoudan
        17
    jackgoudan  
       1 天前
    @FabricPath 大佬请问下,我原先主要的工作职责是 k8s 那套为主,换了一份工作去做 ml infra ,现在组里 rdma 懂得人不太多,从投入产出来说,您认为深入搞下 rdma 有意义吗?
    FabricPath
        18
    FabricPath  
       1 天前
    @jackgoudan "深入"

    需要看你的公司,如果你是头部公司,和 mellanox/nvidia 有周会或者月会的话,深入搞 RDMA 有意义;
    如果你工作的时候,没有任何和 mellanox/nvidia 的人有交流,那你不太能深入搞 RDMA ,RDMA 是网卡硬件实现的,一堆的黑盒逻辑,nvidia 的开发都不一定能说的清你遇到的问题

    如果你是做信创产业的,并且有固定的合作的网卡厂家(国内挺多搞 RDMA 网卡的,不过缺陷比较多),那一样能“深入”搞 RDMA ,并且由于你平时遇到的问题实在是太多了,大概率比用 nvidia 的网卡会更深入了解 RDMA ;缺陷就是技术栈不复用,因为 nvidia 的 nvl72 开始,就几乎是强制使用 infiniband 了,“你可以用 RoCE ,但是我们技术支持力度肯定不如用 ib”,但国内的 RDMA 网卡都是 RoCE 。

    所以你评估一下你是否真的能深入搞 RDMA ,如果能,那么这个行业虽然很窄,但是前景广阔,未来属于高速网络;
    如果你不满足上述的环境,那大概率就是搞搞 RDMA 的监控、测试一下 RDMA 的配置了,玩熟练了就跑路吧
    jackgoudan
        19
    jackgoudan  
       1 天前
    @FabricPath 明白 单位平台还行,卡也不少。 不过还没到-如果你是头部公司,和 mellanox/nvidia 有周会或者月会,这类公司是公有云这种吗?

    另外结合你的描述,我降低目标,玩熟练 RDMA 那套东西就好 。十分感谢
    FabricPath
        20
    FabricPath  
       1 天前
    @jackgoudan 不一定是公有云,nvidia 的大客户就行,或者说你有问题能找到 nvidia 的人给你对接就行。这个领域基本上没有开放的知识,即使 nvidia 给的文档,也是用 partners.nvidia.com 分发的,而且文档都带水印,所以网络上基本没有开放的文档
    jackgoudan
        21
    jackgoudan  
       22 小时 27 分钟前
    @FabricPath 哈哈,那我明白了。 工作里对 nv 的人接触仅有几次来公司的技术分享哈哈 ,算不上 partner 。多问一嘴,大佬是在哪儿上班啊? id 也是属实 rdma 老兵了 哈哈
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2526 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 03:49 · PVG 11:49 · LAX 19:49 · JFK 22:49
    ♥ Do have faith in what you're doing.