V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
SuperJarvis
V2EX  ›  分享创造

Deepseek V4 要发布了,你尝试了吗?

  •  
  •   SuperJarvis · 1 天前 · 1210 次点击
    目前 deepseek app 已经可以用最新的 deepseek v4 了,1M context ,知识更新到 2025 年 5 月,效果试起来比之前 3.2 好不少。

    我的🦞龙虾,搭建了一个 deepseek v4 的 track 网站: https://deepseekv4.space/ 欢迎围观,这里会更新最新的 deepseek 模型的内容
    8 条回复    2026-02-12 16:54:20 +08:00
    jroger
        1
    jroger  
       17 小时 25 分钟前 via iPhone
    试了一个以前每次发布新的都会试的需求,这次一次性成功。昨晚还试了 GLM 5 ,也很强,但是从实现结果上看不如 deepseek 。

    我还发现两个模型生成的效果还很相似,这是为啥呢?
    whoosy
        2
    whoosy  
       15 小时 23 分钟前
    这应该不是满血版 v4 吧,实测下来更像是 lite 版,而且据说上下文不是 1M ,而是 3M
    takanashisakura
        3
    takanashisakura  
       15 小时 18 分钟前 via iPhone
    哪儿来的 v4 啊?
    565656
        4
    565656  
       14 小时 53 分钟前
    Can it not be multimodal?豆包都好点
    SuperJarvis
        5
    SuperJarvis  
    OP
       13 小时 19 分钟前
    @jroger 底层架构 glm5 也借鉴了之前 DeepSeek 提出的架构
    suitts
        6
    suitts  
       11 小时 3 分钟前 via iPhone
    官网没提啊,哪里来的消息?
    Peiiii
        7
    Peiiii  
       9 小时 52 分钟前 via Android
    @jroger 都蒸馏了国外其它模型,可能是这个原因
    wangyaominde
        8
    wangyaominde  
       7 小时 45 分钟前
    不像是 V4 ,或者说以后一段时间没有新模型发布了,我测下来像是新架构带来的提升,训练与推理彻底分离,算存解耦,能力可插拔,后面更新就是更新某个模块会提升这个系统的能力,多模态以后也是一个模块

    都是我猜的哈,大佬轻喷

    猜测的架构:
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1341 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 16:40 · PVG 00:40 · LAX 08:40 · JFK 11:40
    ♥ Do have faith in what you're doing.