V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
hedwi
V2EX  ›  分享发现

deepseek 超越 Claude 3.5 紧追 o1

  •  
  •   hedwi · 1 天前 · 947 次点击

    DeepSeek-V3 的综合能力 DeepSeek-V3 在推理速度上相较历史模型有了大幅提升。

    在目前大模型主流榜单中,DeepSeek-V3 在开源模型中位列榜首,与世界上最先进的闭源模型不分伯仲。

    https://www.deepseek.com

    11 条回复    2024-12-27 21:09:05 +08:00
    yinmin
        1
    yinmin  
       1 天前 via iPhone
    实际多用一段时间 v3 ,还是觉得有差距
    hedwi
        2
    hedwi  
    OP
       1 天前
    @yinmin 不是才出的么 你用了多久了 我只觉得比以前快了好多
    tool2dx
        3
    tool2dx  
       1 天前
    刚充钱了,回复是挺快的,测试了一下代码,回答属于一线水准,日常能用就行。
    hedwi
        4
    hedwi  
    OP
       1 天前
    @tool2dx 我之前充的还没花完 很便宜
    LaTero
        5
    LaTero  
       1 天前 via Android
    好慢啊,是刚上线太多人试超载了吗。而且我有点好奇,这公司是怎么做的 600B 的模型 1 元 100 万个 token 不亏本的?还是现在还处在亏本挣吆喝的阶段?
    Hookery
        6
    Hookery  
       1 天前
    @LaTero 大模型都是虧本的,靠 token 也只是一點毛毛雨回血。
    cnkuner
        7
    cnkuner  
       1 天前
    今天试用了,让分析一个 Excel 表格,输出很满意。
    不过听说军儿在挖 deepseek 的团队。
    hedwi
        8
    hedwi  
    OP
       1 天前
    @Hookery 他家据说能盈利的 不知道真假
    hedwi
        9
    hedwi  
    OP
       1 天前
    @LaTero 他这个训练成本低很多 只有几分之一 有点东西
    hedwi
        10
    hedwi  
    OP
       1 天前
    @cnkuner 已经挖走了一个天才少女好像
    Donaldo
        11
    Donaldo  
       1 天前
    上下文有些短,丢了比较长的论文进去,不够用
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1574 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 19ms · UTC 16:54 · PVG 00:54 · LAX 08:54 · JFK 11:54
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.