V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
fancy2020
V2EX  ›  问与答

有大佬解释一下 deepseek 和 ChatGPT 的关系吗?

  •  
  •   fancy2020 · 2 天前 · 1167 次点击

    最近看到挺多 deepseek 的新闻,好奇试了一下。
    问了几个问题(英文)同时丢给 ChatGPT 和 deepseek ,发现 deepseek 的结果和 ChatGPT 的极其相似。
    内容结构基本上是一摸一样的,就是替换了一些单词。

    在网上也看到有人问 deepseek 是什么 model ,它回答是 ChatGPT 的。

    对 AI 大模型的技术没什么了解,所以好奇问一下为什么会这样?

    9 条回复    2025-01-03 23:36:48 +08:00
    565656
        1
    565656  
       2 天前
    很多模型会使用 gpt 的输出当作训练资料,俗称蒸馏学习
    fancy2020
        2
    fancy2020  
    OP
       2 天前
    @565656
    感谢回答,对机器学习不了解哈,好奇问一下这么做算是“作弊”吗?
    比如 OpenAI 是否允许这么做?
    565656
        3
    565656  
       2 天前   ❤️ 1
    @fancy2020 #2 OpenAI 肯定不允许,但是 openai 自己的训练资料也不敢明说,自己也是侵权。现在的模型都不值钱,随便开源,唯独训练资料是最宝贵的,比大模型的权重更值钱。
    YooboH
        4
    YooboH  
       2 天前   ❤️ 1
    大家都是摸着 openai 过河,gemini 还有 llama 大概率也蒸馏,算是公开的秘密吧,毕竟说白了就是利用了 chatgpt 的输出结果训练自己的模型,而且也没有任何手段能限制这一点,openai 自己的用户守则在法律上估计很难说有什么约束力
    fancy2020
        5
    fancy2020  
    OP
       2 天前
    它这种基于 ChatGPT 的输出结果做训练的方式是否在效果上会有一个上限,比如再怎么优化也不可能超越 ChatGPT?

    另外想讨论一下,deepseek 在技术上的创新真的是革命性的吗?

    比如如果它可以用很便宜的成本训练和推理,那么会不会对 Nvidia 的估值造成影响(因为不需要那么多的 GPU 了)?
    Azmeont
        6
    Azmeont  
       2 天前   ❤️ 1
    能解答这个问题,肯定也能解答这个问题:

    Google 的 Gemini 自曝自己是文心一言
    https://m.huxiu.com/article/2443851.html
    kokutou
        7
    kokutou  
       2 天前 via Android
    总会有些新数据的 提升有 但是慢而且不大
    YooboH
        8
    YooboH  
       2 天前   ❤️ 2
    @fancy2020 训练效果很难说。不可能单纯只用来自 openai 的数据,大模型首先是预训练,用整个互联网的数据训练基座,然后是指令微调以及 rlhf ,这其中每个过程都需要大量的数据处理和清洗,一般来说微调或者 rlhf 阶段可能会用 openai 或者其他家的模型输出来监督,但也都会有自己处理的数据,每家的真实训练数据都是保密的,所以到底什么样没人能说得清。
    deepseek 更多是工程方面做的比较好吧,理论方面好像没什么突破,他能做到意味着别家也能。现在最大的问题是 llm 快到头了,互联网的数据能用的全都用过了,剩下顶多是对现有数据再精细清洗一轮,后续不知道还能不能再有突破。
    Donaldo
        9
    Donaldo  
       1 天前
    @565656 #3 明说那个被自杀了。。。。。。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2593 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 15:32 · PVG 23:32 · LAX 07:32 · JFK 10:32
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.