V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
FirefoxChrome
V2EX  ›  分享发现

3 月 31 日, UC 伯克利联手 CMU、斯坦福、UCSD 和 MBZUAI,推出了 130 亿参数的开源模型 Vicuna,仅需 300 美元就能实现 ChatGPT 90%的性能。

  •  
  •   FirefoxChrome · 2023-04-04 23:35:47 +08:00 · 1069 次点击
    这是一个创建于 593 天前的主题,其中的信息可能已经有所发展或是发生改变。
    Vicuna 是通过在 ShareGPT 收集的用户共享对话上对 LLaMA 进行微调训练而来,训练成本近 300 美元。研究人员设计了 8 个问题类别,包括数学、写作、编码,对 Vicuna-13B 与其他四个模型进行了性能测试。测试过程使用 GPT-4 作为评判标准,结果显示 Vicuna-13B 在超过 90% 的情况下实现了与 ChatGPT 和 Bard 相匹敌的能力。同时,在在超过 90% 的情况下胜过了其他模型,如 LLaMA 和斯坦福的 Alpaca 。

    今天,团队正式发布了 Vicuna 的权重——只需单个 GPU 就能跑

    单个 GPU:Vicuna-13B 需要大约 28GB 的 GPU 显存。
    多个 GPU:如果没有足够的显存,则可以使用模型并行来聚合同一台机器上多个 GPU 的显存。
    仅用 CPU:如果想在 CPU 上运行,则需要大约 60GB 的内存。

    全文: https://mp.weixin.qq.com/s/BG1dw3PeRysvq_UBgo6UFQ
    2 条回复    2023-04-24 15:19:16 +08:00
    sbilly
        1
    sbilly  
       2023-04-06 10:23:14 +08:00
    没感觉有这么好的效果
    RRRoger
        2
    RRRoger  
       2023-04-24 15:19:16 +08:00
    请问这个 300 美元是什么 电费吗 一个普通的显卡都不止 300 美元了吧
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3433 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 11:56 · PVG 19:56 · LAX 03:56 · JFK 06:56
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.