V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
subpo

有没有专注于便宜/速度快的在线模型推荐?类似 gemini-3.1-flash-lite 的

  •  
  •   subpo · Apr 16 · 814 views
    用途是用于本地的轻度需求,比如语音输入做后处理,或者翻译等等

    我本来 gemini-3.1-flash-lite-preview 用得特别好,速度贼快而且 pro 套餐每个月送 10 刀 api 额度压根用不完

    但是现在 G 家明显算力奇缺,这种模型经常 429 ,速度也不快了,语音输入动不动报错真是服了

    现在还有推荐的吗?不考虑本地模型,我的 mac 跑 e4b 虽然也能满足需求,但是处理一个请求 3 ,4 秒钟,还是太慢了

    haiku 5.4-mini 这类太贵的也不想用,毕竟原本是相当于免费的

    还有选择吗?
    3 replies    2026-04-16 14:07:10 +08:00
    xixi1412
        1
    xixi1412  
       Apr 16
    openrouter,账号里充 10 刀,免费模型每天可调 1000 次
    subpo
        2
    subpo  
    OP
       Apr 16
    @xixi1412 免费模型速度都不大行
    xixi1412
        3
    xixi1412  
       Apr 16
    @subpo 没遇到过速度问题,前几天 qwen3.6plus free,一天一亿很流畅.一个账号不够,就多几个账号负载均衡一下.
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   816 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 21:07 · PVG 05:07 · LAX 14:07 · JFK 17:07
    ♥ Do have faith in what you're doing.