V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
xinbaoCode
V2EX  ›  程序员

便宜的大模型 API 推荐?

  •  
  •   xinbaoCode · 274 天前 · 7535 次点击
    这是一个创建于 274 天前的主题,其中的信息可能已经有所发展或是发生改变。

    听说阿里云的通义千问 API 收费了,看了下价格。

    阿里云 ==> 0.12 元/1000tokens

    我看了下,我最近 20 天就用了大概 1000 * 1000 tokens,还好在免费额度里,算了下账,都差点要 120 远了😭,还好目前是免费的🤣

    果断弃用,xdm ,还有什么便宜的 API 调用不?目前我了解到的最低价格是

    GPT4 ==> 0.024 元/1000 tokens

    51 条回复    2024-08-18 00:19:06 +08:00
    noahlias
        1
    noahlias  
       274 天前   ❤️ 1
    国内的:
    kimi/ deepseek/ chatglm/ 01-ai/讯飞星火

    或者你用一个 sass 服务比如 https://openrouter.ai/
    市面上的大模型基本都有(开源或者闭源)
    WANHOO
        2
    WANHOO  
       274 天前
    我用的 gpt4 0.07 /1k token
    fredweili
        3
    fredweili  
       274 天前
    有一些算力的,自己部署开源模型,白嫖
    LeslieLeung
        4
    LeslieLeung  
       274 天前   ❤️ 1
    如果能搞定绑卡支付,还是用 OpenAI 官方的省心:

    - 不限制不能并发(具体还是要看帐号的等级,而转发站现在 GPT 4 不能并发)
    - 转发站莫名其妙会请求失败(用过两三个,有一两个会出现这样的状况)

    又想省钱又想省心的办法可以自建一个 one-api ,然后加一个官方渠道,加几个一折左右的转发站,用它的负载均衡功能来达到省钱和稳定的目的。

    如果完全不想花钱,可以试试 ollama ,像 gemma7B 这种主观感觉跟 GPT 3.5 Turbo 差不多。
    tiantangtianma
        5
    tiantangtianma  
       274 天前 via iPhone
    @fredweili 有开源模型推荐吗
    fredweili
        6
    fredweili  
       274 天前
    @tiantangtianma meta LLaMA2
    xinbaoCode
        7
    xinbaoCode  
    OP
       274 天前
    @noahlias 听闻 kimi 火,我去研究,🙏
    holdeer
        8
    holdeer  
       274 天前
    为什么选择最贵的?😂
    xinbaoCode
        9
    xinbaoCode  
    OP
       274 天前
    @holdeer 哈,并没有呀,GPT4 国内的 sass 只要 0.024 元
    xinbaoCode
        10
    xinbaoCode  
    OP
       274 天前
    @noahlias 感觉 kiwi 也蛮贵的,moonshot-v1-32k 的 1M 上下文差不多也要 24 元了。😂
    Ivone29
        11
    Ivone29  
       274 天前
    我使用 OpenRouter 免费的 API
    crackidz
        12
    crackidz  
       274 天前
    成本在这,再怎么便宜也不会差距很大
    noahlias
        13
    noahlias  
       274 天前
    @xinbaoCode 你说的 gpt-4 能支持并发吗?据我所知国内的这些第三方 应该是没有很高的 gpt-4 使用的 tier 的 而且很多 gpt-4 都是用 azure 套壳的 并不是 openai 的
    我记得 coze 的 dalle 的图就是微软的

    8eacekeep
        14
    8eacekeep  
       274 天前
    吓得我去看了下 api ,发现 3.5 用了俩月,终于用了 1 刀了
    hahastudio
        15
    hahastudio  
       274 天前
    Gemini 有免费额度
    https://ai.google.dev/pricing
    street000
        16
    street000  
       274 天前 via Android
    gemini 目前免费但是 api 很难用还不稳定
    qdlidada
        17
    qdlidada  
       274 天前
    qwen-turbo 0.008 元 1000tokens
    xinbaoCode
        18
    xinbaoCode  
    OP
       274 天前
    @qdlidada turbo 感觉回答问题不太精准哈,还是不太敢用😂
    walle1530
        19
    walle1530  
       274 天前
    shiyuu
        20
    shiyuu  
       274 天前
    @walle1530 这个不支持 gpt4 吧
    jiurenmeng
        21
    jiurenmeng  
       274 天前
    楼主说的 gpt4 0.024 是哪个
    sywsy
        22
    sywsy  
       274 天前   ❤️ 1
    gemini 免费,买个域名在 cloudflare 上转发下国内就能访问了
    leantli
        23
    leantli  
       274 天前
    chatglm4 0.1 元/1k tokens, 国内的模型算中文 tokens 比国外的少, 要用的话建议就是英文 gpt4, 中文 chatglm4, 不追求回答质量的话那选择更是非常多了
    等 claude-3-haiku api 放出来, 感觉可以考虑用这个, 看官网评测性能虽然弱于 gpt4, 但差距没有特别大, 而且看起来价格可能会很便宜
    xinbaoCode
        24
    xinbaoCode  
    OP
       274 天前
    @jiurenmeng 这个 https://api.kksj.me/ ,之前他们在 V2EX 推荐过,感觉还不错我就购买了,不过只买了 10 块钱😂
    wensonsmith
        26
    wensonsmith  
       274 天前
    简单问题本地 ollama ( mistral/qwen-13b 这俩效果可以),M 芯片跑起来挺快

    复杂问题 Kimi / ChatGPT 4
    kneo
        27
    kneo  
       273 天前 via Android
    为什么挑便宜的?便宜的能好用?一百多还不够一小时工资吧。
    coinbase
        28
    coinbase  
       273 天前
    直接本地搭建一个 Qwen 7b 的,基本够用了应该,一张 4090 就可以跑
    xinmans
        29
    xinmans  
       273 天前 via iPhone
    @wensonsmith 需要 gpu ?还是 cpu 也可以?
    richarddingcn
        30
    richarddingcn  
       273 天前
    aws claude 3?
    luckykong
        31
    luckykong  
       273 天前
    @wensonsmith #26 qwen-13b 是哪个? 是 14B 么?
    想问一下你跑的哪个版本?速度怎么样?我用过一个,感觉有些慢,难道是我配置不行。。。。
    akatale
        32
    akatale  
       273 天前
    与其找便宜的不如找效果最好的,要便宜有免费的那最便宜
    lekai63
        33
    lekai63  
       273 天前
    我目前也用的是国内的转发站 ,大体就是 0.8 元人民币 ==> 1 美元额度。
    算下来就是楼上的 0.024/1k tokens 吧

    不过目前也就个人用用,冲了 200 刀( 160 人民币)。claude 3 的三个相关模型,gpt-4 的模型 看起来都能用。
    lekai63
        34
    lekai63  
       273 天前
    所以不知道并发情况。之前还纳闷这些转发站的上游渠道,那现在似乎优点明白了:
    gpt-4 ---> Azure
    claude ---> AWS
    SiWXie
        35
    SiWXie  
       273 天前 via iPhone
    @lekai63 老哥用的那家的,推荐下,最近想试试
    lekai63
        36
    lekai63  
       273 天前   ❤️ 1
    @SiWXie 我去看了看,这家没 aff 啊,心好痛啊。

    还好他家域名短,辛苦老哥看图片
    ![]( https://r2pub.quarkmed.com/2024/03/b531235d24f7d61eb1edaa93e0dc203b.png)

    👆 真·广告位出租 👆
    wensonsmith
        37
    wensonsmith  
       273 天前
    @xinmans
    @luckykong

    纯 CPU 就可以。M1 Pro, 16G 跑着挺快

    对,14b 我说错了。

    Xiritianming
        38
    Xiritianming  
       273 天前
    together.ai 有 25 美刀额度免费
    kneo
        39
    kneo  
       273 天前 via Android
    @wensonsmith 这些本地“小模型”只能跑点文科东西,反正对我来说基本上没法用。快倒是真快,刷刷刷好几屏我眼睛都跟不上。
    tiantangtianma
        40
    tiantangtianma  
       273 天前 via iPhone
    @fredweili 谢谢
    tiantangtianma
        41
    tiantangtianma  
       273 天前 via iPhone
    @incubus 谢谢
    xinmans
        42
    xinmans  
       273 天前 via iPhone
    @wensonsmith 支持中文不
    cnhh
        43
    cnhh  
       273 天前
    低价的中转 API 平台上线 Claude 3 Opus 模型了

    https://v2ex.com/t/1019642
    wensonsmith
        44
    wensonsmith  
       273 天前
    @xinmans #42 qwen-13b ,国内的模型中文支持好些。mistral 中文很烂
    wensonsmith
        45
    wensonsmith  
       273 天前
    @kneo #39

    写点 python 代码没问题的
    SantinoSong
        46
    SantinoSong  
       272 天前
    @cnhh #43 他们家稳定性不行,便宜是便宜
    cnhh
        47
    cnhh  
       272 天前
    @SantinoSong 现在挺稳了
    syozzz
        48
    syozzz  
       271 天前
    @cnhh 这家原价的全是 7r=1 刀的,用不起
    cnhh
        49
    cnhh  
       271 天前
    @syozzz 就 3 个模型是原价
    fakecoder
        50
    fakecoder  
       188 天前
    @Xiritianming #38 刚才试了下,好像就 5 美刀了
    YongXMan
        51
    YongXMan  
       122 天前 via Android
    推荐一下国内直连的大模型平台,支持 gpt-4o claude 3.5 等常用大模型 https://datapipe.app
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3396 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 11:04 · PVG 19:04 · LAX 03:04 · JFK 06:04
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.