爱意满满的作品展示区。
longxinglink

讲讲家里云新人部署求职项目用的大模型 API 供应商:主力 NVIDIA NIM + 备用 Ollama + OpenAI Codex 调试,含 glm-5.1、gemma4:31b、minimax-m2.7,零成本不爆账单

  •  
  •   longxinglink ·
    mskatoni · Apr 14 · 8293 views
    This topic created in 52 days ago, the information mentioned may be changed or developed.

    1. NVIDIA NIM API (包含网页调用,API )

    项目 详情
    注册地址 https://build.nvidia.com/settings/api-keys
    Base URL https://integrate.api.nvidia.com/v1
    模型数量 约 187 个开源模型(含 gemma-4-31b 、GLM5 等)
    并发限制 支持 40 并发,几乎无限量
    注册门槛 域名邮箱即可,无需验证手机号、无需绑卡,gmail 邮箱需要验证手机号

    作为我的大模型主要供应商,SLA 一直很稳定,高并发但是模型比较老旧,支持境内访问


    2. Ollama Cloud API ( Free 不包含网页调用,仅 API )

    项目 详情
    地址 https://ollama.com/
    Base URL https://ollama.com/v1
    模型数量 36 个开源模型(含 glm-5.1 、gemma4:31b 、minimax-m2.7 )
    注册门槛 gmail 注册无需手机号、无需支付方式
    主要限制 Free 计划同一时间每个 API Key 只能请求同一个模型

    作为我的大模型备用供应商,SLA 一直很稳定,可惜量少不支持高并发,支持境内访问


    openclaw 我用的这个,用于家里云调试非常好用( Claude 不要用于 openclaw ,会封号) 美/新/英等国家,新注册账户送一个月 Plus 或者 Business ,但是需要绑定支付方式

    OpenAI Codex ( Free 计划包含网页调用 cli ,API 需额外付费)

    项目 详情
    地址 https://openai.com/codex/
    可用模型 gpt-5.4 等(含 xhigh 思考级别)
    Free 计划额度 限制2.2 美元 / 5 小时(约为 Plus 计划的一半)
    注册门槛 临时域名邮箱或者 gmail 即可,风控很友好,这个无需多言
    Supplement 1  ·  Apr 18
    NVIDIA API 新增包括 z-ai/glm-5.1 、minimaxai/minimax-m2.7 等四款模型
    minimaxai/minimax-m2.7
    nvidia/ising-calibration-1-35b-a3b
    nvidia/nemotron-3-content-safety
    z-ai/glm-5.1
    Supplement 2  ·  May 16
    * * *

    ## 4. GitHub Models API ( Free 包含网页调用和 API )

    | 项目 | 详情 |
    | --- | --- |
    | 注册地址 | https://github.com/marketplace/models |
    | Base URL | `https://models.github.ai/inference/chat/completions` |
    | 模型数量 | 约 40+ 个模型(含 OpenAI 、Meta 、DeepSeek 、Mistral 、xAI 、Microsoft 等) |
    | 注册门槛 | GitHub 账号即可,API 需要创建带 `models:read` 权限的 PAT ,教程 https://www.v2ex.com/t/1212214 |
    | 主要限制 | Free API 用于实验和原型,按模型分级限速;普通模型大约 10-15 RPM ,高级/推理模型限制更低 |

    作为备用 API 很合适,优点是 GitHub 账号体系稳定,不用额外注册一堆平台;缺点是免费额度偏实验性质,遇到高级模型很容易触发限速。

    * * *

    ## 5. Groq API ( Free 包含网页调用和 API )

    | 项目 | 详情 |
    | --- | --- |
    | 注册地址 | https://console.groq.com/keys |
    | Base URL | `https://api.groq.com/openai/v1` |
    | 模型数量 | 约 16 个模型(含 llama-3.3-70b-versatile 、qwen/qwen3-32b 、openai/gpt-oss-120b 、whisper-large-v3 等) |
    | 注册门槛 | 域名邮箱注册即可,无需绑卡即可创建 API Key |
    | 主要限制 | Free 计划按模型限制 RPM 、RPD 、TPM 、TPD ,常见文本模型大约 30 RPM ,部分模型更高或更低 |

    作为高速备用供应商很好用,Groq 的优势就是响应快,适合轻量问答、批量小任务、语音转写

    * * *

    ## 6. OpenRouter API ( Free 包含网页调用和 API )

    | 项目 | 详情 |
    | --- | --- |
    | 注册地址 | https://openrouter.ai/settings/keys |
    | Base URL | `https://openrouter.ai/api/v1` |
    | 模型数量 | 300+ 个模型(绝大部分需要付费,不建议绑定支付方式和付费) |
    | 注册门槛 | gmail/outlook 邮箱注册,极小部分免费模型可用 |
    | 主要限制 | Free 用户免费模型一般 20 RPM 、50 requests/day |

    绝大部分模型免费用户无法使用,适合作为备用模型兜底供应商故障转移

    * * *

    ## 7. Google AI Studio / Vertex AI ( Free 包含网页调用和 API ,付费后限额提升)

    | 项目 | 详情 |
    | --- | --- |
    | 注册地址 | https://aistudio.google.com/apikey |
    | 可用模型 | Gemini 系列模型、Embedding 、部分多模态能力等,具体以 AI Studio / Vertex AI 控制台为准 |
    | 注册门槛 | Google 账号即可创建免费 API Key ;开启付费层级参考 https://www.v2ex.com/t/1210083 |
    | 主要限制 | Free 层级 RPM / RPD 较低;启用 Billing 后进入 Pay-as-you-go ,限额明显提高,但需要注意账单风险 |
    | 新人额度 | 新 GCP 用户通常有 $300 Cloud credits ,约 90 天有效,具体以 Google Cloud 页面为准 |

    需要支付 10 美元预付费,获得$300 试用额度账单账户,OR_BACR2_44 解决教程 https://www.v2ex.com/t/1210083 试用结束后预付费不退款
    42 replies    2026-05-21 21:59:46 +08:00
    irvinghua
        1
    irvinghua  
       Apr 14
    nvidia 是不是改了规则,我按照你的链接点进去注册,提示没有权限使用 API KEY ,提示文字:“Please verify your account to get API access.” 输入国内手机号验证,在输入栏校验死活不通过。而且看了下模型列表,只查到有 glm-5 ,没有 glm-5.1 啊
    irvinghua
        2
    irvinghua  
       Apr 14
    @irvinghua 终于通过了,那个手机号校验输入栏设计得很智障,要先选国家和地区,再输入手机号。选定了国家,国家区号前缀居然不会跟着联动改变,比如选 China ,输入栏国家区号依然是+1 ,要手动改成+86 ,我刚刚手动改成+086 校验一直通不过,非得是+86 。
    cvbnt
        3
    cvbnt  
       Apr 14
    NVIDIA NIM 最好补充一下,要搭配 CC SWITCH 里开启代理才能在 Claude code 里用
    rebnonu
        4
    rebnonu  
       Apr 14
    用 opencode 。CC SWITCH 配置好了直接用
    CareiOS
        5
    CareiOS  
       Apr 14
    免费使用?
    longxinglink
        6
    longxinglink  
    OP
       Apr 14
    @irvinghua NVIDIA NIM API 使用域名邮箱不需要手机号验证,使用 gmail 邮箱需要手机号验证,ollama 才有 glm-5.1 和 minimax-m2.7 这在文中有写

    @cvbnt 开源模型性能有限,没有为 Claude code 工程编码场景优化设计,建议使用 Codex Free 计划( https://openai.com/codex/)或订阅 Claude.ai ,,第三方转接层风险请自行评估。

    @CareiOS 对,我用的都是三家的免费计划
    BD8NCF
        7
    BD8NCF  
       Apr 14
    NIM 使用域名邮箱也要手机收短信验证,下午试了。
    之前看到有人说 gemma4 可以免费用,看了下,gemma4 要收费的
    longxinglink
        8
    longxinglink  
    OP
       Apr 14
    @BD8NCF NVIDIA NIM API 注册获得的 API 里 /models 有 NVIDIA NIM API ,且全程没有绑定任何支付方式,NVIDIA NIM API 并没有付款通道,请问 V 友是在哪里看见 “gemma4 要收费的”
    NVIDIA NIM API 我使用的 xxx.ggff.net 二级域名邮箱和 xxx.de 域名邮箱 都没有复现 V 友说的 “NIM 使用域名邮箱也要手机收短信验证” ,V 友的说法可以复现吗?
    BD8NCF
        9
    BD8NCF  
       Apr 14
    @longxinglink
    我用我自己的域名,通过 cf 转 gmail 的邮箱,类似 [email protected] 这样的,确定要手机短信验证,短信内容有“通达文”字样,似乎是国内一家公司代发的。我看手机上去年也收到这个号的短信,不知道是哪家发的验证码,肯定不是 nvidia ,大概他们用的同一家的短信服务。

    gemma4 要收费的意思,并不是说 nvidia 直接收费,是 nvidia 不免费提供,你在 free endpoint 里面找不到。应该是 nvidia 的几家合作商提供的收费主机。

    你看 google 家的模型,
    https://build.nvidia.com/models?filters=publisher%3Agoogle
    gemma-4 就没有 Free EndPoint 字样,只是 Downloadable

    gemma-4-31b-it 部署环节,你就可以看到费用了:
    https://build.nvidia.com/google/gemma-4-31b-it/deploy
    longxinglink
        10
    longxinglink  
    OP
       Apr 14
    @BD8NCF
    是否需要手机号验证似乎有他们自己的一套风控逻辑?

    https://build.nvidia.com/settings/api-keys 里生成获得的 key 可以用 gemma-4-31b-it 以及其他模型,

    你说的 https://build.nvidia.com/google/gemma-4-31b-it/deploy 是托管在第三方服务商比如 Bitdeer AI 是需要额外收费
    BD8NCF
        11
    BD8NCF  
       Apr 15
    @longxinglink 是我搞错了。他家提供的 api 可以使用 key 直接访问就 ok 了。我以为他家是提供 docker 给你部署然后再访问你自己部署的模型。
    MorningBOBO
        12
    MorningBOBO  
       Apr 15
    ollama glm5.1 要收费了 model is experiencing high volume. while capacity is being added, a subscription is required for access: ollama
    liuxue
        13
    liuxue  
       Apr 16 via iPhone
    ollama 我尝试了注册,发现用 gmail 也要手机号了
    longxinglink
        14
    longxinglink  
    OP
       Apr 18
    @MorningBOBO NVIDIA API 新增包括 z-ai/glm-5.1 、minimaxai/minimax-m2.7 等四款模型,nvidia 免费了
    MorningBOBO
        15
    MorningBOBO  
       Apr 18
    @longxinglink 好的,谢谢告知。
    imqiyue
        16
    imqiyue  
       Apr 20
    感谢,nvidia 现在上 glm5.1 了
    okface
        17
    okface  
       Apr 20
    nvidia 的手机号验证过不了,用的 CF 域名邮箱
    longxinglink
        18
    longxinglink  
    OP
       Apr 20
    @okface 老老实实验证手机号吧,一个手机号可以多次验证,实测同一个+44 可以验证 5 次以上
    ycxzfforever
        19
    ycxzfforever  
       Apr 20
    NVIDIA 验证的时候提示:
    This phone number has exceeded limits, please try a different phone number or try again later.
    longxinglink
        20
    longxinglink  
    OP
       Apr 20
    @ycxzfforever 被验证太多次(几十上百)或者运营商在 nvidia 黑名单内
    Oo0
        21
    Oo0  
       Apr 20
    用了下 glm5.1,就是有一丢丢慢,当然免费不能奢求太多
    tinola
        22
    tinola  
       Apr 20
    @ycxzfforever 同样,换了几个都是这样。
    njmaojing
        23
    njmaojing  
       Apr 20
    谢谢 OP ,不过 nvidia 的 glm5.1 目前是真慢....
    qf19910623
        24
    qf19910623  
       Apr 20
    nvidia 要手机号验证,然后验证码又发不出去,一直显示手机号受限制
    yshan
        25
    yshan  
       Apr 20
    手机号验证不了,换了几个号都不行
    https://forums.developer.nvidia.cn/t/86-exceeded-limits/28664/65

    官方论坛上也有人报同样的问题
    longxinglink
        26
    longxinglink  
    OP
       Apr 20
    @yshan 好像被注册机撸羊毛党搞炸了,我也没法注册
    longxinglink
        27
    longxinglink  
    OP
       Apr 20
    @yshan 好像又好了,美国 IP ,接码写+44 xxxx ,很卡但是勉强通过了一个,验证手机号验证了半天
    iorilu
        28
    iorilu  
       Apr 20
    nvidia 是一分钟 40 次, 怎么可能 40 并发
    kingwang
        29
    kingwang  
       Apr 20   ❤️ 3
    别浪费时间了,程序员拿那么高的工资这点钱不想出。NVIDIA 的 api 基本上是废的,响应都是分钟级的
    default996
        30
    default996  
       Apr 20
    在 cc-switch 中配置了,各种问题……
    gzlock
        31
    gzlock  
       Apr 21
    使用 google vioce 验证手机号时,出现以下错误
    The phone number you provided is invalid, please try again.
    yshan
        32
    yshan  
       Apr 21
    @longxinglink 有好用的接码平台吗
    longxinglink
        33
    longxinglink  
    OP
       Apr 21   ❤️ 1
    @yshan 这个论坛能讲吗 hh ?有一个 0.07 美元,最低充值 6.8 人刀的,搜 5sim
    baozijianke
        34
    baozijianke  
       May 5
    感谢分享, 尝试中。
    emberzhang
        35
    emberzhang  
       May 20
    ollama 免费的 gemma4-31b 都慢得要命,nvidia 更不用看了,经常连测试都测不通
    diudiuu
        36
    diudiuu  
       May 21
    @default996 最终有没有配置好呢,在 cc-switch 中
    diudiuu
        37
    diudiuu  
       May 21
    大哥你是用在自己项目里面的,还是类似 new api 服务网关的

    这个 cc switch 有直接对接的吗?好无语不知道怎么弄,用的英伟达的
    longxinglink
        38
    longxinglink  
    OP
       May 21
    @diudiuu https://www.v2ex.com/t/1205076 如果你点击我的头像可以发现这篇文章
    我用的是无服务器部署 cliproxyapi 方案,前端 Docker 跑在 Render 免费档,后端 API 等登录凭证储存 跑在 Github 私有仓库

    域名是白嫖的二级域名,如果你有一个 gamil 邮箱,这些部署下来可以无缝跑通
    https://www.v2ex.com/t/1210029
    longxinglink
        39
    longxinglink  
    OP
       May 21
    把这个帖子丢给 openai 或者 Claude ,哪怕是网页版本,它们会教导你如何部署,cliproxyapi 可以设置别名,加个分发和四方支付就能开中转站了
    @diudiuu
    diudiuu
        40
    diudiuu  
       May 21
    @longxinglink #39 多谢,原来域名都可以白嫖.

    https://github.com/maximhq/bifrost 我一直在看这个

    这俩有啥区别,和 cliproxyapi
    longxinglink
        41
    longxinglink  
    OP
       May 21
    @diudiuu bifrost 在性能和扩展性和专业性上完美碾压,更为优秀,cliproxyapi 是一坨 shi ,但是我懒得换了
    diudiuu
        42
    diudiuu  
       May 21
    @longxinglink #41 好的多谢
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2612 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 77ms · UTC 15:45 · PVG 23:45 · LAX 08:45 · JFK 11:45
    ♥ Do have faith in what you're doing.