便宜的大模型 API 推荐?

274 天前
 xinbaoCode

听说阿里云的通义千问 API 收费了,看了下价格。

阿里云 ==> 0.12 元/1000tokens

我看了下,我最近 20 天就用了大概 1000 * 1000 tokens,还好在免费额度里,算了下账,都差点要 120 远了😭,还好目前是免费的🤣

果断弃用,xdm ,还有什么便宜的 API 调用不?目前我了解到的最低价格是

GPT4 ==> 0.024 元/1000 tokens

7545 次点击
所在节点    程序员
51 条回复
jiurenmeng
274 天前
楼主说的 gpt4 0.024 是哪个
sywsy
274 天前
gemini 免费,买个域名在 cloudflare 上转发下国内就能访问了
leantli
274 天前
chatglm4 0.1 元/1k tokens, 国内的模型算中文 tokens 比国外的少, 要用的话建议就是英文 gpt4, 中文 chatglm4, 不追求回答质量的话那选择更是非常多了
等 claude-3-haiku api 放出来, 感觉可以考虑用这个, 看官网评测性能虽然弱于 gpt4, 但差距没有特别大, 而且看起来价格可能会很便宜
xinbaoCode
274 天前
@jiurenmeng 这个 https://api.kksj.me/ ,之前他们在 V2EX 推荐过,感觉还不错我就购买了,不过只买了 10 块钱😂
incubus
274 天前
wensonsmith
274 天前
简单问题本地 ollama ( mistral/qwen-13b 这俩效果可以),M 芯片跑起来挺快

复杂问题 Kimi / ChatGPT 4
kneo
274 天前
为什么挑便宜的?便宜的能好用?一百多还不够一小时工资吧。
coinbase
274 天前
直接本地搭建一个 Qwen 7b 的,基本够用了应该,一张 4090 就可以跑
xinmans
274 天前
@wensonsmith 需要 gpu ?还是 cpu 也可以?
richarddingcn
274 天前
aws claude 3?
luckykong
274 天前
@wensonsmith #26 qwen-13b 是哪个? 是 14B 么?
想问一下你跑的哪个版本?速度怎么样?我用过一个,感觉有些慢,难道是我配置不行。。。。
akatale
274 天前
与其找便宜的不如找效果最好的,要便宜有免费的那最便宜
lekai63
274 天前
我目前也用的是国内的转发站 ,大体就是 0.8 元人民币 ==> 1 美元额度。
算下来就是楼上的 0.024/1k tokens 吧

不过目前也就个人用用,冲了 200 刀( 160 人民币)。claude 3 的三个相关模型,gpt-4 的模型 看起来都能用。
lekai63
274 天前
所以不知道并发情况。之前还纳闷这些转发站的上游渠道,那现在似乎优点明白了:
gpt-4 ---> Azure
claude ---> AWS
SiWXie
274 天前
@lekai63 老哥用的那家的,推荐下,最近想试试
lekai63
274 天前
@SiWXie 我去看了看,这家没 aff 啊,心好痛啊。

还好他家域名短,辛苦老哥看图片
![]( https://r2pub.quarkmed.com/2024/03/b531235d24f7d61eb1edaa93e0dc203b.png)

👆 真·广告位出租 👆
wensonsmith
274 天前
@xinmans
@luckykong

纯 CPU 就可以。M1 Pro, 16G 跑着挺快

对,14b 我说错了。

Xiritianming
274 天前
together.ai 有 25 美刀额度免费
kneo
273 天前
@wensonsmith 这些本地“小模型”只能跑点文科东西,反正对我来说基本上没法用。快倒是真快,刷刷刷好几屏我眼睛都跟不上。
tiantangtianma
273 天前
@fredweili 谢谢

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1024958

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX