如何优化提升 3.5 模型 API 的响应速度?

364 天前
 PoohBear

我们在做一个面向海外用户的产品,现在在用 gpt-3.5-turbo ,服务器在新加坡,经常要 10 秒才响应,想问下可以怎么优化?

919 次点击
所在节点    OpenAI
11 条回复
chuck1in
364 天前
务器在放在日本也有这个问题,用的 gpt4 ,还是很慢。还以为是网络问题,原来大家都有这个问题吗?
tool2d
364 天前
gtp4 无可替代,但是 3.5 改用国内的替代大模型,基本回复都能达到相同水准,并且响应速度飞快。
PoohBear
364 天前
想问下大家 3.5 的响应速度一般是多久
Tink
364 天前
10 秒?不可能吧...我的 1 秒左右(国内服务器挂梯子)
PoohBear
364 天前
@tool2d 产品面向海外英语用户
tool2d
364 天前
@PoohBear 国内大模型精通英语的。
wujiang007
364 天前
你说的是非 stream 模式吧? GPT4 只会更慢,用 stream 边出字边显示,看起来会快一点。
brader
364 天前
@chuck1in 请问下你的日本服务器会不会有 504 time out 问题,我的日本节点偶尔会有这个问题,延迟倒是还好,都是 1s 以内响应
brader
364 天前
大家知道哪个地方的服务器,访问情况会最好吗
PoohBear
364 天前
@tool2d #6 有些聊天内容尺度比较大= =
yinmin
363 天前
以前注册的后付费账户的 api 速度快,最近注册的预付费的 api 速度慢很多。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/993448

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX