如何优化提升 3.5 模型 API 的响应速度?

2023-11-20 13:06:01 +08:00
 PoohBear

我们在做一个面向海外用户的产品,现在在用 gpt-3.5-turbo ,服务器在新加坡,经常要 10 秒才响应,想问下可以怎么优化?

952 次点击
所在节点    OpenAI
11 条回复
chuck1in
2023-11-20 13:07:22 +08:00
务器在放在日本也有这个问题,用的 gpt4 ,还是很慢。还以为是网络问题,原来大家都有这个问题吗?
tool2d
2023-11-20 13:09:58 +08:00
gtp4 无可替代,但是 3.5 改用国内的替代大模型,基本回复都能达到相同水准,并且响应速度飞快。
PoohBear
2023-11-20 13:21:25 +08:00
想问下大家 3.5 的响应速度一般是多久
Tink
2023-11-20 13:51:33 +08:00
10 秒?不可能吧...我的 1 秒左右(国内服务器挂梯子)
PoohBear
2023-11-20 15:24:39 +08:00
@tool2d 产品面向海外英语用户
tool2d
2023-11-20 15:31:36 +08:00
@PoohBear 国内大模型精通英语的。
wujiang007
2023-11-20 15:32:26 +08:00
你说的是非 stream 模式吧? GPT4 只会更慢,用 stream 边出字边显示,看起来会快一点。
brader
2023-11-20 15:35:07 +08:00
@chuck1in 请问下你的日本服务器会不会有 504 time out 问题,我的日本节点偶尔会有这个问题,延迟倒是还好,都是 1s 以内响应
brader
2023-11-20 15:35:37 +08:00
大家知道哪个地方的服务器,访问情况会最好吗
PoohBear
2023-11-20 17:31:43 +08:00
@tool2d #6 有些聊天内容尺度比较大= =
yinmin
2023-11-21 00:38:39 +08:00
以前注册的后付费账户的 api 速度快,最近注册的预付费的 api 速度慢很多。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/993448

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX