接到一个项目,有几个技术问题请教下各位大佬

21 小时 9 分钟前
 blakezhaothinks

领导要我做一个服务,暂且叫做 aiservice ,就是把外部大模型的 api 都包一下,公司内部统一通过这个 aiservice 中转,目的是记录各部门的使用次数、以及限流(防止不合理调用)。 有几个问题请教下:

  1. 有没有必要做这个项目? 我的理解是可以给每个部门分配一个 api key ,使用记录和限流大模型供应商那边都是现成的。

  2. 如果要做,有没有必要做一个服务出来? 直接用 nginx 这类 web 服务器是不是也能做记录和限流?

  3. 如果要做一个服务,这种场景有什么推荐的技术栈。

1650 次点击
所在节点    程序员
10 条回复
qczone
21 小时 4 分钟前
jaycezhang7890
21 小时 1 分钟前
做这个还是有必要的吧,感觉也合理,做一个 aiservice 可以让使用记录和限流规则可以更加精确,本人前端,推荐 node ,nodejs 的中间件机制很合适,其实这种就用自己熟悉的技术栈就行。
这种的话,可以给每个部门分配同一个 api key ,然后你这边可以对每个部门乃至每个人做记录和限流。
NoDataNoBB
20 小时 52 分钟前
限流一般是按照 token 和请求频率的,nginx 没有这种限流
ZeekChatCom
20 小时 50 分钟前
lasuar
20 小时 43 分钟前
找开源的,而且你得了解大模型的一些基础知识,否则不一定做得下来。
markgor
20 小时 42 分钟前
1 、如果是做一个适配服务,适配目前的 api ,统一使用方法,那我觉得可行吧。
*但是实际情况我看了下都是往 openAI 接口对齐的,豆包、腾讯、阿里 的。虽然接口是对齐,但如果是接入多个外部模型就变了你不能复用模型提供方的记录和限流,必须自己单独做限制记录。

2 、nginx 原生不支持,并且你还涉及到 产生你自己的 token 或 key 给每个部门。

3 、用自己熟悉的技术栈,但要考虑连接数的问题,可以优先考虑支持协程的。
Ayanokouji
20 小时 37 分钟前
blakezhaothinks
20 小时 17 分钟前
感谢各位建议,奉上 10 铜币。已准备使用开源项目 one-api 试一试。
hunkjun
17 小时 23 分钟前
one-api
RangerWolf
10 小时 16 分钟前
one-api 亲测好用

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1094863

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX