现在微创企业 ai 应用都是如何部署的

24 天前
 csulyb

基于开源的模型微调,然后用 docker 打包模型和代码,去云服务商买 GPU 去跑吗 这个成本应该很高吧,特别是前期用户少的时候?

举个例子,有一个 PDF 内容大纲提取总结的 AI 服务,希望能给 100 人公司用,这个成本多大

1919 次点击
所在节点    程序员
8 条回复
gaobh
24 天前
有钱就行,200W 起
dayeye2006199
24 天前
创业企业买什么 GPU ,先 API 用着弄明白怎么赚钱再来研究这事儿
Hookery
24 天前
成本需要考虑到并发量,提取总结的智能程度要求,以及是否上云。
paopjian
24 天前
初创企业还敢玩自研 AI?你都没证,直接买服务去
dododada
24 天前
你 pdf 的模型要多大显存呢?看下需求呗,24 以内就考虑 4090 ,48 以内考虑 3090 ,或者 a6000 ,48 以上考虑 6000a ,3W-20W 不等,平摊到 100 个人,人均 300-2000 ,大概可以干到公司倒闭。

上云的话,算一下每天的成本就行了
crackidz
24 天前
买现成 API 都行啊...为啥搞这么重

非得这么重的话,可以考虑 serverless 部署,没人用的时候进行销毁,有人用的时候创建,就完了...
makerbi
24 天前
1. 微调的目的是什么?是否必须微调?没有经验的情况下微调只会耗费大量资源而且降低模型本身的能力。能用提示词搞定的就优先用提示词。如果要求是能问答企业内部知识的场景,考虑 RAG 是否可以完成?
2. 考虑并发会到多少?并发数直接影响到你需要的显卡资源数量。按我观察的经验来看,大部分企业员工在应用 AI 这件事情上尝鲜的程度多于真正日常使用的程度,也就是说部署一个并发数在个位数的服务就完全绰绰有余了。
3. 如果不是严格要求私有化部署的情况下,使用公有服务是最优选择。
4. PDF 总结也有很多种做法,显存资源不够的情况下对应的就是上下文长度较小,那就分块总结再合并总结,也能完成任务。
fffq
24 天前
GPT Wrapper

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1084831

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX