chatgpt 出来这么久了,看到的都是卖号,或者直接用 api 开发个啥,就没人想微调,针对垂直行业做定制化的 chatgpt?

2023-04-03 22:34:57 +08:00
 diehe

据我对各行各业的观察,这个需求其实很大的。

最好是,把整个微调过程,做成无需写代码的方式。 让他们只要简单上传,自己行业的专业数据资料,就能得到一个全能的二十四小时在线的行业专家。

并且这个本行业的 chatgpt 还可以做成 api 形式,对外收费。岂不美哉? 当然这是后话!

有懂这方面技术的大佬,愿意一起来弄这个事么?

15373 次点击
所在节点    程序员
109 条回复
bt7vip
2023-04-03 22:38:30 +08:00
和电脑出现早期需要打字员一样的状况,不是不想做,是除了少部分人,其他人没有调整模型的能力或者技术,有是一回事,会用又是一回事,况且算力也是一个限制。
siriulx
2023-04-03 22:41:09 +08:00
你是说这个么 https://beta.character.ai/
这个之前拿了 150M 的投资
Procumbens
2023-04-03 22:42:08 +08:00
diehe
2023-04-03 22:42:35 +08:00
@bt7vip 算力就是显卡噻,这个不是问题。主要是调整模型的技术,感觉懂的人不多啊!
diehe
2023-04-03 22:46:28 +08:00
@siriulx 不是,他这个就是角色扮演,我说的是针对企业的。垂直行业,私人定制那种。
zapper
2023-04-03 22:47:05 +08:00
现在还没有这个 API 。所以没有,而且哪个掌握核心的公司会随便上传自己的专业数据资料?给人类做慈善吗
说白了未来就是数字分身的天下,创一个自己的分身跟吃饭一样简单。
到时老板们有无数个数字分身替他解决各种奇葩问题。普通打工人会只能做强线下的工作,而普通人的数字分身只能去帮普通人上网对线、买东西吧

最后,你指的应该是泛 AIGC 这个行业,而不是什么 chatgpt 吧
diehe
2023-04-03 22:54:14 +08:00
@zapper 这个基于 chatgpt 开源的程序,搭建自己垂直行业的 chatgpt ,然后基于这个去微调,这个数据不至于上传给 chatgpt 吧?
a302800411
2023-04-03 22:57:20 +08:00
你说的是 gpt 插件,官方就快上线了。

3.5 的模型压还根不支持微调。
JensenQian
2023-04-03 23:00:13 +08:00
官方说要支持插件了
https://openai.com/blog/chatgpt-plugins
DingDingDang123
2023-04-03 23:08:31 +08:00
哈哈,这不是说我吗?
我自己开通了 plus 后,发现这东西真麻烦,后来在 v2 上发贴。
很多 v2 的朋友找我帮忙帮开,其实还是挺有意义。
总要先用起来吧。你说是吧。

我帮忙代开 chat plus, vx 见我之前的贴子。
kwh
2023-04-03 23:16:30 +08:00
@zapper 有道理,毕竟 AI 的智慧基于计算机资源。那么一个国家的 AI 那该多么强大???

而且 AI 最不怕的就是数据多,可以想象,如果我国有了 AI ,把所有的个人数据输入,分分钟给每个人进行定性,打标签。

而且 AI 多半能取代人工编程,大不了多试几次,而且还可以把问题抛出来,让人工解决 AI 不会的问题,然后 AI 就噌噌噌的把剩余的代码写完。感觉以后在某些编程领域,真人只会成为 AI 编程的附庸。
zapper
2023-04-03 23:22:41 +08:00
@diehe 首先,chatgpt 没有开源。目前基于他的程序也就是 API 套壳而已。
而且是联网云计算的,为什么不会上传
然后就是楼主有什么优势?能让大佬跟你合作呢,总不能说你是郭帆吧
nightwitch
2023-04-03 23:26:57 +08:00
gpt3.5 以后的模型没开源啊。基础模型没开源的情况下,没法做定制,无非就是提示词不一样,这种有什么好定制的
yunyuyuan
2023-04-03 23:30:43 +08:00
@nightwitch OP 可能说的是傻瓜版定制,使用者不需要懂任何计算机技术,翻墙都不会的那种。但是要搞这种服务,首先要目标行业相关的人脉吧,普通程序员的人脉应该不怎么广
Lanceliel
2023-04-03 23:33:46 +08:00
楼主以为难点在于微调模型?
整理“行业的专业数据资料”才是最困难&成本最高的部分。
有能力搞定这部分的话,也未必非得基于 ChatGPT 了:
https://doi.org/10.48550/arXiv.2303.17564
thinszx
2023-04-03 23:45:54 +08:00
1. 没那么多相关数据
2. 没那么多计算资源
按照之前 gpt3 一类的模型成本来看,单单训练一次就要烧掉几百万美元,而且这个参数量,想要达到让模型有很好的泛化性,训练数据相比普通的模型要多出来几百倍估计都不止,如果只是想要在原始的模型上微调是可能的,但是原始模型没开源,大概率以后也不可能开源了,所以不太可能做到
Senorsen
2023-04-03 23:51:00 +08:00
想了想,好像是 Azure
shaohan0228
2023-04-03 23:59:44 +08:00
autodesk 要测试的 maya assist 就是用的 Azure 的 openai 服务,算是垂直领域吧
realpg
2023-04-04 00:23:59 +08:00
某个无主之地出现了新的金矿,挣钱的要么是巨头,要么是卖铲子的
SGL
2023-04-04 00:44:31 +08:00
问得好,但是 GPT3.5 好像没有开源

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/929554

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX