AIGC 多模态如何实现?

2023-06-28 21:09:34 +08:00
 x77

比如用户输入了一组字符串,我怎么判断他 User 是需要 AI 回复文本还是作图还有(未来可能支持)作曲或视频

1644 次点击
所在节点    程序员
6 条回复
raycool
2023-06-28 21:43:41 +08:00
NLP 语义理解
airyland
2023-06-28 22:23:42 +08:00
调一次 ChatGPT 的 function call 解析成结构化数据
x77
2023-06-28 22:27:03 +08:00
@airyland

function_call: auto ,它返回的内容是怎么样的?
conhost
2023-06-28 23:59:48 +08:00
NLP 里面有意图识别,之前的任务机器人就是按照先进行意图识别,再进行槽位抽取。目前的大模型可能是反映成不同的 prompt
x77
2023-06-29 11:32:20 +08:00
@conhost

AWS 或者 Azure 有没有提供这种服务?或者推荐个 NLP 云服务?
x77
2023-06-29 12:45:43 +08:00
看了下 OpenAI 的文档,function 可能可以实现,但是感觉很麻烦。让 gpt 模型调用我预置好函数,如果一段自然语言夹杂着作画指令,模型调用我的函数时它怎么给我传递参数?我又改如何从杂乱的信息里提取有效的参数。。。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/952519

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX