AIGC 多模态如何实现？

2023-06-28 21:09:34 +08:00

x77

比如用户输入了一组字符串，我怎么判断他 User 是需要 AI 回复文本还是作图还有（未来可能支持）作曲或视频？

1731 次点击

所在节点

6 条回复

raycool

2023-06-28 21:43:41 +08:00

NLP 语义理解

airyland

2023-06-28 22:23:42 +08:00

调一次 ChatGPT 的 function call 解析成结构化数据

x77

2023-06-28 22:27:03 +08:00

@airyland

function_call: auto ，它返回的内容是怎么样的？

conhost

2023-06-28 23:59:48 +08:00

NLP 里面有意图识别，之前的任务机器人就是按照先进行意图识别，再进行槽位抽取。目前的大模型可能是反映成不同的 prompt

x77

2023-06-29 11:32:20 +08:00

@conhost

AWS 或者 Azure 有没有提供这种服务？或者推荐个 NLP 云服务？

x77

2023-06-29 12:45:43 +08:00

看了下 OpenAI 的文档，function 可能可以实现，但是感觉很麻烦。让 gpt 模型调用我预置好函数，如果一段自然语言夹杂着作画指令，模型调用我的函数时它怎么给我传递参数？我又改如何从杂乱的信息里提取有效的参数。。。

第 1 页／共 1 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.