怎样使用 ChatGPT 构造一个客服机器人?

2023-04-04 02:10:01 +08:00
 ericgui

我意思是,把我们很多 FAQ 问题和答案,以及更多的资料喂给 ChatGPT ,然后你去问 ChatGPT ,它就给你回复了

但我怎么把自己的那么多资料喂给 ChatGPT 呢?

总不能每次你问一次,我先把资料喂给 ChatGPT 一次吧?那多费劲,更何况 GPT-3.5 只能接受 3000 个 token 的输入,GPT-4 也只能接受 32000 个 token

3392 次点击
所在节点    程序员
14 条回复
malusama
2023-04-04 04:29:52 +08:00
find tune
gaobh
2023-04-04 06:41:30 +08:00
自己搭一个知识库,再结巴分词,再把问题根据相似度选择最相关的片段处理。
swulling
2023-04-04 08:02:40 +08:00
@malusama gpt 3.5 和 4 还没有开放 fine-tuning 的 API

https://platform.openai.com/docs/guides/embeddings

当然现在有很多成熟的库,比如 llama_index 和 langchain
knightdf
2023-04-04 08:55:38 +08:00
xmumiffy
2023-04-04 09:03:55 +08:00
admin9
2023-04-04 09:19:56 +08:00
内容数字化,使用 cosine similarity 算法找出跟问题最相关的内容,作为 prompt 传给 GPT
https://github.com/openai/openai-cookbook/blob/main/examples/Question_answering_using_embeddings.ipynb
RoshanWu
2023-04-04 09:48:53 +08:00
fg990
2023-04-04 09:56:50 +08:00
服务机器人是需求最明确。
lower
2023-04-04 10:13:11 +08:00
chatgpt 肯定是希望其他的公司、产品、服务全都以插件的形式接入在它平台被集成和调用……
diehe
2023-04-04 10:28:05 +08:00
@swulling llama_index 好像就是 chatindex ,langchain 这个我也关注到了,准备自己搭建一个玩玩。就是不知道,质量咋样!
SmiteChow
2023-04-04 10:31:51 +08:00
请参考 chatpdf.com
aCodingCat
2023-04-04 10:59:04 +08:00
我也有这个疑问
如果是聊天场景,难道用户每次发送,都要附带之前全量的聊天记录吗?那 token 岂不是很容易就爆了
duffercn
2023-04-04 23:45:20 +08:00
Embeddings
alanhe421
307 天前
嗯 此类需要本质是拓展 AI 模型知识库,so ,embedding 合适

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/929571

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX