用你自己的数据, 5 分钟训练一个专属 ChatGPT,回答有据可依无幻觉

2023-06-13 23:02:27 +08:00
 yeeisme

不用自己去研究 langchain ,折腾向量数据。 无服务器,面向接口,利用 http://aiproxy.io/ 提供的自定义垂直聊天机器人、知识库能力,5 分钟就构建一个自己的聊天机器人。 只需要添加您的网站链接、PDF 等数据,即可获得类似 ChatGPT 的聊天机器人。让它专注于回答您设定的知识,减少逻辑错误和生成幻觉,只基于对您输入材料的理解去回答问题。

您还可以使用此能力,将自己在网络上阅读的微信公众号文章,研究资料或其他文本形式的内容添加到知识库,让它帮你深度理解并记录,成为你的第二大脑。

每一个回答,都是可解释的,回答时还会引用内容来源文档,保证准确无误。

感兴趣的,可以看详细的文档: https://docs.aiproxy.io/dev/library

下面展示一个利用此能力,构建的 TG 产品智能问答机器人,把产品文档的链接提交一下,就自动生成了一个如下效果的智能客服。

说个题外话,aiproxy 除了提供垂直数据 chat ,这还是一个非常专业的 openai 接口代理平台,长期使用的开发者和团队用户,最低 10%费率,国内网络访问方便,还是非常划算的。

产品最近也上线了开发者开放平台,各大围绕 chatgpt 构建的应用、插件作者,欢迎来试试。也可以来拿个邀请链接,贴到自己的博客或者产品页,实现 GPT 自由。

2189 次点击
所在节点    推广
10 条回复
aduangduang
2023-06-14 10:36:04 +08:00
10 元人民币能兑换 10000 积分,每个 token 价格为 0.02 积分,因此 10 元人民币可以用 500 个 tokens 。
???
你要不要看看自己在说什么?
yeeisme
2023-06-14 12:26:12 +08:00
@aduangduang 数字推理 gpt3.5 模型也就这个水平了。你调用时可以上 gpt4 ,能好点。
yeeisme
2023-06-14 12:26:58 +08:00
@aduangduang 你也可以禁掉基于给定知识的推理,文档有什么答什么
RageBubble
2023-06-14 15:47:00 +08:00
这有点像对 GPT 进行微调,只不过 openia 只提供了 davince 以下的模型,使用你们这个可以直接微调 gpt4 。
我已经买了会员了,准备好好研究一下。
RageBubble
2023-06-14 15:48:55 +08:00
另外,你们的教程文档我无法使用 gpt4 的 web browsing 功能浏览,希望能让 gpt 访问,我有时候不想自己看文档
yeeisme
2023-06-14 16:11:36 +08:00
@RageBubble 因为现在官方就还没放出 browsing 的 api ,后续平台计划自己做,敬请期待
yeeisme
2023-06-14 16:13:18 +08:00
@RageBubble 微调的成本可太高了。这个模式,今天看有会员用,一篇微信公众号的文章训练目前大概消耗 1 个积分,10 块钱可以买 1 万篇公众号文章。微调模型固定资源应该是 10 万起步吧。
当然这功能正式放开,肯定要收平台存储和计算资源的费用。
RageBubble
2023-06-14 17:00:02 +08:00
@yipengfei329 #6 我的意思,当时我给 gpt4 你们的网址,想让 gpt4 去读里面的文档,然后让它告诉我怎么使用,有哪些功能。结果他说你们的 robots 阻止了它访问。
RageBubble
2023-06-14 17:20:41 +08:00
还有一点就是,你们会怎么处理用户上传的训练数据?
yeeisme
2023-06-14 19:58:05 +08:00
@RageBubble 向量化后存储,机密数据还是不适合用,openai 也会得到最后总结环节数据的

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/948492

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX