各位大佬,很好奇 chatdoc 和 chatpdf 和对一个网址进行总结是怎么实现的啊

2023-10-27 14:48:50 +08:00
 helloword001
各位大佬,很好奇 chatdoc 和 chatpdf 和对一个网址进行总结是怎么实现的啊,有没有哪位大佬知道的啊
1312 次点击
所在节点    OpenAI
8 条回复
helloword001
2023-10-27 15:49:34 +08:00
我顶
luzemin
2023-10-27 16:01:22 +08:00
简单画了下,大概就是这意思,中间的细节你自己再查下

Selenium39
2023-10-27 16:06:23 +08:00
现在各种 chatXXX 太多了,能不能弄一个 chatAll 的网站
ChatLaw: https://chatlaw.cloud
ChatDoctor: https://github.com/Kent0n-Li/ChatDoctor
ChatPPT: http://chatppt.closeai.red
ChatDoc: https://chatdoc.com
ChatDb: https://www.chatdb.ai
edisonwong
2023-10-27 16:09:27 +08:00
@Selenium39 我写了个有点类似的,参考帖子 https://v2ex.com/t/983404 也许不是很完善,目前在优化中
helloword001
2023-10-27 16:30:19 +08:00
@luzemin 牛逼
helloword001
2023-10-27 16:31:25 +08:00
@edisonwong 你这开源吗,能学习一下吗
edisonwong
2023-10-27 16:39:05 +08:00
@helloword001 我这个的内核的逻辑跟 quvir 没区别,可以看看 github quvir
mmdsun
2023-10-27 21:24:04 +08:00
我用 Azure OpenAI GPT-4 ,接口它是支持自定义数据集,调用聊天接口指定数据源就可以了:背后也是向量搜索。
https://learn.microsoft.com/zh-cn/azure/ai-services/openai/concepts/use-your-data#data-formats-and-file-types
(——提示用这种认识搜索服务是要额外花钱的,如果考虑成本自建更好,开源向量数据库也很多)
```
{
"messages": [
{
"role": "user",
"content": "who is my manager?"
}
],
"dataSources": [
{
"type": "AzureCognitiveSearch",
"parameters": {
"endpoint": "'$SearchEndpoint'",
"key": "'$SearchKey'",
"indexName": "'$SearchIndex'",
"filter": "my_group_ids/any(g:search.in(g, 'group_id1, group_id2'))"
}
}
]
}
```

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/986021

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX