lm studio 上部署哪个 ai 模型可以处理 pdf 文件啊? 我看都需要复制 pdf 里面内容发送才行,有没有直接发 pdf 文件 它就能识别文件里面内容并处理的
![]() |
1
zqqian 11 小时 51 分钟前
现在的主流 ai 都可以,例如 gpt ,gemini
|
![]() |
2
zqqian 11 小时 50 分钟前
抱歉,看错了,lm studio 上的开源模型可以选 qwen 支持多模态的
|
3
miaoxiaomayi OP @zqqian 我今天用这些 ai ,他们好像无法直接识别我发的 pdf 文件里面内容
|
4
miaoxiaomayi OP 都说 xxx.pdf 实际内容为空
|
![]() |
5
zqqian 7 小时 41 分钟前
@miaoxiaomayi #3 现在大模型读取 pdf 的原理都是把每一页转成图像,然后再喂给大模型的。可能是你使用的那个 chat 客户端没有实现这个功能,参考 gemini 的文档: https://ai.google.dev/gemini-api/docs/document-processing?hl=zh-cn#:~:text=.text)-,%E6%8A%80%E6%9C%AF%E8%AF%A6%E6%83%85,-Gemini%20%E6%9C%80%E5%A4%9A%E6%94%AF%E6%8C%81
|