xiaokangz
18 天前
回复下自己的帖子吧,分享下自己做这个项目的经历,说不定对跟我一样懵的小伙伴有点帮助。
起初,我以为要通过微调来实现,但搞了几天后,发现根本搞不起来,一来没有机器,二来也没有数据。后来有一个同事提到说,可以用 RAG 实现。当时我还没听过这个词,于是换了换思路,发现市面上已经有很多现成的工具,比如 MaxDB 、AnythingLLM 之类的,而且使用下来发现效果还过得去。于是就开始尝试理解 RAG (检索增强生成)的工作原理。就这样,一边学一边做,最后把整个流程跑通了。
现在看来 RAG 无非就是让大模型做阅读理解,唯一的难点是如何提升检索内容的相关性与准确性,这是提升大模型回答质量的关键。
在深入研究之后,发现传统的 RAG 更适合回答那些知识库已经有明确答案的问题,比如如何创建一个用户,这类问题通常手册里已经给出了明确答案。但诸如“这本书大致讲了一个什么样的故事?”之类的全局性问题,传统 RAG 无能为力。此时可以考虑使用 LightRAG ,或者 GraphRAG 。