对话式RAG
在许多问答应用中,我们希望允许用户进行反复对话,这意味着应用需要某种形式的“记忆”来记录过去的问题和答案,并具备将这些信息融入当前思考的逻辑。
在本指南中,我们重点关注添加用于整合历史消息的逻辑。 关于聊天历史管理的更多细节在这里覆盖。
我们将介绍两种方法:
- 链接,其中我们始终执行检索步骤;
- 代理,其中我们给予大型语言模型自由决定是否以及如何执行检索步骤(或多个步骤)。
对于外部知识源,我们将使用Lilian Weng的同一篇LLM Powered Autonomous Agents博客文章,来自RAG教程。