RAG

Retrieval-Augmented Generation/RAG


Embedding|


RAG 框架
Haystack| RAGFlow| Txtai| LLM-App | ragas(评估)


RAG Pipline


图片来源



Naive RAG
步骤1:构建数据索引(Index)
1、加载不同来源、不同格式文档;
2、将文档分割成快(Chunk);
3、对切块的数据进行向量化并存储到向量数据库;
步骤2:检索增强(Retrieval-Augmented)
1、通过向量相似度检索与问题最相关的K个文档;
2、检索召回知识附加上下文填充至Prompt;
步骤3:生成(Generation)
检索增强提示输入至LLM生成请求响应;




Naive RAG
Advanced RAG
Modular RAG
Graph RAG

大模型的缺陷:
1、知识局限性。缺少垂直领域、非公开知识;
2、知识实时性。新知识添加训练周期长、成本高;
3、幻觉问题。最大的问题,模型生成的内容与现实世界事实或用户输入不一致。

What are the limitations of LLMs?




参考

爱鼓捣 -- AI开发者de频道

B站/大模型_Lance





BypInformation