Retrieval‑Augmented Generation (RAG, 檢索增強生成)
- RAG(Retrieval‑Augmented Generation) 是將「資料檢索 (Retrieval)」與「語言模型生成 (Generation)」結合的技術。
- 在模型回答問題前,先檢索外部知識庫(如維基百科、企業文件、資料庫),再將相關內容注入提示 (prompt),協助模型生成更準確的回覆。
- 此方法能減少模型的「幻覺(Hallucination)」問題,並避免大量微調模型。
目錄
RAG 的運作原理
- 接收查詢:使用者提出問題。
- 文件檢索:從知識庫或向量資料庫(如 FAISS、Pinecone)中搜尋相關文件。
- 內容整合:將檢索到的文件與原始問題組合成提示 (Prompt)。
- 生成回覆:語言模型利用外部資訊生成更準確、基於事實的回答。
應用範例
- 問答系統 (QA):客服機器人可透過 RAG 連接企業內部文件,提供最新資訊。
- 文件搜尋與摘要:輸入問題,模型先檢索文件,再生成摘要回答。
- 專業知識領域:醫學、法律、技術領域,可透過專業資料庫檢索補充模型不足的知識。
- 即時新聞回應:結合網路檢索,讓模型具備最新資訊的回覆能力。
RAG 的優勢與挑戰
優勢
- 降低模型幻覺:依據實際檢索資料生成答案,減少虛構資訊。
- 減少微調成本:無須針對每個新知識進行模型微調。
- 可即時更新知識:隨時新增資料庫內容,即可擴充模型知識。
- 結合多來源:支援多文檔檢索與跨資料來源整合。
挑戰
- 檢索品質依賴資料庫:若資料不足或檢索失敗,生成結果會受影響。
- 提示設計複雜:需優化檢索結果與提示結構,避免資訊冗餘。
- 效能與延遲:檢索與向量匹配過程可能增加回應時間。
結語
- RAG 是解決知識缺乏與模型幻覺的重要技術,適用於需要「最新資訊」或「專業知識」的應用場景。
- 它透過「檢索 + 生成」模式,結合 LLM 的語言能力與外部知識庫,兼顧準確性與即時性。
- RAG 是目前企業知識型 AI、智慧客服與資料問答系統的核心方法。
References
Prompt Engineering Guide
Retrieval Augmented Generation (RAG)
Lewis et el. (2021)
Natural Questions
WebQuestions
Retrieval-Augmented Generation for Large Language Models: A Survey (Dec 2023)
Retrieval Augmented Generation: Streamlining the creation of intelligent natural language processing models (Sep 2020)
上一篇:Prompting Techniques - 思維樹
下一篇:Prompting Techniques - 自動推理與工具使用
