AI Community - Forum

Prompting Techniques-Retrieval‑Augmented Generation (RAG, 檢索增強生成)

提示詞工程 (Prompt Engineering)

nick 2025年07月31日05:52 1

Retrieval‑Augmented Generation (RAG, 檢索增強生成)

RAG（Retrieval‑Augmented Generation） 是將「資料檢索 (Retrieval)」與「語言模型生成 (Generation)」結合的技術。
在模型回答問題前，先檢索外部知識庫（如維基百科、企業文件、資料庫），再將相關內容注入提示 (prompt)，協助模型生成更準確的回覆。
此方法能減少模型的「幻覺（Hallucination）」問題，並避免大量微調模型。

目錄

RAG 的運作原理

接收查詢：使用者提出問題。
文件檢索：從知識庫或向量資料庫（如 FAISS、Pinecone）中搜尋相關文件。
內容整合：將檢索到的文件與原始問題組合成提示 (Prompt)。
生成回覆：語言模型利用外部資訊生成更準確、基於事實的回答。

應用範例

問答系統 (QA)：客服機器人可透過 RAG 連接企業內部文件，提供最新資訊。
文件搜尋與摘要：輸入問題，模型先檢索文件，再生成摘要回答。
專業知識領域：醫學、法律、技術領域，可透過專業資料庫檢索補充模型不足的知識。
即時新聞回應：結合網路檢索，讓模型具備最新資訊的回覆能力。

RAG 的優勢與挑戰

優勢

降低模型幻覺：依據實際檢索資料生成答案，減少虛構資訊。
減少微調成本：無須針對每個新知識進行模型微調。
可即時更新知識：隨時新增資料庫內容，即可擴充模型知識。
結合多來源：支援多文檔檢索與跨資料來源整合。

挑戰

檢索品質依賴資料庫：若資料不足或檢索失敗，生成結果會受影響。
提示設計複雜：需優化檢索結果與提示結構，避免資訊冗餘。
效能與延遲：檢索與向量匹配過程可能增加回應時間。

結語

RAG 是解決知識缺乏與模型幻覺的重要技術，適用於需要「最新資訊」或「專業知識」的應用場景。
它透過「檢索 + 生成」模式，結合 LLM 的語言能力與外部知識庫，兼顧準確性與即時性。
RAG 是目前企業知識型 AI、智慧客服與資料問答系統的核心方法。

References

Prompt Engineering Guide
Retrieval Augmented Generation (RAG)
Lewis et el. (2021)
Natural Questions
WebQuestions
Retrieval-Augmented Generation for Large Language Models: A Survey (Dec 2023)
Retrieval Augmented Generation: Streamlining the creation of intelligent natural language processing models (Sep 2020)

目錄:Prompting Techniques

上一篇：Prompting Techniques - 思維樹
下一篇：Prompting Techniques - 自動推理與工具使用

Prompting Techniques-Tree of Thought (ToT, 思維樹)

主題系列文章索引

Applications - Generating Synthetic Dataset for RAG