RAGとAI Agentの融合
RAGとは何か
RAG(Retrieval-Augmented Generation:検索拡張生成) は、LLMの回答に外部の知識ソースから検索した情報を組み合わせる技術です。LLMの学習データに含まれない最新情報や企業固有の情報を正確に回答するために不可欠な技術です。
なぜRAGが重要か:
- LLMの学習データには含まれない社内情報へのアクセス
- ハルシネーション(事実でない情報の生成)の抑制
- 情報の出典を明示できるため、信頼性の向上
- LLMの再学習不要で、知識をリアルタイムに更新可能
RAGの基本アーキテクチャ
標準的なRAGパイプライン
1. ドキュメント準備(Indexing)
文書 → チャンク分割 → ベクトル化 → ベクトルDB格納
2. 検索・回答(Retrieval & Generation)
ユーザー質問 → クエリのベクトル化 → 類似チャンク検索
→ 関連チャンクをLLMのコンテキストに追加 → 回答生成
主要コンポーネント
| コンポーネント | 役割 | 代表的なツール |
|---|---|---|
| Embedding Model | テキストをベクトルに変換 | OpenAI text- |