AI用語の基礎知識
【第8回】「RAG」とは――一般的な知識しか持たないAIを「自社専用の専門家」にする技術
2026年6月1日 07:00
RAGとは、「検索拡張生成」を意味する英語 “Retrieval-Augmented Generation” の略です。
ChatGPTやGeminiに、自社の就業規則や最新の製品仕様について質問して、見当違いの答えを返された経験はありませんか? AIは、学習していない情報や最新情報について、知らないままでもそれらしい回答を作ってしまうことがあります。これが【第2回】で解説した「ハルシネーション」ですね。
AIは便利だけれど、自社の仕事にはそのまま使いにくい……。その弱点を補う技術の一つが、今回取り上げる「RAG」です。
外部知識を検索してから回答する仕組み
RAGとは、AIが回答を作る前に、外部の知識ベースや社内文書を検索し、その内容を参考にして回答させる仕組みです。
たとえば、社内規定、製品マニュアル、FAQ、議事録、仕様書などを、あらかじめAIが検索しやすい形でデータベースに登録しておきます。利用者が「新製品Aの保証期間は?」と質問すると、AIはいきなり回答を作るのではなく、まず関連しそうな文書を探します。
次に、その検索結果を参考資料としてLLMに渡します。LLMは、自分がもともと学習していた知識だけではなく、渡された資料の内容を読み取ったうえで回答を生成します。
つまりRAGは、「AIにすべてを暗記させる技術」ではなく、必要なときに必要な資料を探し出し、その資料を根拠に回答させる仕組みなのです。
たとえるなら、通常のLLMは「何も見ずに答える試験」。いくら頭が良くても、教科書に載っていない最新情報や、社外秘のデータは答えられません。無理に答えようとすると、それらしい“嘘”を作ってしまうことがあります。
一方、RAGは「資料持ち込み可の試験」だと言えます。AIは手元の社内マニュアルや文書を検索し、それを読みながら回答します。これにより、ハルシネーションを減らし、最新情報や社内固有の情報に基づいた回答をしやすくなるわけです。
Retrieval(検索して)、Augmented(情報を追加し)、Generation(文章を作る)。これがRAGの基本的な考え方です。
ファインチューニングとは何が違う?
【第4回】では、AIの用途に合わせて知識や応答傾向を調整する方法として「ファインチューニング」に触れました。では、知識を追加するならRAGではなく、ファインチューニングを使えばよいのでは、と思う人もいるかもしれません。
しかし、両者は向いている用途が違います。ファインチューニングは、モデルの振る舞いや専門性を調整するには有効ですが、情報を更新するたびに学習し直すのは大変です。就業規則や製品仕様のように、内容が頻繁に変わる情報を扱うには、手間もコストもかかります。
その点、RAGでは参照する文書を差し替えれば、比較的簡単に最新情報へ追従できます。AIそのものを作り替えるのではなく、外付けの資料を更新するイメージです。
企業内AIや問い合わせ対応AIでは、この性質が大きな強みになります。AIに「自社のすべてを覚えさせる」のではなく、「必要な社内資料を正しく探して読ませる」方が、現実的で運用しやすい場合が多いのです。
RAGにも限界はある
ただし、RAGを使えば必ず正しい答えが返ってくるわけではありません。検索する文書が古かったり、間違っていたりすれば、回答も誤ります。また、AIが資料を読み違えることもあります。
それでも、根拠となる文書を参照させられる点は大きな利点です。回答に引用元や参照文書を表示できれば、人間が確認しやすくなります。
これからの企業向けAI活用では、AIモデルそのものの賢さだけでなく、「どの資料を、どう検索させ、どう回答に使わせるか」が重要になります。
RAGは、一般的な知識しか持たないAIを、自社の情報を扱える“専用アシスタント”に近づけるための基本技術といえるでしょう。







































