学術&研究
RAGの検索精度を向上させるメタ知識と原子単位検索:新たなアプローチの紹介
Retrieval-Augmented Generation(RAG)は、大規模言語モデル(LLM)に最新かつ関連性の高い情報を提供することで、誤った情報生成を減らし、精度の高い回答を生成するための技術である。しかし、この技術には大規模なデータベースから効率的に正確な情報を検索するという課題が残されている。この記事では、RAGシステムをさらに発展させ、企業向けに実用的な検索精度向上を目指す2つの手法を紹介する。 ## 1. Meta Knowledgeを活用したRAG拡張(Meta Knowledge for Retrieval Augmented LLMs) 2024年8月16日、ケンブリッジ大学で開催されたGenerative AIワークショップで「Meta Knowledge for Retrieval Augmented Large Language Models」という新しいRAGシステムが[発表]{target=“_blank”}された。この技術は、従来の「検索してから読む」というプロセスを「準備してから書き換え、検索して読む」という形に進化させ、検索精度と再現率を大幅に向上させるアプローチだ。 ### メタ知識の活用と実験結果 この手法は、文書ごとに生成されたメタデータや合成QA(質問と回答)を活用し、ユーザーのクエリに対して動的に検索範囲を広げる「Meta Knowledge Summary(MK Summary)」を導入している。これにより、複数の文書にまたがる複雑なクエリにも対応し、検索結果の幅と深さが従来よりも大きく向上する。 実験結果によれば、この手法は従来のチャンクベースのRAGシステムに比べて検索の再現率や具体性が20%以上改善された。また、この技術はコスト効率にも優れており、2000件の研究論文を処理するのに約20ドルしかかからないことが報告されている。このアプローチは、ファインチューニングなしで様々なドメインに適用でき、幅広い普及が期待されている。 ![Meta Knowledge for Retrieval Augmented Large Language Models Fig1.jpg] :::small 画像の出典:[Meta Knowledge for Retrieval Augmented Large Language Models]{target=“_blank”} ::: ## 2. 原子単位の質問ベース検索(Question-Based Retrieval using Atomic Units) ケンブリッジ大学の研究チームは2024年5月20日、新しい検索技術を提案する論文「Question-Based Retrieval using Atomic Units for Enterprise RAG」を[発表]{target=“_blank”}した。企業が内部文書を使ってより正確な情報検索を行うための手法で、従来のシステムに比べて大幅な性能向上を実現するという。 ### 原子単位の検索と成果 「原子単位の検索」とは、文書を「原子」と呼ばれる小さな単位に分割し、それに基づく質問を生成することで、ユーザーのクエリに対してより正確に情報を検索する手法だ。このアプローチにより、従来のチャンクベースの検索に比べ、検索精度が飛躍的に向上したことが確認されている。 実験では、この技術を用いることで正確な情報を検索できる確率が65.5%から70.2%に向上し、生成された質問を活用した検索ではさらに73.8%に達した。研究者たちは、この手法が企業向けRAGシステムの標準となり、業務効率化に貢献することを期待しているという。 ![Question-Based Retrieval using Atomic Units for Enterprise RAG Fig1.jpg] :::small 画像の出典:[Question-Based Retrieval using Atomic Units for Enterprise RAG]{target=“_blank”} ::: :::box [関連記事:LLMはRAGと事前知識をどう使い分けるのか マサチューセッツ大とMicrosoftの研究グループが発表] ::: :::box [関連記事:「RAG」と「ロングコンテキストLLM」の徹底比較:LLMの長文理解における新たなハイブリッドアプローチ Google DeepMindとミシガン大学の研究] :::