学術&研究

学術&研究
2024/9/8 [SUN]
RAGの検索精度を向上させるメタ知識と原子単位検索:新たなアプローチの紹介のサムネイル画像

RAGの検索精度を向上させるメタ知識と原子単位検索:新たなアプローチの紹介

Retrieval-Augmented Generation(RAG)は、大規模言語モデル(LLM)に最新かつ関連性の高い情報を提供することで、誤った情報生成を減らし、精度の高い回答を生成するための技術である。しかし、この技術には大規模なデータベースから効率的に正確な情報を検索するという課題が残されている。この記事では、RAGシステムをさらに発展させ、企業向けに実用的な検索精度向上を目指す2つの手法を紹介する。 ## 1. Meta Knowledgeを活用したRAG拡張(Meta Knowledge for Retrieval Augmented LLMs) 2024年8月16日、ケンブリッジ大学で開催されたGenerative AIワークショップで「Meta Knowledge for Retrieval Augmented Large Language Models」という新しいRAGシステムが[発表]{target=“_blank”}された。この技術は、従来の「検索してから読む」というプロセスを「準備してから書き換え、検索して読む」という形に進化させ、検索精度と再現率を大幅に向上させるアプローチだ。 ### メタ知識の活用と実験結果 この手法は、文書ごとに生成されたメタデータや合成QA(質問と回答)を活用し、ユーザーのクエリに対して動的に検索範囲を広げる「Meta Knowledge Summary(MK Summary)」を導入している。これにより、複数の文書にまたがる複雑なクエリにも対応し、検索結果の幅と深さが従来よりも大きく向上する。 実験結果によれば、この手法は従来のチャンクベースのRAGシステムに比べて検索の再現率や具体性が20%以上改善された。また、この技術はコスト効率にも優れており、2000件の研究論文を処理するのに約20ドルしかかからないことが報告されている。このアプローチは、ファインチューニングなしで様々なドメインに適用でき、幅広い普及が期待されている。 ![Meta Knowledge for Retrieval Augmented Large Language Models Fig1.jpg] :::small 画像の出典:[Meta Knowledge for Retrieval Augmented Large Language Models]{target=“_blank”} ::: ## 2. 原子単位の質問ベース検索(Question-Based Retrieval using Atomic Units) ケンブリッジ大学の研究チームは2024年5月20日、新しい検索技術を提案する論文「Question-Based Retrieval using Atomic Units for Enterprise RAG」を[発表]{target=“_blank”}した。企業が内部文書を使ってより正確な情報検索を行うための手法で、従来のシステムに比べて大幅な性能向上を実現するという。 ### 原子単位の検索と成果 「原子単位の検索」とは、文書を「原子」と呼ばれる小さな単位に分割し、それに基づく質問を生成することで、ユーザーのクエリに対してより正確に情報を検索する手法だ。このアプローチにより、従来のチャンクベースの検索に比べ、検索精度が飛躍的に向上したことが確認されている。 実験では、この技術を用いることで正確な情報を検索できる確率が65.5%から70.2%に向上し、生成された質問を活用した検索ではさらに73.8%に達した。研究者たちは、この手法が企業向けRAGシステムの標準となり、業務効率化に貢献することを期待しているという。 ![Question-Based Retrieval using Atomic Units for Enterprise RAG Fig1.jpg] :::small 画像の出典:[Question-Based Retrieval using Atomic Units for Enterprise RAG]{target=“_blank”} ::: :::box [関連記事:LLMはRAGと事前知識をどう使い分けるのか マサチューセッツ大とMicrosoftの研究グループが発表] ::: :::box [関連記事:「RAG」と「ロングコンテキストLLM」の徹底比較:LLMの長文理解における新たなハイブリッドアプローチ Google DeepMindとミシガン大学の研究] :::

学術&研究
2024/9/7 [SAT]
Google、咳音を用いた病気の早期検出を可能にするAIモデル「HeAR」を発表のサムネイル画像

Google、咳音を用いた病気の早期検出を可能にするAIモデル「HeAR」を発表

Google
学術&研究
2024/9/5 [THU]
アリババクラウド、新AIモデル「Qwen2-VL」をリリース—画像理解と多言語対応で先端技術を提供のサムネイル画像

アリババクラウド、新AIモデル「Qwen2-VL」をリリース—画像理解と多言語対応で先端技術を提供

基盤モデル
アリババ
学術&研究
2024/9/5 [THU]
東大松尾研 フルスクラッチで開発したLLM「Tanuki-8×8B」を公開/所属研究員の千葉氏「FORBES JAPAN 30 UNDER 30 2024」に選出のサムネイル画像

東大松尾研 フルスクラッチで開発したLLM「Tanuki-8×8B」を公開/所属研究員の千葉氏「FORBES JAPAN 30 UNDER 30 2024」に選出

基盤モデル
国内企業事例
学術&研究
2024/9/2 [MON]
失われゆくCOBOLの専門知識とレガシーシステムの近代化を支援するLLM「XMainframe」のサムネイル画像

失われゆくCOBOLの専門知識とレガシーシステムの近代化を支援するLLM「XMainframe」

基盤モデル
論文
学術&研究
2024/9/1 [SUN]
ロボット触覚技術の新たな展開:人工皮膚不要のセンサーシステムのサムネイル画像

ロボット触覚技術の新たな展開:人工皮膚不要のセンサーシステム

ロボティクス
学術&研究
2024/8/31 [SAT]
独哲学者マルクス・ガブリエル氏、京都哲学研究所のシニア・グローバル・アドバイザーに就任「人類は価値観の危機に直面している」のサムネイル画像

独哲学者マルクス・ガブリエル氏、京都哲学研究所のシニア・グローバル・アドバイザーに就任「人類は価値観の危機に直面している」

国内企業事例
学術&研究
2024/8/28 [WED]
AIエージェントが法廷シミュレーションを進化させる:AgentCourtの登場のサムネイル画像

AIエージェントが法廷シミュレーションを進化させる:AgentCourtの登場

論文
学術&研究
2024/8/27 [TUE]
ディズニー、ヒューマノイドロボットの自律動作技術を発表:モーションデータから学習する新アニマトロニクスのサムネイル画像

ディズニー、ヒューマノイドロボットの自律動作技術を発表:モーションデータから学習する新アニマトロニクス

論文
学術&研究
2024/8/25 [SUN]
Transformerの動作を視覚化する「Transformer Explainer」ジョージア工科大学が公開のサムネイル画像

Transformerの動作を視覚化する「Transformer Explainer」ジョージア工科大学が公開

論文
学術&研究
2024/8/24 [SAT]
LLMエージェントがソフトウェア開発の未来を形作る シドニー大学などの研究調査のサムネイル画像

LLMエージェントがソフトウェア開発の未来を形作る シドニー大学などの研究調査

AIエージェント
論文
学術&研究
2024/8/22 [THU]
MIT、AIリスクの理解不足を警告   AIの潜在リスクを網羅した新たなデータベース「AI Risk Repository」を公開のサムネイル画像

MIT、AIリスクの理解不足を警告 AIの潜在リスクを網羅した新たなデータベース「AI Risk Repository」を公開

論文
学術&研究
2024/8/19 [MON]
Google DeepMind、テキストから高品質な画像を生成する新モデル「Imagen 3」を正式リリースのサムネイル画像

Google DeepMind、テキストから高品質な画像を生成する新モデル「Imagen 3」を正式リリース

Google
論文
アクセスランキング
VTuber「潤羽るしあ」のイラストレーター、生成AIによる著作権侵害への訴訟費用をクラウドファンディングで調達
失われゆくCOBOLの専門知識とレガシーシステムの近代化を支援するLLM「XMainframe」
東大松尾研 フルスクラッチで開発したLLM「Tanuki-8×8B」を公開/所属研究員の千葉氏「FORBES JAPAN 30 UNDER 30 2024」に選出
4
現実世界のヒューマノイド重機がアニメの世界に TVアニメ『シンカリオン チェンジ ザ ワールド』に「零式人機 ver.2.0」が登場
5
独哲学者マルクス・ガブリエル氏、京都哲学研究所のシニア・グローバル・アドバイザーに就任「人類は価値観の危機に直面している」
DXFW rectangle
FOLLOW US
各種SNSでも最新情報をお届けしております