特集
FEATURE
ビジネス
BUSINESS
ラーニング
LEARNING
エンジニアリング
ENGINEERING
学術&研究
ACADEMICS & STUDY
公共
PUBLIC
エンタメ&アート
ENTERTAINMENT & ART
1~13 / 2778件
リコーは2026年3月30日、図表を含む多様なドキュメントを高精度に読み取る推論能力を備えたマルチモーダル大規模言語モデル(LMM)「Qwen3-VL-Ricoh-32B-20260227」の開発を完了したと[発表]{target=”_blank”}した。同社はこのモデルを「リーズニングLMM」と位置付けており、多段推論を通じて複雑な企業文書を理解できる点を特徴としている。 同モデルは、アリババクラウドのマルチモーダルモデル「Qwen3.0-VL」をベースに開発された。経済産業省およびNEDOが進める国内生成AI開発力強化プロジェクト「GENIAC」第3期の取り組みとして開発されたものだ。 また、軽量版モデル「Qwen3-VL-Ricoh-8B-20260227」は同日より無償公開されている。さらに、リーズニング性能の評価に特化したリコー独自のベンチマークツールも今後公開予定としている。 ## 図表を含む文書理解に特化した「リーズニングLMM」 リコーが開発したリーズニングLMMは、企業内で扱われる文書に多く含まれる図表・グラフ・レイアウト情報を含めて理解できるマルチモーダルAIモデルだ。 通常のLLMはテキスト処理を中心としているが、LMMでは画像や図表などの視覚情報を含めて処理できる。さらに同モデルは推論能力を強化しており、複数のステップにわたる推論を行うことで、複雑なドキュメント内容をより正確に理解できるという。 このような能力は、企業の業務文書、報告書、技術資料などの読み取りや分析といった用途での活用が期待されている。 ## 独自ベンチマークで高い文書理解性能 リコーは今回、文書理解能力を評価するための独自ベンチマーク「JDocQA-Reasoning」を用いて性能評価を行った。その結果、同社のモデルは32B規模でありながら、大規模モデルと比較しても高い性能を示したとしている。 また、公開ベンチマークと独自ベンチマークを組み合わせた比較でも、同モデルは競合モデルに近い性能を示した。 ![Qwen3-VL-Ricoh-32B-20260227.jpg] :::small 画像の出典:[Ricoh]{target=“_blank”} ::: **■ 公開ベンチマーク(JDocQA)と独自ベンチマーク(JDocQA-Reasoning)の比較。リコーのモデルは32B規模でありながら高い性能を示した** ![0330_1a.webp] :::small 画像の出典:[Ricoh]{target=“_blank”} ::: ## リコーのLLM・LMM開発ラインアップ リコーはこれまでにも、複数のLLMおよびLMMモデルを開発してきた。今回のリーズニングLMMは、同社のマルチモーダルAI開発の中核モデルの一つとして位置付けられている。 **■ リコーのLLM/LMMモデルラインアップ。LLMとLMMの両系列で複数のモデルを開発している** ![0330_1b.webp] :::small 画像の出典:[Ricoh]{target=“_blank”} ::: リコーは今後、企業のドキュメント処理や業務効率化に向けて、これらのAIモデルを活用したサービスの展開を進めていくとしている。 :::box [関連記事:リコー、「文書×AI」を現場仕様に──Qwen2.5-VL-32B基盤、視覚データ60万枚でチューニング] ::: :::box [関連記事:リコー、複雑な図表読み取りに特化したマルチモーダルLLMを開発 7月に無償公開へ] ::: :::box [関連記事:新たにウーブン・バイ・トヨタなどが採択 国産の生成AI開発プロジェクト「GENIAC」第2期がスタート] ::: :::box [関連記事:Alibaba CloudのAI研究チームQwen、DeepSeek-V3を超えるAIモデル「Qwen2.5-Max」とVLM (視覚言語モデル)「Qwen2.5-VL」を発表] ::: :::box [関連記事:仏Mistral AI、高速・高精度なMistral OCRを発表―マルチモーダル対応でLaTeX数式・図表を崩さず抽出、PDFをAI対応データに変換] :::
Ledge.aiにソリューション情報を掲載しませんか?
使い方や具体的な目標などを詳しくご説明します
お問い合わせ