ビジネス

1~13 / 2549件

ビジネス
2025/12/24 [WED]
Mistral AI、手書き文書も高精度にテキスト化する「Mistral OCR 3」発表──文書AI基盤を強化のサムネイル画像

Mistral AI、手書き文書も高精度にテキスト化する「Mistral OCR 3」発表──文書AI基盤を強化

Mistral AIは2025年12月19日(現地時間)、スキャンしたドキュメントや手書き文字を認識し、テキストデータへ変換できる新たな光学文字認識(OCR)モデル「Mistral OCR 3」を[発表]{target=“_blank”}した。単なる文字抽出にとどまらず、文書構造を保持した出力を特徴とし、同社は企業向けDocument AI基盤を支える中核モデルとして位置付けている。 @[YouTube] ## スキャン文書や手書き文字を“構造ごと”理解 Mistral OCR 3は、PDFや画像として保存された文書から、印字されたテキストだけでなく、手書き文字、図表、レイアウト情報を含めて解析する。契約書や請求書、申請書類、フォーム文書、歴史的資料など、紙や画像ベースで存在する多様な文書のデジタル化を想定して設計されている。 **■ Mistral AIが公開したOCRベンチマーク比較図。フォーム文書、手書き文字、請求書、複雑な表、歴史的スキャン文書といった複数のデータセットにおける性能を示している** ![ocr-3.png] :::small 画像の出典:[MistralAI]{target=“_blank”} ::: 従来のOCRが文字列抽出に主眼を置いていたのに対し、Mistral OCR 3は文書全体の構造理解を重視している点が特徴だ。 ## MarkdownとHTMLでの出力に対応 出力形式として、本文テキストはMarkdown形式で提供され、表についてはHTMLベースで再構築できる。これにより、文書検索、要約、RAG(検索拡張生成)、AIエージェントによる業務処理など、下流のAI処理パイプラインにそのまま組み込める設計となっている。 Mistral AIは、OCRを単体機能としてではなく、生成AIによる文書理解・活用の前段階を担う要素として位置付けている。 ## API提供と価格設定 Mistral OCR 3はAPI経由で提供される。公式ドキュメントによると、価格は通常のAPI利用で1,000ページあたり2ドル、Batch APIを利用した場合は1,000ページあたり1ドルとされている。大量の文書を処理する企業利用を想定したコスト設計となっている。 ## Document AIスタックの中核モデルに Mistral OCR 3は、同社が展開するDocument AI関連機能の基盤モデルとして位置付けられている。紙や画像として存在する情報をAIが扱える構造化データへ変換する役割を担い、大規模言語モデルと組み合わせた業務自動化やデータ活用を支える。 Mistral AIは今後も、企業向けAI基盤の拡充を進めていくとしている。 関連記事 :::box [関連記事:Google、PDFや画像を直接理解する「Gemini 1.5」を発表──最大1,000ページ超の文書処理に対応] ::: :::box [関連記事:Adobe、Acrobatに生成AIを統合──PDFを「読む・探す・要約する」Document AIへ進化] ::: :::box [関連記事:Amazon、書類処理AI「Textract」を強化──表・フォーム理解を自動化] ::: :::box [関連記事:Microsoft、CopilotでPDFや業務文書のAI活用を本格化──Word・Excelとの連携を強化] ::: :::box [関連記事:生成AIは「文書理解」へ進化する──RAGとDocument AIが業務自動化の鍵に] :::

アクセスランキング
25to26_registration_rectangle_top_ai70th
FOLLOW US
各種SNSでも最新情報をお届けしております