特集
FEATURE
ビジネス
BUSINESS
ラーニング
LEARNING
エンジニアリング
ENGINEERING
学術&研究
ACADEMICS & STUDY
公共
PUBLIC
エンタメ&アート
ENTERTAINMENT & ART
1~13 / 2718件
Googleは2026年3月10日(米国時間)、マルチモーダル対応の埋め込みモデル「Gemini Embedding 2」を[発表]{target=“_blank”}した。Gemini APIおよびVertex AIを通じてパブリックプレビューとして提供を開始する。テキストと画像など異なる形式のデータを同一のベクトル空間で表現できるようにすることで、検索や推薦、RAG(Retrieval-Augmented Generation)などのAIアプリケーションの精度向上を目指す。 ## テキストと画像を同一ベクトル空間で扱うembeddingモデル Embedding(埋め込み)モデルは、文章や画像などのデータを数値ベクトルに変換し、意味的な類似度を計算できるようにするAI技術である。セマンティック検索やレコメンド、クラスタリング、ドキュメント分類など、多くのAIシステムの基盤として利用されている。 **Gemini Embedding 2の概念図:テキスト、画像、動画、音声、ドキュメントなど異なるデータを埋め込みモデルがベクトル化し、共通の「embedding空間」で比較できるようにする** ![Gemini Embedding 2 multimodal input.jpg] :::small 画像の出典:[Google]{target=“_blank”} ::: 発表されたGemini Embedding 2は、テキストだけでなく画像など複数のモダリティを対象にした埋め込み処理に対応する。異なる種類のデータを同一のベクトル空間に変換することで、例えば画像と文章の意味的な近さを比較したり、画像を含むデータベースから関連情報を検索したりすることが可能になる。 こうしたマルチモーダル埋め込みは、商品検索やコンテンツ推薦、画像付きドキュメント検索など、より高度な情報検索システムの構築に活用できるとされる。 ## Gemini APIとVertex AIから提供 Gemini Embedding 2は、Googleの生成AIプラットフォームであるGemini APIおよびVertex AIを通じて利用できる。開発者はこれらのサービスを利用することで、アプリケーションや企業システムに埋め込みモデルを組み込み、検索や知識探索機能を実装できる。 Embeddingモデルは、生成AIと組み合わせてRAG(Retrieval-Augmented Generation)を構築する際の重要な要素でもある。企業が保有する文書やデータベースから関連情報を検索し、その結果を生成AIの回答生成に活用する仕組みで、近年多くのAIアプリケーションで採用が進んでいる。 **Gemini Embedding 2のベンチマーク比較:テキスト、画像、動画、音声など複数モダリティの検索タスクで既存のembeddingモデルと比較して高い性能を示した** ![gemini-embedding-2-benchmarks.width-1000.format-webp.jpg] :::small 画像の出典:[Google]{target=“_blank”} ::: Googleは今回のモデルをパブリックプレビューとして提供し、開発者からのフィードバックを得ながら改良を進めるとしている。 ## Geminiモデル群の拡張の一環 今回の発表は、Googleが展開するGeminiモデルファミリーの拡張の一環と位置付けられる。Googleは近年、テキスト生成やマルチモーダル理解、コーディング支援などさまざまな用途向けにGeminiモデルを提供してきた。 Embeddingモデルは、AIアプリケーションの検索や知識基盤を支える役割を担う技術とされる。Gemini Embedding 2の導入により、検索システムやレコメンドエンジン、マルチモーダルRAGなど、AIを活用した情報探索基盤の高度化が期待される。 :::box [関連記事:Google、オンデバイス向け埋め込みモデル「EmbeddingGemma」を公開──約3億パラメータで200MB動作を実現] ::: :::box [関連記事:Google 大規模言語モデルに「視覚」を与える メルカリと開発した商品画像検索AIも公開] ::: :::box [関連記事:Gemini 3 Flashに高精度な画像理解「Agentic Vision」追加──“考えて見る”新機能をGemini APIで提供開始] ::: :::box [関連記事:Google、「Gemini 3」を正式発表──推論・マルチモーダル性能を強化した最新モデル、本日より提供開始] ::: :::box [関連記事:Google検索、日本語版「AIモード」を開始──Gemini 2.5活用、“検索から対話”へ] :::
Ledge.aiにソリューション情報を掲載しませんか?
使い方や具体的な目標などを詳しくご説明します
お問い合わせ