特集
FEATURE
ビジネス
BUSINESS
ラーニング
LEARNING
エンジニアリング
ENGINEERING
学術&研究
ACADEMICS & STUDY
公共
PUBLIC
エンタメ&アート
ENTERTAINMENT & ART
1~13 / 2667件
Googleは2026年2月19日(現地時間)、同社の大規模言語モデル「Gemini」シリーズの最新モデル「Gemini 3.1 Pro」を[発表]{target=“_blank”}した。Googleは同モデルを「複雑問題解決の新たなベースライン」と位置づけ、研究モデル「Gemini 3 Deep Think」と同じコア知能を実務用途向けにスケールしたものだと説明している。同日よりコンシューマー向けアプリから開発者向けAPI、エンタープライズ向け基盤まで順次ロールアウトを開始した。 ## 「複雑問題解決の新ベースライン」と位置付け 発表の中でGoogleは、Gemini 3.1 Proを「[our new baseline for complex problem-solving]{target=“_blank”}(複雑な問題解決の新たな基準)」と表現した。 同社によれば、Gemini 3.1 ProはGemini 3 Deep Thinkと同じコア知能を備えつつ、より実務的な用途に適したスケールへ最適化されたモデルだという。研究用途に限定されていた推論能力を、より広範な利用層に開放する位置づけとなる。 ## ARC-AGI-2で77.1%──3 Proから2倍超 今回の発表で注目されるのは、抽象推論ベンチマーク「ARC-AGI-2」におけるスコアだ。 DeepMindが公開した評価結果によれば、Gemini 3.1 ProはARC-AGI-2で77.1%を記録した(ARC Prize Verified)。前世代のGemini 3 Pro(31.1%)から大幅に向上している。 ARC-AGI-2は、未知の論理パターンを解く能力を測定するベンチマークで、単純な知識検索では対応しにくい抽象推論を評価するものとされる。 比較対象として公表されている数値では、Claude Opus 4.6が68.8%、GPT-5.2が52.9%となっている。 ![HBiFhy-XsAA06bm.jpg] :::small 画像の出典:[Google]{target=“_blank”} ::: ## Humanity’s Last Examでもトップ帯 総合的な知識と推論能力を測るベンチマーク「Humanity’s Last Exam」では、Gemini 3.1 Proは44.4%を記録している。同条件での比較では、Claude Sonnet 4.6が40.0%、GPT-5.2が34.5%となっており、Gemini 3.1 Proはトップ帯に位置している。 ![gemini_3-1-pro__benchmarks.jpg] :::small 画像の出典:[Google]{target=“_blank”} ::: ## SWE-bench Verified 80.6%──実務性能は維持 ソフトウェア開発能力を測定する「SWE-bench Verified」では、Gemini 3.1 Proは80.6%を記録した。 Claude Opus 4.6の80.8%とほぼ同水準であり、抽象推論ベンチマークでの大幅な向上と同時に、実務的なコーディング性能も維持していることが示されている。 ## デモ事例:ISS追跡から3D群れシミュレーションまで Googleは、Gemini 3.1 Proのデモ事例を複数紹介している。 - 公開APIを用いた国際宇宙ステーション(ISS)のリアルタイム追跡ダッシュボード構築 - テキストプロンプトからのアニメーションSVG生成 - 手の動きに反応するインタラクティブ3Dスターリング(ムクドリ)群れシミュレーション - 小説『嵐が丘』の雰囲気を反映したポートフォリオUIの生成 ![animated SVGs.jpg] :::small 画像の出典:[Google]{target=“_blank”} ::: モデルのコード生成や構造表現の品質を手早く比較する題材として、開発者コミュニティでしばしば用いられてきた「自転車に乗るペリカン」のアニメーションSVG生成も取り上げられている。Googleは「アニメーションSVGで自転車に乗るペリカンを生成せよ」というプロンプトを用い、Gemini 3 ProとGemini 3.1 Proの生成結果を並べて提示した。 公開された比較画像では、Gemini 3 Proの生成例では自転車のペダルは回転しているものの、ペリカンの脚はペダル動作と連動していない。一方、Gemini 3.1 Proの生成例では、脚がペダルに正しく配置され、動きと連動している様子が確認できる。 ## 提供範囲 Gemini 3.1 Proは、発表同日より段階的に提供が開始される。コンシューマー向けにはGemini AppおよびNotebookLMで利用可能となる。開発者向けには、Gemini APIのプレビュー版として提供され、Google AI StudioやGemini CLI、Android Studioなどの開発環境からアクセスできる。さらに、企業向けにはVertex AIおよびGemini Enterpriseを通じて導入可能とされている。 :::box [関連記事:Google、推論特化「Gemini 3 Deep Think」アップデート──ARC-AGI-2で84.6%など主要ベンチマークで軒並み高評価、科学・研究・工学領域の高度な問題解決に照準] ::: :::box [関連記事:Gemini 3 Flashに高精度な画像理解「Agentic Vision」追加──Python実行で画像を再検査、品質5〜10%向上] ::: :::box [関連記事:Sakana AI、推論時に複数LLMを協調させる「AB-MCTS」を発表―― o4-mini・Gemini 2.5・DeepSeek R1を連携し、汎用推論タスクで30%以上の正解率を記録] ::: :::box [関連記事:Anthropic、「Claude Opus 4.5」を発表──ソフトウェア開発・エージェント性能・安全性を強化した最新フラッグシップモデル] ::: :::box [関連記事:ChatGPT、新モデル「GPT-5.2」公開──アルトマンCEO「最も賢い一般提供モデル」 推論・コード生成が大幅進化] :::
Ledge.aiにソリューション情報を掲載しませんか?
使い方や具体的な目標などを詳しくご説明します
お問い合わせ