特集
FEATURE
ビジネス
BUSINESS
ラーニング
LEARNING
エンジニアリング
ENGINEERING
学術&研究
ACADEMICS & STUDY
公共
PUBLIC
エンタメ&アート
ENTERTAINMENT & ART
1~13 / 2822件
OpenAIは2026年4月23日(現地時間)、最新AIモデル「GPT-5.5」を[発表]した。複雑な目標を理解し、ツールを使い、自ら作業を確認しながらタスクを完了まで進める「real work」向けのモデルとして位置づける。ChatGPTとCodexで提供を開始し、API提供も近日中に予定している。 ## 知識労働タスクで高い性能、他モデルとの比較でも優位 GPT-5.5は、コーディング、調査、情報分析、文書作成、スプレッドシート作成など、知識労働全般を対象とした性能向上が特徴だ。知識労働タスクを評価する「GDPval」では84.9%を記録し、前世代モデルや他社モデルと比較しても高い水準を示した。 OpenAIは、GPT-5.5が従来モデルよりもタスクの意図を迅速に理解し、少ない指示で適切な行動を選択できる点を強調している。 ![GDPval.png] :::small 画像の出典:[OpenAI]{target=“_blank”} ::: ## ツールを使った実務処理能力を強化 実際のコンピュータ環境での操作能力を測る「OSWorld-Verified」では78.7%を記録した。これは、ファイル操作やブラウザ操作など、ツールを組み合わせた実務タスクにおける処理能力の向上を示すものだ。 GPT-5.5は、単に回答を生成するだけでなく、ツールを活用して作業を進める「エージェント型AI」としての性能を強化している。 ![OSWorld-Verified.png] :::small 画像の出典:[OpenAI]{target=“_blank”} ::: ## 業務ワークフローでも高精度、実運用を意識 顧客対応などの業務プロセスを再現した「Tau2-bench Telecom」では98.0%の精度を記録した。複数ステップにわたる判断や処理が求められるタスクでも、高い一貫性で処理できることが示されている。 OpenAIは、こうした結果を踏まえ、GPT-5.5を企業の実務ワークフローに組み込めるモデルとして位置づけている。 ![Tau2-bench Telecom.png] :::small 画像の出典:[OpenAI]{target=“_blank”} ::: ## コーディング性能も向上、開発者利用を後押し コーディング能力を評価する「Terminal-Bench 2.0」でも、GPT-5.5はGPT-5.4を上回るスコアを示した。実際の開発環境に近い条件での評価においても、コード生成や修正、デバッグの精度が向上している。 OpenAIは4月、Codexの週間利用開発者数が300万人を超えたと発表しており、同社の開発者向けAI利用の拡大を背景に、その後2週間で400万人超に拡大したとしている。GPT-5.5はこうした開発者向けAIエージェントの中核モデルとしても機能する。 ![Terminal-Bench 2.0.png] :::small 画像の出典:[OpenAI]{target=“_blank”} ::: ## ChatGPTとCodexで提供開始、Pro向けにも展開 ChatGPTでは、GPT-5.5 ThinkingとGPT-5.5 Proが提供される。GPT-5.5 Thinkingは、複雑な問題に対してより速く簡潔な回答を生成するモデルで、調査や分析などの用途に適している。 GPT-5.5 Proは、回答の網羅性や構成、正確性の面で大幅な改善が報告されており、ビジネスや法務、教育、データサイエンス領域での利用を想定する。 APIについては、入力100万トークンあたり5ドル、出力100万トークンあたり30ドルの価格が示されており、提供開始は「coming soon」とされている。 ## 安全性評価とBio Bug Bountyも公開 OpenAIはあわせて、GPT-5.5の[System Card]を公開。GPT-5.5が複雑な実務、オンライン調査、情報分析、文書・表計算作成、ツール横断作業を対象に設計されたモデルであると説明している。 安全性面では、生物領域のリスクに関する検証として、[GPT-5.5 Bio Bug Bounty]も開始した。AIレッドチーミング、セキュリティ、バイオセキュリティの経験を持つ研究者を対象に、バイオ安全性に関する防御策を破る普遍的な脱獄手法の発見を募る。報奨金は最大2万5000ドルとしている。 :::box [関連記事:OpenAI、「GPT-5.4 Thinking」「GPT-5.4 Pro」発表 スプレッドシート・資料作成・コーディングなど実務性能を強化] ::: :::box [関連記事:OpenAI、コーディングエージェント「Codex」を刷新 “ほぼすべての開発作業”を担う統合AIパートナーへ] ::: :::box [関連記事:OpenAI、防御用途で制限を緩和した「GPT-5.4-Cyber」発表 認証済みセキュリティ専門家向けに提供] ::: :::box [関連記事:Anthropic、新AI基盤モデル「Claude Mythos Preview」を発表 脆弱性発見能力の高さから一般公開は見送り] ::: :::box [関連記事:OpenAI、バイオ研究特化の推論モデル「GPT-Rosalind」公開 生命科学研究を支援] :::
Ledge.aiにソリューション情報を掲載しませんか?
使い方や具体的な目標などを詳しくご説明します
お問い合わせ