特集
FEATURE
ビジネス
BUSINESS
ラーニング
LEARNING
エンジニアリング
ENGINEERING
学術&研究
ACADEMICS & STUDY
公共
PUBLIC
エンタメ&アート
ENTERTAINMENT & ART
1~13 / 2514件
米Amazon傘下のAmazon Web Services(AWS)は2025年12月3日(現地時間)、年次イベント「AWS re:Invent 2025」で、自社開発AIチップ「Trainium3」を搭載する大規模AI向け統合システム「Amazon EC2 Trn3 UltraServer(以下、Trainium3 UltraServer)」の一般提供(GA)を開始したと[発表]{target=“_blank”}した。 システムは3ナノメートルプロセスで製造したTrainium3を最大144基搭載でき、前世代(Trainium2 UltraServer)と比較して計算性能は最大4.4倍、メモリ帯域とエネルギー効率は約4倍に向上したという。 ## 最大362 FP8 PFLOPS、最大144チップ構成の新AIサーバー Trainium3 UltraServerはFP8精度で最大362 PFLOPSの演算性能を発揮し、1筐体に最大144基のTrainium3チップを搭載できる。メモリ帯域は合計706 TB/s、HBMメモリ容量は最大20.7 TBとなり、大規模言語モデル(LLM)やマルチモーダルモデルの学習・推論向けに最適化されているという。 AWSは、OpenAIのオープンウェイトモデル「GPT-OSS」を用いた社内テストでは、1チップあたりのスループットが3倍、推論レイテンシが4倍高速化したと説明している。 ## 新ネットワーク基盤「NeuronSwitch-v1」やUltraClusters 3.0で大規模化に対応 Trainium3 UltraServerには、AWSが新たに開発したネットワークスイッチ「NeuronSwitch-v1」が搭載され、チップ間の通信帯域は前世代と比較して2倍になった。また、新たな「Neuron Fabric」により、チップ間通信の遅延は10マイクロ秒未満に抑えられるという。 複数のUltraServerを接続するクラスタ構成「EC2 UltraClusters 3.0」では、最大100万基のTrainiumチップまでスケール可能とされ、大規模データセットを用いたモデル学習や、数百万規模の同時推論リクエストにも対応できるとしている。 @[YouTube] ## 既に複数企業が活用、高速化やコスト削減の事例も AWSは複数の顧客事例を紹介しており、AnthropicやKarakuri、Metagenomi、NetoAI、Ricoh、Splash Musicなどが、Trainiumシリーズを用いてトレーニングコストを最大50%削減したという。また、生成系スタートアップのDecartは、Trainium3を用いたリアルタイム動画生成により、フレーム生成が4倍高速化し、GPU比でコストを半減できたとしている。 さらに、AWSの生成AI基盤「Amazon Bedrock」では、Trainium3上で既に本番ワークロードが稼働している。 ## 次世代「Trainium4」ではNVIDIA NVLink Fusionにも対応予定 AWSは、次世代AIチップ「Trainium4」の開発も進めていると公表した。現時点で示されている目標値は、FP4で6倍以上、FP8で3倍の性能向上、メモリ帯域4倍の拡張など。さらに、Trainium4はNVIDIAの新インターコネクト技術「NVLink Fusion」に対応予定で、NVIDIA GPUと共存するラックスケール構成が可能になるとしている。 ## 大規模AIインフラの「選択肢」を拡大 AWSは、Trainium3 UltraServerの提供開始により、生成AIやエージェント型AI、Mixture-of-Expertsモデルなどの大規模ワークロードに対し、高速・低コストで提供できる選択肢を拡大したと説明した。今後もTrainiumシリーズとGPUの双方をサポートする方針を示しており、用途に応じた柔軟なAIインフラ構成が可能になるという。 :::box [関連記事:米アマゾン、米政府向けAI・スーパーコンピュータ基盤に最大500億ドル(約7.8兆円)投資──AWSの機密クラウド全レベルで1.3GWを増強] ::: :::box [関連記事:AnthropicとAWSの提携が拡大、新たに40億ドルを投資 :次世代AI開発の基盤構築へ] ::: :::box [関連記事:Amazon、Anthropicと戦略的提携 最大40億ドル投資ーーAWSで生成AI開発] ::: :::box [関連記事:Amazon、生成系AI関連のサービスを発表。GPTへ攻勢強める] ::: :::box [関連記事:2025年のAI半導体を読む 王者NVIDIAと競合の現在地] :::
Ledge.aiにソリューション情報を掲載しませんか?
使い方や具体的な目標などを詳しくご説明します
お問い合わせ