学術＆研究 - ACADEMICS & STUDY -

1～13 / 490件

学術＆研究

2025/7/16 [WED]

NTT、“再学習ゼロ”の「ポータブルチューニング」公開──業務特化の生成AIモデルの運用コストを劇的削減、tsuzumiにも搭載

NTTは2025年7月9日、生成AIの特化モデルを再学習せずに基盤モデル間で転移可能とする新技術「ポータブルチューニング」を[発表]{target=“_blank”}」の実現にも貢献するとしている。 ## カスタマイズコストの抜本的削減を実現生成AIを業務に応用する際、用途特化のカスタマイズが求められるが、基盤モデルが更新されるたびに再学習が必要となり、大きなコストと時間を要していた。NTTはこの課題に対し、特化学習で得た知見を、報酬モデルという中立的なモジュールを介して「持ち運ぶ」手法を開発。報酬モデルを一度構築すれば、異なる構造や規模の基盤モデルにも適用でき、再学習を行わずに高い性能を維持できると説明している。 ![250709ab.jpg] :::small 画像の出典：[NTT]{target=“_blank”} ::: ## 技術の仕組みと特徴ポータブルチューニングは、以下の3点を軸に構成されている。 - **報酬モデルによる出力補正** ：特化学習の成果を、基盤モデルの出力を評価・調整する報酬モデルとして独立して学習。 - **モデル非依存の汎用性** ：報酬モデルは特定の基盤モデルに依存せず、構造やパラメータ数が異なる複数のモデルに転用可能。 - **再学習工程の削減** ：基盤モデルを更新しても報酬モデルを再利用できるため、再学習を行わずに特化性能を保持。これにより、モデル更新のたびに必要だったGPU使用やデータ再整理といったリソース投入が不要となり、運用面・環境面の両面での負荷を大幅に軽減できるとされる。 ## 「tsuzumi」など複数基盤モデルで検証 NTTは、自社開発の日本語LLM「tsuzumi」を含む複数の基盤モデルに対してポータブルチューニングを適用し、特化性能を高水準で維持できることを確認したと述べている。実験では、異なるモデル間においても同一の報酬モデルを適用することで、再学習なしで特化出力の一貫性が保たれることを実証した。さらに、NTTは本技術の研究成果を、2025年7月13日からカナダ・バンクーバーで開催されている国際機械学習会議（ICML 2025）で発表する予定としている。 ## 今後の展望 NTTは今回の技術が、既存の軽量ファインチューニング手法（LoRA、QLoRAなど）と比較しても、再学習に伴う作業負荷・GPU時間・電力消費を本質的に削減できる点を強調している。将来的には、複数の小型AIを連携・協調させる分散型AIネットワーク「AIコンステレーション®」構想の中核技術としても活用する計画で、今後は省電力型LLM群との組み合わせによる持続可能なAI運用環境の構築を目指す方針だ。生成AIを導入する企業や自治体にとって、特化モデルを持続的に運用するための最大の障壁は「モデル更新のたびに再チューニングが必要」という運用コストであった。今回発表されたポータブルチューニングは、その運用課題を根本から解消する可能性がある。NTTは今後、外部パートナーと協力して、さまざまな業務用途への適用を広げる考えを示している。 :::box [関連記事：NTT独自のLLM「tsuzumi」 2024年3月に商用サービス提供予定] ::: :::box [関連記事：NTTの自社開発LLM「tsuzumi」を3月25日から商用サービス提供開始] ::: :::box [関連記事：NTT、サカナ AI と連携を発表「AIコンステレーション研究」でサステナブルな社会を目指す] ::: :::box [関連記事：LoRAとは｜画像生成AI・LLMの軽量ファインチューニング技術] ::: :::box [関連記事：LoRAより少ない計算コストと時間で高性能な「DoRA」] :::

学術＆研究 - ACADEMICS & STUDY -

NTT、“再学習ゼロ”の「ポータブルチューニング」公開──業務特化の生成AIモデルの運用コストを劇的削減、tsuzumiにも搭載

中国・北京大学など、AIに「感情スイッチ」を実現──「計算感情空間」の構築でLLMが怒り・悲しみ・喜びを自在に切替

中国・中関村アカデミー、10億人シミュレーションを実証──LLM搭載システム『Light Society』で地球規模の“仮想社会”を一気に再現

高性能LLMを“日常のデバイス”で──分散AIクラスタOSS「exo」登場「iPhone、iPad、Androidデバイスなど」×「Llama、Mistral、LLaVA、Qwen、Deepseekなど幅広いLLM」

人間の意思決定や反応を「先読み」する基盤AI——独米チーム、160実験・1,000万超の行動データで学習したモデル「Centaur（ケンタウロス）」を公開

ハルシネーション（事実誤認）より深刻なAIの「わかったふり」を暴く：MITなどが発見したLLMの“ポチョムキン理解”とは

医師の4倍精度、診断コスト70%減──Microsoftの医療AI「MAI-DxO」が304症例で検証結果を発表

これからのAIスキルは「プロンプト」ではなく「コンテキスト・エンジニアリング」──Google DeepMind フィリップ・シュミット氏が提起

Anthropic、AIエージェントが“リアル店舗経営”に挑んだ1か月「Project Vend」で成果と課題を詳報、経済研究プログラム「Economic Futures Program」も公表

「理解」から「描写」へ Alibabaの画像生成AI「Qwen VLo」、ログイン不要で誰でも試せるプレビュー公開

Sakana AI、推論時に複数LLMを協調させる「AB-MCTS」を発表―― o4-mini・Gemini 2.5・DeepSeek R1を連携し、汎用推論タスクで30%以上の正解率を記録

大規模言語モデルの「温度設定」がAI出力の鍵を握る——6つのタスクでの体系的検証で科学的根拠を提示：ルクセンブルク大学らが発表

Black Forest Labs、オープンウェイト画像編集モデル「FLUX.1 Kontext [dev]」を公開 コンテキスト保持の性能で新基準

NTT、“再学習ゼロ”の「ポータブルチューニング」公開──業務特化の生成AIモデルの運用コストを劇的削減、tsuzumiにも搭載

中国・北京大学など、AIに「感情スイッチ」を実現──「計算感情空間」の構築でLLMが怒り・悲しみ・喜びを自在に切替

中国・中関村アカデミー、10億人シミュレーションを実証──LLM搭載システム『Light Society』で地球規模の“仮想社会”を一気に再現

高性能LLMを“日常のデバイス”で──分散AIクラスタOSS「exo」登場「iPhone、iPad、Androidデバイスなど」×「Llama、Mistral、LLaVA、Qwen、Deepseekなど幅広いLLM」

人間の意思決定や反応を「先読み」する基盤AI——独米チーム、160実験・1,000万超の行動データで学習したモデル「Centaur（ケンタウロス）」を公開

ハルシネーション（事実誤認）より深刻なAIの「わかったふり」を暴く：MITなどが発見したLLMの“ポチョムキン理解”とは

医師の4倍精度、診断コスト70%減──Microsoftの医療AI「MAI-DxO」が304症例で検証結果を発表

これからのAIスキルは「プロンプト」ではなく「コンテキスト・エンジニアリング」──Google DeepMind フィリップ・シュミット氏が提起

Anthropic、AIエージェントが“リアル店舗経営”に挑んだ1か月「Project Vend」で成果と課題を詳報、経済研究プログラム「Economic Futures Program」も公表

「理解」から「描写」へ Alibabaの画像生成AI「Qwen VLo」、ログイン不要で誰でも試せるプレビュー公開

Sakana AI、推論時に複数LLMを協調させる「AB-MCTS」を発表―― o4-mini・Gemini 2.5・DeepSeek R1を連携し、汎用推論タスクで30%以上の正解率を記録

大規模言語モデルの「温度設定」がAI出力の鍵を握る——6つのタスクでの体系的検証で科学的根拠を提示：ルクセンブルク大学らが発表

Black Forest Labs、オープンウェイト画像編集モデル「FLUX.1 Kontext [dev]」を公開 コンテキスト保持の性能で新基準

タグから探す

ブランドから探す

「理解」から「描写」へ　Alibabaの画像生成AI「Qwen VLo」、ログイン不要で誰でも試せるプレビュー公開

Black Forest Labs、オープンウェイト画像編集モデル「FLUX.1 Kontext [dev]」を公開　コンテキスト保持の性能で新基準

「理解」から「描写」へ　Alibabaの画像生成AI「Qwen VLo」、ログイン不要で誰でも試せるプレビュー公開

Black Forest Labs、オープンウェイト画像編集モデル「FLUX.1 Kontext [dev]」を公開　コンテキスト保持の性能で新基準