学術&研究
Sakana AI、生物の「すみ分け」戦略を活用したAIエージェントの新手法「CycleQD」発表
2024年12月3日、AIスタートアップのSakana AIが、複数の小規模AIモデル(AIエージェント)がそれぞれ特定の得意分野を持ち、協力して課題を解決する新たな開発手法を提案する論文「Agent Skill Acquisition for Large Language Models via CycleQD」を[発表]{target=“_blank”}した。 ## 多様性を重視したエージェント集団の進化的開発 Sakana AIが開発した「CycleQD」は、AIエージェント間の「すみ分け(ニッチ)」戦略に基づく進化的な開発フレームワークだ。生物学的な「ニッチ」概念を応用し、特定のスキルに特化したAIエージェントがそれぞれ異なる役割を果たすことで、全体として多様で強力なAIシステムを構築する。 この研究は、経済産業省のGENIACによる支援を受けたプロジェクトの一環であり、同発表はSakana AIの研究成果を紹介するブログシリーズの第一弾となる。 CycleQDは、従来のLLM(大規模言語モデル)のファインチューニング手法とは異なり、モデルマージと進化計算の融合により、多様なタスク遂行能力を持つエージェント群を生成する。Sakana AIはこの手法を用いて、コンピュータサイエンス分野のタスクで高い性能を示すモデル群の構築に成功したという。 ## Quality Diversityの応用によるスキルの進化 CycleQDは、「Quality Diversity(QD)」と呼ばれる進化計算の概念を活用する。QDは、単一の最良解を探す従来の最適化手法とは異なり、特徴的かつ多様な解の集合を見つけることを目指す。これにより、特定のスキルだけでなく、様々な能力を持つエージェントが同時に進化する環境を構築できる。 @[YouTube] エージェントは、「品質(Quality)」と「行動特性(Behavior Characteristics: BCs)」という2つの評価軸で選抜される。品質はタスク性能、行動特性はスキルの多様性を示す。これらの評価軸を周期的に切り替えることで、特定スキルの習得と多様性維持の両立が図られる。 以下の図は、CycleQDが進化プロセスを通じて多様なエージェントを生成する仕組みを示す ![cycleqd_schematic.png] :::small 画像の出典:[Sakana AI]{target=“_blank”} ::: このように、親モデルの選択、交叉(Crossover)、突然変異(Mutate)、子モデルの評価と配置(Child Placement)のサイクルを繰り返すことで、質と多様性を両立したエージェント群を形成している。 ## CycleQDを支えるモデルマージとSVD この進化的アプローチを支える基盤技術として、CycleQDでは「モデルマージ」と「SVD(特異値分解)」を活用している。 CycleQDでは、AIエージェント同士を組み合わせる「モデルマージ」を進化計算における「交叉」として利用。さらに、突然変異操作には「特異値分解(SVD)」を導入し、モデルの内部構造を調整することで、新しいスキル構造の探索を可能にする。これにより、無駄な計算リソースを使わずに、複雑なスキルを持つAIエージェント群を効率的に進化させる仕組みが実現した。 ## 多様なタスクでの性能向上を確認 Sakana AIは、Llama3-8B-Instructモデルを使用して、プログラミング(MBPP)、データベース操作(DB)、OS操作(OS)といったコンピュータサイエンスタスクでCycleQDの性能を評価した。以下の表は、CycleQDを含む各手法のタスク性能を比較したものである。 ![cycleqd_table.png] :::small 画像の出典:[Sakana AI]{target=“_blank”} ::: 表の説明: **・MBPP(プログラミング):** Pythonコード生成の精度をpass@1で評価。 **・DB(データベース操作):** タスク成功率を測定。 **・OS(OS操作):** タスク成功率を測定。 **・平均値(Avg):** 3つのタスクにおける平均性能を算出。 表の結果は、CycleQDがプログラミング(MBPP)で最も高い76.4の性能を示し、平均性能でも他の手法を上回ることを示している。 ## 持続可能なAI開発への道筋 近年のAI開発は、巨大モデルの構築に注力する一方で、計算資源のコストが大きな課題となっている。CycleQDが示す小規模モデル群による集団的なスキル獲得は、資源効率が高く、より持続可能なAI開発のアプローチといえる。 Sakana AIは、CycleQDを生涯学習システムの基盤として位置づけ、多様なスキルを持つエージェント群が成長・協力するマルチエージェントシステムの構築を視野に入れている。こうした技術は、科学研究から産業応用まで幅広い分野での活用が期待される。 ## 今後の展望と応用可能性 CycleQDの次なるステップとして、Sakana AIはエージェント群間の協調や競争によるスキル向上に注力する方針だ。多様なスキルセットを持つAIエージェントの組み合わせにより、現実世界の複雑な問題解決に対応する次世代AIの構築が進められる見込みだ。 :::box [関連記事:Sakana AI 異なるAI基盤モデルを融合させ新しいモデルを構築する「モデルマージの進化的最適化」を公開] ::: :::box [関連記事:経産省 生成AI基盤の開発支援に84億円を拠出 Googleクラウドを無償提供する採択事業者を発表] ::: :::box [関連記事:Sakana AI、科学研究を完全自動化する「The AI Scientist」を発表 研究アイデアの生成から実験の実行、データ解析、論文執筆、査読プロセスまでをカバー] :::