学術&研究

学術&研究
2024/12/9 [MON]
Sakana AI、生物の「すみ分け」戦略を活用したAIエージェントの新手法「CycleQD」発表のサムネイル画像

Sakana AI、生物の「すみ分け」戦略を活用したAIエージェントの新手法「CycleQD」発表

2024年12月3日、AIスタートアップのSakana AIが、複数の小規模AIモデル(AIエージェント)がそれぞれ特定の得意分野を持ち、協力して課題を解決する新たな開発手法を提案する論文「Agent Skill Acquisition for Large Language Models via CycleQD」を[発表]{target=“_blank”}した。 ## 多様性を重視したエージェント集団の進化的開発 Sakana AIが開発した「CycleQD」は、AIエージェント間の「すみ分け(ニッチ)」戦略に基づく進化的な開発フレームワークだ。生物学的な「ニッチ」概念を応用し、特定のスキルに特化したAIエージェントがそれぞれ異なる役割を果たすことで、全体として多様で強力なAIシステムを構築する。 この研究は、経済産業省のGENIACによる支援を受けたプロジェクトの一環であり、同発表はSakana AIの研究成果を紹介するブログシリーズの第一弾となる。 CycleQDは、従来のLLM(大規模言語モデル)のファインチューニング手法とは異なり、モデルマージと進化計算の融合により、多様なタスク遂行能力を持つエージェント群を生成する。Sakana AIはこの手法を用いて、コンピュータサイエンス分野のタスクで高い性能を示すモデル群の構築に成功したという。 ## Quality Diversityの応用によるスキルの進化 CycleQDは、「Quality Diversity(QD)」と呼ばれる進化計算の概念を活用する。QDは、単一の最良解を探す従来の最適化手法とは異なり、特徴的かつ多様な解の集合を見つけることを目指す。これにより、特定のスキルだけでなく、様々な能力を持つエージェントが同時に進化する環境を構築できる。 @[YouTube] エージェントは、「品質(Quality)」と「行動特性(Behavior Characteristics: BCs)」という2つの評価軸で選抜される。品質はタスク性能、行動特性はスキルの多様性を示す。これらの評価軸を周期的に切り替えることで、特定スキルの習得と多様性維持の両立が図られる。 以下の図は、CycleQDが進化プロセスを通じて多様なエージェントを生成する仕組みを示す ![cycleqd_schematic.png] :::small 画像の出典:[Sakana AI]{target=“_blank”} ::: このように、親モデルの選択、交叉(Crossover)、突然変異(Mutate)、子モデルの評価と配置(Child Placement)のサイクルを繰り返すことで、質と多様性を両立したエージェント群を形成している。 ## CycleQDを支えるモデルマージとSVD この進化的アプローチを支える基盤技術として、CycleQDでは「モデルマージ」と「SVD(特異値分解)」を活用している。 CycleQDでは、AIエージェント同士を組み合わせる「モデルマージ」を進化計算における「交叉」として利用。さらに、突然変異操作には「特異値分解(SVD)」を導入し、モデルの内部構造を調整することで、新しいスキル構造の探索を可能にする。これにより、無駄な計算リソースを使わずに、複雑なスキルを持つAIエージェント群を効率的に進化させる仕組みが実現した。 ## 多様なタスクでの性能向上を確認 Sakana AIは、Llama3-8B-Instructモデルを使用して、プログラミング(MBPP)、データベース操作(DB)、OS操作(OS)といったコンピュータサイエンスタスクでCycleQDの性能を評価した。以下の表は、CycleQDを含む各手法のタスク性能を比較したものである。 ![cycleqd_table.png] :::small 画像の出典:[Sakana AI]{target=“_blank”} ::: 表の説明: **・MBPP(プログラミング):** Pythonコード生成の精度をpass@1で評価。 **・DB(データベース操作):** タスク成功率を測定。 **・OS(OS操作):** タスク成功率を測定。 **・平均値(Avg):** 3つのタスクにおける平均性能を算出。 表の結果は、CycleQDがプログラミング(MBPP)で最も高い76.4の性能を示し、平均性能でも他の手法を上回ることを示している。 ## 持続可能なAI開発への道筋 近年のAI開発は、巨大モデルの構築に注力する一方で、計算資源のコストが大きな課題となっている。CycleQDが示す小規模モデル群による集団的なスキル獲得は、資源効率が高く、より持続可能なAI開発のアプローチといえる。 Sakana AIは、CycleQDを生涯学習システムの基盤として位置づけ、多様なスキルを持つエージェント群が成長・協力するマルチエージェントシステムの構築を視野に入れている。こうした技術は、科学研究から産業応用まで幅広い分野での活用が期待される。 ## 今後の展望と応用可能性 CycleQDの次なるステップとして、Sakana AIはエージェント群間の協調や競争によるスキル向上に注力する方針だ。多様なスキルセットを持つAIエージェントの組み合わせにより、現実世界の複雑な問題解決に対応する次世代AIの構築が進められる見込みだ。 :::box [関連記事:Sakana AI 異なるAI基盤モデルを融合させ新しいモデルを構築する「モデルマージの進化的最適化」を公開] ::: :::box [関連記事:経産省 生成AI基盤の開発支援に84億円を拠出 Googleクラウドを無償提供する採択事業者を発表] ::: :::box [関連記事:Sakana AI、科学研究を完全自動化する「The AI Scientist」を発表 研究アイデアの生成から実験の実行、データ解析、論文執筆、査読プロセスまでをカバー] :::

学術&研究
2024/12/8 [SUN]
Google DeepMind、基盤ワールドモデル「Genie 2」発表:無限に広がる3D環境で汎用AIエージェントの開発を加速のサムネイル画像

Google DeepMind、基盤ワールドモデル「Genie 2」発表:無限に広がる3D環境で汎用AIエージェントの開発を加速

AIエージェント
Google
論文
学術&研究
2024/12/7 [SAT]
1つ欠ければ全崩壊:LLMを支える特異なパラメータ「スーパーウェイト」の発見ーーAppleなどの研究チームが発表のサムネイル画像

1つ欠ければ全崩壊:LLMを支える特異なパラメータ「スーパーウェイト」の発見ーーAppleなどの研究チームが発表

Apple
論文
学術&研究
2024/12/7 [SAT]
マインクラフト内で最大1000体のAIエージェントが自律的に共同生活。文明形成を観察する実験「Project Sid」の成果と課題のサムネイル画像

マインクラフト内で最大1000体のAIエージェントが自律的に共同生活。文明形成を観察する実験「Project Sid」の成果と課題

論文
AIエージェント
学術&研究
2024/12/4 [WED]
パナソニック、「いいね」の簡単フィードバックで嗜好を反映する画像生成AI「Diffusion-KTO」を開発のサムネイル画像

パナソニック、「いいね」の簡単フィードバックで嗜好を反映する画像生成AI「Diffusion-KTO」を開発

論文
学術&研究
2024/12/2 [MON]
Google、AIが量子コンピューターのエラーを訂正するシステム「AlphaQubit」を発表のサムネイル画像

Google、AIが量子コンピューターのエラーを訂正するシステム「AlphaQubit」を発表

Google
論文
学術&研究
2024/12/1 [SUN]
AIが2時間の対話で人格を再現:スタンフォード大学とGoogle DeepMindの挑戦のサムネイル画像

AIが2時間の対話で人格を再現:スタンフォード大学とGoogle DeepMindの挑戦

Google
AIエージェント
論文
学術&研究
2024/11/30 [SAT]
スケーリング則の終焉か?AIスケーリング則の限界を指摘するゲイリー・マーカス氏の主張とはのサムネイル画像

スケーリング則の終焉か?AIスケーリング則の限界を指摘するゲイリー・マーカス氏の主張とは

学術&研究
2024/11/30 [SAT]
懺悔の部屋には「AIイエス・キリスト」が スイスの聖ペテロ礼拝堂で行われたプロジェクトのサムネイル画像

懺悔の部屋には「AIイエス・キリスト」が スイスの聖ペテロ礼拝堂で行われたプロジェクト

学術&研究
2024/11/30 [SAT]
パナソニックHDとPHP研究所、松尾研と協力し「松下幸之助」再現AIを開発 パーソナライズドLLM技術の研究開発を推進
のサムネイル画像

パナソニックHDとPHP研究所、松尾研と協力し「松下幸之助」再現AIを開発 パーソナライズドLLM技術の研究開発を推進

学術&研究
2024/11/29 [FRI]
Neuralink「脳インプラント」初の被験者、72時間耐久テストに挑戦の様子をライブ配信のサムネイル画像

Neuralink「脳インプラント」初の被験者、72時間耐久テストに挑戦の様子をライブ配信

イーロン・マスク
近未来
学術&研究
2024/11/29 [FRI]
日本語対応LLM性能を可視化する「オープン日本語LLMリーダーボード」公開のサムネイル画像

日本語対応LLM性能を可視化する「オープン日本語LLMリーダーボード」公開

学術&研究
2024/11/29 [FRI]
アリババ「OpenAIの『o1』にインスパイアされ開発した」ーー新モデル「Marco-o1」をオープンソースで公開 汎用推論能力を追求のサムネイル画像

アリババ「OpenAIの『o1』にインスパイアされ開発した」ーー新モデル「Marco-o1」をオープンソースで公開 汎用推論能力を追求

論文
アクセスランキング
国税庁、中小法人の8割をAIによる税務調査 追徴税額は過去最多の3572億円に
1つ欠ければ全崩壊:LLMを支える特異なパラメータ「スーパーウェイト」の発見ーーAppleなどの研究チームが発表
マインクラフト内で最大1000体のAIエージェントが自律的に共同生活。文明形成を観察する実験「Project Sid」の成果と課題
4
第1回東京都AI戦略会議始動 松尾豊教授、安野貴博氏、Sakana AI伊藤COOらが議論 
5
日本政府、AI・半導体産業強化に約1兆5000億円を投入:ラピダスへの8000億円支援も含む補正予算案を閣議決定
aispacon202412
FOLLOW US
各種SNSでも最新情報をお届けしております