学術&研究

学術&研究
2025/3/21 [FRI]
物理公式を“発見”するAI『LLM-Feynman』 —— 中国・東南大学がリチャード・ファインマンが講義で示した100種類の公式の90%以上を再構築のサムネイル画像

物理公式を“発見”するAI『LLM-Feynman』 —— 中国・東南大学がリチャード・ファインマンが講義で示した100種類の公式の90%以上を再構築

中国・東南大学と蘇州研究院の研究者チームは2025年3月、大規模言語モデル(LLM)を活用する新たなAIシステム「LLM-Feynman」を[発表]{target=“_blank”}した。 物理学者リチャード・ファインマンの講義に基づく100種類の公式を再構築するタスクにおいて、90%以上の再現率を記録したほか、材料科学の4つの実課題においても90%超の精度や高い解釈性を達成したと報告している。 ## 背景 これまでの数式発見には、シンボリック回帰(Symbolic Regression)などの手法が用いられてきたが、得られる数式はしばしば複雑で、物理学的な意味付けや汎化性能に課題があった。また、従来の機械学習は予測精度に優れる一方で、ブラックボックス的な性質から科学的洞察を導くには不向きとされていた。 これに対しLLM-Feynmanは、LLMが内包するドメイン知識を活用しつつ、数式の精度、簡潔さ、解釈性を同時に最適化することで、人間の科学者に近いアプローチで「意味ある法則」を見出すことを目指した構造を持つ。 ## 仕組み —— LLM-Feynmanの三つのモジュール LLM-Feynmanは大きく3つのモジュールから構成される。 1. **データ前処理と特徴生成** : 材料の組成や結晶構造などを入力し、Automatminerなど既存の特徴抽出手法とLLM推薦を組み合わせて特徴量を作成。物理的次元や意味を明示することで、後段の解釈性向上を図る。 2. **数式探索(シンボリック回帰)** : LLMがPythonコード形式で候補式を生成し、(a)精度、(b)数式の複雑度、(c)LLMが自己評価した「科学的妥当性スコア」を複合した損失関数を用い、多目的最適化を繰り返す。 3. **公式解釈(MCTS)** : Monte Carlo Tree Search(MCTS)を活用して、LLMが数式の意味や背景を構造的に説明する。 ### 図1. LLM-Feynmanのフレームワーク LLMがデータと科学知識を組み合わせ、自己評価を繰り返しながら新たな公式を発見するプロセスを示す。 ![Flowchart of the LLM-Feynman framework.jpg] :::small 画像の出典:[LLM-Feynman:]{target=“_blank”} ::: ## 実証 —— 物理公式再構築と材料科学への応用 研究チームは、LLM-Feynmanがどの程度「意味のある公式」を発見できるかを下記の課題で検証した。 1. **物理公式の再発見(Feynman Lectures)** : 無作為ノイズを含む状況下でも、100式中90%以上を正しく再現した。従来手法AI-Feynmanでは難しかった複雑式やノイズが多い場面でも高い堅牢性を示した。 2. **2D材料の合成可能性予測** : 170の実験的合成データと、PU学習+メタラーニング(MAML)を組み合わせて「未合成の2D材料候補」をネガティブサンプル化。最終的に93.3%の精度で合成可能性を分類する公式を発見した。 3. **ペロブスカイト合成可能性予測** : 約3,300の実験データを用いて安定構造を判別し、テストセットで100%の分類精度を記録。 4. **固体電解質の導電率予測・2D材料のGWバンドギャップ** : 回帰タスクでもR²>0.8を達成し、特定温度や結晶対称性などの影響要因を数式として示した。 ### 図2. LLM-Feynmanの性能評価 ベンチマーク手法(PySRやSISSO)との比較において、LLM-Feynmanは自己評価を導入することで精度と式の単純さを両立している。 ![Performance of the LLM-Feynman framework.jpg] :::small 画像の出典:[LLM-Feynman:]{target=“_blank”} ::: ### 2D材料合成可能性における詳細 2D材料はエレクトロニクスやエネルギー分野での応用が期待される一方、実際に合成される例は限られる。研究チームは論文や各種データベースから構造情報を収集し、PU学習を活用することで合成「不可」と推定されるサンプルを発掘。MAMLによる初期パラメータ最適化の組み合わせによって、高精度の合成可否モデルを訓練し、LLM-Feynmanで公式を探索した。 ### 図3. 2D材料合成可能性に対するLLM-Feynmanの応用 PU学習にMAMLを組み合わせて精度を高め、LLM-Feynmanが複数の要因を統合する公式を抽出した様子が示されている。 ![Performance of LLM-Feynman in the synthesizability of 2D materials.jpg] :::small 画像の出典:[LLM-Feynman:]{target=“_blank”} ::: ## 今後の展望と課題 このフレームワークは、LLMの進化とともに継続的な性能向上が見込まれている。一方で、LLMのトークン長制限や大規模データセット(1万件以上)への対応が技術的課題として挙げられており、階層的処理や強化学習の導入などが今後検討されるとしている。 研究チームによると、LLM-Feynmanは「汎化可能で解釈可能な科学公式と理論の自動発見」という新たなパラダイムを提示したという​。 :::box [関連記事:Sakana AI、科学研究を完全自動化する「The AI Scientist」を発表 研究アイデアの生成から実験の実行、データ解析、論文執筆、査読プロセスまでをカバー] :::

アクセスランキング
勉強会イベント2025
FOLLOW US
各種SNSでも最新情報をお届けしております