特集
FEATURE
ビジネス
BUSINESS
ラーニング
LEARNING
エンジニアリング
ENGINEERING
学術&研究
ACADEMICS & STUDY
公共
PUBLIC
エンタメ&アート
ENTERTAINMENT & ART
1~13 / 636件
北京大学とGoogle Cloud AI Researchに所属する研究者らは、学術論文向けの図表や手法図を自動生成するフレームワーク「PaperBanana」を提案した。論文はarXivに公開されている。[発表]{target=“_blank”}した。研究は、AI研究者が論文執筆時に作成する手法図や統計プロットなどのイラストを自動化することを目的とする。 ## 学術図作成の課題 論文では、学術図の作成が依然として手作業中心である点を課題として挙げている。 - 手法図やパイプライン図は研究理解に不可欠 - 作図には時間と専門的デザインスキルを要する - 既存の画像生成モデルは構造的整合性や論理忠実性の担保が難しい 研究チームは、単なる画像生成ではなく、論文向け図としての構造整合性と内容忠実性を担保する仕組みの構築を目指した。 ## PaperBananaの構成 PaperBananaは、複数モジュールからなるフレームワークとして設計されている。処理は大きく2段階に分かれる。 ### ■ Linear Planning Phase - Retriever Agent:参考図の取得 - Planner Agent:構造設計 - Stylist Agent:視覚スタイルの調整 - Initial Descriptionの生成 ### ■ Iterative Refinement Loop - Visualizer Agent:図の生成 - Critic Agent:生成結果の評価 - 記述の修正と再生成 **【論文より:PaperBananaの全体フレームワーク】Linear Planning PhaseとIterative Refinement Loopの2段構成で、複数モジュールが反復的に図を生成・改善する。** ![method_diagram.jpg] :::small 画像の出典:[PaperBanana]{target=“_blank”} ::: 論文では、この反復ループをT=3回実行する構成が示されている。一度生成して終わりではなく、自己批評を通じて改善を重ねる点が特徴だとしている。 ## 評価ベンチ「PaperBananaBench」 研究チームは評価用データセット「PaperBananaBench」も構築した。 - NeurIPS 2025採択論文から抽出 - 手法図生成タスク292件 - 評価指標:Faithfulness(内容忠実性)/Clarity(明瞭性)/Conciseness(簡潔性)/Aesthetics(美観) 論文では、既存のベースライン手法と比較し、これらの指標で優位性を示したと報告している。 ## 研究の位置づけと拡張可能性 PaperBananaは手法図の生成に加え、棒グラフや分布図などの統計プロット生成にも対応可能であると論文で示されている。 研究チームは同手法を、研究プロセス自動化の一環として位置づけている。近年はコード生成や論文要約、レビュー支援などの分野でAI活用が進んでいるが、同研究はその中で「視覚表現工程」の自動化に焦点を当てた提案となる。 :::box [関連記事:科学のボトルネックは「検証」へ──“Impending Crisis(差し迫った危機)”を警告 Google・カーネギーメロン大学など16機関の研究] ::: :::box [関連記事:Waymo、DeepMindの世界モデル「Genie 3」を活用した自動運転向け生成シミュレーション「Waymo World Model」を発表] ::: :::box [関連記事:OpenAIの新事業「Frontier」:AIエージェント導入は“常駐エンジニア”が伴走し一気通貫支援 日本ではソフトバンクも検証開始] ::: :::box [関連記事:Anthropic、最上位LLM「Claude Opus 4.6」公開——業務AIエージェント「Cowork」は大手SaaS各社の株価急落に影響を与える反響] ::: :::box [関連記事:MIT、ChatGPT使用で脳活動が最大55%低下と報告──エッセイ執筆実験で示された生成AI依存の影響] :::
Ledge.aiにソリューション情報を掲載しませんか?
使い方や具体的な目標などを詳しくご説明します
お問い合わせ