Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Energy Matching: Unifying Flow Matching and Energy-Based Models for Generative Modeling

Created by
  • Haebom

作者

Michal Balcerak, Tamaz Amiranashvili, Antonio Terpin, Suprosanna Shit, Sebastian Kaltenbach, Petros Koumoutsakos, Bjoern Menze

概要

本稿では、フローベースの生成モデルの制限を克服するために、エネルギーマッチングという新しいフレームワークを提案します。既存のフローベースのモデルは部分的な観測値や追加の事前情報を統合するのが困難ですが、エネルギーベースのモデル(EBM)はスカラーエネルギー項を追加して効果的に処理します。エネルギーマッチングは、フローベースのアプローチにEBMの柔軟性を与え、データ多様体から遠く離れたサンプルはcurl-free最適輸送経路に沿って移動し、データ多様体に近づくにつれてエントロピーエネルギー項がボルツマン平衡分布に導き、データの基底確率構造を明示的に捕捉する。時間に依存しない単一のスカラーフィールドを使用してこれらのダイナミクスをパラメータ化します。これは、強力なジェネレータであり、逆問題の効果的な規制のための柔軟な辞書情報として機能します。 CIFAR-10およびImageNetイメージ生成では、従来のEBMよりも優れた性能を示し、データ多様体から遠い場所で輸送ベースのアプローチのシミュレーションなしの学習を維持します。また、さまざまなモード探索をサポートする相互作用エネルギーを導入し、タンパク質生成設定でこれを実演します。時間条件、補助ジェネレータ、または追加のネットワークなしでスカラー電位エネルギーを学習することに焦点を当て、従来のEBM方法とは大きく異なります。

Takeaways、Limitations

Takeaways:
フローベースモデルの柔軟性の向上とEBMのメリット統合による生成モデルの性能改善
時間に関係のない単一のスカラーフィールドを使用した合理化されたフレームワークの提示。
部分的な観測値と追加の事前情報の利用可能性の拡大。
様々なモードナビゲーション支援によるアプリケーションの拡張
CIFAR-10とImageNetで従来のEBMと比較して優れた性能を達成
Limitations:
本論文で提示した方法の一般的な性能と限界に関する追加の実験と分析の必要性
さまざまなデータセットとアプリケーションのスケーラビリティ検証が必要です。
スカラー場学習の安定性と効率性の改善が必要
👍