Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Equilibrium Matching: Generative Modeling with Implicit Energy-Based Models

Created by
  • Haebom

作者

Runqian Wang, Yilun Du

概要

Equilibrium Matching(EqM)は、平衡動力学の観点から構築された生成モデリングフレームワークです。伝統的な拡散とフローベースの生成モデルの非平衡、時間条件付きダイナミクスを捨て、暗黙のエネルギーランドスケープの平衡勾配を学習します。このアプローチにより、調整可能なステップサイズ、アダプティブオプティマイザ、アダプティブオペレーションを使用して、学習されたランドスケープから傾斜降下法を使用してサンプルを取得する最適化ベースのサンプリングプロセスを推論時間に採用できます。 EqMは、ImageNet 256$\times$256でFID 1.90を達成し、経験的に拡散/フローモデルの生成性能を上回ります。さらに、EqMはデータマニホールドで学習しサンプリングすることで理論的に正当化されます。作成に加えて、EqMは部分的にノイズの多い画像のデノイズ、OOD検出、画像構成などのタスクを自然に処理する柔軟なフレームワークです。時間条件付き速度を統合された平衡ランドスケープに置き換えることによって、EqMは流れとエネルギーベースのモデル間のより強力なリンクを提供し、最適化ベースの推論への簡単な経路を提示します。

Takeaways、Limitations

Takeaways:
拡散/フローモデルよりも優れた生成性能を達成しました(ImageNet 256x256からFID 1.90)。
データマニホールドで学習しサンプリングすることは理論的に正当化されました。
部分ノイズ画像のデノイズ、OOD検出、画像構成など、さまざまな操作に適用できます。
フローとエネルギーベースのモデル間のリンクを強化し、最適化ベースの推論方法を提示します。
Limitations:
論文で具体的なLimitationsへの言及はありません。 (論文の要約内容には含まれていません。)
👍