Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Causal-Adapter: Taming Text-to-Image Diffusion for Faithful Counterfactual Generation

Created by
  • Haebom

作者

Lei Tong, Zhihua Liu, Chaochao Lu, Dino Oglic, Tom Diethe, Philip Teare, Sotirios A. Tsaftaris, Chen Jin

Causal-Adapter: Counterfactual Image Generation with Causal Interventions

概要

Causal-Adapterは、固定されたテキスト画像拡散バックボーンを使用して反射実績画像を生成するためのモジュラーフレームワークです。この方法は、画像の重要なアイデンティティを変更することなくターゲット属性への因果的介入を可能にし、その影響を因果的依存変数に一貫して伝播します。プロンプトエンジニアリングに依存する以前のアプローチとは異なり、Causal-Adapterは、2つの属性正規化戦略(正確な意味制御のためのテキスト埋め込みと整列したプロンプト注入と属性要素を分離し、偽の相関を減らすための条件付きトークンに対する損失)で強化された構造的因果モデリングを利用します。 Causal-Adapter は、正確な属性制御のための Pendulum で最大 91% MAE 低減、高品質 MRI イメージ生成のための ADNI で 87% FID 削減により、合成および実データセットで最先端のパフォーマンスを実現します。

Takeaways、Limitations

Takeaways:
固定拡散モデルで反射実績画像を生成するための強力で一般化可能なアプローチを提示します。
正確な属性制御と強力なアイデンティティの保存を実現します。
合成および実際のデータセットにおける最先端のパフォーマンスを示します。
Limitations:
論文にLimitationsへの言及はありません。
👍