本論文は、テキスト画像拡散モデルの画像編集能力を向上させるために、ソース画像を編集可能なノイズマップに変換する新しい技術であるENM Inversionを提案する。既存のインバージョン方式がテキストプロンプトの正確性を確保するのが困難であるという問題を解決するために、ENM Inversionはコンテンツの保存と編集可能性の両方を保証する最適なノイズマップを探索します。この技法は、再構成された画像と編集された画像との間の差を最小限に抑えて所望の編集を実行し、画像およびビデオ編集作業における従来の方法よりも優れた性能を示す。