Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

VideoEraser: Concept Erasure in Text-to-Video Diffusion Models

Created by
  • Haebom

作者

Naen Xu, Jinghuai Zhang, Changjiang Li, Zhi Chen, Chunyi Zhou, Qingming Li, Tianyu Du, Shouling Ji

概要

本論文では、テキストビデオ(T2V)拡散モデルの悪用によるプライバシー、著作権、安全上の問題を解決するために、トレーニングを必要としない新しいフレームワークであるVideoEraserを提案します。 VideoEraserは、オプションのプロンプト埋め込み調整(SPEA)と敵対的 - 弾力性のあるノイズガイド(ARNG)の2段階のプロセスを通じて、既存のT2V拡散モデルに統合できるプラグアンドプレイモジュールとして設計されています。 VideoEraserは、オブジェクト、芸術的なスタイル、セレブリティ、明示的なコンテンツなど、望ましくない概念を含むビデオの生成を効果的に防ぎます。実験の結果、VideoEraserは従来の方法よりも効率性、整合性、忠実度、堅牢性、一般化性能に優れ、4つの課題で平均46%の望ましくないコンテンツ削減率を達成し、最先端のパフォーマンスを示しました。

Takeaways、Limitations

Takeaways:
訓練なしにT2V拡散モデルの否定的なコンテンツ生成を効果的に抑制する新しい方法を提示した。
従来の方法と比較して、改善された効率性、完全性、忠実度、堅牢性および一般化性能を示す。
プラグアンドプレイ方式で既存モデルに簡単に統合可能。
個人情報保護、著作権、安全問題の解決に貢献。
Limitations:
論文で提示された特定のT2V拡散モデルの性能評価であり,他のモデルに対する一般化の可能性に関するさらなる研究が必要である。
新しいタイプの不要なコンテンツまたはより洗練されたプロンプトに対するVideoEraserのパフォーマンス検証が必要です。
VideoEraserの計算コストと性能低下の分析が必要
👍