[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

CSD-VAR: Content-Style Decomposition in Visual Autoregressive Models

Created by
  • Haebom

作者

Quang-Binh Nguyen, Minh Luu, Quang Nguyen, Anh Tran, Khoi Nguyen

概要

この論文は、単一のイメージからコンテンツとスタイルを分離するコンテンツ - スタイル分解(CSD)の問題を扱います。サイズに合わせたサイズ認識クロス最適化戦略を使用します。第二に、SVDベースの修正方法によるコンテンツリークを軽減します。達成したことを示しています。

Takeaways、Limitations

Takeaways:
VARを用いたCSD実行の可能性を提示し、従来の拡散モデルベースの方法より優れた性能を示す。
サイズ認識クロス最適化、SVDベースの修正、拡張KVメモリなどの新しい技術提案
CSD作業用の新しいベンチマークデータセットCSD-100を提供。
Limitations:
CSD-100データセットの規模と多様性の追加レビューが必要です。
提案された方法の一般化性能に対する追加実験の必要性
異なるタイプの画像またはスタイルでのパフォーマンス評価が必要です。
👍