Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Attention of a Kiss: Exploring Attention Maps in Video Diffusion for XAIxArts

Created by
  • Haebom

作者

Adam Cole, Mick Grierson

概要

本論文は,ビデオ拡散変換器のアテンション機構に関する芸術的,技術的研究を提示した。アナログビデオ信号を操作して新しい視覚美学を作成した初期のビデオアーティストに触発され、本研究は生成ビデオモデルからクロスアテンションマップを抽出して視覚化する方法を提案します。オープンソースWanモデルに基づいて構築されたこのツールは、テキストビデオ生成におけるアテンションの時間的および空間的動作の解釈可能なウィンドウを提供します。探索的調査と芸術的事例研究により、アテンションマップを分析ツールと生の芸術資料の両方として活用する可能性を調査します。この研究は、芸術のための説明可能なAI(XAIxArts)の成長分野に貢献し、アーティストがAIの内部の仕組みを創造的な媒体に取り戻すように招待します。

Takeaways、Limitations

Takeaways:
ビデオ拡散変換器のアテンション機構を可視化し分析する新しい方法を提示
テキスト - ビデオ作成プロセスの理解を高める。
アテンションマップを芸術的創作活動に活用可能性を提示。
XAIxArts分野への貢献
Limitations:
Wanモデルに基づく研究なので、他のモデルに対する一般化可能性の制限。
アテンションマップの解釈に対する主観性の存在
芸術的なケーススタディの限られた範囲。
👍