Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Sự chú ý của một nụ hôn: Khám phá bản đồ chú ý trong video khuếch tán cho XAIxArts

Created by
  • Haebom

Tác giả

Adam Cole, Mick Grierson

Phác thảo

Bài báo này trình bày nghiên cứu nghệ thuật và kỹ thuật về cơ chế chú ý của bộ chuyển đổi khuếch tán video. Lấy cảm hứng từ những nghệ sĩ video thời kỳ đầu, những người đã thao túng tín hiệu video analog để tạo ra thẩm mỹ thị giác mới, nghiên cứu này đề xuất một phương pháp trích xuất và trực quan hóa các bản đồ chú ý chéo từ các mô hình video sinh sản. Được xây dựng trên mô hình Wan nguồn mở, công cụ này cung cấp một cửa sổ có thể diễn giải được về hành vi thời gian và không gian của sự chú ý trong quá trình tạo văn bản thành video. Thông qua nghiên cứu khám phá và các nghiên cứu điển hình về nghệ thuật, chúng tôi khám phá tiềm năng của việc sử dụng bản đồ chú ý như một công cụ phân tích và chất liệu nghệ thuật thô sơ. Nghiên cứu này đóng góp vào lĩnh vực AI có thể giải thích cho Nghệ thuật (XAIxArts) đang phát triển, khuyến khích các nghệ sĩ khám phá lại hoạt động bên trong của AI như một phương tiện sáng tạo.

Takeaways, Limitations

Takeaways:
Một phương pháp mới để trực quan hóa và phân tích cơ chế chú ý của máy biến áp khuếch tán video được trình bày.
Hiểu rõ hơn về quá trình chuyển văn bản thành video.
Đề Xuất khả năng sử dụng bản đồ chú ý trong các hoạt động sáng tạo nghệ thuật.
ĐóNg góp cho lĩnh vực XAIxArts.
Limitations:
Vì nghiên cứu này dựa trên mô hình Wan nên khả năng khái quát hóa sang các mô hình khác bị hạn chế.
Tính chủ quan tồn tại trong việc giải thích bản đồ chú ý.
Phạm vi nghiên cứu nghệ thuật hạn chế.
👍