Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Omni-Effects : Génération d'effets visuels unifiés et contrôlables spatialement

Created by
  • Haebom

Auteur

Fangyuan Mao, Aiming Hao, Jintao Chen, Dongxia Liu, Xiaokun Feng, Jiashu Zhu, Meiqi Wu, Chubin Chen, Jiahong Wu, Xiangxiang Chu

Contour

Cet article propose Omni-Effects, un nouveau modèle capable de générer et de contrôler spatialement divers effets visuels (VFX) au sein d'un même environnement. Les modèles de génération d'effets visuels basés sur LoRA existants peinent à contrôler spatialement plusieurs effets en raison de leur apprentissage spécifique. Omni-Effects relève ce défi grâce au mélange d'experts basé sur LoRA (LoRA-MoE) et aux invites de perception spatiale (SAP). LoRA-MoE intègre plusieurs effets tout en atténuant les interférences inter-tâches, tandis que SAP intègre les informations de masque spatial dans des jetons de texte pour permettre un contrôle spatial précis. De plus, le module Independent Information Flow (IIF) sépare les signaux de contrôle des effets individuels, évitant ainsi tout mélange indésirable. Nous présentons également Omni-VFX, un ensemble complet de données VFX construit à l'aide d'un nouveau pipeline de collecte de données et d'un environnement d'évaluation VFX dédié. Les résultats expérimentaux démontrent qu'Omni-Effects permet un contrôle spatial précis et la génération d'effets variés.

Takeaways, Limitations_

Takeaways:
Une nouvelle méthode pour créer et contrôler efficacement divers effets visuels à partir d'un seul modèle.
Surmonter les limites des modèles existants basés sur LoRA grâce à LoRA-MoE et SAP.
Fournir un ensemble de données VFX à grande échelle appelé Omni-VFX et un cadre d'évaluation dédié.
Offre aux utilisateurs la flexibilité de spécifier à la fois le type et l'emplacement de l'effet souhaité.
Limitations:
Des éclaircissements supplémentaires sont nécessaires concernant la taille et la diversité de l’ensemble de données Omni-VFX.
Manque d'analyse du coût de calcul et du temps de formation de la méthode proposée.
Une validation supplémentaire de l’applicabilité et de l’évolutivité dans des environnements de production cinématographique réels est nécessaire.
Une analyse plus détaillée des performances de généralisation sur différents types d’effets visuels est nécessaire.
👍