Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Stylisation de tête 3D préservant l'identité avec distillation de partition multivue

Created by
  • Haebom

Auteur

Bahri Batuhan Bilecen, Ahmet Berke Gokmen, Furkan Guzelant, Aysegul Dundar

Contour

Cet article présente un nouveau cadre pour le stylisme de tête 3D qui répond aux défis des méthodes existantes, qui reposent principalement sur des photos frontales et préservent l'individualité. Nous synthétisons des images à 360 degrés à l'aide du modèle PanoHead et intégrons la distillation par vraisemblance logarithmique négative (LD), les scores de grille multi-vues, les gradients miroirs et les techniques de pondération des scores dans une architecture de réseau antagoniste génératif (GAN) 3D afin d'améliorer la préservation de l'individualité et la qualité du stylisme. Cela permet de mieux comprendre le processus de distillation efficace entre les modèles de diffusion et les GAN, en mettant l'accent sur la préservation de l'individualité.

Takeaways, Limitations

Takeaways:
ÉLargissez les possibilités de style sous différents angles en utilisant le champ de vision à 360 degrés.
Préserver la personnalité et améliorer la qualité du style grâce à la distillation à vraisemblance logarithmique négative (LD).
Architecture GAN 3D améliorée utilisant des scores de grille multi-vues et des dégradés miroir.
Fournit de nouvelles perspectives sur le processus de distillation efficace entre les modèles de diffusion et les GAN.
Limitations:
ÉTant donné que la structure dépend du modèle PanoHead, il existe un risque de dégradation des performances lors de l'application d'autres modèles 3D.
Une validation supplémentaire des performances de généralisation de la méthode proposée est nécessaire.
Manque d’évaluation des performances sur de grands ensembles de données.
👍