Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Transfert de style vers les bandes dessinées Calvin et Hobbes à l'aide de Stable Diffusion

Created by
  • Haebom

Auteur

Asvin Kumar Venkataramanan, Sloke Shrestha, Sundar Sripada Venugopalaswamy Sriraman

Contour

Ce rapport de projet résume le processus d'affinage du modèle de diffusion stable à l'aide de l'ensemble de données de bandes dessinées Calvin et Hobbes. L'objectif est d'effectuer un transfert de style, en transformant une image d'entrée arbitraire en style de bande dessinée Calvin et Hobbes. Pour un affinage efficace, nous avons entraîné stable-diffusion-v1.5 par adaptation de rang faible (LoRA), et le processus de diffusion est géré par un autoencodeur variationnel (VAE) dans U-net. Compte tenu du temps d'apprentissage et de la qualité des données d'entrée, les résultats sont visuellement attrayants.

Takeaways, Limitations

Takeaways : Nous présentons une méthode efficace de réglage fin pour un modèle de diffusion stable utilisant LoRA, démontrant qu'elle permet d'obtenir de bons résultats de transfert de style même avec des jeux de données et un temps d'apprentissage limités. Nous présentons également une approche pratique pour des tâches de transfert de style spécifiques, comme le style de bande dessinée Calvin et Hobbes.
Limitations : Le rapport manque d'informations détaillées sur la taille et la qualité de l'ensemble de données utilisé. En l'absence de mesures de performance objectives, les résultats reposent uniquement sur des évaluations qualitatives. La validation des performances de généralisation pour des images de styles différents est insuffisante. De par la nature du rapport, les détails techniques et les informations sur le dispositif expérimental sont limités.
👍