Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

APT : Formation personnalisée adaptative pour les modèles de diffusion avec données limitées

Created by
  • Haebom

Auteur

JungWoo Chae, Jiyoon Kim, JaeWoong Choi, Kyungyul Kim, Sangheum Hwang

Contour

La personnalisation des modèles de diffusion à partir de données limitées pose des défis importants, tels que le surapprentissage, la perte de connaissances a priori et un mauvais alignement du texte. Le surapprentissage modifie la distribution des prédictions de bruit, ce qui entrave le processus de débruitage et entraîne une perte de cohérence sémantique du modèle. Dans cet article, nous proposons l'apprentissage personnalisé adaptatif (APT), un nouveau cadre qui atténue le surapprentissage en utilisant des stratégies d'apprentissage adaptatif et en régulant la représentation interne du modèle lors du réglage fin. L'APT se compose de trois éléments principaux : (1) la coordination de l'apprentissage adaptatif, qui détecte le degré de surapprentissage à chaque intervalle de temps en introduisant une métrique de surapprentissage et applique une augmentation adaptative des données et une pondération adaptative des pertes en fonction de cette métrique ; (2) la stabilisation de la représentation, qui régule la moyenne et la variance des cartes de caractéristiques intermédiaires afin d'éviter des variations excessives dans les prédictions de bruit ; et (3) la préservation des connaissances a priori pour l'alignement de l'attention, qui aligne les cartes d'attention croisée du modèle affiné avec celles du modèle pré-entraîné afin de maintenir les connaissances a priori et la cohérence sémantique. Des expériences approfondies démontrent qu'APT surpasse les méthodes existantes en atténuant efficacement le surapprentissage, en préservant les connaissances antérieures et en générant des images de haute qualité et diversifiées avec des données de référence limitées.

Takeaways, Limitations

Takeaways: Présentation d'une solution efficace au problème de la personnalisation des modèles de diffusion avec des données limitées, démontrant la possibilité d'atténuer les problèmes de surajustement et de générer des images de haute qualité en préservant les connaissances antérieures et en améliorant les performances du modèle grâce à des stratégies d'apprentissage adaptatif et à la régularisation des représentations.
Limitations: Les performances d'APT peuvent dépendre d'ensembles de données ou d'architectures de modèles spécifiques, les coûts de calcul peuvent augmenter dans les applications pratiques et les performances de généralisation doivent être vérifiées pour différents types de données et situations de surajustement.
👍