Cette page résume et organise les publications en intelligence artificielle du monde entier. Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif. Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.
Traduction personnalisée de caractéristiques pour la reconnaissance d'expressions : une méthode efficace d'adaptation de domaine sans source
Created by
Haebom
Auteur
Masoumeh Sharafi, Soufiane Belharbi, Houssem Ben Salem, Ali Etemad, Alessandro Lameiras Koerich, Marco Pedersoli, Simon Bacon, Eric Granger
Contour
Cet article propose la Transformation Personnalisée des Caractéristiques (PFT), une nouvelle méthode d'adaptation de domaine sans source (SFDA) qui améliore les performances des modèles de reconnaissance d'expressions faciales (FER) en utilisant uniquement des données cibles non étiquetées contenant uniquement des expressions neutres, sans données sources. Alors que les méthodes SFDA existantes nécessitent des données de différentes classes, la PFT effectue la transformation des caractéristiques en utilisant uniquement des données d'expression neutres. Elle utilise un transformateur léger fonctionnant dans l'espace latent pour éviter la complexité et le bruit de la génération d'images et préserve les informations d'expression en optimisant la combinaison des objectifs de cohérence d'expression et de reconnaissance de style. Par conséquent, elle réduit les coûts de calcul et permet une adaptation efficace du modèle.
Takeaways, Limitations
•
Takeaways:
◦
Nous démontrons que les performances du modèle FER peuvent être améliorées en utilisant uniquement des données d’expression neutres sans données sources.
◦
Il est plus efficace en termes de calcul que les méthodes SFDA existantes basées sur la transformation d'images et contribue à résoudre les problèmes de confidentialité des données et d'espace de stockage.
◦
Réduisez la complexité et le bruit de la génération d'images grâce à des transformations dans l'espace latent.
•
Limitations:
◦
ÉTant donné que seules des données d’expression neutres sont utilisées, il peut y avoir des limites à l’amélioration des performances par rapport aux méthodes qui utilisent des données d’expression diverses.
◦
Des recherches supplémentaires sont nécessaires pour déterminer dans quelle mesure les performances de la méthode proposée peuvent être généralisées à diverses données de domaine cible.
◦
Une évaluation et une validation supplémentaires des performances dans des applications réelles sont nécessaires.