Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Correction des erreurs d'étiquetage des concepts dans les modèles de goulots d'étranglement conceptuels grâce à l'optimisation des préférences

Created by
  • Haebom

Auteur

Emiliano Penaloza, Tianyue H. Zhang, Laurent Charlin, Mateo Espinosa Zarlenga

Contour

Les modèles de goulots d'étranglement conceptuels (CBM) sont proposés pour accroître la fiabilité des systèmes d'IA en limitant leurs décisions à un ensemble de concepts compréhensibles par les humains. Cependant, ces modèles supposent généralement que les ensembles de données contiennent des étiquettes de concepts précises, une pratique souvent violée, entraînant une dégradation significative des performances (jusqu'à 25 % dans certains cas). Dans cet article, nous proposons une nouvelle fonction de perte, l'objectif d'optimisation des préférences conceptuelles (CPO), qui atténue efficacement l'impact négatif des erreurs d'étiquetage des concepts. Nous analysons les principales caractéristiques de l'objectif CPO et démontrons qu'il optimise directement la distribution a posteriori des concepts. Comparé à l'entropie croisée binaire (BCE), nous démontrons que la CPO est intrinsèquement moins sensible au bruit conceptuel. Expérimentalement, nous démontrons que la CPO surpasse systématiquement la BCE sur trois ensembles de données réels, avec et sans bruit d'étiquetage supplémentaire. Le code est disponible sur GitHub.

Takeaways, Limitations

Takeaways: Pour améliorer la fiabilité des modèles de goulots d'étranglement conceptuels, nous proposons CPO, une nouvelle fonction de perte qui résout les problèmes de représentation erronée des concepts et valide expérimentalement son efficacité. CPO présente une sensibilité moindre au bruit conceptuel et offre de meilleures performances sur des ensembles de données réels.
Limitations: Le type et la portée de l'ensemble de données utilisé dans cette étude peuvent être limités. Des recherches supplémentaires sur divers types et concepts d'ensembles de données sont nécessaires. De plus, des vérifications supplémentaires sont nécessaires pour déterminer si les améliorations de performance du CPO sont cohérentes dans toutes les situations.
👍