Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Débiaising social pour des LLM multimodaux équitables

Created by
  • Haebom

Auteur

Harry Cheng, Yangyang Guo, Qingpei Guo, Ming Yang, Tian Gan, Weili Guan, Liqiang Nie

Contour

Cet article présente deux contributions majeures pour résoudre le problème des biais sociaux dans les modèles linguistiques multimodaux à grande échelle (MLLM). Premièrement, nous introduisons le Comprehensive Counterfactual Dataset (CMSC), qui comprend 18 concepts sociaux diversifiés et équilibrés. Le CMSC complète les ensembles de données existants, permettant une approche plus globale de l'atténuation des biais sociaux. Deuxièmement, nous proposons une stratégie de débiasing anti-stéréotypes (CSD) pour atténuer les biais sociaux dans les MLLM en exploitant le contre-concept des stéréotypes répandus. Le CSD intègre une nouvelle méthode d'échantillonnage de données sensible aux biais et un rééquilibrage des pertes pour améliorer l'efficacité de la réduction des biais du modèle. Des expériences approfondies utilisant quatre architectures MLLM majeures démontrent que le jeu de données CMSC et la stratégie CSD réduisent efficacement les biais sociaux par rapport aux méthodes existantes, sans compromettre les performances globales sur les benchmarks d'inférence multimodale courants.

Takeaways, Limitations

Takeaways:
Contribue à résoudre le problème des biais sociaux dans MLLM en fournissant un nouvel ensemble de données contrefactuelles (CMSC) qui comprend des concepts sociaux divers et équilibrés.
Nous présentons une nouvelle stratégie de débiasing anti-stéréotype (CSD) qui réduit les biais sociaux dans MLLM plus efficacement que les méthodes existantes.
La stratégie CSD permet de réduire les biais sans compromettre les performances générales d’inférence multimodale.
Nous validons l’efficacité du CMSC et du CSD grâce à des expériences approfondies sur diverses architectures MLLM.
Limitations:
La couverture des concepts sociaux par l'ensemble de données CMSC n'est peut-être pas exhaustive. Il est nécessaire de l'élargir pour inclure un éventail plus large de concepts sociaux.
L'efficacité de la stratégie CSD peut varier en fonction de l'architecture MLLM et des données d'apprentissage utilisées. Des recherches supplémentaires sont nécessaires sur d'autres modèles et données.
Des recherches supplémentaires pourraient être nécessaires pour définir et mesurer les préjugés sociaux. Différents indicateurs de mesure et méthodologies d'évaluation devraient être envisagés.
👍