Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Cadres culturels : évaluation de l'alignement des attentes culturelles dans les modèles texte-image et les indicateurs d'évaluation

작성자
  • Haebom

Auteur

Shravan Nayak, Mehar Bhatia, Xiaofeng Zhang, Verena Rieser, Lisa Anne Hendricks, Sjoerd van Steenkiste, Yash Goyal, Karolina Stanczak, Aishwarya Agrawal

Contour

Cet article aborde les préoccupations concernant la capacité des modèles texte-image (T2I) à représenter fidèlement divers contextes culturels et présente la première étude visant à quantifier systématiquement la cohérence des attentes culturelles explicites et implicites avec les modèles T2I et les indicateurs d'évaluation. À cette fin, nous présentons CulturalFrames, un nouveau référentiel couvrant dix pays et cinq domaines socioculturels. CulturalFrames comprend 983 invites, 3 637 images générées par quatre modèles T2I de pointe et plus de 10 000 annotations humaines détaillées. Nos résultats révèlent que les attentes culturelles sont insatisfaites en moyenne 44 % du temps, selon les modèles et les pays. Un taux étonnamment élevé de 68 % des attentes explicites sont insatisfaites, et 49 % des attentes implicites le sont également. De plus, les indicateurs d'évaluation T2I existants, quelles que soient leurs méthodes d'inférence sous-jacentes, présentent de faibles corrélations avec les jugements humains de cohérence culturelle. En conclusion, cette étude révèle des lacunes importantes, fournit des environnements de test concrets et suggère des orientations concrètes pour développer des modèles et des mesures T2I culturellement sensibles qui améliorent la convivialité globale.

Takeaways, Limitations

Takeaways:
Nous présentons CulturalFrames, une nouvelle référence pour mesurer et analyser quantitativement les problèmes de biais culturels dans le modèle T2I.
Le modèle T2I a révélé un taux élevé d’échec à répondre aux attentes culturelles (68 % explicites, 49 % implicites, 44 % au total).
Démontre que les mesures d’évaluation existantes n’évaluent pas de manière adéquate l’adéquation culturelle.
Souligne la nécessité de développer des modèles T2I et des mesures d’évaluation culturellement sensibles.
Limitations:
Les repères CulturalFrames se concentrent sur des pays et des zones socioculturelles spécifiques, ce qui peut limiter leur généralisabilité.
La subjectivité des annotations humaines peut influencer les résultats.
Bien que nous ayons couvert une variété de modèles T2I, nous ne pourrons peut-être pas couvrir tous les modèles.
L’interprétation des attentes culturelles implicites peut être ambiguë.
👍