Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Analyse de la représentation des personnages dans le contenu médiatique à l'aide du modèle de fondation multimodale : efficacité et confiance

Created by
  • Haebom

Auteur

Evdoxia Taka, Debadyuti Bhattacharya, Joanne Garde-Hansen, Sanjay Sharma, Tanaya Guha

Contour

Cet article présente un outil d'analyse des expressions de caractères basé sur l'IA et évalue sa convivialité et sa fiabilité grâce à des recherches utilisateurs. À l'aide d'un modèle d'extraction d'analyse basé sur le pré-entraînement CLIP (Contrastive Language Image Pretraining), l'outil quantifie les expressions de caractères par sexe et par âge à partir de données d'images et inclut des composants de visualisation qui affichent efficacement ces résultats aux utilisateurs généraux. Les résultats de la recherche utilisateur ont révélé que les participants comprenaient les résultats d'analyse visualisés et reconnaissaient la convivialité globale de l'outil, mais ils ont également souligné la nécessité de visualisations incluant des catégories démographiques plus détaillées et des informations contextuelles. Si la confiance dans les modèles de genre et d'âge basés sur l'IA était modérée à faible, leur utilisation n'a suscité aucune opposition. Le code de l'outil, les données d'analyse comparative et de recherche utilisateur sont disponibles sur GitHub.

Takeaways, Limitations

Takeaways:
Vérification empirique de l’utilité d’un outil d’analyse de l’expression des caractères basé sur l’IA.
Soulignez l’importance de visualiser les résultats d’analyse basés sur l’IA pour les utilisateurs généraux.
Proposer de nouvelles orientations de recherche pour améliorer la fiabilité des modèles d’IA et répondre aux besoins des utilisateurs.
Limitations:
Limitations de la taille et de la diversité des participants dans la recherche utilisateur.
Les catégories démographiques incluses dans l’analyse sont limitées.
La confiance dans les modèles d’IA est jugée moyenne à faible.
Identifier le besoin d’une visualisation plus détaillée et d’informations contextuelles.
👍