Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Les préjugés humains face à l'IA : examen du jugement humain sur un texte étiqueté comme généré par l'IA

Created by
  • Haebom

Auteur

Tiffany Zhu, Iain Weissburg, Kexun Zhang, William Yang Wang

Contour

Cet article examine si la confiance humaine dans les textes générés par l'IA est limitée par des biais qui vont au-delà des préoccupations d'exactitude. Nous avons examiné la réaction des évaluateurs humains aux contenus étiquetés et non étiquetés dans le cadre de trois expériences : la révision de texte, les résumés d'articles de presse et la rédaction persuasive. Bien que les tests à l'aveugle n'aient pas permis de distinguer les deux types de textes, nous avons constaté que les évaluateurs humains préféraient de plus de 30 % les contenus étiquetés « générés par l'homme » à ceux étiquetés « générés par l'IA ». La même tendance a été observée lorsque les étiquettes étaient modifiées intentionnellement. Ce biais humain en IA a des implications sociales et cognitives plus larges, notamment la sous-estimation des performances de l'IA. Cette étude met en évidence les limites du jugement humain lors des interactions avec l'IA et pose les bases d'une amélioration de la collaboration homme-IA, notamment dans les domaines créatifs.

Takeaways, Limitations_

Takeaways: Cette étude démontre l'existence de biais humains dans le contenu généré par l'IA, davantage influencés par les étiquettes que par les performances réelles de l'IA. Cela souligne la nécessité de mener des recherches pour améliorer la collaboration entre l'humain et l'IA. Elle suggère également une évolution des perceptions sociétales du rôle et de l'utilisation de l'IA, en particulier dans le domaine créatif.
Limitations: L'analyse des différences de biais selon les caractéristiques des participants (âge, profession, connaissances préalables en IA, etc.) est insuffisante. Des recherches supplémentaires sont nécessaires, utilisant un éventail plus large de contenus générés par l'IA et un éventail plus large de méthodes d'évaluation. Cette étude n'a examiné que les biais dus aux étiquettes et n'a peut-être pas suffisamment pris en compte l'impact des différences qualitatives du contenu lui-même sur les résultats de l'évaluation.
👍