Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Des indicateurs à la signification : il est temps de repenser l’évaluation dans la conception collaborative homme-IA

Created by
  • Haebom

Auteur

Sean P. Walton, Ben J. Evans, Alma AM Rahat, James Stovold, Jakub Vincalek

Contour

Cet article appelle à repenser l'évaluation des systèmes collaboratifs homme-IA et propose une approche plus sophistiquée et multidimensionnelle. Nous analysons le « Genetic Car Designer », un système collaboratif homme-IA, à travers une étude de terrain à grande échelle menée auprès de 808 participants et une étude contrôlée en laboratoire menée auprès de 12 participants. Les participants ayant reçu des propositions de conception générées par un système intelligent basé sur MAP-Elites ont démontré un engagement cognitif et comportemental plus important et ont produit des résultats de conception de meilleure qualité que ceux ayant reçu des propositions de conception aléatoires. Nous démontrons que les méthodes d'évaluation existantes, qui se concentrent uniquement sur les indicateurs comportementaux et de qualité de conception, ne parviennent pas à saisir l'intégralité du spectre de l'engagement utilisateur. Nous soutenons que le processus de conception homme-IA doit être considéré comme une évaluation holistique des systèmes homme-IA, prenant en compte l'évolution des états émotionnels, comportementaux et cognitifs du concepteur. Nous soutenons également que les systèmes intelligents doivent être considérés comme des éléments essentiels de l'expérience utilisateur, et non comme de simples outils back-end.

Takeaways, Limitations

Takeaways:
Nous soulignons les limites de l’approche simple et centrée sur les indicateurs existante pour évaluer les systèmes collaboratifs homme-IA et suggérons la nécessité d’une méthode d’évaluation multidimensionnelle qui prend en compte les aspects émotionnels, comportementaux et cognitifs.
Nous démontrons empiriquement que les systèmes intelligents basés sur MAP-Elites sont efficaces pour améliorer l’engagement des utilisateurs et la qualité de la conception.
Il souligne que les systèmes intelligents doivent être considérés comme un élément essentiel de l’expérience utilisateur dans les systèmes d’IA humaine.
Limitations:
ÉTant donné que le système étudié est limité à un type spécifique de tâche de conception (conception automobile 2D), des recherches supplémentaires sont nécessaires pour déterminer sa généralisabilité à d’autres types de tâches de conception.
Le nombre de participants à l’étude en laboratoire était limité (n = 12), ce qui nécessitait de prendre en compte la généralisabilité des résultats.
Des recherches supplémentaires sont nécessaires sur des indicateurs et des méthodes de mesure spécifiques pour évaluer de manière exhaustive les aspects émotionnels, comportementaux et cognitifs.
👍