Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Exploration des effets des cinq grandes personnalités et des capacités de l'IA dans les dialogues de négociation simulés par LLM

Created by
  • Haebom

Auteur

Myke C. Cohen, Zhe Su, Hsien-Te Kao, Daniel Nguyen, Spencer Lynch, Maarten Sap, Svitlana Volkova

Contour

Cet article présente un cadre d'évaluation pour les systèmes d'IA d'agents dans des situations de négociation critiques. Il répond au besoin d'agents d'IA capables de s'adapter à divers opérateurs et parties prenantes. À l'aide de l'environnement de simulation Sotopia, nous évaluons systématiquement l'impact des traits de personnalité et des caractéristiques des agents d'IA sur les résultats des négociations sociales simulées par LLM dans deux expériences, essentielles à diverses applications, notamment la coordination inter-équipes et les interactions civilo-militaires. Dans l'expérience 1, nous utilisons des méthodes de découverte causale pour mesurer l'effet des traits de personnalité sur les négociations de prix. Nous constatons que l'agréabilité et l'extraversion influencent significativement la fiabilité, la réalisation des objectifs et l'acquisition de connaissances. En utilisant une mesure du vocabulaire sociocognitif extraite des communications d'équipe, nous détectons des différences subtiles dans la communication empathique, les fondements moraux et les schémas d'opinion des agents, fournissant ainsi des informations exploitables pour les systèmes d'IA d'agents qui doivent fonctionner de manière fiable dans des scénarios opérationnels à haut risque. Dans l'expérience 2, nous évaluons les négociations d'emploi entre humains et IA en manipulant la personnalité humaine simulée et les caractéristiques des systèmes d'IA (notamment la transparence, la compétence et l'adaptabilité) afin de démontrer l'impact de la fiabilité des agents d'IA sur l'efficacité des missions. Ces résultats soutiennent directement les exigences opérationnelles pour des systèmes d'IA fiables en établissant une méthodologie d'évaluation reproductible permettant de tester la fiabilité des agents IA selon diverses personnalités d'opérateurs et dynamiques d'équipe homme-agent. Cette étude fait progresser l'évaluation des flux de travail des agents IA en allant au-delà des indicateurs de performance standards et en intégrant les dynamiques sociales essentielles à la réussite des missions dans les opérations complexes.

Takeaways, Limitations

Takeaways:
Présentation d'un cadre reproductible pour évaluer la fiabilité des systèmes d'IA d'agent dans des situations de négociation hautement critiques.
Fournir des preuves empiriques sur l’impact des traits de personnalité (agréabilité, extraversion) et des caractéristiques de l’agent IA (transparence, compétence, adaptabilité) sur les résultats des négociations.
Suggérant la possibilité d'analyser la communication empathique, les fondements moraux et les modèles d'opinion des agents grâce à la mesure du vocabulaire cognitif social.
Souligne l’importance d’évaluer les systèmes d’IA au-delà des mesures de performance standard et de prendre en compte la dynamique sociale.
Limitations:
ÉTant donné que les expériences ont été menées à l’aide de l’environnement de simulation Sotopia, des recherches supplémentaires sont nécessaires pour déterminer la généralisabilité aux situations du monde réel.
ÉTant donné que nous n’avons pris en compte que des traits de personnalité spécifiques et des caractéristiques des agents d’IA, des recherches supplémentaires sont nécessaires sur l’influence d’autres facteurs.
ÉTant donné que nous avons simulé des humains à l’aide de LLM, il est possible que cela ne reflète pas entièrement la complexité des humains réels.
👍