Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Plusieurs agents LLM débattent d'un alignement culturel équitable

Created by
  • Haebom

Auteur

Dayeon Ki, Rachel Rudinger, Tianyi Zhou, Marine Carpuat

Contour

Cet article propose un cadre de discussion multi-agents pour améliorer l'adaptabilité des modèles linguistiques à grande échelle (MLE) à divers contextes culturels. Contrairement aux approches conventionnelles à un seul LE et à un seul tour, nous nous concentrons sur l'exploitation des atouts de plusieurs LE complémentaires pour améliorer l'adaptabilité culturelle. Nous présentons deux variantes du cadre de discussion multi-agents, dans lesquelles deux agents basés sur un LE discutent de scénarios culturels et parviennent collectivement à une décision finale : l'une où les agents LE discutent exclusivement et l'autre où ils sélectionnent et réfléchissent dynamiquement sur la discussion. À l'aide de sept LE pondérés ouverts et de 21 combinaisons de LE, nous évaluons le cadre par rapport à la référence NormAd-ETI pour les normes d'étiquette sociale dans 75 pays. Nous constatons que la discussion améliore à la fois la précision globale et l'équité culturelle par rapport à une référence LE unique. Plus précisément, nous démontrons que la discussion multi-agents permet à des LE relativement petits (7 à 9 milliards de paramètres) d'atteindre une précision comparable à celle de modèles beaucoup plus grands (27 milliards de paramètres).

Takeaways, Limitations_

Takeaways:
Nous démontrons que l’adaptabilité culturelle des LLM peut être améliorée grâce à un cadre de discussion basé sur plusieurs LLM.
Suggérant la possibilité d’améliorer les performances des LLM à petite échelle au niveau des LLM à grande échelle.
Efficacité prouvée pour améliorer l’équité culturelle.
Limitations:
ÉTant donné que les résultats sont évalués par rapport à un point de référence spécifique (NormAd-ETI), des recherches supplémentaires sont nécessaires pour déterminer la généralisabilité.
Une analyse plus approfondie de l’efficacité et du coût informatique du processus de discussion est nécessaire.
Des recherches supplémentaires utilisant un ensemble de données plus large englobant divers contextes culturels sont nécessaires.
👍