[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Juger avec plusieurs esprits : Plus de perspectives signifie-t-il moins de préjugés ? Sur l'amplification et la résistance des biais dans le LLM-as-Judge multi-agents

Created by
  • Haebom

Auteur

Chiyu Ma, Enpei Zhang, Yilun Zhao, Wenjun Liu, Yaning Jia, Peijun Qing, Lin Shi, Arman Cohan, Yujun Yan, Soroush Vosoughi

Contour

Cet article analyse systématiquement l'impact des biais inhérents dans une extension multi-agents de l'approche LLM-as-Judge (argumentation multi-agents et méta-évaluation) utilisant des modèles de langage à grande échelle (LLM) comme évaluateurs. En évaluant quatre types de biais (biais de position, biais de détail, biais de processus de pensée et biais de consensus) dans les cadres d'argumentation multi-agents et LLM-as-Meta-Judge, nous constatons que le cadre d'argumentation amplifie et maintient significativement les biais après l'argumentation initiale, tandis que l'approche de méta-évaluation est plus résistante aux biais. De plus, nous montrons que l'ajout d'un agent impartial utilisant PINE, une méthode de réduction des biais à agent unique, est efficace pour réduire les biais dans le cadre de l'argumentation, mais moins efficace dans le cadre de la méta-évaluation. En conclusion, cette étude analyse de manière exhaustive le comportement des biais dans le système LLM-as-Judge multi-agents et souligne la nécessité de stratégies ciblées d'atténuation des biais dans les contextes d'évaluation collaborative.

Takeaways, Limitations_

Takeaways:
Fournit une compréhension approfondie de la manière dont différents types de biais se manifestent dans les systèmes LLM-as-Judge multi-agents.
Nous révélons des différences dans la résistance aux biais des cadres d’argumentation multi-agents et des cadres de méta-évaluation.
Nous analysons l’efficacité de l’application de techniques de réduction des biais à agent unique aux systèmes multi-agents et montrons les différences d’efficacité en fonction des paramètres.
Il souligne la nécessité de développer des stratégies efficaces d’atténuation des biais dans les contextes d’évaluation collaborative.
Limitations:
Les types de biais analysés peuvent être limités. Des recherches supplémentaires sont nécessaires sur d'autres types de biais.
ÉTant donné que les résultats concernent un LLM et un ensemble de données spécifiques, une validation supplémentaire de la généralisabilité est nécessaire.
Il existe un manque d’application et d’analyse comparative d’autres techniques de réduction des biais en dehors de PINE.
La complexité des systèmes multi-agents peut nécessiter une analyse plus approfondie des causes et des mécanismes de biais.
👍