Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Varios agentes de LLM debaten sobre una alineación cultural equitativa

Created by
  • Haebom

Autor

Dayeon Ki, Rachel Rudinger, Tianyi Zhou, Marine Carpuat

Describir

Este artículo propone un marco de discusión multiagente para mejorar la adaptabilidad de los modelos lingüísticos a gran escala (LLM) a diversos contextos culturales. A diferencia de los enfoques convencionales de un solo LLM y un solo turno, nos centramos en aprovechar las fortalezas de múltiples LLM complementarios para mejorar la adaptabilidad cultural. Presentamos dos variantes del marco de discusión multiagente, en las que dos agentes basados ​​en LLM discuten escenarios culturales y llegan a una decisión final de forma colaborativa: una en la que los agentes LLM discuten exclusivamente y otra en la que seleccionan dinámicamente y autorreflexionan sobre la discusión. Utilizando siete LLM de ponderación abierta y 21 combinaciones de LLM, evaluamos el marco frente al parámetro NormAd-ETI para normas de etiqueta social en 75 países. Observamos que la discusión mejora tanto la precisión general como la equidad cultural en comparación con un único LLM de referencia. Específicamente, demostramos que la discusión multiagente permite que LLM relativamente pequeños (de 7 a 9 mil millones de parámetros) alcancen una precisión comparable a la de modelos mucho más grandes (27 mil millones de parámetros).

Takeaways, Limitations

Takeaways:
Demostramos que la adaptabilidad cultural de los LLM se puede mejorar a través de un marco de discusión basado en múltiples LLM.
Sugerir la posibilidad de mejorar el desempeño de los LLM de pequeña escala al nivel de los LLM de gran escala.
Se ha demostrado su eficacia para mejorar la equidad cultural.
Limitations:
Dado que los resultados se evalúan en relación con un punto de referencia específico (NormAd-ETI), se necesita más investigación para determinar su generalización.
Es necesario un análisis más profundo de la eficiencia y el coste computacional del proceso de discusión.
Se necesitan más investigaciones que utilicen un conjunto de datos más amplio que abarque diversos contextos culturales.
👍