Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

RCR-Router: Enrutamiento contextual eficiente y basado en roles para sistemas LLM multiagente con memoria estructurada

Created by
  • Haebom

Autor

Jun Liu, Zhenglun Kong, Changdi Yang, Fan Yang, Tianqi Li, Peiyan Dong, Joannah Nanjekye, Hao Tang, Geng Yuan, Wei Niu, Wenbin Zhang, Pu Zhao, Xue Lin, Dong Huang, Yanzhi Wang

Describir

Este artículo propone RCR-Router, un novedoso marco de enrutamiento para la colaboración eficiente en sistemas de modelos de lenguaje a gran escala (LLM) multiagente. Para superar las limitaciones de las estrategias de enrutamiento estáticas o de contexto completo existentes, RCR-Router adopta un enfoque modular que reconoce roles y selecciona dinámicamente subconjuntos de memoria semánticamente relevantes según el rol y la etapa de la tarea de cada agente. Esto se logra respetando un estricto presupuesto de tokens. Una política de puntuación ligera guía la selección de memoria, y las salidas de los agentes se fusionan iterativamente en un almacén de memoria compartido, lo que permite un refinamiento incremental del contexto. Además, presentamos la métrica de Puntuación de Calidad de Respuesta, que captura las explicaciones generadas por el LLM, para evaluar mejor el rendimiento del modelo. Los resultados experimentales en tres pruebas de control de calidad multisalto (HotPotQA, MuSiQue y 2WikiMultihop) muestran que RCR-Router mantiene o mejora la calidad de las respuestas, a la vez que reduce el uso de tokens hasta en un 30 %.

Takeaways, Limitations

Takeaways:
Presentamos RCR-Router, un nuevo marco de enrutamiento para una colaboración eficiente en sistemas LLM multiagente.
El enrutamiento de memoria dinámico y consciente de roles reduce el uso de tokens y mantiene o mejora la calidad de la respuesta.
Mejorar el método de evaluación proponiendo un indicador de Puntuación de Calidad de Respuesta que tenga en cuenta la descripción de creación del LLM.
Enfatizar la importancia del enrutamiento de memoria estructurada y la evaluación consciente de la salida.
Limitations:
El rendimiento del enrutador RCR propuesto se basa en resultados experimentales limitados a un punto de referencia específico. Se requieren experimentos adicionales con diversas tareas y conjuntos de datos.
Se necesitan más investigaciones para determinar la generalización y objetividad del indicador de puntuación de calidad de respuesta.
Falta de explicación detallada del diseño y optimización de la política de puntuación ligera.
👍