Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Cadena colaborativa de agentes para la sinergia del conocimiento recuperado paramétrico

Created by
  • Haebom

Autor

Yi Jiang, Sendong Zhao, Jianbo Li, Haochun Wang, Lizhe Zhang, Yan Liu, Bing Qin

Describir

Este artículo propone el marco de Cadena Colaborativa de Agentes (CoCoA) para abordar el desafío Limitations de la Generación Aumentada de Recuperación (RAG), un marco prometedor para mejorar el rendimiento de los modelos de lenguaje a gran escala (LLM) en tareas intensivas en conocimiento. Los métodos RAG existentes no logran aprovechar completamente la sinergia entre el conocimiento de parámetros internos del modelo y el conocimiento de recuperación externo, pero CoCoA supera este problema a través de un enfoque multiagente. Primero, presentamos CoCoA-zero, que realiza inferencia después de la inducción de conocimiento condicional. Con base en esto, desarrollamos CoCoA, que afina el LLM sintetizando una ruta de inferencia multiagente extendida. Los resultados experimentales demuestran que CoCoA-zero y CoCoA logran un rendimiento superior en tareas de preguntas y respuestas de dominio abierto y de múltiples pasos.

Takeaways, Limitations

Takeaways:
Presentamos un nuevo marco RAG (CoCoA) que mejora explícitamente la sinergia entre el conocimiento de búsqueda interno y externo en LLM.
Un enfoque de múltiples agentes presenta el potencial para una utilización más precisa y eficiente del conocimiento.
Supera los métodos RAG existentes en tareas de preguntas y respuestas de dominio abierto y de múltiples pasos.
Presentamos una estrategia de aprendizaje de modelos eficaz a través del desarrollo paso a paso de CoCoA-zero y CoCoA.
Limitations:
Se necesita más investigación para evaluar el desempeño de generalización del marco propuesto y su aplicabilidad a diversas tareas.
Falta de análisis del coste computacional y del tiempo de entrenamiento de CoCoA.
Sólo se presentan los resultados de la evaluación del desempeño para un conjunto de datos específico, por lo que es necesario verificar la generalización a otros conjuntos de datos.
👍