Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

SE-Agent: Optimización de trayectorias de autoevolución en razonamiento multipaso con agentes basados en LLM

Created by
  • Haebom

Autor

Jiaye Lin, Yifu Guo, Yuzhen Han, Sen Hu, Ziyi Ni, Licheng Wang, Mingguang Chen, Daxin Jiang, Binxing Jiao, Chen Hu, Huacan Wang

Describir

Este artículo propone SE-Agent, un nuevo marco de trabajo para optimizar el proceso de resolución de problemas (rutas de interacción) de agentes basados en modelos de lenguaje a gran escala (LLM). Abordamos los problemas de los métodos existentes, como MCTS, que ignoran las interdependencias entre las rutas de interacción y la insuficiente diversidad del espacio de búsqueda, lo que resulta en una inferencia ineficiente. SE-Agent optimiza iterativamente el proceso de inferencia mediante tres operaciones: modificación, recombinación y mejora de las rutas existentes. Esto le permite explorar diversas rutas de solución más allá de los óptimos locales y mitigar el impacto de las rutas ineficientes, mejorando así el rendimiento. Los resultados experimentales con el conjunto de datos verificado de SWE-bench demuestran que nuestro enfoque alcanza un rendimiento de vanguardia, con mejoras de hasta el 55 % en cinco LLM robustos.

Takeaways, Limitations

Takeaways:
Un nuevo enfoque para optimizar el proceso de resolución de problemas de agentes basados en LLM.
Solución de los problemas de ignorar las interdependencias y la falta de diversidad en el espacio de búsqueda en los métodos existentes (__T5996_____)
Mejora eficiente del rendimiento y mitigación del impacto de rutas ineficientes mediante operaciones de modificación, recombinación y mejora.
Consiga un rendimiento de vanguardia en SWE-bench Verified (hasta un 55 % de mejora del rendimiento)
Versión de código abierto para una mejor accesibilidad
Limitations:
Las mejoras de rendimiento de SE-Agent pueden estar limitadas a un conjunto de datos específico (SWE-bench verificado).
Se necesita más investigación sobre el rendimiento de generalización a otros tipos de problemas o entornos.
Se necesita más investigación sobre el ajuste de parámetros y la optimización de las tres operaciones (modificación, recombinación y mejora).
👍