Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo. La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro. Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.
Este artículo propone SE-Agent, un nuevo marco de trabajo para optimizar el proceso de resolución de problemas (rutas de interacción) de agentes basados en modelos de lenguaje a gran escala (LLM). Abordamos los problemas de los métodos existentes, como MCTS, que ignoran las interdependencias entre las rutas de interacción y la insuficiente diversidad del espacio de búsqueda, lo que resulta en una inferencia ineficiente. SE-Agent optimiza iterativamente el proceso de inferencia mediante tres operaciones: modificación, recombinación y mejora de las rutas existentes. Esto le permite explorar diversas rutas de solución más allá de los óptimos locales y mitigar el impacto de las rutas ineficientes, mejorando así el rendimiento. Los resultados experimentales con el conjunto de datos verificado de SWE-bench demuestran que nuestro enfoque alcanza un rendimiento de vanguardia, con mejoras de hasta el 55 % en cinco LLM robustos.
Takeaways, Limitations
•
Takeaways:
◦
Un nuevo enfoque para optimizar el proceso de resolución de problemas de agentes basados en LLM.
◦
Solución de los problemas de ignorar las interdependencias y la falta de diversidad en el espacio de búsqueda en los métodos existentes (__T5996_____)
◦
Mejora eficiente del rendimiento y mitigación del impacto de rutas ineficientes mediante operaciones de modificación, recombinación y mejora.
◦
Consiga un rendimiento de vanguardia en SWE-bench Verified (hasta un 55 % de mejora del rendimiento)
◦
Versión de código abierto para una mejor accesibilidad
•
Limitations:
◦
Las mejoras de rendimiento de SE-Agent pueden estar limitadas a un conjunto de datos específico (SWE-bench verificado).
◦
Se necesita más investigación sobre el rendimiento de generalización a otros tipos de problemas o entornos.
◦
Se necesita más investigación sobre el ajuste de parámetros y la optimización de las tres operaciones (modificación, recombinación y mejora).