Este artículo se centra en los flujos de trabajo de agentes, donde múltiples agentes de IA realizan tareas complejas (p. ej., razonamiento, planificación, etc.). El rendimiento de estos flujos de trabajo depende en gran medida de las indicaciones que guían la función de cada agente, y las indicaciones incorrectas pueden degradar el rendimiento general del sistema. Para abordar este problema, presentamos ProRefine, un novedoso método de optimización del tiempo de inferencia. ProRefine mejora dinámicamente las indicaciones para tareas de inferencia de varios pasos mediante la generación y aplicación de retroalimentación textual a través de un bucle de agentes LLM, sin necesidad de entrenamiento adicional ni etiquetado correcto. En cinco conjuntos de datos de referencia de inferencia matemática, ProRefine supera a un modelo de referencia de cadena de pensamiento de disparo cero en un 3-37%, y también demuestra su eficacia para elevar el rendimiento de modelos más pequeños al de modelos más grandes. Esto sugiere su potencial para contribuir a la construcción de sistemas de IA híbridos rentables y potentes, y para mejorar la accesibilidad de la IA de alto rendimiento.