Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

¿Más amplio o más profundo? Escalado del cálculo en tiempo de inferencia LLM con búsqueda adaptativa de árboles de ramificación

Created by
  • Haebom

Autor

Yuichi Inoue, Kou Misaki, Yuki Imajuku, So Kuroki, Taishi Nakamura, Takuya Akiba

Describir

En este artículo, proponemos un nuevo marco de tiempo de inferencia denominado búsqueda de árboles de Monte Carlo de ramificación adaptativa (AB-MCTS) para mejorar la capacidad de inferencia de los modelos de lenguaje a gran escala (LLM). Los métodos de muestreo iterativo convencionales presentan la limitación de no poder utilizar la retroalimentación externa, pero AB-MCTS la supera mediante la exploración y explotación multivuelta para ampliar las respuestas candidatas o reconsiderar las existentes con base en las señales de retroalimentación externa disponibles en tareas como la codificación. Los resultados experimentales en tareas complejas de codificación e ingeniería utilizando modelos de vanguardia muestran que AB-MCTS supera al muestreo iterativo y al MCTS estándar. Esto resalta la importancia de combinar la diversidad de respuestas de los LLM con la mejora de la solución multivuelta para una extensión efectiva del tiempo de inferencia.

Takeaways, Limitations

Takeaways:
Presentamos un nuevo método efectivo (AB-MCTS) para mejorar la capacidad de razonamiento de los LLM
Demostrar la utilidad de una estrategia que mejora el proceso de inferencia aprovechando las señales de retroalimentación externa
Superar las limitaciones del muestreo iterativo y lograr mejoras de rendimiento mediante mejoras en las soluciones multi-turno
Rendimiento superior verificado experimentalmente en tareas complejas de codificación e ingeniería
Limitations:
Se necesitan más investigaciones para determinar la generalización del método propuesto.
Necesidad de evaluar la adaptabilidad a varios tipos de señales de retroalimentación externa
Dado que estos son resultados de evaluación de desempeño para modelos y tareas específicos, es necesario verificar si se pueden generalizar a otros modelos y tareas.
Es necesario considerar la posibilidad de un aumento de los costos computacionales.
👍